400-650-1086
首頁(yè) > 最新資訊 > IT新聞 > 正文

百度開發(fā)語(yǔ)音識(shí)識(shí)系統(tǒng)DeepSpeech,嘈雜環(huán)境下識(shí)別率超Google、蘋果

admin 2014-12-22 10:08:05 0

不久前,百度的首席科學(xué)家吳恩達(dá)(Andrew Ng)在接受採(cǎi)訪時(shí)曾談到了百度最近人工智慧的進(jìn)展情況,強(qiáng)調(diào)了近期百度重點(diǎn)是攻關(guān)語(yǔ)音識(shí)別。現(xiàn)在他們已經(jīng)在這方面取得了突破。

這項(xiàng)成果的名字叫做Deep Speech,是一款採(cǎi)用深度學(xué)習(xí)技術(shù)的語(yǔ)音識(shí)別系統(tǒng)系統(tǒng)。其獨(dú)特之處在于,它可以在飯店等嘈雜環(huán)境下實(shí)現(xiàn)將近81% 的辨識(shí)準(zhǔn)確率。

81%的準(zhǔn)確率聽起來(lái)似乎不算高。但是同樣環(huán)境下,其他的商業(yè)版語(yǔ)音識(shí)別API,包括Bing、Google以及Wit.AI等的最高識(shí)別率也只有65%。相比之下這就算十分突出的表現(xiàn)了。而且按照吳恩達(dá)的說(shuō)法,這樣的結(jié)果依然低估了Deep Speech與其他語(yǔ)音識(shí)別系統(tǒng)的準(zhǔn)確率差異,因?yàn)镈eep Speech進(jìn)行比較時(shí)還把其他語(yǔ)音識(shí)別系統(tǒng)那些返回空白字符串的結(jié)果排除在外了。而且Deep Speech跟頂級(jí)的學(xué)術(shù)型語(yǔ)音識(shí)別模型(基于流行的數(shù)據(jù)集Hub5'00建模)相比也高出9個(gè)百分點(diǎn)。

百度首席科學(xué)家吳恩達(dá)稱儘管這還只是一項(xiàng)研究,但是公司正在考慮將它集成到供智慧手機(jī)和Baidu Eye之類的可穿戴設(shè)備使用的語(yǔ)音識(shí)別軟體當(dāng)中。而且百度還在開發(fā)與Amazon Echo類似、集成有語(yǔ)音助理的家電產(chǎn)品,名字叫做CoolBox。除此以外,百度在開發(fā)的智慧自行車當(dāng)然也能利用Deep Speech技術(shù)。

Deep Speech 的基礎(chǔ)是某種遞歸神經(jīng)網(wǎng)絡(luò)(RNN),這種遞歸神經(jīng)網(wǎng)絡(luò)經(jīng)常被用于語(yǔ)音識(shí)別和文本分析。

但是Deep Speech 的成功主要得益于一個(gè)長(zhǎng)達(dá)10 萬(wàn)小時(shí)的語(yǔ)音數(shù)據(jù)訓(xùn)練集。這是百度人工智慧實(shí)驗(yàn)室團(tuán)隊(duì)用新穎的辦法在嘈雜環(huán)境下建立的。其過(guò)程大致是這樣的。首先百度收集了7000 小時(shí)的語(yǔ)音會(huì)話數(shù)據(jù),然后再將這些語(yǔ)音文件與包含有背景噪音的文件合成到一起,最后形成約10 萬(wàn)小時(shí)的訓(xùn)練集。這些背景噪音包括了飯店、電視、自助餐廳以及汽車內(nèi)、火車內(nèi)等場(chǎng)景。相比之下,Hub5'00 的數(shù)據(jù)集總共只有2300 小時(shí)。

當(dāng)然,這幺龐大的數(shù)據(jù),大多數(shù)系統(tǒng)都不知道如何去處理。吳恩達(dá)表示,Deep Speech的成功很大程度上要取決于百度規(guī)模龐大的基于GPU的深度學(xué)習(xí)基礎(chǔ)設(shè)施。GPU(圖形處理器)往往是偏數(shù)學(xué)型計(jì)算的首選。許多深度學(xué)習(xí)系統(tǒng)都採(cǎi)用GPU避免通信瓶頸(不過(guò)微軟的深度學(xué)習(xí)系統(tǒng)Adam卻走了不同的路線),但是像百度這樣大規(guī)模的設(shè)施卻是少見的。

百度的另一大改進(jìn),是對(duì)這個(gè)龐大的數(shù)據(jù)集採(cǎi)用了點(diǎn)到點(diǎn)的深度學(xué)習(xí)模型,而不是標(biāo)準(zhǔn)的、計(jì)算代價(jià)高昂的聲學(xué)模型。傳統(tǒng)上一般都會(huì)把語(yǔ)音識(shí)別分別為多個(gè)步驟,其中一步叫做語(yǔ)音調(diào)適,但是百度卻不做這一步,而是給Deep Speech 的算法提供大量的數(shù)據(jù),然后讓它去學(xué)習(xí)所有需要學(xué)習(xí)的東西。這種做法除了收穫了準(zhǔn)確率以外,還顯著減少了代碼庫(kù)的規(guī)模。

這項(xiàng)研究是吳恩達(dá)領(lǐng)導(dǎo)的百度人工智慧實(shí)驗(yàn)室多位研究人員的努力成果,論文發(fā)表在康乃爾大學(xué)圖書館的arXiv.org網(wǎng)站上,感興趣的可到此處下載。

本文出自36氪 / boxi

文章來(lái)源:機(jī)房監(jiān)控 http://www.scdprobes.com

售前咨詢

專線:劉剛 13911133352

E-mail:112417434@qq.com

北京金恒智能系統(tǒng)工程技術(shù)有限責(zé)任公司 版權(quán)所有 Copyright 2007-2020 by Create-china.com.cn Inc. All rights reserved.

法律聲明:未經(jīng)許可,任何模仿本站模板、轉(zhuǎn)載本站內(nèi)容等行為者,本站保留追究其法律責(zé)任的權(quán)利!

電話:86+10-62104277/2248/4249 傳真:86+10-62104193-819 京ICP備10010038號(hào)-2網(wǎng)站XML

智慧機(jī)房

在線體驗(yàn)

CREATE·機(jī)房監(jiān)控 體驗(yàn)端  用戶名:Admin    密碼:12345 點(diǎn)擊體驗(yàn)
在線咨詢 電話咨詢
主站蜘蛛池模板: 免费福利小视频| lisaannxxxxx| 中文字幕网在线| 1000部禁片黄的免费看| 福利区在线观看| 波多野结衣与黑人| 成人毛片免费观看视频在线| 国产成人久久久精品二区三区 | 国产叼嘿久久精品久久| 亚洲欧洲日韩综合| youjizz护士| 翁熄系列乱老扒bd在线播放| 最新电影天堂快影eeuss| 国产线视频精品免费观看视频| 再深点灬舒服了灬太大了在线观看| 久久久久成人精品一区二区| 久久成人福利视频| 欧美人与动牲交a欧美精品| 在线播放亚洲美女视频网站| 免费高清a级毛片在线播放| 久久久99精品成人片中文字幕| 国产对白精品刺激一区二区| 欧美午夜性春猛交| 国产麻豆剧看黄在线观看| 你懂的手机在线视频| 一级毛片高清免费播放| 老司机精品导航| 扒开内裤直接进| 国产一区二区三区不卡在线观看 | 亚洲入口无毒网址你懂的| 99久久国产宗和精品1上映| 狠色狠色狠狠色综合久久| 好男人好资源在线影视官网| 啊轻点灬大ji巴太粗太长了欧美| 主播福利在线观看| 草草影院私人免费入口| 日本免费a视频| 国产ts人妖视频| www320999com| 男女一边摸一边做爽爽| 女人是男人未来1分50秒|