2013年8月22日百度世界大會上,百度宣布語音識別技術(shù)及能力全面開放。此舉為開發(fā)者提供了多層次的語音接口,將催生這一領(lǐng)域的蓬勃發(fā)展。在百度的引領(lǐng)下,圍繞語音識別的全新體系和大數(shù)據(jù)生態(tài)將在不久的未來初露崢嶸。
過去的一年時間里,語音交互類應用并未像觸控、手勢識別等一樣得到廣泛的普及和應用,根本的原因有兩個:一是語音識別準確率有待提升,尤其是技術(shù)對不同語言的支持,存在較大的差別;二是語音識別技術(shù)門檻較高,有一定的授權(quán)費用,阻礙了技術(shù)在應用端的落地。種種難題使得國內(nèi)開發(fā)者在語音識別領(lǐng)域步履維艱,只有百度、騰訊等巨頭互聯(lián)網(wǎng)公司在相關(guān)的研發(fā)方面有所建樹。
近一年來,百度在語音識別領(lǐng)域不斷取得突破性進展,早已確立了其行業(yè)領(lǐng)先的地位,2013年百度世界大會上語音識別技術(shù)及能力的開放,更是實現(xiàn)了百度從“行業(yè)領(lǐng)跑者”到“生態(tài)構(gòu)建者”的轉(zhuǎn)型。
突破語音識別的瓶頸
百度云語音技術(shù)負責人賈磊在百度世界大會上表示,百度語音識別技術(shù)、引擎在識別準確率上獲得了突破性進展,運用深度神經(jīng)網(wǎng)絡(DNN:Deep Neural Network)技術(shù)和自然語言處理技術(shù)NLP,使語音技術(shù)準確率提升了25%,用戶體驗得到大幅度優(yōu)化。除了降低了錯誤率,百度語音助手在速度上也有大幅提升。不考慮網(wǎng)絡環(huán)境,識別和響應速度提高了30%。
百度語音助手團隊獲得2013年百度Summer Party最高獎
目前,DNN技術(shù)已成為新一代語音識別的“主導者”。正因為這一點,百度語音助手開發(fā)團隊在今年的百度最高獎角逐中脫穎而出,打破了該獎項始終被商業(yè)營銷產(chǎn)品“壟斷”的慣例。
三個層次,全面開放
與同類語音識別技術(shù)以授權(quán)費方式獲取收入的傳統(tǒng)方式不同,百度將面向開發(fā)者無條件開放整個語音生態(tài)系統(tǒng)。
而語音生態(tài)系統(tǒng)的開放包括三個層次,一是最底層的語音識別技術(shù)API的開放,囊括了合成技術(shù)、理解技術(shù)、認證技術(shù)、指紋技術(shù)等,開發(fā)者可以調(diào)用API接口實現(xiàn)語音識別功能;二是百度語音助手SDK,提供開發(fā)工具包,實際上是對語音識別標準化服務進行封裝,識別結(jié)果做關(guān)鍵詞抽取,搜索結(jié)果進行結(jié)構(gòu)化數(shù)據(jù)返回,最終對接服務和應用。這一點是對應用開發(fā)者最具誘惑力的;第三點則是面向能力弱的開發(fā)者,百度語音助手直接安裝在硬件上即可。
底層語音識別API,只有實力強的開發(fā)者具備。相比,第二層所釋放的能量會更大,因為涵蓋的范圍更廣泛,周邊信息分類查詢和導航功能,公交路線查詢和導航,到站提醒、自動報站、盲人步行路線自定義、管理和導航,以及外部的旅游、餐飲、購物等幾乎能想象到的場景,都可以封裝成模塊、組件,讓開發(fā)者輕松調(diào)取,百度語音技術(shù)開放的原則,也從一個技術(shù)、工具真正過渡到包羅萬象的語音識別應用生態(tài),未來會接入更多的第三方應用,實現(xiàn)能夠容納從衣食住行到人的生活方方面面真正的助手。
輸入您的電話號碼,點擊通話,稍后您將接到我們的電話,該通話對您 完全免費 ,請放心接聽!
恭喜您!
抽到 競網(wǎng)建站
發(fā)出的紅包