2013年8月22日百度世界大會上,百度宣布語音識別技術及能力全面開放。此舉為開發者提供了多層次的語音接口,將催生這一領域的蓬勃發展。在百度的引領下,圍繞語音識別的全新體系和大數據生態將在不久的未來初露崢嶸。
過去的一年時間里,語音交互類應用并未像觸控、手勢識別等一樣得到廣泛的普及和應用,根本的原因有兩個:一是語音識別準確率有待提升,尤其是技術對不同語言的支持,存在較大的差別;二是語音識別技術門檻較高,有一定的授權費用,阻礙了技術在應用端的落地。種種難題使得國內開發者在語音識別領域步履維艱,只有百度、騰訊等巨頭互聯網公司在相關的研發方面有所建樹。
近一年來,百度在語音識別領域不斷取得突破性進展,早已確立了其行業領先的地位,2013年百度世界大會上語音識別技術及能力的開放,更是實現了百度從“行業領跑者”到“生態構建者”的轉型。
突破語音識別的瓶頸
百度云語音技術負責人賈磊在百度世界大會上表示,百度語音識別技術、引擎在識別準確率上獲得了突破性進展,運用深度神經網絡(DNN:Deep Neural Network)技術和自然語言處理技術NLP,使語音技術準確率提升了25%,用戶體驗得到大幅度優化。除了降低了錯誤率,百度語音助手在速度上也有大幅提升。不考慮網絡環境,識別和響應速度提高了30%。
百度語音助手團隊獲得2013年百度Summer Party最高獎
目前,DNN技術已成為新一代語音識別的“主導者”。正因為這一點,百度語音助手開發團隊在今年的百度最高獎角逐中脫穎而出,打破了該獎項始終被商業營銷產品“壟斷”的慣例。
三個層次,全面開放
與同類語音識別技術以授權費方式獲取收入的傳統方式不同,百度將面向開發者無條件開放整個語音生態系統。
而語音生態系統的開放包括三個層次,一是最底層的語音識別技術API的開放,囊括了合成技術、理解技術、認證技術、指紋技術等,開發者可以調用API接口實現語音識別功能;二是百度語音助手SDK,提供開發工具包,實際上是對語音識別標準化服務進行封裝,識別結果做關鍵詞抽取,搜索結果進行結構化數據返回,最終對接服務和應用。這一點是對應用開發者最具誘惑力的;第三點則是面向能力弱的開發者,百度語音助手直接安裝在硬件上即可。
底層語音識別API,只有實力強的開發者具備。相比,第二層所釋放的能量會更大,因為涵蓋的范圍更廣泛,周邊信息分類查詢和導航功能,公交路線查詢和導航,到站提醒、自動報站、盲人步行路線自定義、管理和導航,以及外部的旅游、餐飲、購物等幾乎能想象到的場景,都可以封裝成模塊、組件,讓開發者輕松調取,百度語音技術開放的原則,也從一個技術、工具真正過渡到包羅萬象的語音識別應用生態,未來會接入更多的第三方應用,實現能夠容納從衣食住行到人的生活方方面面真正的助手。
自流量競爭升級到平臺競爭開始,小程序也成為互聯網巨頭戰略布局的重點。在此背景下,各具特色的小程序開始出現。11月25日,百度披露智能小程序月活..
網站作為企業在互聯網上最直觀的展示名片,已經被越來越多的企業接受和推廣。就連眾多傳統企業、政府機關、事業單位等,也一并被時代的浪潮沖到了線..
隨著智能手機、ipad等智能移動設備的普及,推動了網站風格樣式的更新迭代。為解決PC端和移動端不同訪客的用戶體驗問題,眾多的建站產品供應商分別提..
輸入您的電話號碼,點擊通話,稍后您將接到我們的電話,該通話對您 完全免費 ,請放心接聽!
恭喜您!
抽到 競網建站
發出的紅包