首頁>國企·民企>深·觀察深·觀察

識別精確度超過95% 智能語音技術(shù)讓生活更簡單

2017年12月13日 11:13 | 來源:新華網(wǎng)
分享到: 

新華社北京12月11日電  題:識別精確度超過95% 智能語音技術(shù)讓生活更簡單

新華社記者胡喆

多部門合力打造國家級專家?guī)?百度、阿里云、騰訊、科大訊飛等分別啟動建設(shè)“自動駕駛、城市大腦、醫(yī)療影像、智能語音”4家國家新一代人工智能開放創(chuàng)新平臺……近日,隨著我國新一代人工智能發(fā)展規(guī)劃暨重大科技項目的啟動實施,我國在人工智能領(lǐng)域頻頻發(fā)力、引發(fā)社會高度關(guān)注。

作為在這四大領(lǐng)域當(dāng)中走在前列的一隅,我國的智能語音識別技術(shù)有何“長處”?識別精確度超過95%的智能語音新技術(shù)又將怎樣改變生活?

從60.2%提升到95%以上:語音識別已經(jīng)“準(zhǔn)出新高度”

連珠的妙語、閃爍的字幕……科大訊飛董事長劉慶峰在一次演講中,向人們展示了智能語音識別技術(shù)和其應(yīng)用所具備的“魔力”。劉慶峰在演講的同時使用著最新的智能語音識別技術(shù)——可以讓他演講的內(nèi)容實時以中英文雙字幕的形式呈現(xiàn)在大屏幕上,反應(yīng)迅速、幾乎沒錯。

“基于‘訊飛超腦計劃’,科大訊飛開啟了一場以語音和語言為入口的‘認(rèn)知革命’?!眲c峰介紹,過去6年中,他們的語音識別技術(shù)準(zhǔn)確率從60.2%提升到95%以上,已全球領(lǐng)先。

6年前,科大訊飛推出了全球首個語音云開放平臺。目前,該平臺的日處理次數(shù)達(dá)到40億次?!霸谡Z音合成方面,中國已是國際上的領(lǐng)先者?!笨拼笥嶏w副總裁胡郁介紹。

劉慶峰認(rèn)為,人工智能面臨前所未有發(fā)展機遇,科大訊飛如果只做技術(shù)提供方,會處于一個相對被動和弱勢的地位,所以提出了“平臺+賽道”發(fā)展路徑,將人工智能技術(shù)賦能給廣大開發(fā)者,加快推廣應(yīng)用。

導(dǎo)航、醫(yī)療、公檢法:多的是你不知道的“智能語音”

“我是羅永浩,你鎮(zhèn)定一下,我要開始導(dǎo)航了?!边@是高德地圖羅永浩版本的導(dǎo)航聲音片段。高德地圖2014年首次使用語音合成技術(shù)實現(xiàn)明星導(dǎo)航,林志玲語音上線即引發(fā)轟動。隨后,先后推出羅永浩等明星導(dǎo)航音。

近年來,隨著人工智能熱潮的襲來,以智能語音為代表的各類應(yīng)用也層出不窮。如QQ閱讀調(diào)用訊飛語音合成技術(shù)推出有聲聽書;蝦米音樂使用訊飛語音識別技術(shù),推出哼唱檢索……

科大訊飛通過與公檢法系統(tǒng)開展創(chuàng)新合作,使智能語音技術(shù)不斷拓展著應(yīng)用的新疆域。2016年在安徽開展的測試顯示,人工智能判斷詐騙電話的準(zhǔn)確率極高;人工智能還充當(dāng)起法庭書記員,經(jīng)測試,智能語音識別參與庭審取得實際效果,庭審時長縮短30%。

在中部某省立醫(yī)院門診大廳,兩臺機器人格外吸引人?!澳?我是導(dǎo)診機器人‘曉醫(yī)’,很高興為您服務(wù)。關(guān)于科室位置在哪,去哪個科室,還有就診遇到的問題,這些都可以問我哦?!笔煜?19個常見病和癥狀對應(yīng)的科室信息,“曉醫(yī)”可通過智能語音識別技術(shù),每天服務(wù)近5000次。

“人工智能的關(guān)鍵是把復(fù)雜的世界簡單化?!卑俣裙径麻L兼首席執(zhí)行官李彥宏表示,未來30年至50年,人工智能將成為推動人類歷史進步的強大動力。

讓未來充滿“意想不到”:人工智能會否成“脫韁野馬”?

按照業(yè)內(nèi)人士的預(yù)估,未來不僅在我們已知的領(lǐng)域,在一些未知領(lǐng)域,“智能語音”技術(shù)也會帶給人們許多“意想不到”的突破。

人工智能在“改卷子”方面的能力,就超乎了人們的想象。在江蘇省的高考智能閱卷驗證中,兩個不同的人工智能語文作文閱卷分差小于7分,一致率達(dá)92.82%,比兩位老師的閱卷評分的一致率高出5%以上;在湖南省研究生考試的智能閱卷驗證中,兩個不同的人工智能分別對英語作文進行閱卷評分,分差小于6分的一致率竟高達(dá)99.83%,比兩位老師的閱卷評分一致率高出了4%以上。

據(jù)悉,教育部考試中心正聯(lián)合科大訊飛建設(shè)人工智能聯(lián)合實驗室,在教育領(lǐng)域醞釀著更多“黑科技”的誕生。

自平臺開放以來,科大訊飛基于這一平臺的各類開發(fā)者數(shù)量由去年同期的20.2萬增至45萬,增長123%,語音云日均使用次數(shù)由25.7億次增至超過40億次。開發(fā)者們在平臺將語音技術(shù)快速集成到產(chǎn)品中,讓產(chǎn)品具備“能聽會說會思考會預(yù)測”的功能。

專家指出,一方面要構(gòu)建開放協(xié)同的人工智能科技創(chuàng)新體系,加強關(guān)鍵共性技術(shù)攻堅,增加人工智能創(chuàng)新的源頭供給。另一方面,要培育高端高效的智能經(jīng)濟,圍繞教育、醫(yī)療、養(yǎng)老等民生需求和熱點難點,加快創(chuàng)新應(yīng)用,促進人工智能與各產(chǎn)業(yè)領(lǐng)域深度融合,積極培育新興業(yè)態(tài),布局產(chǎn)業(yè)鏈高端,全面提升質(zhì)量和效益。

編輯:劉小源

關(guān)鍵詞:語音 技術(shù) 識別

更多

更多