“創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,步伐更快”(經(jīng)濟新方位·支持民營經(jīng)濟發(fā)展)
企業(yè)是科技創(chuàng)新的主體。習近平總書記強調(diào):“有能力、有條件的民營企業(yè)要加強自主創(chuàng)新,在推進科技自立自強和科技成果轉(zhuǎn)化中發(fā)揮更大作用?!?/p>
越來越多的民營企業(yè)創(chuàng)新步伐不斷加快,成為推動經(jīng)濟高質(zhì)量發(fā)展的重要力量。在安徽合肥,記者走進國家智能語音創(chuàng)新中心。這是工業(yè)和信息化部2021年批復(fù)組建的4家國家制造業(yè)創(chuàng)新中心之一,由科大訊飛牽頭,依托合肥智能語音創(chuàng)新發(fā)展有限公司,國內(nèi)10多家智能語音企業(yè)和科研院所聯(lián)手組建而成。中心與企業(yè)聯(lián)動,充分發(fā)揮科技創(chuàng)新驅(qū)動作用,不斷促進創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,為生產(chǎn)生活帶來更多想象空間。
助生產(chǎn)提質(zhì)增效——
“智能耳朵”將質(zhì)檢效率提高2/3
浙江捷昌線性驅(qū)動科技股份有限公司主營電機生產(chǎn)?!霸趥鹘y(tǒng)工業(yè)場景中,電機設(shè)備一旦出現(xiàn)故障,發(fā)出異常聲音,通常都是經(jīng)驗豐富的老師傅用耳朵聽,來判斷故障點?!惫拘虏a(chǎn)基地生產(chǎn)總監(jiān)張巍峰介紹:“我們實現(xiàn)了電機在流水線組裝完成后,通過聲紋質(zhì)檢系統(tǒng)檢測采集產(chǎn)品運轉(zhuǎn)數(shù)據(jù)?!?/p>
一款系統(tǒng),如何通過聲音識別產(chǎn)品質(zhì)量?
靜音房中,電機運轉(zhuǎn),嗡嗡聲響接連不斷;顯示屏上,聲紋起伏,數(shù)據(jù)被采集捕捉;存在故障,通過數(shù)據(jù)分析,維修點位隨即可以確定。一直以來,張巍峰都在琢磨怎樣通過機器“聽音”提高質(zhì)檢效率,“自個兒摸索兩三年,沒有取得一點進展”。
機緣巧合,一次技術(shù)推介會上,得知國家智能語音創(chuàng)新中心正在開展工業(yè)聲學(xué)方向的研究,張巍峰當即尋求合作:“我們有需求,他們懂技術(shù),優(yōu)勢互補,說不定能研發(fā)出來。”
研發(fā)初期,中心委派的聲紋分析工程師入廠調(diào)研,收集樣本;質(zhì)檢工人現(xiàn)場聽音,記錄特征。6個多月時間,采集近5萬條數(shù)據(jù),算法選型、深度學(xué)習、參數(shù)調(diào)節(jié),經(jīng)過與人工聽音多輪比拼試驗,工業(yè)聲紋質(zhì)檢系統(tǒng)初步建成。
國家智能語音創(chuàng)新中心總經(jīng)理吳江照介紹,利用工業(yè)聲學(xué)技術(shù)開展設(shè)備質(zhì)檢,除了民營企業(yè)自主創(chuàng)新,還離不開科研院所的大力支持?!鞍l(fā)聲位置、距離遠近都會對收音造成影響,為了解決工業(yè)領(lǐng)域的麥克風陣列分布問題,我們和西北工業(yè)大學(xué)科研團隊開展交流,共同探討技術(shù)方案。”吳江照說。
如今,這款“智能耳朵”已在產(chǎn)線投用,質(zhì)檢識別準確率達到95%?!耙淮温?lián)合研發(fā),僅一條產(chǎn)線每年就能為我們節(jié)省成本近15萬元!”張巍峰算了筆賬,過去人工聽音,易因疲勞而失準,現(xiàn)在使用工業(yè)聲紋質(zhì)檢系統(tǒng),不僅效率提高2/3,還增強了一致性。曾經(jīng)難以分辨的齒輪或換向器故障點,通過聲紋數(shù)據(jù)分析,有了改進方向。
讓生活智慧便捷——
“全屋智控”識別用戶指令更精準精確
一進門,燈光自動點亮,空調(diào)自行開啟;一句語音指令,舒緩的音樂在耳邊響起,陽臺上的晾衣架開始升降;廚房里,感應(yīng)裝置監(jiān)測到煤氣泄漏,既能報警,還會開窗……走進合肥榮事達電子電器集團智能全屋體驗生活館,研發(fā)中心技術(shù)人員孫杰指向巴掌大小的控制面板:“能集中控制空調(diào)、音箱、窗簾等,啟動各種智能情景?!?/p>
一塊屏幕,如何實現(xiàn)“全屋智控”?
從傳統(tǒng)的按鍵控制到智能的語音交互,為實現(xiàn)多款產(chǎn)品集成,孫杰帶領(lǐng)團隊與國家智能語音創(chuàng)新中心一道攻關(guān),花了約一年時間。
首先要解決的,是用戶反映最多的“免喚醒”功能。孫杰介紹,喚醒詞是為了激活設(shè)備進入運行狀態(tài),一般來說,喚醒詞說出后,若能立刻給出反應(yīng),有利于提升用戶體驗??扇绻看问褂弥悄茉O(shè)備都需要喚醒詞,也會造成交互冗余,增添麻煩。
為此,企業(yè)結(jié)合市場調(diào)研,分析常用指令,中心則利用聲學(xué)技術(shù),提供算法支持。通過具有AI(人工智能)交互能力的語音芯片加持,這款控制面板可以實現(xiàn)一分鐘內(nèi)“一次喚醒,多輪交互”。
“誤操作”是橫在面前的另一道難題?!熬蛹疑顣r,經(jīng)常出現(xiàn)閑聊觸發(fā)關(guān)鍵詞、設(shè)備作出響應(yīng)的情況,尤其是在開發(fā)‘免喚醒’功能后?!敝行腁I語音芯片部研發(fā)總監(jiān)周正友介紹。
是否可以通過識別聲音、判斷方向,進而給出正確回應(yīng)?為了解決這個難題,周正友和同事們根據(jù)波速強度,算法分析音頻,經(jīng)過多次試驗,系統(tǒng)識別準確度大幅提升。
眼下,除了智能家居,這款具有語音交互功能的面板產(chǎn)品還被應(yīng)用到其他領(lǐng)域?!搬t(yī)院、養(yǎng)老院、辦公室等商用客戶也很感興趣!”孫杰表示,企業(yè)與中心聯(lián)合攻關(guān),既增強了創(chuàng)新能力,還開拓了應(yīng)用市場。
為創(chuàng)新提供支撐——
AR字幕眼鏡帶來“看得見的聲音”
耳邊,交流聲音不斷,眼前,文字逐句呈現(xiàn)。這讓弱聽患者劉爍感覺不錯:“跟看劇一樣!戴上眼鏡,聲音就能轉(zhuǎn)化成文字顯示在眼前,還可以調(diào)節(jié)字體大小、背景顏色,絲毫不影響視線?!?/p>
這款A(yù)R(增強現(xiàn)實)字幕眼鏡,由北京亮亮視野科技有限公司與國家智能語音創(chuàng)新中心聯(lián)合研發(fā),具備實時轉(zhuǎn)寫、語音翻譯等功能,已為5000多名弱聽患者帶來“看得見的聲音”。
面向市場需求,兼具技術(shù)基礎(chǔ),新品研發(fā)按說應(yīng)該很順利。令亮亮視野系統(tǒng)研發(fā)部總監(jiān)趙偉沒想到的是,技術(shù)遷移并不簡單?!拔覀兿氲氖前蜒坨R和聲學(xué)技術(shù)相結(jié)合,增強用戶體驗,可眼鏡收集聲音后,難以依托眼鏡本體算力進行轉(zhuǎn)寫?!壁w偉思來想去,決定“上云”一試。
這朵“云”,是國家智能語音創(chuàng)新中心構(gòu)建的端云一體語音云平臺,為金融、醫(yī)療、智能交通等領(lǐng)域企業(yè)提供技術(shù)服務(wù),助力企業(yè)高效穩(wěn)定運營,日交互量達20億次。
近半年時間里,趙偉在合肥、北京兩地奔走,從拾音降噪到接入“云端”,企業(yè)、中心協(xié)同創(chuàng)新。如何精準識別人聲?科研人員調(diào)節(jié)上千次麥克風陣列組合,確定聲音增益最佳范圍。怎樣確保轉(zhuǎn)寫迅速穩(wěn)定?技術(shù)人員將數(shù)據(jù)接入云平臺,提供響應(yīng)及時的算力支撐。
“簡化操作步驟、調(diào)節(jié)字幕位置,產(chǎn)品去年研發(fā)成功以來,軟件前后更新了三四個版本?,F(xiàn)在,我們正在和中心討論,如何增加語音控制開關(guān)功能,讓用戶操作更加便捷?!壁w偉說。
近年來,為支持智能語音產(chǎn)業(yè)發(fā)展,工信部批復(fù)組建國家智能語音創(chuàng)新中心,給予專項支持;2021年,安徽省印發(fā)《支持中國聲谷創(chuàng)新發(fā)展若干政策》,鼓勵人工智能及智能語音產(chǎn)業(yè)發(fā)展和推廣應(yīng)用,引導(dǎo)企業(yè)協(xié)同創(chuàng)新發(fā)展。“政府有政策,企業(yè)有場景、有需求,中心有技術(shù)、有實力。依托這樣的創(chuàng)新合作形式,可以更有效實現(xiàn)資源聯(lián)動。創(chuàng)新鏈產(chǎn)業(yè)鏈深度融合,步伐更快?!眳墙照f。
本期統(tǒng)籌:呂 莉
版權(quán)聲明:凡注明“來源:中國西藏網(wǎng)”或“中國西藏網(wǎng)文”的所有作品,版權(quán)歸高原(北京)文化傳播有限公司。任何媒體轉(zhuǎn)載、摘編、引用,須注明來源中國西藏網(wǎng)和署著作者名,否則將追究相關(guān)法律責任。