訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
智慧語音辨識AI市場即將井噴,關鍵“芯元素”成引爆點
獲取產業訊息零時差!立即訂閱電電公會電子報。
與去年阿法狗(AlphaGo)輕鬆擊敗李世石後人們紛紛驚歎人類被機器人超越不同的是,前不久全球排位第一的柯潔再次完敗於人工智慧(AI)的機器人後,人們明顯已經逐漸接受了人工智慧在很多領域超越人類的事實,更多地從理性角度探討以人工智慧為基礎的科技對人類社會的改變機遇。據今日頭條首份人工智慧影響力報告表明,中國國民AI信心指數高達83,中國消費者對人工智慧的態度變得十分積極。

“事實上,人工智慧正在逐漸走入我們生活,尤其作為人工智慧非常重要的語音智慧識別的研究上,世界範圍內已經做出了非常成功的創新應用,而中國同樣也走在了前列。”以電源和模擬半導體技術領先的深圳芯智匯科技有限公司(X-Powers Technology)產品經理徐正弟近日對媒體表示。由於非常看好基於語音的人工智慧技術的應用,芯智匯科技近日在中國率先發佈了專門針對人工智慧熱門應用的語音辨識多陣列麥克風前端ADC晶片AC108。“作為智慧語音應用中非常關鍵的入口信號拾取的AC108推出,我們期待以突破性的SNR(信噪比,108dB)性能和更優化的設計助推企業在人工智慧應用領域搶佔市場先機。”徐正弟指出。
 
消費者正習慣語音交互,Smart Home是首個突破口
最新發佈的《2017年互聯網趨勢報告》指出,在使用Google Assistant(穀歌語音助手)的智慧手機用戶中,2016年5月僅20%的移動查詢通過語音方式完成,而至2017年5月已有近7成的詢問是通過自然/交談語言進行的。僅僅一年時間已經發生巨大改變,多數消費者的移動查詢習慣已開始偏向智慧語音交互。
 
“智慧語音首先會在垂直市場落地,在交互相對單一、場景相對固定,且用戶有剛需的應用場景中,比如家電控制、車載電子就有大量的發展機會。”徐正弟在接受採訪時介紹道。這類場景的需求相對簡單,最需要的是一系列命令詞的識別,技術相對容易實現。與此同時,在自動駕駛成熟之前,車內駕駛者都無法釋放出雙手,因此車內語音控制也是剛需。就目前而言,智慧家居的語音控制顯然走得更前些,很明顯的例子就是Amazon Echo的風靡!
 
2016年下半年,Amazon將Echo Dot的售價從99美元下降到49美元,這意味著未來一年Echo相關產品的出貨量將大幅度提升。與此同時,上游供應鏈透露的消息稱,2017年Amazon已將智慧音箱的訂單量增加至1,000萬台,為2016年的三倍!在這場智慧音箱的競賽中,Amazon、Google和Apple等全球領導企業正在推動越來越多的互聯網公司發佈類似的智慧音箱產品,其中也不乏中國企業加入競逐,如京東智慧的叮咚系列,這也為上下游各環節的供應商帶來了巨大的機會。

信號拾取前端處理很關鍵,108dB SNR解決遠場語音設計最大挑戰
事實上,像智慧手機上Siri、Google Assistant這樣近距離的智慧語音應用已經相對成熟(因為更偏向演算法),“而目前最主要的智慧語音應用通常交互距離在3~5米,更遠距離或者環境更嘈雜的遠場智慧語音信號處理是Smart Home應用的關鍵,這是AC108推出的主要目標市場。”徐正弟表示,“這些應用需要多陣列麥克風,必須解決多通道語音採集、高信噪比(SNR)以及低複雜度設計要求。”

智慧語音應用的實現需要三個環節:首先是拾取——將自然的語音信號轉化為數位信號;緊接是前處理——對採集到的語音信號進行降噪、消回聲、去混響等處理,形成“乾淨”的音訊信號;最後是本地或雲端的語音辨識引擎對“乾淨”的語音信號進行識別和語義分析,從而實現智慧回饋。顯然,在完成演算法層面的語音辨識之前需要進行遠距離拾音,首當其衝必須使用麥克風陣列,配套語音前處理演算法,如NS、AEC、De-reverb等,才能實現自然語言人機交互。

在整套智慧語音系統中,前端語音採集和處理,對語音辨識高準確率起到了決定性作用。從硬體元器件的層面分析,前端語音ADC晶片的性能表現是關鍵因素!一般而言,決定ADC晶片性能優劣的其中一個重要參數是信噪比SNR,它表徵了最大不失真聲音信號、即主觀上認為的有用信號強度與噪音強度之間的比率,信噪比SNR越高,噪音越小,晶片性能表現越好。

分析市場上幾款主流智慧音箱產品的相關報告可以發現其前端語音ADC晶片SNR為98dB、101dB,而AC108宣稱的108dB是目前業內同類產品中達到最高信噪比的ADC晶片。“AC108型號名稱凸顯了其性能優勢——‘Audio Codec 108dB(SNR)’,108dB是目前滿足麥克風陣列應用的最高性能。同時AC108嚴格按照家電級標準進行設計、生產、測試,從而保證良好品質要求。”徐正弟介紹道。
 
全生態產業鏈已經成熟,市場引爆在即
毫無疑問,語音智慧應用正在飛速發展。“從我們與中國外企業接觸來看,這個市場目前正面臨一波井噴的大發展機遇,目前包括格力、美的、海爾、長虹等主要的家電企業已經密集佈局智慧語音控制產品,從空調、冰箱、彩電,甚至到小家電都有相關產品佈局,部分產品已經推出市場。”徐正弟指出,“特別是隨著包括成本、方案成熟度、設計複雜度的改變,市場爆發性增長指日可待。”

據徐正弟的分析,在空調等大件家電應用中,目前語音辨識方案增加的成本約占整體成本的5%~10%,成本壓力還是比較大。“這部分成本存在很大的壓縮空間,芯智匯科技與中國語音辨識產業鏈的合作廠商正在快速促進低成本、高性能的解決方案。”徐正弟進一步解釋道:“目前多數智慧語音應用的SoC一般保留標準的I2S介面,傳統上支援多路ADC輸入的做法是採用FPGA或MCU實現通道變換而AC108在設計中即考慮了該因素,通過將多路語音信號通過升取樣速率的方式,實現了標準的I2S支援多路音訊資料傳輸,使得方案中可以節省FPGA或MCU,大大降低方案設計成本和複雜度。”此外,與部分方案需要採用多片ADC支援麥克風陣列不同,基於AC108級聯兩顆晶片(最多可四片級聯)即可實現多陣列麥克風方案。
 
這種定制化的優化解決方案在大大降低成本的同時,還能加快廠商的產品上市進度,而這對於快速發展的消費市場來說尤為關鍵。據瞭解,目前芯智匯AC108已向潛在客戶提供EVM Board和使用友好的配套PC工具,方便工程師快速對ADC進行選型評估。“我們還提供專業詳細的指導文檔和參考驅動,以及保姆式的服務,説明客戶快速完成設計開發,加速產品上市。”徐正弟介紹道。高性能類比信號處理通常是工程師的噩夢,對於消費電子市場為主的智慧語音辨識應用來說,這樣的“保姆式”技術服務對實現產品高性能和快速上市非常重要。

無論ADC還是SoC,都只是語音辨識生態鏈中的一環,整個生態鏈的成熟發展至關重要。目前麥克風陣列演算法、配套語音前處理演算法、雲端語義平臺等已經發展成熟。“業內的大量研發工作還在快速提升語音辨識效果,包括大量AI訓練下的多語種支持,快速可複製量產多環節配合,等等。AC108的推出再次彌補了針對麥克風陣列的高性能ADC的短板,我們已經與中國主要的平臺方案商合作,並與亞馬遜Alexa等國際平臺合作,這些產業鏈的良好互動正在助推智慧語音辨識爆發性增長,預期一年內將看到越來越多的相關產品上市。”徐正弟樂觀地指出。
訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。