訂閱電子報∣ 友善列印字體大小 文章分享-Facebook 文章分享-Plurk 文章分享-Twitter
讓人與電腦都輕鬆聽分明!洞見未來打造多人聲分離引擎解決聽力難題
數位時代James Huan
獲取產業訊息零時差!立即訂閱電電公會電子報。
重度聽損的陳柏儒,克服萬難習得訊號處理與演算法的技能,邀請法律背景的哥哥陳宥任,以獨有的多人人聲分離引擎,趁助聽器法案開放,提供具輔聽功能的解決方案。

先天性的雙耳重度聽力障礙,在新生兒發生率約千分之一,如果加上中度、輕度或單耳聽力受損,發生率更高達三倍。現代科技的發達,對於聽力障礙這樣如此常見的人類難題並非完全束手無策,然而能夠在嬰幼兒時期早期發現並不容易。

患有先天性雙耳重度聽障的陳柏儒,首次被確認有聽力障礙已經四歲;早已錯過目前已知關於嬰幼兒聽力和語言發展的黃金時段。人類的聽覺中樞,是在出生後一段時期,不斷受環境聲音刺激,才得以發展完成。當先天失去聽力,大腦中原先準備用於聽與說的功能失去了刺激,孩子在學習聽語就發生困難。

「我們擁有聽力,因此對你我學習來說,有聽就容易說得精準。」大他三歲的哥哥陳宥任回憶,在小學時期,父母親為了讓柏儒跟上學習進度,每天下課回家,從傍晚到晚上都還得為他複習學校教的課程,才勉強可以追上同儕的能力。「你大概可以想像需要花10倍以上的功夫,透過助聽器與讀唇的幫忙,才有機會完全讓他學會幾個ㄅㄆㄇㄈ。」

發音、語言都不容易,很容易讓陳柏儒感到氣餒。「我和同學一點都不一樣,每天得像是帶著耳機一樣,一直帶著助聽器。」回到陳柏儒 9 歲那年,一次在保姆家對著助聽器生氣的場景令他印象深刻。「助聽器就像一個可以幫你放大幾百倍聲音的耳機,不止什麼聲音都等倍放大,要用的時候還可能會沒電,讓人聽不清楚,或甚至聽不到。」無法在重要時刻隨時有效接收外界資訊的盲點,讓急性子的陳柏儒常常對這個連結一個透明管、帶著電池與耳膜的器材大發雷霆。

柏儒回想當初自己未成年的時期,重要場合助聽器卻無效,曾很多次將昂貴的助聽器摔在地上。「那時我根本不知道助聽器一副要這麼貴。」陳柏儒說,就和一般擁有喇叭的裝置,每過幾年就可能訊號衰弱、電池或結構老化導致無法使用一樣,許多聽力障礙的朋友每過幾年就需要換購一副價格並不便宜的助聽器,甚至為了許多用途或擔心緊急狀態沒電而不只擁有一套。

就算擁有助聽器,成長的過程也不是沒有障礙,一路陪著柏儒克服各種挑戰的哥哥宥任,最瞭解其中的苦痛。「我們一般聽力正常的人在路上聽到車輛按喇叭、救護車鳴笛,很容易判斷聲音的來處。」陳宥任說,「可是柏儒走在路上或是開車的時候聽到聲音卻要四面八方尋找可能的發聲位置,時常難以快速反應。」同樣的狀況也發生在一般的生活場景,當多人快速交談,有超過一個人以上講話時間與速度重疊,聽力損傷者就很難辨識正在說話的人,更別提將注意力集中在內容本身。

「更困難的是外語」陳宥任說,「學習主要語言就已經要花比別人還長的時間,透過唇型與發音同步學習外語對重度聽障來說更是難上加難。」已經攀爬渡過最困難時期的陳柏儒笑著生動地描述失去聽力的真實感受「所以你知道我要聽說讀寫有多困難!當聽不到、聽不清楚、沒電了,我一方面憤怒、一方面又沮喪。」他接著說「好像一切都靜止了,或是每天只有有限時間,我就只能在這有聽力的時間裡學習,超過了就必須停止,不能和世界交流、不能知道更多事。」

「這是我們為什麼有機會做洞見未來!」自身的經驗讓陳柏儒對聽覺障礙的不便有著滿滿希望突破的熱情。因為自學寫程式做影片特效,接觸了程式語言的他希望能夠幫助更多和他一樣經歷的伙伴。「我知道一般聽損者購買選擇助聽器的困難,就好比選電腦,有太多的場景、需求需要被滿足,產品本身也有被改進的空間。」陳柏儒說。

發展了數十年的助聽器領域,其實也不是沒有進展、沒有大廠投入。事實上,全球聽損患者所需要的助聽器,大致上由數家長久以來持續耕耘的廠家所瓜分;近十年來,隨著半導體越做越小,消費型電子普及的進步也影響了這個領域,「現在的助聽器已經比過去好,持久力也更強。」一位熟悉助聽器通路市場,但不願意具名的資深銷售人員說明。因為已經不是單純、隨時放大聲音,加上機構設計、電池技術提升與處理晶片計算速度更快、更省電,讓助聽器領域已經有長足的進步,「現在一般電池在非長期戶外、特殊環境下,都有機會用超過幾天,還有廠商專注在藍芽傳輸功能,讓你可以用智慧手機、電腦與外界溝通。」這位人士表示:「當然很多款外型也越來越帥,看起來就像是帶了很酷的耳機,不再讓患者有帶著助聽器被特別注視的感覺。」

看準美國在 2017 年通過關於助聽器分類的OTC助聽器法案,要求美國食品與藥品管理署(Food and Drug Administration, FDA)放寬對助聽器的要求,建立非處方簽的助聽器類別,同時要保障安全、規範生產製造要求,讓一般人可以在沒有記名處方簽的情況透過線上或郵件購買的方法。陳柏儒認為切入提供新型解決方案的時機恰到好處。於是邀請本來投入法律專業的哥哥陳宥任,兄弟倆攜手打造洞見未來。

洞見未來選擇以「多人聲分離引擎」演算法作為研發重點,可以從混雜的聲音中抽取出人聲,讓人及機器都可以在多人交談、吵雜的情況下精確地捕捉到人聲。他們將演算模型,推出了自家低功耗、小體積的電子訊號處理器晶片,在人多嘈雜的情境中亦能在 10 毫秒內分離出一個最主要的人聲,讓聽障者能專注地接收特定聲音。

「10 毫秒這個數據與助聽器相關規範有關,規定要求助聽器之延時不得超過10~20毫秒。」陳宥任說,助聽器延遲時間若超過 10 毫秒,使用者就會感受到聲音延遲,容易產生頭暈不適等情況。他們並非市面上唯一能將助聽器聲音延遲控在 10 毫秒的團隊,但要同時做到低延時、低功耗就並不容易。「對聽障者而言,助聽器是除了睡覺外都要戴著的必需品,因此產品續航力相當重要。」陳柏儒解釋,洞見助聽器待機時的功耗是 0.5 毫安培,依照產品的理想設計,在功能全開的 3 毫安培下,產品續航力還能撐到 15 小時以上。

「我們的晶片原型是為助聽器而生,不過推出後也有耳機廠商找上我們。」陳柏儒指出,一般無線耳機為講求方便性,通常都會犧牲音質,因此現在有耳機品牌商直接將洞見的技術用於「通話降噪」及「延長續航力」;至於多人聲分離引擎,除了用於幫助聽障者外,未來也可能用在協助分離多人討論音軌,結合語音轉文字(Speech to Text, STT)的技術提供自動繕寫會議記錄等特殊用途。「我們希望可以透過技術幫助到更多人,無論他們是不是重度聽力損傷。」熱血的兄弟倆互望用力點頭說。

訂閱電子報 友善列印 字體大小:
獲取產業訊息零時差!立即訂閱電電公會電子報。