您正在使用IE低版瀏覽器,為了您的雷鋒網賬號安全和更好的產品體驗,強烈建議使用更快更安全的瀏覽器
此為臨時鏈接,僅用于文章預覽,將在時失效
芯片 正文
發私信給包永剛
發送

0

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

本文作者:包永剛 2019-12-27 10:08
導語:首款AI語音芯片量產不到一年之后,探境科技CEO魯勇本周宣布探境的語音識別方案實現百萬級出貨。

今年3月份,雷鋒網(公眾號:雷鋒網)《舍棄馮諾依曼架構突破內存墻瓶頸的AI芯片,即將轟動市場?》一文介紹了解決AI芯片內存墻挑戰的多種路徑以及探境科技采用的創新方法。距離文章發布不到十個月之后,也是探境首款AI語音芯片量產不到一年之后,探境科技CEO魯勇本周宣布探境的語音識別方案實現百萬級出貨。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

百萬級出貨,只是衡量一款使用成熟制程工藝成功的最小出貨量級,但對于AI芯片來說卻意義重大。此前我們已經多次強調,對于AI芯片初創公司而言,設計出芯片只是成功的開始,能否大規模落地才更為關鍵。

如今,無論是巨頭還是初創公司,大都為AI芯片難落地的苦惱。顯然,探境科技量產不到一年的音旋風(Voitist)611 AI語音芯片出貨就達百萬級值得關注,他們取得這一成績的策略和方法或許也值得參考和借鑒。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

 探境科技CEO魯勇

推翻馮諾依曼架構

3月份的文章已經介紹了探境科技設計出的非馮諾依曼架構的計算架構——存儲構SFA(Storage First Architecture)。SFA架構解決內存墻挑戰的方法比較獨特,以存儲調度為核心的計算架構,數據在存儲之間的搬移過程之中就完成了計算,計算對于數據來說只是一種演變。

當時,魯勇對于SFA架構進一步的解釋是,存儲是我們SFA架構優先的出發點,去考慮數據在搬移過程中做計算,也就是由數據帶動計算而非由算子帶動數據。與通常計算的先有計算指令然后提供數據相反,SFA架構是先有數據,然后再把算子交給它。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

探境科技SFA架構

由于沒有詳盡的說明,SFA也有被誤解為最近幾年討論很多的存內計算(In-Memory Computing),魯勇近日再次接受雷鋒網采訪時首先明確,SFA不是存內計算。我們說SFA不是馮諾依曼架構,指的是SFA不是以計算帶動存儲。不過,SFA架構采用的是標準單元庫設計,沒有改變底層的工藝。

SFA架構解決內存墻挑戰的核心是,既然深度學習算法需要的卷積運算的乘法計算次數不能減少,那就想辦法把數據在存儲器和運算單元之間的搬運次數降低,達到提升算力、降低功耗和解決內存帶寬限制的目的。

“SFA架構實現的方法是通過硬件、架構調度、數據調度管理等創新。實驗數據表明,SFA架構所采用的各種微觀和宏觀調度算法,比較’類CPU架構‘采用的基于總線和指令集的映射方法,在近似存儲量、近似算力、近似外部存儲帶寬、近似功耗約束的前提下,可以獲得8~12倍的利用率收益?!濒斢卤硎?。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

除了高能效比,SFA架構還帶來了通用和易用的優勢。魯勇說:“我們的芯片是首款通用型AI芯片,可以支持所有已知的神經網絡,對數據類型也沒有限制,對常見的稀疏數據也可以實現自適應支持?!?/p>

還有非常重要的一點,將AI模型從云端遷移到終端,使用探境的芯片不需要重新訓練。魯勇表示:“我們提供的工具鏈可以給零基礎的客戶使用,不僅在算法從云端到終端遷移的時候不需要重新訓練,節省時間。還能保證模型從浮點到定點進行量化之后,精度幾乎沒有變化?!?/p>

他透露,“我們有一套從特別的量化技術,硬件上提供一些比較冗余的信息,保證即使量化為8比特也不會丟失信息。同時借助AI、非線性的一套算法,通過軟硬結合的方式,甚至可以做到量化到4比特,模型都不需要重新訓練?!?/strong>

魯勇所說的精度幾乎沒有變化,指的是量化后精度有千分之幾的變化。比如從浮點16位時的95.7%的精度量化為定點八位后精度變為95.3%。

因此,基于SFA架構的探境AI芯片采用28nm的工藝能效就超過4TOPS/W,數據訪問降低10倍到100倍,存儲子系統功耗降低10倍以上。

魯勇還透露,SFA架構的圖像芯片已經成功流片,圖像AI芯片的核心指標IPS/W全球第一,達到了800 IPS/W。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

數據顯示,目前市面上的AI圖像芯片這一指標大都沒有超過100 IPS/W。

算法挖掘架構優勢

當然,優秀的架構必須很好地融合算法,才能最大化硬件的優勢。特別是AI時代,越來越多人意識到軟硬一體的重要性。探境在算法上也有其獨特的降噪和識別算法。語音識別大致可以分為四個過程,語音信號采集、語音信號處理、語音識別、獲得結果。以家居這個AI語音落地較多的場景為例,具有信噪比(信號與噪聲的比例)比較低,會有不可預見的噪聲以及多個聲源等挑戰。

從語音識別的過程來看,想要獲得滿意的結果,首先需要的是降噪算法。探境科技聯合創始人 軟件研發副總裁李同治介紹:“我們的降噪算法基于深度學習,不僅可以處理常見的穩態噪聲,對一些非穩態的噪聲和突發性的噪聲也可以很好地處理。為了驗證這套算法識別的有效性,我們將一批信噪比在3dB左右的語音數據送到一家知名互聯網公司的云端識別引擎進行測試,結果顯示降噪后比降噪前的識別率能夠提升30%以上?!?/p>

30%是個什么概念?根據李同治播放的音頻,使用探境的AI降噪算法,能夠有效地過濾風聲、雨滴聲這些噪音。

降噪后的下一步是識別,在語音識別中,探境采用的是其稱為HONN的新型高計算強度神經網絡。李同治透露,HONN將計算機視覺中的一些經驗遷移到語音識別中。HONN增加了卷積的操作次數,減少了傳統DNN/TDNN算法中全連接的次數。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

對比傳統的DNN算法,HONN特點在于算法的參數大概是傳統DNN算法的1/5,更少的參數意味著只需要更少存儲面積,也就相當于更低的芯片成本。雖然參數更少,但HONN單幀對算力的需求超過幾百兆OPs,DNN僅為個位數。

最終結果顯示,在信噪比大于10dB和5-10dB的環境中,HONN命令詞識別準確率的提升分別為2%和10%。

在實際的場景測試中,HONN使用單麥克風效果也十分顯著。但語音識別的場景還有更加苛刻的場景,比如掃地機器運行中產生的聲音,或者控制客廳或廚房中家電設備時距離較遠語音信號快速衰減,這時候就需要使用麥克風陣列。

傳統的麥克風陣列有三個缺點,一個是聲源定位依賴單麥克風,遠場時喚醒率低影響使用體驗;另一個是降噪算法和識別模型不適配;還有就是對多個麥克風以及電容等元器件一致性要求非常高,無形提高了整個系統的物料成本;最后,當干擾聲源與目標聲源方向接近時,這套流程也無能為力。

“為了解決這些問題,我們提出了基于FCSP(頻域復數子空間投影)的端到端AI雙麥新算法,把增強和識別一體化,進行端到端的識別流程。在這個識別流程中,我們放棄了使用傳統的數字信號處理算法來做語音增強,而是用一套基礎于深度學習的AI算法做信號增強。處理算法的參數和神經網絡一起訓練,通過整體優化降低最后的識別錯誤率?!袄钔芜€進一步指出。

“我們的喚醒識別全部依賴增強后的信號,不會出現信號增強依賴于單麥喚醒的情況。并且在訓練的過程中,還加入了注意力模型和注意力機制,這樣干擾源和信號源接近的時候也能處理得很好?!?/p>

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

這是前比較前沿的方法,國外的亞馬遜、谷歌也在采用端到端的方法做增強和識別的一體化處理。根據探境給出的數據,亞馬遜采用的是基于可學習的空間濾波方法,在信噪比低于5dB時,單字識別錯誤率相對降低15%。谷歌使用的方法是頻域因子分解模型,單字識別錯誤率相對降低16%。探境的頻域復數子空間投影命令詞識別錯誤率相對降低20%。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

采用這樣的方法就意味著可以用更少的麥克風實現更好的效果,谷歌表示,使用端到端的處理算法后其雙麥的識別率可以達到了傳統算法7麥克風陣列的識別率。

李同治表示,之所以探境能用更復雜的算法實現更好的效果,除了我們有強大的算法研究實力,同樣重要的是有高算力的SFA架構芯片完美地制程這套算法和框架。

基于升級的雙麥克風算法,探境也對音旋風611進行了升級,推出了音旋風612語音識別方案,對麥克風及配套電路的要求更低,高噪聲環境的識別率更高。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

快速落地的秘密

至此,探境AI芯片能夠快速落地的秘密也就清晰了。最底層,探境進行芯片架構進行的創新,打破AI芯片內存墻的限制。當然,SFA架構除了帶來更高能效比、更低功耗,通用性讓其不僅可以用于AI語音,也適用于AI視覺處理。根據魯勇的說法,SFA架構也能用于云端的訓練和推理。

不過,客戶并不關注芯片的架構創新,他們更關注成本及易用性。探境獨特的量化技術可以節省遷移成本,軟件平臺可以降低開發者的使用門檻,這讓芯片成為了易于使用的方案。

但要最終打動用戶,解決用戶痛點才是決定因素。這方面,探境所做的是在降噪、識別算法中也采用深度學習,基于SFA架構帶來的高算力,用模型參數更少但對算力要求更高的AI模型,實現用兩個麥克風陣列達到4個甚至7個麥克風陣列的效果。

通過軟硬一體的優化,用成本、易用性、效果提升、系統易集成帶來的優勢,最終打動用戶。

當然,除了技術,市場策略也非常關鍵。探境的SFA架構可以用于AI視覺,并且探境成立之時是AI視覺更火熱的時候,但魯勇并沒有選擇安防市場,而是首先進入更容易落地和產生營收的AI語音市場,用更高的算力融合更更好的算法,讓產品具有更強的競爭力。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

同時,針對語音市場還布局了低功耗、主流、旗艦產品,能夠全面滿足市場需求。為滿足客戶不同的需求,既可以單獨提供芯片或者算法,也能夠提供全棧的方案。未來還將推出針對圖像市場的8XX系列芯片。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

為進一步拓展市場,探境近日也和國內知名電子行業分銷商世強先進科技有限公司以及致力于智能語音控制與交互技術研究、創意產品設計和生產銷售的深圳阿凡達智控有限公司也達成了合作。

量產不到一年AI語音芯片出貨就達百萬級!探境轟動市場的秘密

那么,接下來的問題是,首款AI芯片量產不到一年出貨就達到百萬級,已經有30個合作伙伴的探境科技,2020年語音方案出貨能否達到千萬級?在AI視覺市場是否也能快速落地?雷鋒網

相關文章:

舍棄馮諾依曼架構突破內存墻瓶頸的AI芯片,即將轟動市場?

雷鋒網原創文章,未經授權禁止轉載。詳情見轉載須知。

分享:
相關文章

文章點評:

表情
最新文章
請填寫申請人資料
姓名
電話
郵箱
微信號
作品鏈接
個人簡介
為了您的賬戶安全,請驗證郵箱
您的郵箱還未驗證,完成可獲20積分喲!
請驗證您的郵箱
完善賬號信息
您的賬號已經綁定,現在您可以設置密碼以方便用郵箱登錄
彩票平台刷流水骗局