在以智能音箱“百箱大戰”為代表的AIoT市場火熱的背后,實則是“帶著鐐銬跳舞”,作為業界翹楚,云知聲給到產業五把鑰匙。
1
“百箱大戰”下的智能音箱市場滯脹
近日,人工智能算法公司云知聲發布了基于首款 AIoT 芯片“雨燕”的智能音箱和智能家居解決方案,并宣布將該方案開源。
今年5月,云知聲推出全球首款面向IoT的AI芯片UniOne,在一系列芯片設計中,雨燕是第一代產品,也是第一款面向物聯網人機交互場景的AI芯片,適用于智能家居和智能音箱領域;在“雨燕”之后,公司表示還將推出面向智能車載領域的第二代芯片“雪豹”,以及用于構建智慧城市的第三代“旗魚”,兩款產品預計將分別于明、后年面世。
“UniOne 雨燕”發布現場
作為初代,“雨燕”所處的智能家居語音交互市場異常火熱。此次發布會上,云知聲副總裁康恒博士這樣描述當前的智能音箱格局:“從2017年開始,有一個現象叫‘百箱大戰’,與之相應的,音箱的解決方案在今年出現了‘百家爭鳴’。”
商戰本為利,AIoT的戰爭也不例外。據相關數據顯示,僅是中國,2018年智能家居的產業規模將達到1800億,兩年之后,這一數據很可能翻倍,而在2021年,將會達到5000億元。
然而,市場利得并不是那么容易收入囊中。
春秋、戰國可以決出五霸、七雄,但在當今市場經濟和世界貿易的生存規則下,如果不掌握真正的武功秘籍,那AIoT領域勝出的更有可能是亞馬遜、谷歌、蘋果這些無論端、云、芯都居于世界頂尖的科技巨頭。
在國內智能音箱市場上,“天貓精靈”和“小愛同學”在價格戰上打的火熱,但不知道是否賠本賺吆喝;百度的戰略最初是想收購渡鴉進入高端市場,但在沒有商業模式的支撐,最終也只能以帶屏的小度在家略顯差異化的進入戰局;作為BAT最后一家,“騰訊聽聽”在千呼萬喚中于今年4月始出來,沒有太多亮點,主打設計和性能,也得到了一些死忠粉的支持。
總體來看,無論是“百箱大戰”還是BAT入局,行業整體還是呈現出雷聲大、雨點小,并不能讓市場形成消費習慣的滯脹狀態。
自2012年成立以來持續在語音交互領域深耕的云知聲,面對如上的市場問題,提出了他們的幾點思考,以及解決方案。
康恒博士整體介紹基于雨燕AIoT 芯片的開源方案
2
定制芯片,用語音交互邏輯解決終端碎片化困境
為什么智能音箱、或者智能家居的概念屬性高于實際價值表現?
康恒首先從IoT的終端呈現出非常明顯的碎片化困境做出解釋:
“物聯網和傳統互聯網相比,產品形態和使用方式都呈現出高度多樣化。在互聯網時代,終端只有電腦、手機,或者平板。進入IoT時代,產品形態包括車機、電視、智能音箱、機器人,甚至空調、冰箱、洗衣機、廚電、小家電,所有的設備都可以連接到物聯網上,產品形態是高度碎片化和多樣化的。”
在碎片化的終端形態下,真正能夠體現出產品價值的,除了產品性能,更重要的是連接的性能。簡單說,就是面要大、接口要廣、邏輯要強。
但說起來容易,做起來難。如何能夠讓終端如人腦的神經網絡一般連接?這是一個追求極高速率,但又異常復雜的操作,在康恒看來,唯有芯片可以完成。
“我們把語音交互的邏輯在芯片上得到實現。”
目前,云知聲有專門面向AI的加速器DeepNet,包括面向語音交互、麥克風陣列降噪和處理的數字信號處理器DSP,以及內置通用ARM核。同時,也在通用CPU上實現了8倍的性能提升。
在專門針對AI的性能設計方面,TTS實現了16倍的速度提升,深度神經網絡則實現了50倍的提升。
在硬件加強和性能提升的基礎上,所有硬件設備實現了感知、表達、思考三個核心方面的增強賦能,同時,將語音交互邏輯放在芯片上得到實現。
技術、產品、服務全棧應對分散供應鏈下的風險
其次,多元化的需求和碎片化的終端,導致了分散的供應鏈。
對此,康恒舉例說明:
“以前,在手機行業做應用方案,合作的供應鏈除了常規之外,最重要的只有兩個,一是主控芯片CPU,二是安卓的源代碼和谷歌合作。但對于AIoT來說,則除了芯片、硬件和操作系統,還需要增加AI算法、云端,甚至需要把它們打包成應用程序。所以,架構的復雜程度完全不同。”
在應對方式上,云知聲給出的建議是,讓方案商選擇包括技術、產品和服務的全棧式解決方案。
事實上,一個完整的語音交互過程需要前期的語音喚醒、聲紋識別、麥克風陣列、回聲消除等步驟,之后才是語音識別。文字所表達的意圖,則需要由廣義自然語言理解來處理。如果將自然語言理解拓展開來,還要涉及到對話、內容的推介,知識圖譜等非常深厚的技術框架。
在對語音交互技術的復雜性存在普遍的認知盲區下,康恒指出了一個非常常見的謬誤:“業界有不少產品商會覺得產品可以自己做,算法公司只需要提供算法,或者引擎就可以。一般這種情況,都是低估了技術架構的復雜度。”
然而,并不是技術全棧之后就可以完全避免風險。
最穩妥的方式,還是進一步達成產品和服務的全棧。在達成技術全棧基礎上,產品的全棧要考慮交互、能否量產等問題。而服務的全棧之所以重要,原因在于它可以把技術元素、硬件和生產等元素結合起來,這中間有很多需要協助客戶完成的工作。
3
優化產品體驗需運用工具和SOP提升測試規范
第三個問題是難以把控的產品體驗。
和考試不一樣,在 AIoT領域,即使產品的每個零部件都是高分性能,它的最終表現有可能是非常低分,這里牽涉屬性沖突的問題。
“真正的好產品不是紙面設計的高大上,而是極佳體驗。各部分零部件的性能磨合非常重要。”康恒表示說。
而性能磨合需要的是不斷的試驗和測試,目前在產業界,這點做的并不好。不少欠成熟的企業還是粗放式驗收,“把生產出的音箱擺在測試工位上,然后讓測試員不斷重復歡迎詞和查天氣,類似的驗收方式都是很不正規的。”
對于如何為客戶提升測試的標準化從而提升產品體驗,云知聲提供了一系列工具,以及SOP,可以把控客戶在測試環節的規范運作。
“比如說,麥克風是否有不良,一致性是不是夠好,裝配之后,結構是否有密封或者振動問題?我們有一系列的工具來幫助大家,無論是IQC或者最后的產測,甚至有一些是自動化的工具。”康恒說。
產品本身性能和團隊協作決定了產品周期
產品周期對于廠商來說也是一個極大的考驗。
其中,最常見的問題是盲目樂觀,不少廠商自認為做硬件經驗很豐富,做音箱、或智能家居就可以得心應手。
但這個邏輯,在康恒看來是不成立的。
在他看來,實際與產品周期緊密相關的,不是做硬件是否有經驗,或者說企業的規模、實力、人數,這些都是邊緣因素。真正起決定性的,一是上述產品本身的性能體驗可以在多長時間內做到極致,二是團隊協作,在新品的架構上,AI、硬件、軟件和云端服務都需要不斷磨合。
在如何縮短產品周期的問題上,康恒表示云知聲會根據具體服務公司的業務提供方案。
4
開源代碼設計促進產品實現快速復制
最后一點,是如何能夠在不同的產品之間實現快速復制。
產品形態的碎片化,導致了方案商在獲得收益方面不能靠單一的產品形態或者方案獲得滿足,需要考慮不同的應用場景。那么,一個產品的開發能否用到之前積累的代碼和設計,能否將成功經驗復制到新的產品項目中,對方案公司來說至關重要。
“有時候,這點甚至事關方案公司的生死。”康恒強調說,如果產品之間可以實現快速復制,投入將可以極大減少。
在如何優化提升產品復制的問題上,云知聲采用了代碼開源和根據客戶需求完成定制兩種方式。據康恒介紹說,云知聲目前都是開源代碼設計,方案商可以根據需求修改代碼,在云端服務層,會根據客戶的需求,或者具體產品的需求來完成定制的工作。
結語
無論是“百箱大戰”還是“百家爭鳴”,在AIoT大火的背后,終端碎片化、供應鏈分散、產品體驗難提升、產品周期難把控、產品經驗難復制,這五大暗流成為影響產業良性發展的重要風險因子,定制芯片,技術、產品、服務全棧,運用工具和SOP,優化團隊協作,開源代碼設計是云知聲給到行業的五大對策。
雨燕 AIoT 芯片的開源方案現場展示
對于云知聲來說,“雨燕”在智能音箱和智能家居中的應用讓其邁出了馳騁在AIoT領域的第一步,其后的“雪豹”和“旗魚”還將致力于智能汽車和智慧城市。在產業界,優秀的公司會擔綱領導者的角色,它們未來會有怎樣的建樹,“機器人文明”將與您一起持續關注!