角逐智能小家電藍(lán)海市場(chǎng),AI 企業(yè)該做怎樣的技術(shù)儲(chǔ)備和戰(zhàn)略規(guī)劃丨WARE 2019
AI 全面落地鲫售,詳解聲智科技全鏈條操作系統(tǒng) SoundAI Azero | WARE 2019
比起談酷炫的概念,聲智科技更希望腳踏實(shí)地地把這些概念一一落地径筏。
小米 AI 智能音箱障陶、小度智能音箱滋恬、華為 AI 音箱、王者榮耀智能機(jī)器人抱究、榮耀 YOYO 智能音箱恢氯、天貓精靈魔盒……
不管你是不是一個(gè)智能音箱用戶,上述的產(chǎn)品中,你或多或少都聽(tīng)說(shuō)過(guò)勋拟。而在這些音箱們「小嘴叭叭」與用戶交流的背后勋磕,多多少少都離不開(kāi)一家名為「聲智科技」的公司的支持。
聲智科技是一家融合聲學(xué)和人工智能技術(shù)的平臺(tái)服務(wù)商挂滓,成立 3 年,聲智科技已經(jīng)占領(lǐng)中國(guó)語(yǔ)音市場(chǎng)超過(guò) 70% 的市場(chǎng)份額啸胧,是全球最大的智能音箱技術(shù)供應(yīng)商之一赶站。
在過(guò)去兩年多的「百箱大戰(zhàn)」的戰(zhàn)場(chǎng)上,各家音箱產(chǎn)品身上纺念,或多或少都有聲智科技這家公司的身影贝椿。官方數(shù)據(jù)顯示,目前陷谱,聲智科技賦能的產(chǎn)品累計(jì)出貨量超過(guò) 2000 萬(wàn)臺(tái)烙博,其服務(wù)客戶包含了小米、百度烟逊、阿里习勤、華為、騰訊焙格、360图毕、中國(guó)移動(dòng)等多家行業(yè)巨頭。
用周治國(guó)自己的話來(lái)說(shuō)眷唉,聲智科技是一家「躲在巨頭背后的服務(wù)提供商」予颤。
7 月 19 日,在由深圳灣舉辦的「WARE 2019·新硬件 AI 技術(shù)與應(yīng)用峰會(huì)」上冬阳,聲智科技銷售總監(jiān)周治國(guó)與我們分享了在 AI+IoT+5G 的融合新趨勢(shì)蛤虐,聲智科技對(duì)于智能語(yǔ)音設(shè)備下半場(chǎng)的思考,首次在深圳公開(kāi)分享全鏈條遠(yuǎn)場(chǎng)智能交互系統(tǒng)「SoundAI Azero」肝陪,并帶來(lái)了 SoundAI Azero 賦能的多款硬件產(chǎn)品驳庭。
/ / / / / / / / / /
智能語(yǔ)音市場(chǎng)上的「冰」與「火」
過(guò)去幾年中,智能音箱市場(chǎng)有多么火熱氯窍,我們可以從數(shù)據(jù)中明顯感受到——根據(jù) Strategy Analytics 披露的數(shù)據(jù)饲常,2018 年全年智能音箱的出貨量達(dá)到 8620 萬(wàn),其中狼讨,2018 Q4 單一季度的出貨量便達(dá)到了 3850 萬(wàn)臺(tái)贝淤,超過(guò) 2017 年全年的出貨量。
而當(dāng)時(shí)間進(jìn)入 2019 年之后政供,我們?cè)俣染劢怪悄芤粝涫袌?chǎng)播聪,不難發(fā)現(xiàn)朽基,這一市場(chǎng)依然火爆,但市場(chǎng)格局早已不是兩年前的「百箱爭(zhēng)鳴」离陶,現(xiàn)如今的智能音箱市場(chǎng)稼虎,玩家僅剩為數(shù)不多的幾家巨頭,留給產(chǎn)品團(tuán)隊(duì)和傳統(tǒng)設(shè)備廠商的機(jī)會(huì)并不多招刨。
在復(fù)盤這一市場(chǎng)時(shí)霎俩,周治國(guó)指出,與傳統(tǒng)智能硬件相比计济,語(yǔ)音產(chǎn)品技術(shù)鏈條長(zhǎng)茸苇,需要整合的技術(shù)和內(nèi)容較傳統(tǒng)硬件要復(fù)雜得多,受限于團(tuán)隊(duì)的資金和技術(shù)能力沦寂,要把語(yǔ)音 AI 的用戶體驗(yàn)成熟度做到產(chǎn)品級(jí)并實(shí)現(xiàn)量產(chǎn)学密,期間的挑戰(zhàn)并不小。
智能音箱這么火熱传藏,為什么市面上看到的品牌那么少腻暮?國(guó)外只有亞馬遜和 Google,國(guó)內(nèi)集中在百度毯侦、小米哭靖、阿里、騰訊這些巨頭手里侈离。是大家不想做嗎试幽?真的是由于巨頭補(bǔ)貼造成大家對(duì)這個(gè)市場(chǎng)有一些膽怯嗎?其實(shí)不是卦碾。
一方面铺坞,智能音箱涉及到喚醒算法、降噪算法洲胖、聲學(xué)結(jié)構(gòu)济榨、內(nèi)容整合等多項(xiàng)技術(shù),技術(shù)鏈條長(zhǎng)绿映,只有巨頭廠家才有能力調(diào)動(dòng)資源擒滑;另一方面,智能音箱后期需要接入大量的技能叉弦、服務(wù)丐一、視音頻內(nèi)容等,這所需時(shí)間周期長(zhǎng)卸奉、成本高钝诚。
而隨著 AI+IoT+5G 的到來(lái),智能語(yǔ)音硬件還遠(yuǎn)遠(yuǎn)不止智能音箱單一品類榄棵,需要應(yīng)對(duì)的產(chǎn)品形態(tài)更加多樣和碎片凝颇,這將大大延長(zhǎng)技術(shù)鏈條在設(shè)備的移植周期和成本。此外疹鳄,智能語(yǔ)音產(chǎn)品還存在聲學(xué)調(diào)試?yán)щy拧略、開(kāi)發(fā)周期長(zhǎng)等問(wèn)題,這些問(wèn)題對(duì)于產(chǎn)品團(tuán)隊(duì)和傳統(tǒng)設(shè)備廠商來(lái)說(shuō)瘪弓,都是不小的挑戰(zhàn)垫蛆。
基于上述思考,聲智科技發(fā)布了全鏈條遠(yuǎn)場(chǎng)智能交互系統(tǒng)「SoundAI Azero」腺怯。該系統(tǒng)以遠(yuǎn)場(chǎng)語(yǔ)音交互和遠(yuǎn)場(chǎng)雙工通話為技術(shù)內(nèi)核袱饭,兼容主流芯片架構(gòu)、硬件設(shè)計(jì)和聲學(xué)結(jié)構(gòu)呛占,具有一站式 Turnkey 解決方案虑乖、全面的語(yǔ)音交互能力、高整合內(nèi)容資源晾虑、協(xié)議兼容性強(qiáng)疹味、兩周實(shí)現(xiàn)快速開(kāi)發(fā)等特點(diǎn),可廣泛應(yīng)用于多種場(chǎng)景的硬件設(shè)備帜篇。
AI+IoT+5G 背景下糙捺,行業(yè)需要能夠快速落地的一站式解決方案?
SoundAI Azero 與 Alexa 類似,同樣提供了從聲學(xué)結(jié)構(gòu)設(shè)計(jì)笙隙、遠(yuǎn)場(chǎng)語(yǔ)音交互洪灯、技能服務(wù)開(kāi)發(fā)的一站式全鏈條解決方案,但其目的又不只是做好「中文版的 Alexa」竟痰,而是基于聲智科技在中文語(yǔ)音市場(chǎng)豐富的服務(wù)經(jīng)驗(yàn)签钩,在各個(gè)細(xì)節(jié)做精、做細(xì)凯亮,幫助設(shè)備廠商又快又好地實(shí)現(xiàn)產(chǎn)品開(kāi)發(fā)和量產(chǎn)边臼。
如周治國(guó)所說(shuō):
SoundAI Azero 操作系統(tǒng)只有一個(gè)目的,就是幫助大家的產(chǎn)品快速落地假消。
語(yǔ)音交互方面柠并,SoundAI Azero 集成了遠(yuǎn)場(chǎng)喚醒、波束形成富拗、聲源測(cè)向臼予、噪聲抑制、混響消除啃沪、回聲消除粘拾、端點(diǎn)檢測(cè)、語(yǔ)音識(shí)別创千、聲紋識(shí)別缰雇、語(yǔ)義理解入偷、語(yǔ)音合成、雙工通話械哟、自然語(yǔ)言處理疏之、聲波配網(wǎng)等多項(xiàng)技術(shù),遠(yuǎn)場(chǎng)交互能力強(qiáng)暇咆,并支持硬件檢測(cè)锋爪。
同時(shí),SoundAI Azero 還支持自定義喚醒詞爸业。周治國(guó)表示其骄,未來(lái),設(shè)備商可以在 1~2 天內(nèi)實(shí)現(xiàn)快速自定義喚醒詞扯旷,且這一喚醒詞的體驗(yàn)效果可以達(dá)到目前小米「小愛(ài)同學(xué)」體驗(yàn)效果的 85%拯爽,以實(shí)現(xiàn)產(chǎn)品快速上市。而在產(chǎn)品上市之后薄霜,廠商還可以通過(guò)在線數(shù)據(jù)收集的方式來(lái)實(shí)現(xiàn)自定義喚醒詞的迭代升級(jí)某抓,讓產(chǎn)品體驗(yàn)慢慢向「小愛(ài)同學(xué)」們靠近。
內(nèi)容和服務(wù)方面惰瓜,SoundAI Azero 接入了市面上主流的音樂(lè)否副、有聲讀物、視頻平臺(tái)崎坊,以及信息查詢备禀、生活服務(wù)、出行路況等服務(wù)奈揍,并通過(guò)免費(fèi)技能的方式開(kāi)放給合作伙伴曲尸,確保設(shè)備從一開(kāi)始就具備了語(yǔ)音交互基礎(chǔ)的內(nèi)容和服務(wù)。同時(shí)男翰,SoundAI Azero 還提供靈活的技能開(kāi)發(fā)及接入方式另患,支持 Android、 Linux蛾绎、QNX 等七種系統(tǒng)以及多種播放器昆箕,常用技能開(kāi)發(fā)部署時(shí)間一周以內(nèi),可極大縮短開(kāi)發(fā)周期租冠。
為了幫助合作伙伴完成快速開(kāi)發(fā)鹏倘,在云端,SoundAI Azero 還支持「內(nèi)容+IoT+APP」三云合一顽爹;設(shè)備端纤泵,SoundAI Azero 對(duì) Turnkey 代碼進(jìn)行了開(kāi)源【翟粒基于此捏题,設(shè)備上最快可以實(shí)現(xiàn)兩周完成快速開(kāi)發(fā)工作玻褪。
在應(yīng)用場(chǎng)景方面,SoundAI Azero 除了我們熟悉的智能音箱外涉馅,也將支持智能家居归园、智能會(huì)議黄虱、智能教育稚矿、智能醫(yī)療、智能汽車捻浦、金融科技晤揣、能源電力、智能法院朱灿、智能交通和機(jī)器人等多種應(yīng)用場(chǎng)景下多個(gè)終端產(chǎn)品昧识。
Azero 系統(tǒng)不止是針對(duì)智能音箱,聲智科技希望將語(yǔ)音引申到各行各業(yè)盗扒,用一套系統(tǒng)解決所有事情跪楞,降低中小客戶在這方面的投入。
對(duì)話聲智科技:做好細(xì)節(jié)侣灶,把炫酷的概念真正落到具體的應(yīng)用中
深圳灣:智能音箱新一輪的較量是產(chǎn)品體驗(yàn)和技術(shù)實(shí)?的較量甸祭,未來(lái), 聲智科技有哪些可以領(lǐng)先行業(yè)一到兩年的技術(shù)研發(fā)投入褥影?
我們(聲智科技)本來(lái)是躲在巨頭背后的服務(wù)提供商池户,我們現(xiàn)在想針對(duì)中小企業(yè)提供服務(wù)。我們(聲智科技)有一個(gè)口頭禪凡怎,聲智科技是比較實(shí)在的公司校焦,我們更關(guān)注的是全鏈條用戶的體驗(yàn)。當(dāng)然统倒,與很多語(yǔ)音技術(shù)提供商一樣寨典,包括聲紋、分布式拾音房匆、多輪對(duì)話耸成、全輪對(duì)話,這些技術(shù)聲智科技都會(huì)做坛缕,但是我們重點(diǎn)會(huì)關(guān)注整個(gè)鏈條真實(shí)的體驗(yàn)墓猎。
舉個(gè)例子,整個(gè)鏈條的延時(shí)赚楚,如果通過(guò)多個(gè)云來(lái)做毙沾,產(chǎn)品延時(shí)會(huì)非常長(zhǎng),而超過(guò) 1.5 秒以后就會(huì)影響用戶實(shí)際的體驗(yàn)宠页,所以左胞,聲智科技希望通過(guò)三云合一寇仓,大大縮短這個(gè)時(shí)間。類似這樣的產(chǎn)品體驗(yàn)提升烤宙,是聲智科技的主要方向遍烦。
另外,我們要快速加快這些硬件的落地躺枕,可能會(huì)支持更多操作系統(tǒng)服猪、硬件和操作平臺(tái),包括一些低功耗的拐云,我們不會(huì)自己做芯片罢猪,但是會(huì)支持更多芯片公司、芯片廠家叉瘩,賦予他們智能硬件的概念膳帕。
深圳灣:SoundAI Azero 全鏈條遠(yuǎn)場(chǎng)智能交互系統(tǒng)可以幫助客戶兩周內(nèi)完成快速開(kāi)發(fā),那么到量產(chǎn)上市一般可以有多快薇缅?
「兩周內(nèi)完成快速開(kāi)發(fā)」是針對(duì)語(yǔ)音鏈條的開(kāi)發(fā)危彩,至于整個(gè)產(chǎn)品的量產(chǎn)周期需要根據(jù)產(chǎn)品的復(fù)雜性而定。根據(jù)我們的經(jīng)驗(yàn)泳桦,如果這個(gè)產(chǎn)品是無(wú)屏的智能音箱汤徽,基于 SoundAI Azero ,我們可以將目前市面上主流的 7~8 個(gè)月的產(chǎn)品上線時(shí)間縮短到 2 個(gè)月蓬痒。