還別說雪隧,耳機鑲鉆西轩,真好看!
智能語音雖火但開發(fā)難度大,國內(nèi)初創(chuàng)團隊還有機會嗎萍歉?| 活動回顧
這股正在智能語音的新浪潮中侣颂,技術(shù)和生產(chǎn)能力都相對受限的初創(chuàng)團隊還有機會嗎?
亞馬遜的 Alexa,蘋果的 Siri蔑舞,微軟的 Cortana拒担,Google 的 Google Assistat,智能語音已成早已為國外科技巨頭緊盯的趨勢攻询,「人工智能助手」實現(xiàn)了從語音識別到語義理解再到功能執(zhí)行的過程从撼,將人工智能產(chǎn)品迅速推進到了能夠在消費級場景當(dāng)中得到應(yīng)用、派得上用場钧栖、并被消費者買賬的階段低零。
然而當(dāng)國外用戶只要買一臺 Echo 就能立刻享受到智能語音助理帶來的便利時,國內(nèi)消費者在面對語音智能產(chǎn)品時的選擇卻少得可憐桐经,在行業(yè)端,智能語音雖然已經(jīng)成為國內(nèi)幾乎每家科技和互聯(lián)網(wǎng)公司都在關(guān)注的領(lǐng)域浙滤,但這樣的熱度還遲遲沒有傳遞給消費者阴挣,在這股正在興起的新浪潮中,相比行業(yè)巨頭技術(shù)和生產(chǎn)能力都相對受限的初創(chuàng)團隊還有機會嗎纺腊?本期由深圳灣和 ACT Lab 聯(lián)合主辦 AI&BOBO CLASS 課程畔咧,邀請了前小米電視音響團隊負(fù)責(zé)人、前魅族科技智能硬件總監(jiān)揖膜、現(xiàn)前海黑鯨科技 CEO 王興超誓沸,他為我們分析了初創(chuàng)團隊在入局語音智能品類時所面臨的困難,以及在「困境」中壹粟,初創(chuàng)團隊可能的突圍方向拜隧。
語音智能產(chǎn)品的開發(fā)難度,體現(xiàn)在研發(fā)趁仙、內(nèi)容生態(tài)洪添、市場教育和供應(yīng)鏈上
王興超提到,此前 WiFi 音箱對比普通藍(lán)牙音箱所面臨的一些困難雀费,可以很好地與現(xiàn)在語音智能類音箱產(chǎn)品類比干奢。做這類產(chǎn)品的難度,主要集中在四個方面:研發(fā)難度盏袄、內(nèi)容生態(tài)忿峻、市場教育和供應(yīng)鏈上薄啥。
在技術(shù)研發(fā)上,王興超著重提到了遠(yuǎn)場語音識別中的難點逛尚。
「第一個階段垄惧,遠(yuǎn)場語音的喚醒,這個階段不僅要能保證在安靜的環(huán)境下把音箱喚醒黑低,還包括正在播放音樂或者周邊噪音比較大的環(huán)境赘艳。這種情況下,在三四米遠(yuǎn)的距離外克握,通過喚醒詞讓音箱進入到監(jiān)聽模式是相當(dāng)困難的蕾管。」
「第二個階段菩暗,喚醒之后掰曾,在三四米這樣的距離下,用戶說的話停团,設(shè)備必須能夠完整地采集到旷坦,并保證采集到數(shù)據(jù)的準(zhǔn)確度,這也是目前業(yè)界面臨的另一個難點所在佑稠。這種聲音數(shù)據(jù)的采集過程秒梅,嚴(yán)重依賴于使用麥克風(fēng)的數(shù)量,結(jié)構(gòu)的設(shè)計舌胶,用戶說話的清晰度捆蜀,方言還是普通話,以及環(huán)境噪音是否夠低幔嫂×舅」
「在采集到了用戶的語音之后,還要把語音轉(zhuǎn)成文字履恩,進而對轉(zhuǎn)成文字進行語義理解锰茉。中國的漢字中,有很多相同的發(fā)音切心,但是代表了截然不同的意思飒筑,需要結(jié)合上下文語境才能把語音轉(zhuǎn)換成文字,否則轉(zhuǎn)化成了文字都錯了绽昏,那么后面的處理肯定也是錯誤的扬霜。」
目前的語音智能產(chǎn)品能給用戶帶來價值嗎而涉?
而在面向消費者的產(chǎn)品價值上著瓶,王興超提出了這樣四個問題:
- 提高效率了嗎?
- 直達內(nèi)容了嗎啼县?
- 直達服務(wù)了嗎材原?
- 幫用戶省錢了嗎沸久?
高精度的語音識別作為交互方式,對比現(xiàn)有的屏幕交互余蟹,確實可以在大多數(shù)場景下提高交互效率卷胯。但智能語音在連接內(nèi)容端和服務(wù)端的能力上,國內(nèi)生態(tài)卻還稱不上令人滿意威酒,一方面語音智能本身的「直達」能力不足窑睁,不能很好地根據(jù)用戶語言給出關(guān)于內(nèi)容和服務(wù)的最優(yōu)解決方案,另一方面葵孤,內(nèi)容和服務(wù)資源與語音智能產(chǎn)品間的生態(tài)整合也還不到位担钮。
具體場景下的最優(yōu)體驗,可能是初創(chuàng)團隊涉足這個領(lǐng)域時可以試水的方向
如果目前整個智能語音行業(yè)都還面臨諸多挑戰(zhàn)尤仍,那么初創(chuàng)團隊還有入局的契機嗎箫津?王興超通過自己團隊正在開發(fā)的產(chǎn)品,給出了另一個可能的突圍方向宰啦。
他們做的是一款具備語音智能的電視盒子產(chǎn)品苏遥,功能和體驗都針對家庭客廳觀看電視時的具體體驗進行優(yōu)化,可以使用語音指令進行進行換臺赡模、播放田炭、資源搜索等等一系列功能,很大程度上解決了使用智能電視時需要用按鍵優(yōu)先的遙控器進行大量點按操作的問題漓柑。同時教硫,由于成本極低,電視盒子生產(chǎn)商可以很容易地將他們的方案集成到自己的電視盒子產(chǎn)品中欺缘。
王興超所給出的方向栋豫,即是使用較低技術(shù)和硬件成本挤安,著力打磨在具體場景下常用的數(shù)個功能谚殊,達到該場景下體驗的最優(yōu)化,憑借低成本和高適用性來打開面向 C 端的產(chǎn)品市場和面向 B 端的方案市場蛤铜。在這個過程中講繼續(xù)技術(shù)上的積累和產(chǎn)品上的優(yōu)化嫩絮,從而繼續(xù)在語音智能的市場中向上攀登。
這樣一邊生存一邊成長的經(jīng)營哲學(xué)围肥,對在巨頭林立的紅海領(lǐng)域中試圖突圍的初創(chuàng)團隊來說剿干,可能更加實用。