從概念到量產(chǎn)只用了三個(gè)月?——一個(gè)互聯(lián)網(wǎng)特色的硬件創(chuàng)新故事
從 DuerOS 說起:語音智能技術(shù)的認(rèn)知踪区、落地和未來
百度的人工智能戰(zhàn)略,可能是互聯(lián)網(wǎng)巨頭中最接地氣兒的吊骤。
兩年前,我們跟一位人工智能從業(yè)者聊天的時(shí)候白粉,他曾提到專業(yè)和非專業(yè)人群對(duì)「人工智能」這個(gè)詞的理解存在相當(dāng)大的差異传泊。老百姓眼里的人工智能,是電影里那種像人一樣有著自主意識(shí)隨時(shí)盤算著毀滅人類的「人造生命」鸭巴,而在搞人工智能研究的人看來眷细,機(jī)器視覺、語義理解鹃祖、深度學(xué)習(xí)……這個(gè)命題下每一個(gè)細(xì)分領(lǐng)域都算的上是人工智能的范疇溪椎。
如今,當(dāng)以語音為媒介的人工智能得到越來越多關(guān)注的時(shí)候恬口,類似的差異還仍然存在校读。不過,這樣的差異已經(jīng)不是老百姓和從業(yè)者之間概念理解錯(cuò)位楷兽,而是人工智能從業(yè)者當(dāng)中地熄,在面對(duì)技術(shù)發(fā)展和技術(shù)應(yīng)用博弈時(shí)截然不同的態(tài)度。
DuerOS 們的任務(wù)芯杀,是提供便捷應(yīng)用技術(shù)的工具
按照媒體慣用的命名方式端考,2017 年應(yīng)該算得上是「語音智能元年」,特別下半年以來揭厚,國內(nèi)的互聯(lián)網(wǎng)巨頭紛紛加大了在語音智能領(lǐng)域的布局力度却特,DuerOS 作為百度押寶人工智能之后交出的第一份作業(yè),算得上是諸多語音智能平臺(tái)中最搶眼的一個(gè)筛圆。
在今年的百度 AI 開發(fā)者大會(huì)上裂明,百度就提出「DuerOS 要做人工智能時(shí)代的安卓」,一個(gè)能為產(chǎn)品廠商解決基本的人工智能技術(shù)問題太援、為產(chǎn)品提供軟件基礎(chǔ)的平臺(tái)闽晦,功能類似于中國版的亞馬遜 Alexa。
但許多人工智能產(chǎn)品行業(yè)的從業(yè)者提岔,更傾向于把這些巨頭的人工智能平臺(tái)簡(jiǎn)單理解成一種可以塞進(jìn)各種產(chǎn)品中的通用型人工智能仙蛉。而現(xiàn)在人工智能全行業(yè)的技術(shù)基礎(chǔ)都還難以支撐這種通用性,「一個(gè)『啥都能干』的人工智能系統(tǒng)放到具體的使用場(chǎng)景中碱蒙,如果缺乏對(duì)場(chǎng)景的深度理解和針對(duì)性優(yōu)化的話荠瘪,到頭來可能『啥都干不好』夯巷,所以還是選個(gè)具體的細(xì)分領(lǐng)域做更靠譜“梗」類似的觀點(diǎn)趁餐,我們聽到不止一次。
但 DuerOS 從來不是這樣一個(gè)「通用型人工智能」篮绰,實(shí)際上后雷,在向開發(fā)者做介紹時(shí),DuerOS 更常用的描述是「一個(gè)至少能夠完成基本服務(wù)的系統(tǒng)」——定位和姿態(tài)比「人工智能中的 Android」還要低得多阶牍。
這樣的認(rèn)識(shí)上的偏差不能簡(jiǎn)單地歸為理解錯(cuò)誤喷面,背后反映的其實(shí)是兩種截然不同的思維導(dǎo)向星瘾。
對(duì)以產(chǎn)品為導(dǎo)向的技術(shù)型產(chǎn)品商來說走孽,「我想讓我的產(chǎn)品達(dá)到 10 分的體驗(yàn),但現(xiàn)在技術(shù)只能支持到 6 分琳状,所以我覺得這個(gè)現(xiàn)在還做不了磕瓷,我得另選個(gè)至少能達(dá)到 9 分的領(lǐng)域∧畛眩」
而 DuerOS 等技術(shù)提供方以技術(shù)應(yīng)用為導(dǎo)向看待這個(gè)問題時(shí)困食,就變成「我想支持廠商做出 10 分體驗(yàn)的產(chǎn)品,但現(xiàn)在整體行業(yè)的技術(shù)水平或許才發(fā)展到 6 分翎承,那我先把最成熟的 6 分做到大家都能用硕盹,看看能解決哪些問題,同時(shí)通過產(chǎn)品化獲取的經(jīng)驗(yàn)叨咖,繼續(xù)進(jìn)一步的技術(shù)優(yōu)化瘩例,力求達(dá)到 10 分。
而事實(shí)是甸各,這「6 分」的技術(shù)確實(shí)已經(jīng)能解決不少問題了垛贤。它或許不能像鋼鐵俠里的 JARVIS 那樣給你打點(diǎn)好生活的方方面面順便還能在你把妹撩漢的時(shí)候給你恰到好處的助攻,但要幫你擺脫只有 6 個(gè)按鍵卻還要完成 N 種反人類操作的機(jī)頂盒遙控器是綽綽有余了趣倾。
產(chǎn)品「賦能」并不是非要把電冰箱變成 JARVIS
「賦能」是跟著語音智能被提起的另一個(gè)概念——指的是把語音智能作為一種「能力」賦予到各種各樣的硬件產(chǎn)品上。但這種賦能并不是在各種傳統(tǒng)硬件里都塞進(jìn)一個(gè)智能語音助手儒恋,而是指任何在應(yīng)用新技術(shù)之后能帶來的體驗(yàn)上的提升善绎。
賦能傳統(tǒng)硬件,跟依托人工智能技術(shù)打造「人工智能產(chǎn)品」是有很大區(qū)別的诫尽。以家庭機(jī)器人為代表的人工智能產(chǎn)品禀酱,實(shí)際上是人工智能技術(shù)發(fā)展催生的新品類,所以人工智能技術(shù)層次是支撐整個(gè)產(chǎn)品體驗(yàn)的核心箱锐。而我們說語音智能賦能傳統(tǒng)硬件時(shí)比勉,更多是運(yùn)用人工智能技術(shù),在產(chǎn)品基本功能之上做進(jìn)一步的體驗(yàn)提升。
而 DuerOS 在其中扮演的浩聋,就是這樣一個(gè)讓硬件產(chǎn)品開發(fā)者能夠便捷地運(yùn)用語音智能提升產(chǎn)品體驗(yàn)的工具观蜗,其最大的價(jià)值,可能并不在于把人工智能的邊界往前推進(jìn)了多少衣洁,而在于把現(xiàn)有資源整合了多少墓捻,把可用門檻降低了多少。
DuerOS 與國安廣視合作的 G1 機(jī)頂盒就是這樣一個(gè)例子坊夫。
這款人工智能機(jī)頂盒具備自然語言交流砖第、語音搜索、語音控制环凿、語音點(diǎn)播梧兼,圖像識(shí)別、問詢服務(wù)等多項(xiàng)功能智听,但最基本的任務(wù)還是解決傳統(tǒng)電視「好多臺(tái)羽杰、好多鈕、好繁瑣到推、難互動(dòng)」的操作弊端考赛,讓用戶動(dòng)動(dòng)嘴就可以對(duì)電視進(jìn)行各種操作,在電視這樣一個(gè)非常傳統(tǒng)的領(lǐng)域中莉测,這一升級(jí)帶來的便捷是實(shí)實(shí)在在可以感知颜骤、切中痛點(diǎn)的。這款智能機(jī)頂盒已經(jīng)在長沙落地捣卤,很快便有超過 10 萬用戶體驗(yàn)到了 DuerOS 帶來的智能化服務(wù)忍抽。
在具體產(chǎn)品和場(chǎng)景落地的過程中,取勝的關(guān)鍵在于發(fā)現(xiàn)傳統(tǒng)硬件產(chǎn)品在使用時(shí)還沒有被滿足的需求點(diǎn)腌零,這需要對(duì)產(chǎn)品和應(yīng)用場(chǎng)景的充分理解梯找。在傳統(tǒng)硬件行業(yè),產(chǎn)品廠商才是硬件方面的專家益涧,要與產(chǎn)品本身的功能锈锤、調(diào)性、場(chǎng)景特征達(dá)到恰到好處的結(jié)合闲询,就需要充分了解產(chǎn)品廠商對(duì)產(chǎn)品的定義久免,調(diào)查和理解產(chǎn)品廠商的需要內(nèi)容源是什么,想表達(dá)的內(nèi)容在設(shè)備上有沒有扭弧,分別該如何處理和調(diào)整阎姥。這種與產(chǎn)品團(tuán)隊(duì)的深度對(duì)接,也是 DuerOS 現(xiàn)在正在花大力氣做的事鸽捻。
同時(shí)呼巴,DuerOS 敢自比 Android泽腮,很大程度上還在于留給廠商和開發(fā)者的定制化空間。一個(gè)很現(xiàn)實(shí)的問題是衣赶,在某些領(lǐng)域廠商和開發(fā)者并不想在自己的設(shè)備上用他人服務(wù)诊赊,這種時(shí)候,DuerOS 就需要開放更多后臺(tái)技術(shù)支持他們開發(fā)自己的服務(wù)府瞄,降低技術(shù)門檻的同時(shí)碧磅,留足自主發(fā)揮的余地,讓廠商和開發(fā)者在得到足夠的對(duì)話式 AI 能力的同時(shí)遵馆,又得以保留產(chǎn)品空間和特色鲸郊。
賦能產(chǎn)品和教育用戶,是同一過程的兩個(gè)方面
我們注意到货邓,除了國安廣視的機(jī)頂盒之外秆撮,DuerOS 在家庭場(chǎng)景下已經(jīng)落地的產(chǎn)品還包括智能電視、無屏電視等逻恐,這類傳統(tǒng)型家庭娛樂終端產(chǎn)品在交互上的可提升空間像吻,也是現(xiàn)在大量智能語音技術(shù)商首先盯上的突破口。
手動(dòng)操作不便的行車場(chǎng)景也一直都是語音智能廠商感興趣的領(lǐng)域复隆,此前也有廠商推出帶語音交互的智能后視鏡、智能導(dǎo)航儀等姆涩,而百度要做的則是依托于大數(shù)據(jù)挽拂,用人工智能賦能汽車這個(gè)品類。DuerOS 扮演的則是這個(gè)體系中的交互窗口骨饿,通過足夠流暢的自然語音交互亏栈,單輪和多輪對(duì)話等功能,讓汽車場(chǎng)景中的人機(jī)交互更加自然便捷宏赘。
家居绒北、車載、移動(dòng)等傳統(tǒng)硬件密集的場(chǎng)景察署,將成為首先打開用戶認(rèn)知的窗口闷游。除了著力構(gòu)建產(chǎn)業(yè)端生態(tài)之外,增強(qiáng)用戶對(duì)語音交互的認(rèn)識(shí)并感受它的便捷贴汪,加速市場(chǎng)教育脐往,也是包括 DuerOS 在內(nèi)的整個(gè)語音智能行業(yè)努力想達(dá)成的目標(biāo)。
百度不止一次表示扳埂,現(xiàn)階段商業(yè)化不是 DuerOS 的目標(biāo)业簿,認(rèn)為只要人機(jī)交互有一次躍升的改變,實(shí)現(xiàn)商業(yè)化完全不成問題阳懂。語音會(huì)讓越來越多用戶實(shí)現(xiàn)全天候的設(shè)備連接梅尤,無論是廣告還是內(nèi)容柜思,都可能在語音設(shè)備上有更多的空間。到了這一階段巷燥,無論是 DuerOS 還是開發(fā)者酝蜒,都會(huì)有很大的盈利空間。
但在現(xiàn)在這個(gè)階段矾湃,DuerOS 同時(shí)完成推動(dòng)行業(yè)生態(tài)構(gòu)建和教育消費(fèi)市場(chǎng)兩方面任務(wù)的方式亡脑,就是打通一條快速賦能、快速產(chǎn)品化的通道邀跃,讓人工智能技術(shù)能夠快速通過各種產(chǎn)品與服務(wù)和用戶霉咨、消費(fèi)者連接起來。
作為最大的中文搜索引擎拍屑,百度很清楚自己的優(yōu)勢(shì)在哪里途戒,在人工智能變革的時(shí)代,像所有互聯(lián)網(wǎng)巨頭一樣僵驰,百度期望的也是在最基礎(chǔ)的生態(tài)上做出自己的優(yōu)勢(shì)喷斋。