CES 上的音箱混戰(zhàn)中,渡鴉的 raven H 憑什么被評(píng)為 CES 最佳讲逛? | CES 2018
拿什么喚醒你的智能設(shè)備?這里是一份關(guān)于喚醒詞的調(diào)研報(bào)告
本篇文章將從數(shù)據(jù)的角度抛寝,科學(xué)的告訴你熊杨,智能語音交互產(chǎn)品該「叫」什么名字。
對(duì)話式 AI 技術(shù)正在重新定義人機(jī)交互的方式墩剖。為引領(lǐng)和定義最好的人機(jī)交互猴凹,百度 DuerOS 在 2017 年 11 月百度世界大會(huì)上,成立了百度 AI 交互設(shè)計(jì)院岭皂,擬以報(bào)告輸出郊霎、產(chǎn)品測(cè)評(píng)等形式,幫助 DuerOS 的合作伙伴和全球 AI 產(chǎn)品在交互設(shè)計(jì)上不斷提升優(yōu)化爷绘。本文系百度 AI 交互設(shè)計(jì)院對(duì)外發(fā)布的第二篇報(bào)告书劝。
和很多智能語音交互產(chǎn)品一樣,當(dāng)你使用搭載 DuerOS 系統(tǒng)的智能音箱的時(shí)候土至,需要多次這樣叫出它的名字「小度小度」购对,才能讓它更好的為我們服務(wù)。但是什么樣的名字才是好名字陶因?什么樣的名字順口悅耳人人喜愛骡苞?本篇文章將從數(shù)據(jù)的角度,科學(xué)的告訴你,智能語音交互產(chǎn)品該「叫」什么名字解幽。
什么是「喚醒」和「喚醒詞」贴见?
在討論名字之前,我們首先對(duì)語音交互過程中的一些定義做一個(gè)簡單的介紹躲株。
語音交互的過程片部,和我們平時(shí)與人交流的方式非常相似。比如某天中午你正坐在辦公室看到窗外陰天霜定,你擔(dān)心接下來會(huì)不會(huì)下雨档悠,于是你向正在低頭辦公的同事喊了一聲「小明」,小明聽到了抬頭看你表示在聽望浩,你接著問「今天會(huì)下雨么辖所?」小明打開手機(jī)查了一下今天的天氣預(yù)報(bào),然后回答你說「天氣預(yù)報(bào)說下午 3~4 點(diǎn)有雷陣雨」磨德。
在百度 AI 交互設(shè)計(jì)院的研究地圖中奴烙,語音交互流程被劃分為五個(gè)環(huán)節(jié):喚醒、響應(yīng)剖张、輸入切诀、理解、反饋搔弄。其中喚醒是每一次用戶與語音產(chǎn)品交互的第一個(gè)接觸點(diǎn)幅虑,因此喚醒環(huán)節(jié)的體驗(yàn)在整個(gè)語音交互流程中至關(guān)重要,它的體驗(yàn)好壞將直接影響用戶對(duì)產(chǎn)品的「第一印象」顾犹。
我們知道倒庵,盡管是「智能」的語音交互產(chǎn)品,機(jī)器仍然沒有我們?nèi)祟惵斆黛潘ⅰ?duì)于目前市面上常見的語音交互產(chǎn)品來說擎宝,一個(gè)眼神或者一個(gè)動(dòng)作還不能引起它的注意,因此需要定義一個(gè)將產(chǎn)品從待機(jī)狀態(tài)切換到工作狀態(tài)的詞語浑玛,我們稱這種詞為「喚醒詞」绍申。
還記得我們剛剛提到的「問天氣」的例子嗎?我們通過呼喊「小明」的名字顾彰,來引起他的注意极阅,而對(duì)于智能語音交互產(chǎn)品,我們也需要通過叫出「名字」涨享,也就是喚醒詞來激活設(shè)備筋搏。以智能音箱產(chǎn)品為例,「小度小度」是喚醒渡鴉 Raven H 的喚醒詞厕隧,「Hey Google」是喚醒 Google Home 的喚醒詞奔脐,「Alexa」是喚醒 Echo 的喚醒詞俄周。
喚醒詞對(duì)用戶體驗(yàn)的影響
百度 AI 交互設(shè)計(jì)院基于大量的對(duì)智能語音交互產(chǎn)品用戶測(cè)試的經(jīng)驗(yàn),發(fā)現(xiàn)影響語音喚醒體驗(yàn)的因素包含兩個(gè)維度——輸入和輸出髓迎。輸入環(huán)節(jié)的影響因素包括喚醒詞栈源、喚醒方式,輸出環(huán)節(jié)的影響因素包括喚醒響應(yīng)速度竖般、喚醒反饋方式、喚醒成功率和誤喚醒率茶鹃。為了確定影響語音喚醒體驗(yàn)的主要因素涣雕,我們通過問卷調(diào)查的方法對(duì)其重要性進(jìn)行了研究。調(diào)查結(jié)果發(fā)現(xiàn)闭翩,對(duì)于用戶來說挣郭,喚醒詞是語音喚醒輸入環(huán)節(jié)中較為重要的影響因素,且一個(gè)好的喚醒詞疗韵,會(huì)直接影響喚醒率兑障。
而目前,關(guān)于喚醒詞設(shè)計(jì)的關(guān)鍵因素還未進(jìn)行科學(xué)的研究蕉汪。鑒于此流译,本期我們以喚醒詞為對(duì)象進(jìn)行研究,希望能夠?qū)拘言~的設(shè)計(jì)提供理論和數(shù)據(jù)上的支持者疤。
怎樣設(shè)計(jì)一個(gè)好的喚醒詞福澡?
針對(duì)喚醒詞,我們先后通過以下兩個(gè)實(shí)驗(yàn)進(jìn)行了研究驹马。
實(shí)驗(yàn)一:現(xiàn)有喚醒詞組合方式研究
實(shí)驗(yàn)二:喚醒詞語音要素研究
下面我們對(duì)每個(gè)實(shí)驗(yàn)的結(jié)論進(jìn)行逐一詳述:
實(shí)驗(yàn)一:現(xiàn)有喚醒詞組合方式研究
首先革砸,我們對(duì)市場(chǎng)上各類語音交互設(shè)備喚醒詞的組合方式進(jìn)行拆解,發(fā)現(xiàn)喚醒詞均是在一個(gè)簡單「名字」的基礎(chǔ)上加以變化而構(gòu)成糯累,此外算利,「名字」本身也具備不同的構(gòu)成方式。在實(shí)驗(yàn)中泳姐,我們?yōu)橛脩籼峁┝瞬煌M合方式的喚醒詞效拭,由用戶根據(jù)其個(gè)人喜好程度在 5 點(diǎn)量表上進(jìn)行評(píng)價(jià)(1-非常不喜歡、2-不喜歡胖秒、3-一般允耿、4-喜歡、5-非常喜歡)扒怖。
實(shí)驗(yàn)結(jié)果表明较锡,不同組合方式下,用戶的喜好程度不同:
1)在以「名字」為基礎(chǔ)的不同組合方式中盗痒,「名字+名字」的疊詞式組合方式最受用戶喜歡蚂蕴,而「品牌+名字」的組合方式最不被用戶喜歡低散。
2)另外,就「名字」本身而言骡楼,「小+字」的名字最受用戶喜歡熔号。這點(diǎn)也與漢語人名命名習(xí)慣相符,『漢語人名用字的統(tǒng)計(jì)分析(鄭淑花鸟整,2010)』顯示引镊,「小」字在人名命名十大常用字之中。
實(shí)驗(yàn)二:喚醒詞語音要素研究
音節(jié)是聽覺上最容易分辨出來的語音單位篮条,也是最自然的語音單位弟头,漢字中一個(gè)漢字讀音就是一個(gè)音節(jié),每個(gè)基本音節(jié)都是由聲調(diào)涉茧、聲母和韻母三個(gè)部分構(gòu)成赴恨。
理想條件下,我們希望對(duì)喚醒詞每一音節(jié)的聲調(diào)伴栓、聲母伦连、韻母進(jìn)行研究,但是由于音節(jié)數(shù)的增加钳垮,研究變量數(shù)將大幅度增長惑淳,導(dǎo)致我們無法通過一次實(shí)驗(yàn)來完成。另外饺窿,通過文獻(xiàn)查閱汛聚,我們發(fā)現(xiàn)人們?cè)谄饾h語人名時(shí),會(huì)將尾音節(jié)的發(fā)音情況列入考量短荐,同時(shí)倚舀,漢語人名/寵物名統(tǒng)計(jì)研究中也多見其對(duì)尾音節(jié)發(fā)音情況的統(tǒng)計(jì)。
因此忍宋,綜合文獻(xiàn)和前文實(shí)驗(yàn)的結(jié)論痕貌,本次實(shí)驗(yàn)中我們以喚醒詞尾音節(jié)為研究對(duì)象,選取「小+字」的構(gòu)詞結(jié)構(gòu)糠排,變換尾音節(jié)舵稠,進(jìn)行喚醒詞的發(fā)音偏好實(shí)驗(yàn)。同時(shí)為避免用戶受漢字本身字義的影響入宦,實(shí)驗(yàn)中用戶看到的喚醒詞均為標(biāo)有聲調(diào)的拼音哺徊。在實(shí)驗(yàn)中,我們要求用戶根據(jù)其個(gè)人喜好程度在5點(diǎn)量表上對(duì)喚醒詞進(jìn)行評(píng)價(jià)(1-非常不喜歡乾闰、2-不喜歡落追、3-一般、4-喜歡涯肩、5-非常喜歡)轿钠。
實(shí)驗(yàn)結(jié)果表明:
1)聲調(diào)方面巢钓,用戶最喜歡陰平(1 聲);另外相較「仄聲」(3 聲上聲疗垛、4聲去聲統(tǒng)稱為「仄」)症汹,用戶更加喜歡「平聲」(1 聲陰平、2 聲陽平統(tǒng)稱為「平」)贷腕。
2)聲母方面背镇,用戶更加喜歡尾音聲母為零聲母,而包含了 z泽裳、c瞒斩、s 的舌尖前音最不被用戶所喜歡。
3)韻母方面诡壁,從韻母發(fā)音時(shí)的開口口型來看,用戶更喜歡開口口型較大的齊齒呼和開口呼荠割;另外從韻母結(jié)構(gòu)來看妹卿,音節(jié)韻母為單韻母的詞最受用戶的喜歡。
實(shí)驗(yàn)結(jié)果小結(jié)
本文主要圍繞智能語音交互設(shè)備的喚醒詞展開研究蔑鹦,從喚醒詞組合方式和語音要素兩個(gè)方面探討了影響用戶體驗(yàn)的因素夺克,我們發(fā)現(xiàn):
1)現(xiàn)有喚醒詞組成方式方面:
在以「名字」為基礎(chǔ)的不同組合方式中,「名字+名字」的疊詞式組合方式最受用戶喜歡嚎朽,而「品牌+名字」的組合方式最不被用戶喜歡铺纽;
就「名字」本身而言,「小+字」的名字最受用戶喜歡哟忍。
2)語音要素方面:
聲調(diào):用戶最喜歡陰平狡门,同時(shí)相較「仄聲」,用戶更加喜歡「平聲」锅很;
聲母:用戶更加喜歡尾音聲母為零聲母其馏,而包含了 z、c爆安、s 的舌尖前音最不被用戶所喜歡叛复;
韻母: 按照韻母發(fā)音時(shí)的口型開口情況來看,用戶更喜歡開口口型較大的齊口呼和開口呼扔仓;另外按照韻母結(jié)構(gòu)來看褐奥,音節(jié)韻母為單韻母的詞最受用戶的喜歡。
喚醒詞分類
基于本文的研究翘簇,相信你已經(jīng)掌握了如何構(gòu)造一個(gè)好的喚醒詞的方法了吧撬码?以下是我們結(jié)合收集的用戶自定義喚醒詞及本文研究結(jié)論,為喚醒詞作出的分類版保,供讀者們應(yīng)用參考耍群。
需要注意的是义桂,本文是從用戶視角出發(fā),對(duì)喚醒詞進(jìn)行了科學(xué)的研究和探討蹈垢,但是實(shí)際在設(shè)計(jì)喚醒詞時(shí)慷吊,需要考慮的因素還有很多,如:喚醒詞是否過于常見導(dǎo)致語音設(shè)備容易被誤喚醒曹抬,喚醒詞與品牌之間是否具有關(guān)聯(lián)溉瓶。另外,受當(dāng)前語音技術(shù)的限制谤民,現(xiàn)有的喚醒詞多以4音節(jié)詞居多堰酿,但未來隨著語音技術(shù)的進(jìn)步,喚醒詞的長度存在變短的趨勢(shì)张足,在設(shè)計(jì)喚醒詞時(shí)還應(yīng)考慮其可優(yōu)化的空間等等触创。
特別注明:由于實(shí)驗(yàn)設(shè)定的條件和樣本數(shù)量等限制因素,本次實(shí)驗(yàn)研究結(jié)論或許不能代表所有智能產(chǎn)品用戶在家居環(huán)境的全部感受为牍,但希望通過我們的研究和探索哼绑,可以為語音交互中喚醒環(huán)節(jié)的設(shè)計(jì)提供支持和依據(jù),幫助打造自然和極致的語音交互體驗(yàn)碉咆。
內(nèi)容來源:百度 AI 交互研究院
題圖:搭載 DuerOS 的 Sengled 小迪智能音箱燈
責(zé)任編輯:陳壹零