拿什么喚醒你的智能設備?這里是一份關(guān)于喚醒詞的調(diào)研報告
如何提高人工智能的情商?揭秘語音交互話術(shù)中的六大普適性原則
以目標為中心溶其、準確骚腥、簡潔、自然瓶逃、友好桦沉、有個性
「與機器像和人一樣對話」大概是人類對人工智能最初的設想金闽,也是人類希望在人工智能領(lǐng)域?qū)崿F(xiàn)的目標。
然而剿骨,現(xiàn)在的人工智能還僅僅停留在「可以說話」的階段代芜,離「會說話」還存在不小的差距,我們經(jīng)撑ɡ可以聽到「這個問題我還理解不了挤庇,如果你想……,可以這樣對我說……」諸如此類「低情商」的反饋贷掖。
為了探索讓機器如何「像人一樣說話」嫡秕,本篇文章將從用戶視角出發(fā),嘗試從藝術(shù)和人性的角度對語音交互中的機器話術(shù)進行闡述苹威,主要包含以下內(nèi)容:
1. 話術(shù)設計研究:我們?nèi)绾巫龅?/p>
2. 話術(shù)設計原則:用戶關(guān)注什么昆咽?哪個更重要
3. 話術(shù)設計建議:原則如何指導話術(shù)設計
本文轉(zhuǎn)載自百度 AI 交互設計院。
話術(shù)設計研究:我們?nèi)绾巫龅模?/b>
當下的話術(shù)研究多從研究者視角出發(fā)牙甫,原則主要源自研究者的日常觀察掷酗、哲學思辯和專業(yè)判斷。本次窟哺,我們從用戶視角出發(fā)來探討話術(shù)泻轰,研究過程如下:
1. 案頭研究
我們對人與人的對話結(jié)構(gòu)和對話原則進行了系統(tǒng)梳理,特別推薦 Grice 的「合作原則」(出自《邏輯與會話》演講且轨,1967)和索振羽的「得體原則」(出自《語用學教程》第二版浮声,2014)虚婿。這一步至關(guān)重要,它加深了我們對「對話」的理解泳挥,這些原則也成為我們設計實驗話術(shù)時的重要參考依據(jù)然痊。
2. 對話場景設計
為覆蓋盡可能多的場景,我們系統(tǒng)梳理了語音交互的典型場景羡洁,如聽音樂玷过、問天氣、家居控制筑煮、生活服務等辛蚊。同時,每個場景下也細分了機器的不同狀態(tài)真仲,如是否聽清袋马、能否識別、是否有能力滿足等秸应。
3. 具體話術(shù)設計
對話場景梳理清晰后虑凛,我們針對每個場景設計實驗所需話術(shù)。話術(shù)來源主要有二软啼,一是主流語音交互產(chǎn)品的現(xiàn)有話術(shù)桑谍,二是研究者基于人與人的對話原則撰寫而成的話術(shù)。
4. 話術(shù)實驗
上述準備完成后祸挪,進入正式實驗階段锣披。在實驗中,我們創(chuàng)設了各類場景(具體場景見「對話場景設計」部分)贿条,并且模擬了真實的人機對話過程(所有實驗話術(shù)均轉(zhuǎn)為語音合成音進行播報)雹仿,要求用戶基于真實體驗對不同場景下每類話術(shù)的喜好度進行評價。
同時整以,我們使用了「參與式設計」胧辽,以「假如你是機器,你會如何回答」為起點公黑,引導用戶更深地參與到話術(shù)設計中邑商,共同探討實驗話術(shù)以及更為理想的表達方式。這一過程使我們獲得了大量源自用戶的鮮活話術(shù)凡蚜,也使我們能從更豐富的角度挖掘用戶構(gòu)建話術(shù)的原則奠骄、方法與技巧。
5. 設計原則提煉與驗證
基于案頭研究和實驗發(fā)現(xiàn)番刊,我們提煉了初步的設計原則含鳞。之后,要求用戶對原則的可理解性芹务、全面性蝉绷、適用性等進行評估鸭廷。經(jīng)過多輪評估,我們不斷調(diào)整原則熔吗,最終獲得了現(xiàn)在的話術(shù)設計原則辆床。
話術(shù)設計原則:用戶關(guān)注什么?哪個更重要桅狠?
我們發(fā)現(xiàn)讼载,在用戶心中,好的話術(shù)要兼顧理性和感性原則中跌。理性原則體現(xiàn)在「機器的話是有用的」咨堤,話術(shù)應該是以目標為中心、準確漩符、簡潔的一喘;感性原則強調(diào)「對話過程令人愉悅」,話術(shù)應該是自然嗜暴、友好凸克、有個性的。
同時闷沥,我們要求用戶基于自身體驗對各原則的重要性進行了 1-10 級評價萎战,其中1分代表非常不重要,10 分代表非常重要舆逃,分數(shù)越高蚂维,重要性越高。
結(jié)果發(fā)現(xiàn)颖侄,現(xiàn)階段,用戶更看重理性原則享郊,尤其是以目標為中心览祖,準確,而自然炊琉、友好等感性原則暫居相對次要的位置展蒂。
此外,我們也梳理了不同原則下的具體評估指標苔咪,這些指標代表在該原則下锰悼,用戶在對話中具體的關(guān)注點。不同指標的重要性有所不同团赏,詳見下表箕般。
話術(shù)設計建議:原則如何指導話術(shù)設計?
接下來舔清,我們一起看看上述這些原則如何指導具體的機器話術(shù)設計丝里。
1. 以目標為中心原則
以目標為中心是用戶最為看重的原則曲初。用戶非常重視效率(閑聊場景除外),他們希望機器的回復與自己的需求高相關(guān)杯聚,可以快速達成心中所想臼婆。
同時,用戶表示在語音交互中幌绍,需要更多「引導」颁褂,尤其需要了解機器當下和未來狀態(tài)。語音看不見摸不著傀广,我們無法像在圖形用戶界面(GUI)中那樣——通過導航條判斷所在的位置颁独,看到按鈕可以判斷是否點擊等。如果缺少必要的引導主儡,用戶在語音交互中很容易迷茫奖唯,產(chǎn)生各類負面情緒。
因此糜值,話術(shù)設計時丰捷,必須遵循以目標為中心原則,做好引導寂汇,讓用戶可以通過聲音「看到」通往需求的路徑病往。基于此原則骄瓣,設計話術(shù)時可考慮以下幾條建議:
建議 1:優(yōu)先回應用戶的核心意圖
圍繞用戶最關(guān)心的問題優(yōu)先給出適合的回應停巷。
建議 2:清楚傳達機器當前的情況
如果因為各種原因無法直接滿足用戶需求時,應及時告知榕栏,避免用戶困惑畔勤。
建議 4:告訴用戶接下來怎么做
不能清晰識別用戶意圖時妨托,可主動詢問用戶有可能的意圖缸榛,引導用戶完成目標。
建議 5:提供相關(guān)替代方案
在無法直接滿足用戶時兰伤,可考慮提供相關(guān)度較高的替代方案内颗,間接滿足用戶。
2. 準確原則
用戶認為表達準確是最基本的原則敦腔。表述不準確可能導致用戶誤解均澳、無法判斷機器所要傳達的真正含義,使對話脫離正軌甚至無法進行。
基于準確原則负懦,設計話術(shù)時可考慮以下建議:
建議 1: 避免表述有歧義
表述的含義要確定筒捺,不要說讓用戶「這樣理解可以,那樣理解也可以」的話纸厉∠悼裕口語中最常見的歧義是同音歧義,即語音相同帶來的歧義颗品。以下兩類同音歧義肯尺,話術(shù)設計時需要注意:
同音異形詞歧義,如播放菜譜時提到「切 ji 放糖」躯枢,是「記」還是「忌」则吟?
同音同形詞歧義,如閑聊時提到「我最喜歡杜鵑啦」锄蹂,是杜鵑這種花還是杜鵑這種鳥氓仲?
建議 2:避免表述過于籠統(tǒng)模糊
表述要盡可能具體明確,避免過于籠統(tǒng)模糊得糜。
我們來看下面一個案例敬扛,研究中,面對第一種話術(shù)朝抖,大多數(shù)用戶表示「有點懵」啥箭,「是給音箱起名字,還是告訴音箱自己的名字治宣?不知道該怎么回答」急侥。而第二種話術(shù)則明確指出是「音箱對自己的稱呼」。
3. 簡潔原則
在研究中侮邀,用戶多次提到「不喜歡這個話術(shù)坏怪,太啰嗦了,能不能揀重點說」绊茧,「說太多了铝宵,壓根沒記住啊」,這些抱怨體現(xiàn)了用戶對簡潔的重視按傅。
用戶如此重視簡潔是必然的捉超。語音是一維線性的胧卤,只能一個字一個字的聽完唯绍,無法快進,不能后退枝誊。哪怕信息不相關(guān)况芒、無意義,用戶都無法略過。這些冗余信息既浪費用戶時間绝骚,也會增加用戶的煩躁情緒耐版。
更重要的是,大腦能處理的語音信息量有限压汪,一旦超出會給人的工作記憶造成負擔粪牲。長期以來,神奇數(shù)字 7±2 被認為是工作記憶的容量止剖,但近期這一標準遭到質(zhì)疑腺阳,普遍認為這一估計偏高。有研究者(Mastin穿香,2010)認為這一數(shù)字可能是 4±1亭引。
基于此原則,設計話術(shù)時可考慮以下幾條建議:
建議 1:表述簡單明了皮获,不啰嗦
傳遞必要信息前提下焙蚓,保持話術(shù)簡潔。
建議 2:避免信息量過大洒宝,一次提供的選項不超過三個
單次交互提供的信息量不要過大购公,以免給用戶造成認知和記憶負擔。
4. 自然原則
在研究中待德,聽到某些話術(shù)君丁,用戶紛紛表示「這太生硬了,一點都不自然」将宪,「這明顯就是機器說的話绘闷,人怎么可能這么說呢」。用戶希望話術(shù)可以貼近生活较坛,盡可能自然印蔗。
這是非常好理解的。在人機語音交互中丑勤,人類最想使用的肯定是自然語言华嘹。口頭語言是人類最擅長法竞,使用門檻最低的自然語言耙厚,人類使用口頭語言進行交流的歷史已跨越十萬年。與之相比岔霸,書面語言的發(fā)展不過五千年薛躬,計算機語言更是剛剛萌芽。因此呆细,設計話術(shù)時型宝,可參考漢語口頭語言的特點,營造「自然感」。
基于此原則趴酣,設計話術(shù)時可考慮以下幾條建議:
建議 1:措辭口語化
日常對話中梨树,我們會使用豐富多彩的重疊詞(如看看、馬上馬上)岖寞、語氣詞(如吧抡四、呢、哈)仗谆、感嘆詞(如哎床嫌!天!)胸私、惟妙惟肖的象聲詞(如噗通厌处、呼啦)、填補詞(如嗯岁疼,呃)阔涉,也會妙用各種副語言,如「哼哼」之類的鼻化音捷绒、笑聲瑰排、顫音等等。話術(shù)設計中暖侨,可以參考這些口語化的表達椭住。
尤其注意,話術(shù)設計時要盡可能避免專業(yè)術(shù)語字逗、技術(shù)名詞京郑、晦澀用語等。
建議 2:句式自然葫掉,可使用話語標記
口語中句子多短小些举,結(jié)構(gòu)簡單。語言學研究發(fā)現(xiàn)俭厚,口語中長句占比僅 19%户魏,短句占比達到 81%(超過 7 個實詞的單句為長句,反之為短句挪挤。實詞指具有實際含義且能單獨充當句子成分的詞)叼丑。話術(shù)設計時可考慮這一特點,盡可能使用短句扛门。
另外鸠信,口語對話中會使用「話語標記語」做句子之間的過渡,話術(shù)設計時也可參考尖飞。常見的話語標記有:「首先…然后…最后」之類的序列標記症副;「開始」、「以后」之類的時間標記政基;「這」贞铣、「那」之類的指示詞等。
建議 3:增加措辭多樣性
使用同義詞為固定的答案增加多樣性沮明,比如表示確認的時候辕坝,可以隨機呈現(xiàn)「ok」、「收到」荐健、「好的」酱畅、「沒問題」等等。這些同義詞可以增加對話活力江场,讓對話更自然纺酸。
5. 友好原則
研究中,我們發(fā)現(xiàn)址否,用戶很反感機器以「高人一等」的姿態(tài)說話餐蔬,尤其反感被機器指責。高人一等的話語和指責會讓用戶覺得「不忿」佑附、「挫敗」樊诺,甚至會喪失對機器的「信任」。
人是社會性動物音同。日常交往中词爬,我們更喜歡對我們友好、喜歡我們的人权均,而傾向遠離那些不夠友善的人顿膨。判斷對方是否友善,語音是最直觀的線索叽赊。在人機語音交互中虽惭,我們同樣能根據(jù)機器的應答判斷其是否友好。因此蛇尚,話術(shù)設計時要重視友好芽唇。
基于此原則,話術(shù)設計時可考慮以下幾條建議:
建議 1:錯誤歸為機器取劫,而非人
錯誤發(fā)生時匆笤,從機器的角度說明出錯原因。
建議 2:避免要求用戶按照特定的方式表達
尊重用戶的說話方式谱邪,不要試圖教給用戶怎么說話炮捧。
建議 3:體現(xiàn)「關(guān)注用戶需求」的服務態(tài)度
即使不能滿足用戶需求,也要體現(xiàn)出努力幫助用戶的態(tài)度惦银。
6. 有個性原則
必須強調(diào)咆课,話術(shù)體現(xiàn)的個性必須與產(chǎn)品人設保持一致末誓,比如冷靜成熟的產(chǎn)品人設就不太適合嗲嗲說話撒嬌賣萌的話術(shù)。
本次我們發(fā)現(xiàn)书蚪,用戶對「幽默」的話術(shù)接受度較高喇澡。在人際交往中,幽默能提升他人對自己的印象殊校,讓人感覺親密并能幫助人們緩解壓力晴玖。語用學研究也發(fā)現(xiàn),只要適合特定場景为流,幽默話語的交際效果是最佳的呕屎。
不過,幽默具有明顯的文化和群體差異敬察,「甲之蜜糖秀睛,乙之砒霜」,設計話術(shù)時需特別注意莲祸。
建議 1:遇到難題時琅催,可考慮使用幽默話術(shù)回應
遇到無法實現(xiàn)的功能時,通過幽默話術(shù)回應用戶虫给,調(diào)節(jié)氛圍藤抡。
建議 2:娛樂話題的表述可以更加活潑有趣
討論一些娛樂話題或閑聊時,話術(shù)可以考慮增添更多趣味元素抹估。
小結(jié)
本文從用戶視角出發(fā)缠黍,闡述了機器話術(shù)設計的6大普適性原則,以及如何基于這些原則設計話術(shù)药蜻。我們定義的設計原則及提供的設計建議如下:
話術(shù)研究具有挑戰(zhàn)性瓷式。話術(shù)與對話場景、對象语泽,產(chǎn)品本身的人設贸典、特性,系統(tǒng)語音識別踱卵、語義理解能力等均具有密切關(guān)系廊驼。但這不妨礙我們通過參與式的用戶研究探索話術(shù)設計的普適性原則。所謂「深根固柢」惋砂,這些原則是機器話術(shù)設計時的基礎與根基妒挎,有助于我們打造更自然和極致的語音對話體驗。
我們也以此研究為契機西饵,開始探索在AI時代酝掩,在機器話術(shù)這個領(lǐng)域,如何將技術(shù)和藝術(shù)眷柔、人性結(jié)合期虾,希望能帶來讓用戶內(nèi)心真正喜歡的體驗原朝。
機器話術(shù)作為一個充滿藝術(shù)特色又與人性密不可分的主題,還有著許多未知且充滿魅力的方面值得探索镶苞。希望本次研究可以拋磚引玉喳坠,引發(fā)更多同仁更深入的研究。
內(nèi)容來源:百度 AI 交互研究院
題圖:搭載 DuerOS 解決方案的智能電視
實習編輯:江翎海