還別說,耳機(jī)鑲鉆胎撇,真好看介粘!
聊天機(jī)器人如何通過「知識(shí)圖譜」變得更加智能抒寂? | 活動(dòng)回顧
知識(shí)圖譜通過對(duì)現(xiàn)有數(shù)據(jù)的挖掘、抽取掠剑、加工蓬推,將信息融合為統(tǒng)一的全局知識(shí)庫。
聊天機(jī)器人沸伏,是一種通過自然語言模擬人類進(jìn)行對(duì)話的程序,很多大型互聯(lián)網(wǎng)公司投入重金研發(fā)相關(guān)技術(shù)动分,并陸續(xù)推出相關(guān)產(chǎn)品:蘋果的 Siri毅糟、微軟的小冰、百度的小度澜公、Google Allo 等等姆另,涵蓋娛樂、教育坟乾、醫(yī)療等領(lǐng)域迹辐。
本期來到 AI & ROBO Class 的嘉賓是深圳灣的老朋友 —— 王昊奮,他畢業(yè)于上海交通大學(xué)甚侣,曾任教于華東理工大學(xué)明吩,如今是深圳狗尾草科技 CTO,在語義技術(shù)和圖數(shù)據(jù)管理方面有豐富的經(jīng)驗(yàn)殷费。在活動(dòng)現(xiàn)場(chǎng)印荔,王昊奮結(jié)合多年的教學(xué)和研發(fā)經(jīng)驗(yàn),為在座的機(jī)器人從業(yè)者分享聊天機(jī)器人面臨的機(jī)遇和挑戰(zhàn)详羡。
聊天機(jī)器人的誕生比你想象中的早
在眾人眼中仍律,語音聊天機(jī)器人似乎是近幾年才發(fā)展起來的新興事物,其實(shí)实柠,聊天機(jī)器人卻已經(jīng)經(jīng)過了半個(gè)世紀(jì)的研究和發(fā)展水泉。
早在 1966 年,計(jì)算機(jī)科學(xué)家約瑟夫.維森班就設(shè)計(jì)出了世界上最早的聊天機(jī)器人 —— Eliza窒盐,但是 Eliza 并沒有人們想象中的那么智能草则,而且只能完成針對(duì)特定領(lǐng)域的對(duì)話。它被設(shè)定為一個(gè)精神治療師登钥,會(huì)模擬真實(shí)的醫(yī)生對(duì)用戶進(jìn)行提問畔师,比如「你對(duì)那件事感覺如何?」「你覺得那是什么意思牧牢?」看锉,它會(huì)重復(fù)這些開放而模糊的問題姿锭。
隨后的幾十年里,不斷有新的聊天機(jī)器人誕生伯铣,比如 Dr. Sbaitso呻此、「人工語言在線計(jì)算機(jī)實(shí)體」A.L.I.C.E 聊天機(jī)器人、IBM 的 Watson 以及我們現(xiàn)在已經(jīng)熟知的 Siri腔寡、Cortana焚鲜、Alexa 等。
王昊奮認(rèn)為:「如今的聊天機(jī)器人放前,從應(yīng)用場(chǎng)景上來看忿磅,可以分為在線客服、娛樂凭语、教育葱她、個(gè)人助理和智能問答五個(gè)種類。」 比如微軟推出的基于情感計(jì)算機(jī)器人「小冰」似扔,其首要目的就是供網(wǎng)友進(jìn)行「娛樂」吨些,同時(shí)讓人工智能的概念在大眾中普及開來,而手機(jī)上的 Siri炒辉、小度豪墅、Google Now 的功能則更加工具化,用于個(gè)人語音助理黔寇,輔助用戶處理個(gè)人工作和生活上事物偶器。
自然語言處理三步:自然語言理解、對(duì)話管理啡氢、自然語言生成
要實(shí)現(xiàn)人機(jī)間的自然語言通信状囱,意味著計(jì)算機(jī)既能理解自然語言文本的意義术裸,也能以自然語言文本表達(dá)既定的思想和意圖倘是。具體來說,自然語言處理技術(shù)包括了自然語言理解(Natural Language Understanding)袭艺、對(duì)話管理(Dialogue Management)搀崭、自然語言生成(Natural Language Generation)三個(gè)部分。
自然語言理解包括很多層面猾编,從語法上來講瘤睹,它包括了詞性的標(biāo)注,專有名詞的識(shí)別答倡,形態(tài)的分析轰传;從語義理解上來講,它包括了語言之間邏輯的推理瘪撇,語義的計(jì)算获茬,對(duì)話的理解港庄;從文本篇章的層面上理解,它還包括情感分析恕曲,觀點(diǎn)提取等鹏氧。
王昊奮指出,在歧義消除佩谣、用戶意圖識(shí)別把还、語言多變性的處理上,目前的自然語言理解還有很大的提升空間茸俭〉趼模「比如,我對(duì)機(jī)器人說调鬓,我想聽『海闊天空』率翅,傳統(tǒng)的自然語言理解只能識(shí)別出這是一首歌的名稱,并不知道我想要聽的是 Beyond 的 『海闊天空』袖迎,還是信樂團(tuán)的『海闊天空』冕臭,或者是其他翻唱的版本⊙嘧叮」王昊奮說到辜贵。
當(dāng)我們跟機(jī)器人聊天時(shí),是希望可以有多輪對(duì)話归形,能夠一直聊下去托慨,而不是單純的一問一答,所以對(duì)話管理就非常重要暇榴。對(duì)話管理指的是對(duì)話狀態(tài)的更新以及下一步動(dòng)作的規(guī)劃執(zhí)行厚棵,具體來說,它包括了對(duì)話狀態(tài)的跟蹤蔼紧,對(duì)話策略的構(gòu)建婆硬,用戶與對(duì)話媒介的情感建模,對(duì)話程序的個(gè)性建模以及話輪的轉(zhuǎn)換奸例。
另外彬犯,在機(jī)器人在接收并理解了用戶的語言之后,需要找到最佳的語言表達(dá)方式將內(nèi)容和思想反饋給用戶查吊。整個(gè)自然語言生成的過程包括了內(nèi)容選擇谐区、文本規(guī)劃、句子合成逻卖、指代表達(dá)生成宋列、表層實(shí)現(xiàn)等階段。
以目前的發(fā)展來看评也,自然語言生成還存在著很多不足炼杖,如海量的文法結(jié)構(gòu)戈鲁,上下文的整合,以及通過深度學(xué)習(xí)生成答復(fù)的對(duì)話模型很難解釋嘹叫,而這些只能通過更好的語料和參數(shù)調(diào)整來改善婆殿。
知識(shí)圖譜能提供更有價(jià)值的決策支持
2012 年,「知識(shí)圖譜」的概念首先由谷歌提出罩扇,并且將此技術(shù)應(yīng)用在 Google Now 語音服務(wù)上婆芦,從此,知識(shí)圖譜逐漸成為百度喂饥、搜狗等科技公司所追捧的語義分析技術(shù)消约。王昊奮從大四起就開始了知識(shí)圖譜的研究,而那時(shí)的知識(shí)圖譜還被叫做語義萬維網(wǎng)员帮。
「采用了知識(shí)圖譜或粮、邏輯推理機(jī)的機(jī)器人具有記憶功能,同時(shí)有一定的推理能力捞高,使對(duì)話更加流暢自然氯材。」王昊奮說硝岗。
知識(shí)圖譜為深度學(xué)習(xí)的訓(xùn)練提供先驗(yàn)知識(shí)氢哮,而基于知識(shí)圖譜設(shè)計(jì)的用戶畫像和個(gè)性設(shè)定,則能保證虛擬人物交互信息的一致性型檀。
類比人類智慧的形成依賴知識(shí)和經(jīng)驗(yàn)冗尤,機(jī)器依靠知識(shí)圖譜和大數(shù)據(jù),通過人工智能來類比人類胀溺。這里抽象知識(shí)積累所形成的經(jīng)驗(yàn)可以通過知識(shí)規(guī)則或深度學(xué)習(xí)的模型來刻畫裂七,而深度學(xué)習(xí)訓(xùn)練需要的大數(shù)據(jù)可通過知識(shí)圖譜的數(shù)據(jù)增強(qiáng)來實(shí)現(xiàn)。
具體來說仓坞,一個(gè)通用的結(jié)合了知識(shí)圖譜和深度學(xué)習(xí)的框架背零,依賴知識(shí)圖譜對(duì)輸入的文字進(jìn)行實(shí)體和關(guān)系等語義理解,通過深度學(xué)習(xí)包括各種序列到序列學(xué)習(xí)的框架得到候選輸出扯躺,通過推理來做最后回答的排序和過濾來實(shí)現(xiàn)最后的輸出捉兴。
聊天機(jī)器人未來的機(jī)遇和挑戰(zhàn)
現(xiàn)場(chǎng)觀眾提問
在談到聊天機(jī)器人的未來時(shí),王昊奮說:「以現(xiàn)在的發(fā)展來看录语,我認(rèn)為聊天機(jī)器人在某些特定場(chǎng)景的應(yīng)用會(huì)更加普及,比如客服禾乘,法律和醫(yī)療的咨詢澎埠。」
事實(shí)上始藕,聊天機(jī)器人已經(jīng)開始慢慢滲透至這些細(xì)分的領(lǐng)域中蒲稳。IBM 的 Watson 機(jī)器人已經(jīng)在醫(yī)院里輔助醫(yī)生對(duì)病人進(jìn)行醫(yī)療診斷氮趋,另外,基于 Watson 的技術(shù)江耀,IBM 推出了世界首位人工智能律師 ROSS剩胁。
當(dāng)然,如今的自然語言處理和機(jī)器人技術(shù)遠(yuǎn)不夠成熟祥国,在長對(duì)話昵观、上下文處理、個(gè)性化回答舌稀、意圖以及情商的體現(xiàn)上還相當(dāng)欠缺啊犬。隨著時(shí)間的推進(jìn)技術(shù)會(huì)不斷地更新迭代,彼時(shí)聊天機(jī)器人就能打開更廣闊的應(yīng)用空間壁查。