解讀翻譯機(jī)背后的技術(shù):AI常遂、語(yǔ)音和云服務(wù) | 對(duì)話(huà)微軟黃學(xué)東
一款主打可穿戴的翻譯機(jī)上線眾籌:Google 的翻譯,Alexa 的語(yǔ)音交互
一臺(tái)身兼多職的翻譯機(jī)。
近期,Kickstarter 眾籌網(wǎng)上線了一款翻譯機(jī)—— VoiceMojo籍茧。該產(chǎn)品支持 30 多種語(yǔ)言翻譯版述,并集成了 Google Translation 的翻譯技術(shù)以及 Alexa、Google Assistant 硕糊、Siri 的語(yǔ)音交互能力院水,主打國(guó)外市場(chǎng),眾籌套餐價(jià) 1350 港幣(約合 1148 元 )起简十,預(yù)計(jì)于今年 12 月份發(fā)貨檬某。
與同類(lèi)產(chǎn)品相比,VoiceMojo 外形上更像是一款藍(lán)牙耳機(jī)螟蝙,機(jī)身小巧輕便(重量?jī)H為 37g)恢恼,既能隨意放入口袋、錢(qián)包胰默,還能夾在衣服上场斑、套在脖子上進(jìn)行隨身攜帶漓踢。其正面設(shè)計(jì)了一個(gè)機(jī)身一半大小的「一鍵按鈕」,所有功能都可通過(guò)該按鈕+語(yǔ)音指令實(shí)現(xiàn)漏隐。
功能上喧半,VoiceMojo 也與一般的翻譯機(jī)稍有不同。除了語(yǔ)音翻譯的「本職」功能青责,VoiceMojo 還針對(duì)用戶(hù)的典型使用場(chǎng)景和需求痛點(diǎn)挺据,集成了隨行語(yǔ)音場(chǎng)景的其他功能,包括語(yǔ)音助手脖隶、語(yǔ)音記錄和耳機(jī)方面的功能扁耐。比起「翻譯機(jī)」,設(shè)計(jì)團(tuán)隊(duì)似乎也更傾向?qū)⑵涠ㄎ粸?b>「可穿戴語(yǔ)音 AI」产阱。
語(yǔ)音助手:湊齊 Alexa婉称、Google Assistant、Siri 三大家
VoiceMojo 雖然是一款翻譯機(jī)產(chǎn)品构蹬,但語(yǔ)音助手卻是它的主打功能王暗。VoiceMojo 集成了 Alexa、Google Assistant 以及 Siri 等主流語(yǔ)音服務(wù)平臺(tái)怎燥,可實(shí)現(xiàn)語(yǔ)音播放音樂(lè)瘫筐、收聽(tīng)新聞與天氣消息、點(diǎn)外賣(mài)铐姚、預(yù)訂 Uber 專(zhuān)車(chē)以及控制智能家居設(shè)備等功能。
其中肛捍,Alexa 與 VoiceMojo 的集成程度要高一些隐绵,為該設(shè)備的默認(rèn)語(yǔ)音助手。對(duì)此拙毫,團(tuán)隊(duì)介紹稱(chēng)依许,VoiceMojo 的語(yǔ)音助手功能,主要針對(duì)國(guó)外 Alexa 現(xiàn)有用戶(hù)群體的戶(hù)外活動(dòng)場(chǎng)景缀蹄,作為 Ehco 智能音箱的輔助性設(shè)備使用峭跳。目前,該團(tuán)隊(duì)也正在整合 Alexa 適用于戶(hù)外場(chǎng)景的 Skill缺前,后期將通過(guò)配套 App 推送給用戶(hù)蛀醉,提高這些 Skill 的使用率。
同時(shí)衅码,用戶(hù)也可以選擇 Google Assistant 和 Siri拯刁,但需要另外下載二者的官方 App 以及考慮手機(jī)的兼容性問(wèn)題,使用體驗(yàn)要比 Alexa 差些逝段。
語(yǔ)音翻譯:背靠 Google Translation 平臺(tái)垛玻、支持 30 多種語(yǔ)言翻譯
AI 翻譯技術(shù)的逐步成熟和出境游市場(chǎng)的火爆割捅,也逐漸催生了競(jìng)爭(zhēng)激烈的 AI 翻譯市場(chǎng)。據(jù)悉帚桩,VoiceMojo 國(guó)外市場(chǎng)面臨的競(jìng)品超過(guò) 12 款亿驾,其中包括 Travis 翻譯寶、IU 隨身翻譯機(jī)等账嚎。
為了增強(qiáng)自身的競(jìng)爭(zhēng)力颊乘,VoiceMojo 選擇搭載國(guó)外市場(chǎng)份額超過(guò) 60% 以上的 Google Translation 平臺(tái),支持 30 多種語(yǔ)言翻譯醉锄,準(zhǔn)確率為 97%乏悄。
此外,VoiceMojo 還搭載了自動(dòng)鑒別語(yǔ)言算法恳不,能自動(dòng)識(shí)別自然語(yǔ)言檩小,即在用戶(hù)按下「一鍵按鈕」開(kāi)啟翻譯功能后,翻譯機(jī)能自動(dòng)識(shí)別用戶(hù)的自然語(yǔ)言烟勋,并根據(jù)設(shè)置好的默認(rèn)互譯語(yǔ)言進(jìn)行翻譯规求,整個(gè)過(guò)程不到 1 秒。
針對(duì)「翻譯通過(guò)手機(jī)翻譯 App 就能實(shí)現(xiàn)卵惦,為什么要另買(mǎi)翻譯設(shè)備」這個(gè)問(wèn)題阻肿,VoiceMojo 團(tuán)隊(duì)的回答是,「更快」——用戶(hù)使用手機(jī)翻譯沮尿,從拿起手機(jī)到完成翻譯需要 7 步丛塌,而使用翻譯設(shè)備,則只需 3 步畜疾。
該團(tuán)隊(duì)還透露赴邻,在市場(chǎng)拓展過(guò)程中,他們發(fā)現(xiàn)啡捶,日籍游客對(duì)于翻譯機(jī)的需求更為強(qiáng)烈姥敛,其中的原因是,日籍游客的英語(yǔ)發(fā)音普遍不是很好瞎暑。因此彤敛,團(tuán)隊(duì)目前在針對(duì)日籍游客做用戶(hù)調(diào)研,希望聯(lián)合當(dāng)?shù)剡\(yùn)營(yíng)商了赌,推出對(duì)日籍游客更加友好的翻譯機(jī)墨榄,并且,「這一市場(chǎng)的潛力巨大」揍拆。
語(yǔ)音記錄:不僅能同傳渠概,還能跨系統(tǒng)實(shí)時(shí)轉(zhuǎn)文字
實(shí)際上,將語(yǔ)音轉(zhuǎn)換為可視化的文本格式已經(jīng)算不上稀奇,而能將「源語(yǔ)言」的語(yǔ)音轉(zhuǎn)化「目標(biāo)語(yǔ)言」的文本格式播揪,則更能體現(xiàn) VoiceMojo 的語(yǔ)音記錄功底贮喧。這一語(yǔ)言+文本格式同步轉(zhuǎn)換的功能,主要靠其內(nèi)置的雙模語(yǔ)音處理器實(shí)現(xiàn)猪狈。
完成文本轉(zhuǎn)換后箱沦,VoiceMojo 還會(huì)自動(dòng)將文本傳輸?shù)饺魏芜B接著的設(shè)備上,包括電腦雇庙、平板和智能手機(jī)等谓形,并能兼容所有類(lèi)型的操作系統(tǒng)。
針對(duì)會(huì)議記錄等多聲源場(chǎng)景疆前,VoiceMojo 還搭載了全向麥克風(fēng)寒跳,可實(shí)現(xiàn) 360 度拾音,從而提升拾音效果竹椒,進(jìn)而提高文本轉(zhuǎn)換準(zhǔn)確率童太。
除了三項(xiàng)主要功能,VoiceMojo 還附加了耳機(jī)方面的功能胸完。
其機(jī)身設(shè)置了 3.5 毫米音頻插孔书释,適用于相同尺寸的有線耳機(jī)或耳塞,能轉(zhuǎn)「有線」為「無(wú)線」赊窥。該功能的實(shí)現(xiàn)爆惧,只需三步:VoiceMojo 配對(duì)藍(lán)牙設(shè)備、將有線耳機(jī)插入 VoiceMojo 機(jī)身锨能、帶上耳機(jī)進(jìn)行無(wú)線收聽(tīng)(藍(lán)牙設(shè)備 10m 以?xún)?nèi)范圍)扯再。
值得注意的是,VoiceMojo 需要搭配 App 使用腹侣,所有功能的實(shí)現(xiàn)也都依賴(lài)于手機(jī)設(shè)備叔收。
VoiceMojo 的創(chuàng)始團(tuán)隊(duì) Letu(樂(lè)兔)成立于 2015,由來(lái)自香港傲隶、內(nèi)地和臺(tái)灣的設(shè)計(jì)師和工程師共同創(chuàng)立,致力于采用交互式語(yǔ)音應(yīng)答系統(tǒng)窃页,設(shè)計(jì)創(chuàng)新型語(yǔ)音識(shí)別電子產(chǎn)品跺株。目前,該公司已推出了 VisualSonic脖卖、VoiceMojo乒省、VoicePrism 等智能語(yǔ)音產(chǎn)品。