隨時(shí)喚醒語(yǔ)音助手,真不是一句話(huà)的事兒 | 深圳灣夜話(huà)
聲加科技推出低功耗語(yǔ)音本地喚醒 + 雙麥 SVE 降噪技術(shù)方案,助力 TWS 耳機(jī)智能化
高效、高品質(zhì) TWS 耳機(jī)技術(shù)解決方案
耳機(jī)搭載語(yǔ)音助手已經(jīng)成為目前 TWS 耳機(jī)的主流趨勢(shì),但目前市面上絕大部分產(chǎn)品使用的還是以基于手機(jī)的語(yǔ)音識(shí)別方案简肴,用戶(hù)每一次的語(yǔ)音指令都要首先喚醒手機(jī)語(yǔ)音助手晃听,造成響應(yīng)速度較慢(切換歌曲需要等待 5~6 秒)。不少用戶(hù)因此放棄了語(yǔ)音喚醒功能,寧可使用手勢(shì)或按鍵能扒,甚至只能拿出手機(jī)進(jìn)行操作佣渴,體驗(yàn)欠佳。
這主要受限于耳機(jī)運(yùn)算能力較弱初斑,電池續(xù)航時(shí)間短辛润,耳機(jī)設(shè)備端進(jìn)行精確的語(yǔ)音識(shí)別造成了極高難度。聲加科技推出了一系列解決方案见秤,以解決 TWS 耳機(jī)實(shí)時(shí)喚醒砂竖、語(yǔ)音交互的諸多問(wèn)題。
關(guān)鍵詞喚醒(KWS)有限語(yǔ)音命令方案
聲加科技的關(guān)鍵詞喚醒(KWS)有限語(yǔ)音命令方案鹃答,可實(shí)現(xiàn)喚醒低功耗計(jì)算方案乎澄,KWS 啟動(dòng)和手機(jī)語(yǔ)音交互,有限語(yǔ)音命令實(shí)現(xiàn)切歌测摔、調(diào)音量等基本操作三圆。在算法所需資源消耗上,低至 30Mips避咆, 50KBytes memory 的喚醒詞模型(m4f 平臺(tái))舟肉,模型規(guī)模可變查库,能根據(jù)產(chǎn)品計(jì)算資源快速調(diào)整模型路媚,還能整合聲加自有前端語(yǔ)音增強(qiáng),優(yōu)化整體性能樊销。
雙麥 SVE 降噪技術(shù)方案
SVE(Soundplus Voice Enhancement)降噪技術(shù)可以廣泛應(yīng)用于耳塞式耳機(jī)整慎、半入耳式耳機(jī)、入耳式耳機(jī)围苫、頭戴式耳機(jī)裤园、掛耳式耳機(jī)等,是通過(guò)雙麥克風(fēng)陣列剂府,精準(zhǔn)計(jì)算通話(huà)者說(shuō)話(huà)的方位拧揽,在保護(hù)主方向目標(biāo)語(yǔ)音的同時(shí),去除環(huán)境中的各種干擾噪聲腺占,例如其他人的講話(huà)聲淤袜、交通工具產(chǎn)生的噪音、風(fēng)噪聲等等衰伯,有效抑制 90% 的反向環(huán)境噪聲铡羡,由此降低環(huán)境噪聲最高可達(dá) 30dB,保證高品質(zhì)通話(huà)效果意鲸。
其核心技術(shù)包括:
- 回聲消除 AEC:支持單通道回聲抵消烦周、雙通道立體聲回聲抵消尽爆,可在設(shè)備自身播放大音量時(shí)輕松喚醒,ERLE>30dB读慎。
- 聲源定位 Direction of arrival estimation:支持多源定位教翩,以及在強(qiáng)混響及噪聲干擾情況下準(zhǔn)確定位目標(biāo)聲源;
- 定向拾音贪壳、環(huán)境降噪(尤其是風(fēng)噪抑制):能有效降低通話(huà)時(shí)的環(huán)境噪聲饱亿,即使身處嘈雜環(huán)境,也能保障高清晰的語(yǔ)音識(shí)別以及通話(huà)質(zhì)量闰靴。耳機(jī)使用場(chǎng)景復(fù)雜且運(yùn)算資源受限彪笼,如果只依靠基于深度學(xué)習(xí)的小資源語(yǔ)音識(shí)別模型,在嘈雜環(huán)境下會(huì)存在誤識(shí)率高蚂且、識(shí)別率低的問(wèn)題配猫。
目前,聲加科技的耳機(jī)技術(shù)方案已應(yīng)用在了華為 Flypods杏死、小米 Air泵肄、小米 Air2、萬(wàn)魔 EM001淑翼、萬(wàn)魔 EM004腐巢、京東京魚(yú)座等產(chǎn)品上。
編輯:陳宇凡 / 深圳灣
題圖:小米 Air 2