20
|
2017-12-29

即刻體驗無需麥克風(fēng)陣列的遠(yuǎn)場語音識別恐仑,語智科技 FFASR 開發(fā)者平臺上線

遠(yuǎn)場交互不再局限于麥克風(fēng)陣列泉坐,使任意麥克風(fēng)采集的音頻亦可接入云端識別引擎,獲得語音識別結(jié)果裳仆。

兩周前,北京語智科技公司在公布了完成 2000 萬元 Pre-A 輪融資的消息時候歧斟,同時向業(yè)界透露了其遠(yuǎn)場語音識別引擎 FFASR 開發(fā)者平臺(FFASR, Far-Field Automatic Speech Recognition)纯丸。消息在深圳灣(微信公眾號 ID:shenzhenware)發(fā)布后,收到了不少業(yè)界資深人士的反饋静袖,希望真實體驗這一平臺如何助力 IoT 設(shè)備商實現(xiàn)無需麥克風(fēng)陣列的遠(yuǎn)場語音識別觉鼻。

2017 年 12 月 28 日,恰逢「計算機之父」馮·諾依曼生日队橙,或許是為了致敬這位前輩坠陈,語智科技的遠(yuǎn)場語音識別開發(fā)者平臺上線萨惑。登陸語智科技官網(wǎng),即可調(diào)用 API 免費接入:www.yuzhix.com仇矾。

語智科技 FFASR 是專門針對于遠(yuǎn)場語音交互開發(fā)的識別引擎庸蔼,使遠(yuǎn)場交互不再局限于麥克風(fēng)陣列,使任意麥克風(fēng)采集的音頻亦可接入云端識別引擎贮匕,獲得語音識別結(jié)果姐仅。

FFASR 技術(shù)原理

語智 FFASR 和傳統(tǒng)的 ASR 有什么區(qū)別呢?

在聲學(xué)降噪方法方面刻盐,傳統(tǒng) ASR 采用傳統(tǒng)近場語音模型掏膏,必須通過 4/6/8 麥克風(fēng)陣列,才能將遠(yuǎn)場聲源多路合一為近場聲源敦锌,接入傳統(tǒng)識別引擎馒疹。而直接接入語智 FFASR 專為遠(yuǎn)場聲源開發(fā)的識別引擎后,在云端通過深度學(xué)習(xí)模型供屉,就可以完成降噪行冰、識別。

在硬件成本方面伶丐,傳統(tǒng) ASR 需要本地機載端較強處理能力悼做,每個麥克風(fēng)需要一個處理芯片,BOM 成本高哗魂,電路板體積大肛走。而使用了語智 FFASR 的設(shè)備,則無需本地處理能力录别,所有運算都通過云端完成朽色,BOM 成本和電路板體積均可以大幅度壓縮。

在工業(yè)設(shè)計方面组题,傳統(tǒng) ASR 設(shè)備的工業(yè)設(shè)計局限性大葫男,需要以水平、圓形陣列排布崔列,因此現(xiàn)有產(chǎn)品多以「智能音箱」的形態(tài)出現(xiàn)梢褐。而使用了語智 FFASR 的設(shè)備,只需要一個麥克風(fēng)就可以完成識別赵讯,無需裝載多個芯片盈咳,不受設(shè)備硬件體積、ID 設(shè)計的限制边翼。

最后鱼响,在實用效果上,傳統(tǒng) ASR 只能通過「智能音箱」實現(xiàn)語音交互组底,可升級擴展空間小丈积,應(yīng)用領(lǐng)域較少筐骇。而有了語智 FFASR,就可以接入任一搭載單/雙/多麥克風(fēng)的硬件設(shè)備桶癣,進(jìn)行遠(yuǎn)場語音交互拥褂。

為什么 FFASR 擁有領(lǐng)先 15% 的卓越性能娘锁?

在 FFASR 遠(yuǎn)場語音識別引擎上實現(xiàn)這一優(yōu)異的性能表現(xiàn)牙寞,是基于語智科技對遠(yuǎn)場語音識別的技術(shù)鏈條上每個環(huán)節(jié)有著學(xué)術(shù)積累和深刻理解,以及在遠(yuǎn)場降噪莫秆、Deep Learning间雀、聲學(xué)模型、語言模型等多個領(lǐng)域擁有的技術(shù)積累和整合能力镊屎。

具體來說惹挟,由于 FFASR 遠(yuǎn)場識別引擎是通過算法進(jìn)行聲學(xué)降噪處理,因此對聲學(xué)降噪需要解決的三個干擾問題——噪聲缝驳、混響连锯、干涉進(jìn)行了精確的數(shù)學(xué)建模,這同時對處理聲學(xué)降噪的神經(jīng)網(wǎng)絡(luò)提出了更高的設(shè)計要求用狱。為了能夠同時處理前端聲學(xué)降噪和語音識別运怖,語智科技 FFASR 算法將 CNN(卷積神經(jīng)網(wǎng)絡(luò))、RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))夏伊、DNN(深度神經(jīng)網(wǎng)絡(luò))進(jìn)行了深度整合摇展,搭建了更復(fù)雜的深度學(xué)習(xí)網(wǎng)絡(luò),并將網(wǎng)絡(luò)分成很多部分溺忧,用以處理不同的任務(wù)咏连。而這樣的神經(jīng)網(wǎng)絡(luò)還需要更適配和先進(jìn)的訓(xùn)練平臺,語智科技獨立設(shè)計了的訓(xùn)練平臺鲁森,替代通常使用的 Kaldi ASR 進(jìn)行網(wǎng)絡(luò)結(jié)構(gòu)訓(xùn)練祟滴。

FFASR 的三大產(chǎn)品優(yōu)勢

語智 FFASR 開發(fā)者平臺適合手機廠商、IoT 設(shè)備廠商歌溉、想擁有遠(yuǎn)場語音交互能力又不想/能使用麥克風(fēng)陣列的人垄懂、以及 Geeks 們。詳情及對接研底,請訪問語智官網(wǎng)埠偿,或留言給我們。

主筆:陳壹零
資訊來源:語智科技
>>
Back to top btn
亚洲AV无码国产精品网址,久久亚洲AV成人出白浆无码国产,日韩AV美乳欧美,永久免费AV无码软件app下载