Uploads%2farticles%2f12864%2f0  1
|
2018-12-13

被放進(jìn)高通驍龍 855 的 AI 通話降噪方案究竟有何特別上煤?

這是第一個利用深度學(xué)習(xí)和傳統(tǒng)信號處理相結(jié)合的單通道手機(jī)通話降噪方案郎哭。

當(dāng)你置身于人聲嘈雜的酒吧躏结、或者熙熙攘攘的鬧市却盘、或者地鐵呼嘯而過的站臺,一個電話響起媳拴,你接起電話黄橘,但周圍嘈雜的噪音,讓你即便是大聲講話屈溉,手機(jī)麥克風(fēng)也還是會把環(huán)境音一起收集進(jìn)來塞关,讓接聽信號的對方受到了干擾。

為了提升手機(jī)在這種嘈雜背景音中的通話體驗语婴,目前主流的解決方案是描孟,在硬件端采用雙麥克風(fēng),一個收集人聲砰左、一個收集環(huán)境音匿醒,再通過算法增強(qiáng)將人聲與背景音分離,實現(xiàn)通話降噪缠导。

不過廉羔,在 12 月 6 日在高通驍龍技術(shù)峰會上,高通現(xiàn)場展示了一個單麥克風(fēng)降噪解決方案僻造”锼基于驍龍 855 平臺的 AI 通話降噪方案,在極其嘈雜的環(huán)境中髓削,手機(jī)通話對方聽到的便是干凈的人聲竹挡,不受噪音的干擾。

高通驍龍技術(shù)峰會現(xiàn)場展示的驍龍 855 樣機(jī)立膛,搭載了大象聲科的 AI 通話降噪技術(shù)

這一通話降噪方案采用的是大象聲科 AI 降噪技術(shù)揪罕,它是世界上第一個利用深度學(xué)習(xí)和傳統(tǒng)信號處理相結(jié)合的單通道手機(jī)通話降噪方案梯码,「可以提供比傳統(tǒng)語音信號處理算法更優(yōu)的語音通話質(zhì)量『脝」高通產(chǎn)品管理副總裁 Manvinder Singh 評價道轩娶。

大象聲科是一家致力于機(jī)器聽覺的人工智能公司,服務(wù)于小米框往、努比亞鳄抒、錘子、美圖椰弊、51talk许溅、獵豹移動等多家客戶。今年 7 月男应,大象聲科獲得了小米和高通創(chuàng)投的數(shù)千萬人民幣的 Pre-A 輪戰(zhàn)略投資闹司,得到了業(yè)界廣泛關(guān)注娱仔。

在深圳南山留學(xué)生創(chuàng)業(yè)園的「總部」辦公室里沐飘,我們并沒有看到漂亮的前臺小姐姐,甚至沒有一個光亮的前臺牲迫。會議室里傳來與來訪客人的交談聲耐朴,辦公桌上擺滿了各種電子器件。大象聲科創(chuàng)始人兼 CEO 苗健彰常常會引用「不服噪」的口號盹憎,去描繪大象聲科腳踏實地的做事風(fēng)格筛峭,以及為打造更加寧靜和智慧的生活方式而不斷努力的奮斗目標(biāo)。

大象聲科創(chuàng)始人兼 CEO 苗健彰陪每,在 12 月 10 日深圳舉辦的「創(chuàng)新·攜手·共贏暨大象聲科基于高通驍龍移動平臺的 DEMO 發(fā)布會」上致辭影晓。

////////

那么,是什么樣的技術(shù)讓這頭「大象」格外引人注目呢檩禾?

據(jù)苗健彰介紹挂签,大象聲科 AI 智能通話降噪擁有兩大理論基礎(chǔ)——計算聽覺場景分析理論(CASA)和深度學(xué)習(xí)技術(shù),CASA 主要關(guān)注的領(lǐng)域是聲源分離盼产。這里的聲源不單是指人的聲音饵婆,也可能是其它各種聲音。聲源分離的目標(biāo)就是將這些聲音分離開戏售。

機(jī)器聽覺與人類聽覺最大的差異就在于機(jī)器無法準(zhǔn)確判斷音源的類型侨核,繼而對音源進(jìn)行分離和提取。

大象聲科聯(lián)合創(chuàng)始人兼 CTO 張學(xué)良教授指出灌灾,早期解決方式是基于對信號的理解搓译,借助聲音信號的統(tǒng)計特性,采用人工規(guī)則編制算法實現(xiàn)降噪锋喜。這種方法存在的問題是些己,一方面對于復(fù)雜場景規(guī)則很難編制,而且規(guī)則適應(yīng)性差;另一方面轴总,傳統(tǒng)算法中的參數(shù)估計也存在問題直颅。而將語音信號處理與深度學(xué)習(xí)結(jié)合,就能從大量數(shù)據(jù)中自動學(xué)習(xí)規(guī)則怀樟,聽過的噪聲越多功偿,語音處理就越好,并反過來可以幫助傳統(tǒng)信號處理估計參數(shù)往堡。

大象聲科在這個基礎(chǔ)上械荷,通過計將算聽覺場景分析理論(CASA)與深度學(xué)習(xí)技術(shù)相結(jié)合,實現(xiàn)了實時分離人聲和背景噪聲虑灰,從環(huán)境噪音中提取清晰人聲吨瞎,這就突破了傳統(tǒng)信號處理方案的性能瓶頸。

大象聲科聯(lián)合創(chuàng)始人兼 CTO 張學(xué)良在發(fā)布會現(xiàn)場做語音喚醒演示穆咐,在現(xiàn)場來賓的議論聲中(背景嘈雜)颤诀,設(shè)備能夠很準(zhǔn)確的實現(xiàn)語音喚醒

////////

手機(jī)通話是這一技術(shù)方案最典型的應(yīng)用場景。今年 4 月对湃,錘子科技發(fā)布堅果 3 手機(jī)崖叫,便是運(yùn)用了大象聲科 AI 通話智能降噪技術(shù),讓手機(jī)通話中拍柒,過濾掉周圍嘈雜的背景音心傀,實現(xiàn)清晰的通話。

另一應(yīng)用場景是手游通話拆讯。今年 11 月努比亞最新發(fā)布的紅魔 Mars 電競手機(jī)脂男,也是搭載了大象聲科的 AI 語音消噪技術(shù),可以實時分離背景噪聲和人聲种呐,實現(xiàn)在各種復(fù)雜噪音環(huán)境下的清晰語音提取和信號增強(qiáng)宰翅,從而有效抑制環(huán)境噪聲、消除回聲和嘯叫陕贮,為手機(jī)用戶帶來更優(yōu)質(zhì)的通話和游戲體驗堕油。

也就是說,有了這項「AI 語音消噪」黑科技加持肮之,以后用紅魔 Mars 電競手機(jī)玩《絕地求生:刺激戰(zhàn)場》等電競游戲時掉缺,不論是和隊友連麥開語音,還是面對面開黑戈擒,再也不用擔(dān)心受到周圍環(huán)境噪音眶明、回聲和嘯叫的干擾,被其他隊友集體吐槽投訴了筐高。

 努比亞紅魔 Mars 電競手機(jī)

除了手機(jī)通話場景外搜囱,大象聲科還將進(jìn)一步助力智能家居丑瞧、智能車載、可穿戴設(shè)備蜀肘、智能安防等行業(yè)的發(fā)展绊汹。

////////

借著大象聲科深圳發(fā)布會的時機(jī),就今年的成績和明年的展望扮宠,深圳灣和大象聲科進(jìn)行了一次對話西乖。

深圳灣:大象聲科創(chuàng)建兩年,您對現(xiàn)在取得的成績?nèi)绾卧u價坛增?

苗健彰:我覺得達(dá)到了我們的預(yù)期获雕。大象成立之初目標(biāo)就很明確,希望成為聲音拾取領(lǐng)域的杜比(Dolby)收捣,打造智能拾音的標(biāo)準(zhǔn)届案。最近和高通進(jìn)行聯(lián)合發(fā)布,意味著我們向這個目標(biāo)邁進(jìn)了一大步罢艾。

深圳灣:您認(rèn)為現(xiàn)在大象聲科 DEMO 的降噪效果楣颠,是否已經(jīng)達(dá)到極具核心競爭力?或者認(rèn)為目前離期待的效果還差多遠(yuǎn)昆婿?

苗健彰:目前我們的解決方案在性能和通用化程度上面都具備相當(dāng)?shù)母偁幜Α?/p>

在性能上球碉,大象聲科的單通道降噪方案蜓斧,已經(jīng)超越了市面上大多數(shù)的傳統(tǒng)雙麥降噪算法仓蛆。在與努比亞合作的項目中,我們幫助客戶在一個月內(nèi)完成了移植調(diào)試挎春,并且解決了客戶困擾已久的游戲場景下的嘯叫以及噪音抑制問題看疙。

在通用化程度上,我們已經(jīng)支持了包括高通驍龍在內(nèi)的超過十余種不同的軟硬件平臺直奋。比如高通驍龍 8 系列能庆、7 系列和 6 系列平臺。近日在高通驍龍技術(shù)峰會上脚线,我們和高通聯(lián)合展示了基于 855 最新旗艦平臺的 Vocplus Telecom 智能通話降噪方案搁胆,通過共同優(yōu)化該方案在高通驍龍平臺上的性能,將進(jìn)一步幫助 OEM 廠商有效提高軟件移植效率邮绿,降低技術(shù)接入成本渠旁。

但是技術(shù)的追求是沒有止境的,大象聲科目前已經(jīng)驗證了 CASA 和深度學(xué)習(xí)在語音信號處理方面應(yīng)用的前景船逮,這也奠定了行業(yè)的發(fā)展趨勢顾腊,但是距離實現(xiàn)機(jī)器像人類一樣聽聲辯音的理想,還任重道遠(yuǎn)挖胃。

深圳灣:您說過杂靶,大象聲科是技術(shù)驅(qū)動的公司梆惯,在技術(shù)創(chuàng)新方面,這頭成長的大象吗垮,如何做到持續(xù)創(chuàng)新垛吗?

苗健彰:大象聲科有一支全球頂級的科學(xué)家團(tuán)隊,首席科學(xué)家是全世界首位將深度學(xué)習(xí)引入語音增強(qiáng)領(lǐng)域的科學(xué)家烁登。他們不僅賦予我們很強(qiáng)的技術(shù)方向感职烧,也使我們可以不斷吸引到志同道合的技術(shù)人才。

持續(xù)創(chuàng)新是科技企業(yè)的成長原動力防泵,在這方面 Google 是我們的榜樣蚀之。我們的企業(yè)文化和 Google 也有很多類似的地方,比如開放和關(guān)注員工捷泞,比如專注和極致足删。在我們這個團(tuán)隊中,每一位成員都會被給予充分的信任锁右,我也相信每一個人都擁有無限的潛力失受。我們在發(fā)展企業(yè)的同時也要注重社會責(zé)任,頂尖人才是靠文化吸引來的咏瑟,這一點(diǎn)大象一直很重視拂到。

深圳灣:在技術(shù)應(yīng)用方面,目前大象聲科主要的應(yīng)用案例體現(xiàn)在手機(jī)通訊上码泞,我知道在其他領(lǐng)域兄旬,尤其是耳機(jī)和音箱,大象聲科也在拓展著合作余寥。您認(rèn)為目前技術(shù)落地和商業(yè)化的挑戰(zhàn)是什么领铐?大象聲科又是如何做的?

苗健彰:技術(shù)落地既需要團(tuán)隊的努力宋舷,也需要合作伙伴的信任绪撵。大象聲科在技術(shù)攻關(guān)上面是絕對有韌性的公司,我們花了將近一年的時間祝蝠,實現(xiàn)了單麥 AI 降噪算法的技術(shù)落地音诈,不僅優(yōu)化了神經(jīng)網(wǎng)絡(luò)模型的泛化性能,還解決包括模型壓縮绎狭、低功耗细溅、低延時、定點(diǎn)化等諸多工程問題坟岔。在這方面我一直為我們的技術(shù)團(tuán)隊感到驕傲谒兄。

合作伙伴方面,我們的運(yùn)氣一直不錯社付,總能找到科技嗅覺敏銳的廠商承疲,他們勇于嘗試新技術(shù)帶來的產(chǎn)品體驗邻耕,而我們的技術(shù)也總能接受得住用戶的考驗,不辜負(fù)合作伙伴的信任燕鸽。

深圳灣:這次發(fā)布會的主題是創(chuàng)新攜手共贏兄世,毋庸置疑,這是一個拼朋友圈的時代啊研。您認(rèn)為對于大象聲科而言御滩,最重要的朋友是誰?

苗健彰:創(chuàng)新党远、攜?削解、共贏完整的表達(dá)是:與合作伙伴共同創(chuàng)新,與產(chǎn)業(yè)上下游強(qiáng)強(qiáng)攜手沟娱,與終端用戶達(dá)成共贏氛驮。朋友應(yīng)該是肝膽相照,英雄相惜的济似,所以只要與我們服務(wù)用戶矫废,改善人類生活的理念一致的企業(yè)都是我們的朋友。

深圳灣:接下來的 2019 年砰蠢,大象聲科有什么計劃蓖扑?

苗健彰:一方面我們會繼續(xù)加大研發(fā)力度,豐富我們的產(chǎn)品線台舱;另一方面律杠,我們會進(jìn)一步加強(qiáng)與高通等合作伙伴的緊密合作,深耕手機(jī)和 VoIP 云通訊行業(yè)柿赊,同時加快我們智能通話降噪和智能語音交互解決方案在耳機(jī)俩功、車載、智能家居碰声、機(jī)器人等智能硬件上的落地。

主筆熬甫、采訪:陳壹零 / 深圳灣

編輯:大樹 / 深圳灣

>>
Back to top btn
亚洲AV无码国产精品网址,久久亚洲AV成人出白浆无码国产,日韩AV美乳欧美,永久免费AV无码软件app下载