2024-04-24 公司新聞
人類(lèi)感知這個(gè)世界,主要靠視覺(jué)和聽(tīng)覺(jué)。無(wú)人機作為“會(huì )飛的相機”,解決了圖像和視頻數據采集的問(wèn)題,讓我們可以用“上帝”的視覺(jué)去了解世界。有了“會(huì )飛的相機”,能不能讓無(wú)人機成為“會(huì )飛的錄像機”?
這需要我們給無(wú)人機加上拾音(錄音)功能,但由于無(wú)人機飛行時(shí)的本底噪音很大,給無(wú)人機裝上拾音器(麥克風(fēng)),便成為一個(gè)非常困難的技術(shù)及工程問(wèn)題。但音頻數據里往往包含著(zhù)超越視覺(jué)的重要信息,無(wú)人機上搭載使用的拾音器(麥克風(fēng)),能夠更好的利用無(wú)人機去采集豐富的數據,從而將無(wú)人機應用到應急救援、聲紋采集等各種場(chǎng)景中,因此開(kāi)發(fā)一款能上無(wú)人機搭載使用的拾音器意義非凡。恰在這樣的背景下,成至智能的無(wú)人機拾音項目被提到科研攻克的重要位置,并安排CTO陳翔博士親自帶隊的人工智能及電子工程團隊,進(jìn)行了長(cháng)達2年的潛心研發(fā)。
初心與挑戰:激發(fā)聽(tīng)覺(jué)的奇跡
2023年初,成至正式發(fā)售MP10E廣播拾音一體機,它是第一個(gè)實(shí)現量產(chǎn),且能夠利用無(wú)人機從空中拾取外部聲音的產(chǎn)品,它巧妙地平衡了擴音和拾音兩種功能。成至研發(fā)團隊利用人工智能技術(shù),對無(wú)人機的飛行噪音和環(huán)境噪音進(jìn)行了AI降噪,對拾取的人聲進(jìn)行AI增益,首次實(shí)現了無(wú)人機進(jìn)行空地對話(huà)的應用,最遠拾音距離達到7米。
基于MP10E獲得的好評,研發(fā)團隊提出開(kāi)發(fā)一款不帶揚聲器,純粹的拾音產(chǎn)品,因為減去揚聲器后,無(wú)人機的飛行噪音會(huì )有較大幅下降,從而使拾音器獲得高質(zhì)量的原始音頻數據,這也增加了拾音的距離,提高了拾音數據的信噪比等質(zhì)量指標,在聲紋采集等科研工作中發(fā)揮出更好的作用。
技術(shù)攻破:邁向未知的探索
開(kāi)創(chuàng )性的想法總伴隨著(zhù)重重挑戰,但成至總能克服困難成就奇跡,團隊歷經(jīng)多次產(chǎn)品測試和迭代升級,采用了特定指向角度的微型麥克風(fēng)陣列,成功將產(chǎn)品重量減至50克以下,并通過(guò)調整產(chǎn)品重心位置等方法,最大限度的保證了無(wú)人機的續航能力及抗風(fēng)能力。同時(shí),人工智能工程師進(jìn)一步優(yōu)化聲學(xué)算法,成功讓PK10的拾音距離比MP10E增加到50%以上,且拾音的效果更加優(yōu)秀,在鳥(niǎo)類(lèi)聲紋數據的采集中,采樣距離最遠達到30米,大大提升了拾音的清晰度和質(zhì)量。
攻破技術(shù)難關(guān)的PK10提供了兩種降噪模式——標準降噪和深度降噪,允許用戶(hù)在不同場(chǎng)景、不同的飛行狀態(tài)選擇最適合的設置,達到最佳拾音效果。研發(fā)團隊形象地形容深度降噪像一位敏銳的音頻守護者,深度降噪通過(guò)控制音頻信號平滑開(kāi)關(guān)和智能處理,精準監測并響應音頻變化,能迅速消除接近噪聲幅度的信號,去除背景噪音和雜音。對超過(guò)噪聲幅度的信號,則開(kāi)啟信號通道保證音頻平滑過(guò)渡到拾音狀態(tài)。同時(shí),PK10的純拾音功能更是展現了PK10的設計初心,達到拾音延時(shí)≤1s,懸停噪音<-42dB。這一切努力的成果使得PK10大放異彩,讓成至智能再次領(lǐng)導無(wú)人機行業(yè)中聲學(xué)技術(shù)的發(fā)展。