近日,澎思科技與新加坡國立大學Human LanguageTechnology (HLT) 實驗室共同研究的聲紋識別 (Speaker Verification) 技術在RSR2015數據集上刷新世界紀錄。相比目前主流的算法,該技術可以在使用50%或更少的數據進行機器學習的情況下,依然在各種比較協議中表現出十分優異的性能。此番突破,展現了以計算機視覺技術見長的澎思科技,在技術儲備的深度和寬度上的雙向拓展。
“聞聲識人”的黑科技
聲紋識別(Speaker Verification)也稱爲說話人識別,是一種通過聲音判別說話人身份的技術。該技術通過對一種或多種語音信號的特征分析來達到對未知聲音辨別的目的,簡單的說就是辨別某一句話是否是某一個人說的技術。
聲紋識別作爲生物識別技術的一種,在公共安全、金融、智能家居和辦公等領域都有非常廣闊的應用場景,譬如偵查破案、反電信詐騙、治安防控、身份認證、支付、門禁、會議錄音等。相比于人臉識別和指紋識別,聲紋的采集只需要麥克風模塊,成本相比于攝像頭或者指紋識別模塊而言要低,采集的方便性和安全性則要高。在一些特殊領域,聲紋識別更是具有獨一無二的優勢。
在實際應用中,聲紋識別系統往往需要用戶事先錄入聲音,所以利用更少的數據完成聲紋識別的訓練在實際應用中有著很大的需求。澎思科技提出的新算法,極大降低了訓練所需的數據量,但依舊可以實現非常高的識別精度,有著非常重要的實際應用價值。
刷新RSR2015數據集新記錄
RSR2015 (Robust SpeakerRecognition 2015) 數據庫是由新加坡國家科技研究局(Agency for Science, Technology andResearch, A*STAR) 信息通信研究所(Institutefor Infocomm Research, I²R) 收集和發布的,被廣泛應用于聲紋識別等領域的研究工作,是目前最主流的大型語音數據庫之一。該數據庫旨在爲聲紋識別領域提供相關的數據資源,允許使用不同類型的比較協議。
聲紋識別中最常用的評價指標是等錯誤率(Equal Error Rate,EER),在調整阈值後,使得錯誤拒絕率(FalseRejection Rate,FRR)等于錯誤接受率(False Acceptance Rate,FAR),此時的FAR與FRR的值稱爲等錯誤率。一般來說,越低的等錯誤率表示系統有越好的識別准確性。
表格1. 遵循RSR2015的對比協議和trails[1]的比較結果
表格2. RSR2015 part1 evaluation部分的混合性別測試結果
表格3. RSR2015 part2部分的測試結果
表格1中分別是數據庫第一部分的4個子集的測試結果。其中TW (target wrong) 指的是正確的聲紋驗證對象但是使用了錯誤的口令;IC (imposter correct) 代表使用正確口令的聲紋信息的冒名頂替者; IW (imposter wrong) 代表使用錯誤口令的擁有錯誤聲紋信息的人。
在這三項指標中,較爲重要的是IC任務。澎思科技提出的新技術在提升該項任務的准確度的同時,兼顧考慮了整個系統的總體性能。
表格4. RSR2015數據集的SV與UV性能
SV (Speaker Verification)和 UV (UtteranceVerification)分別是針對聲紋與口令識別的性能評估方式。兩項任務綜合體現基于文本的聲紋系統在兩個任務上的性能表現。其中,SV任務的性能尤爲重要。
在所有的對比中,絕大多數的算法都使用了RSR2015的背景集(background set)和發展集(development set)的數據以達到更好的效果。甚至在一些算法中,會添加更多其他數據集的數據來提升准確性。與之不同的是,澎思科技提出的新技術並不依賴于這些的數據,在極少的訓練數據情況下,依舊有著非常高的准確性。詳細的技術細節將在澎思科技與新加坡國立大學HLT實驗室聯合提交至Interspeech2020的論文中介紹,敬請期待。
突破前沿技術 嚴守智能安防重地
聲紋識別技術在公共安全領域有重要的應用前景和巨大的市場需求,一直是安防行業研究的重點。
澎思科技作爲一家專注于計算機視覺和物聯網技術,提供“以人爲核心”行業綜合應用解決方案的人工智能公司,此次在聲紋識別領域取得的突破,彰顯了公司技術儲備的深度和寬度。聲紋識別技術一方面符合公司在智能安防領域深耕的長遠願景,是針對用戶需求深挖場景,發現行業痛點打磨出的新算法技術和産品;另一方面,也豐富公司計算機視覺之外的技術池,提升了技術方案的完整性,爲行業和落地場景的拓展做好准備。
在未來,澎思科技的聲紋識別等語音技術將逐步應用到平安城市、智慧社區、智慧園區、智慧零售、智慧交通等實戰應用場景中,在與計算機視覺和物聯網技術的配合下,提供更多有效可靠的産品和方案,推動AI技術的産品化落地和商業化進程。
責編:花爭
版權作品,未經環球網 huanqiu.com 書面授權,嚴禁轉載,違者將被追究法律責任。