免費論文查重認準CNKI論文查重,專為高校論文檢測、畢業論文查重、碩士論文查重誕生的論文檢測入口平臺,CNKI論文查重系統涵蓋海量的數據庫,為畢業生解決各種煩惱,論文查重軟件免費為各種有論文檢測、論文查重需求的人提供,論文查重認準CNKI查重!
發布時間:2023-02-22 17:50:31 作者:知網小編 來源:m.elxoepd.cn
聲紋識別的理論基礎是每一個聲音都具有獨特的特征,通過該特征能將不同人的聲音進行有效的區分。 這種獨特的特征主要由兩個因素決定,第一個是 聲腔的尺寸 ,具體包括咽喉、鼻腔和口腔等,這些器官的形狀、尺寸和位置決定了聲帶張力的大小和聲音頻率的范圍。 因此不同的人雖然說同樣的話,但是聲音的頻率分布是不同的,聽起來有的低沉有的洪亮。 每個人的發聲腔都是不同的,就像指紋一樣,每個人的聲音也就有獨特的特征。 第二個決定聲音特征的因素是 發聲器官被操縱的方式 ,發聲器官包括唇、齒、舌、軟腭及腭肌肉等,他們之間相互作用就會產生清晰的語音。 而他們之間的協作方式是人通過后天與周圍人的交流中隨機學習到的。 人在學習說話的過程中,通過模擬周圍不同人的說話方式,就會逐漸形成自己的聲紋特征。
目前的聲紋鑒定方法,簡單講分為兩種:一是目前我國司法實踐中普遍應用的"人工鑒定"——專家鑒定人依靠語音學方法,二是未來發展方向的"自動鑒定"——計算機通過算法來模擬人耳對聲學特征的提取、訓練、對比來實現。 那么“變聲器”是什么高深的玩意兒呢?
雖然深度學習帶給模式識別極大的提升,甚至還有開源的相關算法,但是聲紋識別的研究進展仍然不大,這仍然受制于聲紋的采集和特征的建立。 先看噪聲問題,下圖是Mitchell McLaren在論文中做的研究,噪聲對不同模型的聲紋識別影響。 從這個圖中可以看出,混響和噪聲對各類模型和方法都有非常大的影響,這和人類似,嘈雜環境中確實很難分辨出某個人的聲音,但是人耳比較奇特,我們可以很好的處理這種“雞尾酒會”效應,但是目前機器還做不到。 音樂噪聲很好理解,因為音樂通常是寬帶信號,完全覆蓋了人聲的頻段,這會非常影響聲紋的特征表現,動態檢測的時候更是難以提取,我們目前在語音識別中采用的是回聲抵消的方法(嚴格來說是自噪聲去除),同樣也可以用到聲紋識別,但是面對其他設備音樂也很難處理,當前僅有波束形成這一方法。
美國和國內都有不少企業生產聲紋識別的設備,公安部為采購這些設備還正式頒布了《安防聲紋識別應用系統技術要求》的行業標準。 但是這種方法是一種靜態檢測的方法,存在很大的弊端,實時性不好,動態檢測聲紋的需求實際上更大。