題目:共振峰估計
要求:
通過畢業(yè)設(shè)計,融會貫通本科階段所學(xué)習(xí)的理論知識,培養(yǎng)科研能力和分析、解決問題的能力;通過畢業(yè)設(shè)計和畢業(yè)
論文的撰寫,拓寬知識面,掌握資料檢索、分析、系統(tǒng)設(shè)計、理論計算、實驗驗證、數(shù)據(jù)分析、資料整理的能力。
一、共振峰的概念
共振峰是反映聲道諧振特性的重要特征,它代表了發(fā)音信息的最直接的來源,而且人在語音感知中利用了共振峰信息。所以共振峰是語音信號處理中非常重要的特征參數(shù),已經(jīng)廣泛地用作語音識別的主要特征和語音編碼傳輸?shù)幕拘畔。共振峰信息包含在頻率包絡(luò)之中,因此共振峰參數(shù)提取的關(guān)鍵是估計自然語音頻譜包絡(luò),一般認為譜包絡(luò)中的最大值就是共振峰。與基因檢測類似,共振峰估計也是表面上看起來很容易,而實際上又受很多問題困擾。這些問題包括:
(1)虛假峰值。在正常情況下,頻譜包絡(luò)中的極大值完全是又共振峰引起的。但在線性預(yù)測分析方法出現(xiàn)之前的頻譜包絡(luò)估計器中,出現(xiàn)虛假峰值是相當普遍的現(xiàn)象。甚至在采用線性
……(新文秘網(wǎng)http://m.jey722.cn省略663字,正式會員可完整閱讀)……
頻譜包絡(luò)中的局部極大值,稱為選峰法。
(2)倒譜法。聲道響應(yīng)的倒譜衰減很快,在[-25,25]之外的值相當小,因此可以構(gòu)造一個相應(yīng)的倒譜濾波器,將聲道的倒譜分離,對分離出來的倒譜做相應(yīng)的反變換,就可以得到聲道函數(shù)的對數(shù)譜,對此做進一步處理即可求得所需的各個共振峰。
三、提取共振峰的實現(xiàn)
(1)基于線性預(yù)測(LPC)
在語音信號的LPC模型中,語音信號樣本s(n)可由如下差分方程表示:
式中,u(n)為激勵函數(shù),G是增益,{ak;k =1,2,……P}是LPC系數(shù)。相應(yīng)的數(shù)字濾波器傳遞函數(shù)H(z)為
上式還可表示為P個極點的級聯(lián)形式:
式中, 是H(z)在Z平面上第k個極點:若H(z)是穩(wěn)定的,其所有極點都在z平面的單位圓內(nèi)。則第k個共振峰的頻率和帶寬分別為
和 ,T為語音信號采樣周期。語音信號的共振峰能由數(shù)字激光器傳遞函數(shù)H(z)進行估計,最直接的方式是對H(z)進行多項式求根,由所求的根來判斷共振峰或譜形狀極點。然而,該方法難以快速而有效地找到根值。另一有效的獲取共振峰的途徑是語音信號LPC譜的譜峰檢測的方法進行估計共振峰,該方法需要解決共振峰臺并的問題。McCandless試圖采用在z平面單位圓內(nèi)重復(fù)計算H(z)的方式來分離合并的共振峰,另一個有效的方法是采用對數(shù)LPC譜的二階導(dǎo)數(shù)進行估計共振峰,取得較好效果。
(2)倒譜法
語音信號不是加性信號,而是卷積信號。為了能用線性系統(tǒng)對其進行處理,可以先采用卷積同態(tài)系統(tǒng)處理。經(jīng)過卷積同態(tài)系統(tǒng)后輸出的偽時序序列稱為原序列的“復(fù)倒頻譜”。它的定義式可以表示為:
倒譜或稱“倒頻譜”的定義為:
它和復(fù)倒譜的主要區(qū)別是對序列對數(shù)幅度譜的傅立葉逆變換,它是復(fù)倒譜中的偶對稱分量。它們都將卷積運算,變?yōu)閭螘r域中的加法運算,使得信號可以運用滿足疊加性的線性系統(tǒng)進行處理。復(fù)倒譜涉及復(fù)對數(shù)運算,而倒譜只進行實數(shù)的對數(shù)運算,較復(fù)倒譜的運算量大大減少。
如果 和 分別是 和 的倒譜,*(n)= * ,那么*(n)的倒譜c(n)= + 。
(2)倒譜法
選擇最普遍的極零模式來描述聲道相應(yīng)*(n),其z變換的形式為:
經(jīng)過傅立葉變換,取對數(shù)和逆傅立葉變換后可以得到其復(fù)倒譜:
對于倒譜可以只考慮它的幅度特性,可以看出,它是一個衰減序列,且衰減的速度比1/|n|快。因而它比原信號*(n)更集中于原點附近,或者說它更具有短時性。
四、提取共振峰的實現(xiàn)方法的應(yīng)用
(1)基于線性預(yù)測(LPC)的應(yīng)用技術(shù)現(xiàn)狀
肺部氣流沖擊聲帶.通過聲道的響應(yīng),形成語音。不同的聲道形狀產(chǎn)生不同的聲道響應(yīng),導(dǎo)致不同的語音。就聲道的數(shù)學(xué)模型,主要有兩種觀點:
(一)把聲道看作由多個不同截面積的聲管串聯(lián)而成,即聲管模型;
(二)把聲道看作諧振腔,共振峰就是該腔體的諧振頻率,即共振峰模型。
因人耳聽覺的柯替氏器官就是按頻率感受而排列其位置的,因而,實踐證明共振峰模型方法是非常有效的。共振峰是描述語音信號特征的重要參數(shù),所以,準確有效的共振峰提取算法對語音信號的分析、臺成、編碼有重要意義。線性預(yù)測編碼(LPC)是進行語音信號分析、語音信號編碼最有效的技術(shù)之一 其重要性在 ……(未完,全文共3687字,當前僅顯示1862字,請閱讀下面提示信息。
收藏《論文開題報告:共振峰估計》)