语音信号处理

发布网友 发布时间:2022-04-21 22:54

我来回答

4个回答

懂视网 时间:2022-04-13 02:56

5.4 复倒谱和倒谱 定义 设信号x(n)的z变换为X(z) = z[x(n)],其对数为: (1) 那么 的逆z变换可写成: (2) 取 (1)式则有 (3) 于是式子(2)则可以写成 (4) 则式子(4)即为信号x(n)的复倒谱 的定义。因为 一般为复数,故称 为复倒谱。如果对 的绝对取对数,得 (5)

5.4 复倒谱和倒谱

定义

设信号x(n)的z变换为X(z) = z[x(n)],其对数为:

(1)

那么的逆z变换可写成:

(2)

(1)式则有

(3)

于是式子(2)则可以写成

(4)

则式子(4)即为信号x(n)的复倒谱的定义。因为一般为复数,故称为复倒谱。如果对的绝对值取对数,得

(5)

为实数,由此求出的倒频谱c(n)为实倒谱,简称为倒谱,即

(6)

在(3)式中,实部是可以取唯一值的,但对于虚部,会引起唯一性问题,因此要求相角为w的连续奇函数。

性质:

为判断复倒谱的性质,研究有理z变换的一般形式即可。z变换的一般形式为


其中,的绝对值皆小于1,A是一个非负数系数。因此,项对应于单位圆内的零点和极点,项对应于单位圆外的零点和极点,Mi和M0分别表示单位圆内和外的零点数目,Ni和N0分别表示单位圆内和外的极点数目,因子简单地表示时间原点的移动。于是,X(z)的复对数为:


在讨论复倒谱的性质时可以写为以下形式:


性质1:即使x(n)可以满足因果性、稳定性、甚至持续期有限的条件,一般而言复倒谱也是非零的,而且在正负n两个方向上都是无限延展的。

性质2:复倒谱是一个有界衰减序列,其界限为:


其中,a是的最大绝对值,而是一个常数。

性质3:如果X(z)在单位圆外无极点和零点(即),则有


这种信号称为“最小相位”信号。

性质4:对于X(z)在单位圆内没有极点或零点的情形,可以得到“最大相位”信号,有


性质5:如果输入信号为一串冲激信号,它具有如下形式:


这就意味着其也是一个间隔为Np的冲激串。

热心网友 时间:2022-04-13 00:04

语音信号处理
本文来自: 课件下载论坛(http://www.kejianxiazai.com/) 详细出处参考:http://www.kejianxiazai.com/371a1a1.html
1.项目的立项依据
(研究什么,研究的意义、国内外研究现状及分析,附主要参考文献目录)
(改进语音特征参数提取的性能,提高其时频分辨率是必要的,而且是可行的)

在新的语音产生模型指导下,以现有语音特征提取方法为基础,研究一套新的语音特征表示和提取方法,使语音特征的提取结果更精确,把完整的语音信息提交给语音识别的高层次处理模块,为实现理想的语音识别系统打下关键基础是本项目的研究内容和目的。

1.1语音特征参数提取的研究应用现状
语音特征参数提取(Speech Feature Extraction,简记为SFE)是语音识别(包括话者识别、语种识别等)的前端处理功能。没有好的SFE功能模块,整个语音识别系统的性能不可能很好。所以SFE一直是语音处理领域研究的重点之一。

SFE研究从1900年即开始,经历了硬件滤波器、FFT、LPC、基音提取、倒谱等参数提取方法。当前的SFE方法是多种方法的集成结果,比如MFCC是带通滤波和倒谱的组合。在几种常用方法中,MFCC较为突出,应用最为广泛。

MFCC是Mel频率倒谱系数(Mel Frequency Cepstrum Coefficient)的简称。其是将信号的频谱,首先在频域将频率轴变换为Mel频率刻度,再变换到倒谱域得到的倒谱系数。在实际应用中,MFCC的计算过程是这样的:
将信号进行短时傅立叶变换得到其频谱。
求它的频谱幅度的平方,即能量谱,并用一组三角形滤波器在频域对能量谱进行带通滤波。这组带通滤波器的中心频率是按Mel频率刻度均匀排列的,每个滤波器的三角形的两个底点的频率分别等于相邻的两个滤波器的中心频率,即每两个相邻的滤波器的过渡带相互搭接,且频率相应之和为1;滤波器的个数通常与临界带数相近(略小),设滤波器数为M,滤波后得到的输出是:
X(k), k=1,2, ...,M;
将滤波器组的输出取对数,然后对它做2M点逆离散傅立叶变换即得到MFCC。

MFCC具有以下优点:
1) 计算复杂性不大;
2) 健壮性强;
3) 便于进行频域动态规整操作。

以MFCC为代表的常用特征提取方法是否完全满足语音识别的要求?有没有必要进一步改进的必要?

1.2 进一步研究语音特征参数提取的必要性

语音识别技术分特征提取、声学语音学和语言学三大模块。目前,从整体上讲,语音识别效果还远远不能令人满意,其原因除了声学语音学和语言学高层次处理模块有待改进之外,特征提取也是影响识别效果不佳主要因素之一。理由如下:

1) 人耳的最高时间分辨率达到2ms,而目前SFE方法的分析帧长为20-30ms,对于爆破音,塞擦音等辅音,信息丢失严重。
2) 人耳的最高频率分辨率达到1.8Hz, 而目前SFE方法的频率数量级是50Hz ,f=1/T=1/0.020=50Hz。低的频率分辨率不能精确提取基音和共振峰等浊音特征。

目前的SFE方法是元音和辅音分析要求的折中,存在以下相互矛盾的问题:

1) 为了兼顾辅音时间分辨率的要求,对于元音段,目前SFE方法的分析帧长和窗的移动步长偏短,完全可以加大。加大后,不仅可以减少特征的数据量,从而减少计算量,而且可以提高频率分辨率。
2) 考虑的兼顾元音的频率分辨率的要求和计算量问题,对于多数辅音段,目前SFE方法的分析帧长和窗的移动步长偏长,应该更短。缩短后,才可以分析辅音的细节特征,获取语音中极其重要的辅音信息。

综述以上讨论,结论是应该有两种时频分辨率不同的并行的语音特征提取过程。这样做,特征提取过程变得复杂,但现在计算机技术可以应付。

首先建立模型。

1.3 参考文献

2.项目的研究内容、研究目标,以及拟解决的关键问题
2.1 研究内容
2.1.1 建立模型
MFCC是建立在图1所示的语音产生模型之上。假设在声道的同一空间点激励而产生清音和浊音。本项目提出图2所示语音产生模型,并在该模型指导下研究新的语音特征提取方法。图1 和 图2 模型的差异是后者以为噪声激励信号和基音激励信号在声道的不同空间位置产生,更符合语音产生的实际过程。比如发元音的激励点在声门,而发清音时的激励点决不在声门,如 /s/ 在齿位。

2.1.2清音和浊音精确分离
2.1.3辅音特征提取研究
2.1.4 清音和浊音特征的同步和融合

2.2 研究目标

(1) 彻底改变现有语音特征提取的时频分辨率精度。
(2) 控制由此增加的计算量,使目前的计算机技术能够胜任。
(3) 语音特征表示包括语音的瞬时特征和超音段特征。
(4) 提取得到的语音特征表示形式便于应用现有的高层次语音识别方法完成语音识别任务。

2.3 拟解决的关键问题
2.3.1 清音和浊音精确分离
2.3.2 辅音特征提取研究
2.3.3 清音和浊音特征的同步和融合

3.拟采取的研究方案及可行性分析
3.1 清音和浊音精确分离
3.2 辅音特征提取研究
3.3 清音和浊音特征的同步和融合

本研究的创新内容:
1) 提出双激励源语音产生模型;
2) 研究精确分离语音的清音分量和浊音分量的方法;
3) 研究有效的清音分量特征提取方法;
4) 提出清音特征浊音特征浊音特征同步和融合的概念,并给出相应方法,即时间同步匹配法。

素材:
本项目提出一种新的语音产生模型,并结合已有的特征参数提取等方法,研究一种新的语音特征表示方法。
语音产生模型是提取语音特征参数的理论基础。
语音特征表示是语音的各种特征参数(比如基音和声道参数)共同按照某种结合关系建立起来的对语音单位的一种合理表示。

二、 报告正文:参照以下提纲撰写,要求内容翔实、清晰,层次分明,标题突出。
(一)立项依据与研究内容(4000-8000字):
1. 项目的立项依据(研究意义、国内外研究现状及分析,附主要参考文献目录。)(基础研究需结合科学研究发展趋势来论述科学意义;应用研究需结合国民经济和社会发展中迫切需要解决的关键科技问题来论述其应用前景。)
2、项目的研究内容、研究目标,以及拟解决的关键问题。(此部分为重点阐述内容)
3、拟采取的研究方案及可行性分析。(包括有关方法、技术路线、实验手段、关键技术等说明)
4、本项目的特色与创新之处。
5、年度研究计划及预期研究结果。(包括拟组织的重要学术交流活动、国际合作与交流计划等)
本文来自: 课件下载论坛(http://www.kejianxiazai.com/) 详细出处参考:http://www.kejianxiazai.com/371a1a1.html
可以去下载```

参考资料:http://www.kejianxiazai.com/371a1a1.html

热心网友 时间:2022-04-13 01:22

语音信号处理与DSP
http://cslin.auto.fcu.e.tw/scteach/scteach88/dsp1/index.html

语音信号处理
http://www.kejianxiazai.com/371a1a1.html

matlab的语音信号处理
http://bbs.bc-cn.net/viewthread.php?tid=688

热心网友 时间:2022-04-13 02:57

http://www.si.net/forum-510-1.html 这个网站不错去找下

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
13.662097s