首页 | 本学科首页   官方微博 | 高级检索  
相似文献
 共查询到20条相似文献,搜索用时 15 毫秒
1.
利用小波变换模极大值点同信号突变点之间的关系,以及声门闭合时刻(GCI)引起语音信号锐变的特点,通过检测两个相邻GCI的距离来估计语音的基音周期,由此求出基音频率对时间的变化曲线(即声调曲线)。通过仿真,该方法提取声调准确,而且抗噪音的能力比较强。  相似文献   

2.
频域和时域信息对连续交替取样策略汉语声调识别的贡献   总被引:2,自引:0,他引:2  
文献研究表明,在电子耳蜗连续交替取样策略中,时域信息特别是包络随时间的变化轨迹对汉语声调识别有重要影响。在本文中,调整原始信号的包络轨迹,使四个声调的信号具有大体相同的包络变化曲线,称为调整信号。原始信号和调整信号分别通过CIS方案模拟,进行识别率对比。结果显示,在CIS方案中,时域信息对汉语声调识别有重要影响,但是频域信息是汉语声调识别的首要因素。  相似文献   

3.
根据语音分形维和基音周期的说话人性别识别研究   总被引:1,自引:0,他引:1  
根据语音特征实现说话人性别的自动识别,在音频处理与分析中具有重要的应用意义.为了克服语音常规线性参数在刻画说话人性别特征上的不足,本文使用了分形维等非线性参数作为特征空间的有效补偿.首先利用提升算法实现基音周期的提取;然后提取语音的分形维数;最后根据Takens定理,对分形维进行了重构,采用求近似熵的方法得到分形维复杂度.将基音周期、分形维数以及分形维复杂度构成三维向量,进行说话人的性别识别.实验证明,通过非线性参数的介入,与仅使用基音周期等传统线性特征的识别方法相比,识别系统的准确率和稳定性得到有效提高,因此为说话人性别识别提供了一个新的思路.  相似文献   

4.
汉语的声调曲线可以用基音频率轨迹来表示。传统的基频曲线平滑算法主要是中值平滑和线性平滑,这两种算法都不能有效去除基音频率中的连续错误点。本文提出可变阈值的基频曲线平滑搜索算法,根据基频点的分布选择不同阈值,得到更精确的基频曲线,且运算简单快速。分别基于人工神经网络和二次曲线拟合的孤立音节声调识别实验均表明,这种算法相比传统的中值平滑和线性平滑算法识别正确率明显提高,对提高聋儿计算机汉语教学效果具有重要意义。  相似文献   

5.
基于ICA的重叠语音基频提取和语音增强   总被引:1,自引:0,他引:1  
语音信号是一种特征时变信号,基音频率提取和语音增强是两种常见语音处理要求,独立分量分析(ICA)是一种盲信号处理方法,目的 在于将混合在观察信号中的相互独立的源信号分离出来,ICA在很多领域都有广泛的应用,在语音信号上最为成功,本文将ICA用来撮重叠语音信号中的基音频率,提出了一个基于ICA的混叠语音基频提取系统,成功地解决了基频相互接近时无法提取混合信号基频的问题,并将它应用到有音乐背景下的语音增强方面,均取得了较好的结果。  相似文献   

6.
提出一种基于低频带非均匀采样的电子耳蜗编码策略,即低频带精细结构(LFFS)过零刺激方案(简称LFFS方案),以提高电子耳蜗汉语声调和语音识别鲁棒性。根据频带选择法则,在人耳基频感知范围内,采用精细结构过零刺激脉冲序列。声学模拟结果表明:在安静环境下,LFFS方案和连续交替采样(CIS)方案语音识别率差别不大;在噪声环境下,LFFS方案在汉语声调、词汇和句子方面要明显优于CIS方案,同时采用改进指数分布模型得到较好的汉语识别因素分布图。LFFS方案包含了更多的汉语声调信息,所以能有效地提高电子耳蜗植入患者汉语识别鲁棒性。  相似文献   

7.
本文提出了一种基于幅度频率调制的电子耳蜗语音编码新策略即倍频程小波过零刺激(WTZS)方案,以提高噪声环境下的语音和语调语音的识别能力。通过提取语音倍频程小波变换域信号的幅度(AM)和过零点(FM)经梯度参数调整后合成刺激脉冲,选取15名听觉正常的志愿者进行听觉仿真试验。结果表明安静环境下连续间隔采样(CIS)、幅频调制(FAME)和WTZS方案的语音识别率差别不大,CIS方案的语调识别能力稍差。WTZS方案在加噪环境下的语音、语调及句子的识别能力要优于CIS和FAME语音编码策略。WTZS利用了语音信号的AM、FM及梯度参数合成刺激脉冲,有效的提高了噪声环境下语音和语调语音的识别能力,可用于电子耳蜗语音处理器的设计。  相似文献   

8.
目的针对现有数字助听器中的多通道频响补偿算法容易破坏语音信号的共振峰结构,致使频响补偿后语音信号的可懂度、清晰度和舒适度降低等问题,提出一种基于人耳听觉特性的多通道频响补偿算法。方法首先采用一种可以模拟人工耳蜗模型的Gammatone滤波器组,然后通过滤波处理把输入信号分为32个频带,并依据耳聋者的听力曲线对每个频带进行频响补偿。最后采用语音信号每个通道的声压级,以及从共振峰结构和主观测试对比该算法与基于Bark域的非均匀滤波器组分割频率的算法的优越性。结果通过该算法处理后的语音信号可以很好地满足不同听力损失者的听力要求。相对于比较算法,该算法语音信号的共振峰结构完整性更好,在不同的声压级下,该算法的语句可懂度提高10%以上。结论基于Gammatone滤波器组分解的数字助听器频响补偿算法优于对比算法,并且提高了听力损失者的语句可懂度和舒适度。  相似文献   

9.
为了帮助听力语言障碍者进行基于视觉语音训练,提出了一种将语音信号形成图像的新方法。首先对语音音素进行时域、频域、能量值的提取,然后通过计算得到每个采样点的组合特征值,描绘成图像。对元音音素的仿真结果表明:此方法可以较好地区分各种音素及发音过程,可用于语音的识别和辅助训练。  相似文献   

10.
为帮助上肢功能障碍患者进行康复训练,本文设计了一种4自由度上肢外骨骼康复机器人,并实现了语音和肌电两种控制方案。本文基于RSC-4128语音芯片,实现了对特定人的识别。另外自制表面肌电(sEMG)信号采集电极,采集sEMG信号,并通过信号处理、时域特征提取、固定阈值算法等实现模式识别,还利用脉冲宽度调制(PWM)算法实现了对系统运动速度的调节。最后,对系统进行了语音和肌电控制的测试。结果表明语音控制平均识别率达93.1%,肌电控制平均识别率达90.9%,验证了系统控制方案的可行性,为上肢康复机器人控制系统的进一步完善奠定了理论基础。  相似文献   

11.
一种基于汉语音调信息的电子耳蜗语音信号处理新方案   总被引:2,自引:0,他引:2  
本文在连续交替取样(Continuous Inteleaved Sampling,CIS)电子耳蜗语音处理方案的基础上,针对汉语语音信号的特点,提出一种基于汉语音调信息的语音信号处理新方案。文中首先讨论了汉语语音的特点,并初步讨论了音调的变化对语音信号处理效果的影响。结果表明,将汉语的音调变化信息加入到CIS语音信号处理方案中,可明显地提高汉语的识别能力,基于本文的结果,可以设计出适合中国聋人的电子耳蜗。  相似文献   

12.
本研究提出了一种改进的电子耳蜗语音信号处理策略,它将电子耳蜗连续交替取样波形策略(CIS策略)和特征提取策略相结合,既克服了CIS信号处理方案合成语音个性特征不明显的缺点,又消除了单独特征提取策略抗噪能力差的缺陷,使仿真后的电子耳蜗语音识别性能有了较好的改善。  相似文献   

13.
目的电子喉是喉切除患者使用最多的语音恢复工具,但是电子喉语音存在发声机械、音调单一、辐射噪声大等缺点,本文拟运用语音转换技术改善电子喉语音的发声效果,提高语音自然度和可懂度。方法选择200句分别以自然发声和电子喉发声的标准普通话日常用语作为训练语料,采用基于混合高斯模型(Gaussian mixed model,GMM)的语音转换方法对电子喉语音进行转换,转换参数为基频轨迹和声道谱参数(0~24阶梅尔倒谱系数),然后对转换后的语音质量进行主客观评价。结果转换语音的高频辐射噪声得到了有效抑制,基频变化出现。主观分析结果显示,转换语音的自然度和可接受度有所提高,但可懂度变化不大。结论使用语音转换技术可以降低电子喉语音的高频辐射噪声,改变声调和韵律信息,提高自然度和可接受度,对改善电子喉语音的听觉质量有较大帮助。  相似文献   

14.
目的:比较粤语大学生与普通话大学生普通话语音加工能力的异同,为第二语言学习和普通话教育的推广提供参考依据。方法:根据粤语、普通话双语历史评估,选择27名粤语大学生和30名普通话大学生为研究对象。采用oddball范式,对被试普通话的声母、韵母、声调意识进行测试;采用自编的快速命名测试(数字、字母、颜色、图形)对其进行命名速度测试;利用心理实验测试系统(PES)直接测试并记录被试的语音工作记忆得分。对上述结果采用独立样本t检验的方法进行比较。结果:粤语大学生韵母得分和总分低于普通话大学生(P<0.01),声母和声调得分两组差异无统计学意义。粤语大学生在数字、字母、颜色快速命名时间明显长于普通话大学生(均P<0.01),而图形快速命名时间两组差异无统计学意义;粤语大学生和普通话大学生工作记忆水平差异无统计学意义。结论:粤语大学生的普通话语音加工能力显著低于普通话大学生,主要体现在韵母意识和快速命名速度上。提示我们在今后的汉语语音加工研究中,应对粤语和普通话人群区别对待。  相似文献   

15.
目的噪声抑制是语音信号处理的重要课题。本文利用有效听觉编码算法处理语音信号,研究其在噪声抑制问题上的效果。方法基于有效听觉编码算法对于语音信号和白噪声信号在编码系数大小分布上具有显著差别的特性,本文提出一种使用有效听觉编码的降噪算法,在有效听觉编码算法获得的编码系数中抑制噪声,适用于含有加性白噪声的语音信号。结果客观评价结果表明本算法能够有效降低语音中的加性白噪声。同时将该算法与其他当前基于短时傅里叶变换的语音降噪算法进行了对比,表明该降噪算法对于信噪比(signal-to-noise ratio,SNR)的提高比当前得到广泛采用的最小均方误差算法(minimum mean-square error,MMSE)、谱减法等性能更好。结论本文提出的噪声抑制算法可以进一步提高当前噪声抑制算法的性能。  相似文献   

16.
一种新的电子耳蜗的刺激脉冲序列的合成方案   总被引:4,自引:0,他引:4  
现有的电子耳蜗的刺激脉冲序列的合成方案都是以固定频率和位置编码方式刺激听觉神经纤维来诱发听觉。但是,这些合成方法破坏了语音信号的时间上的相关性和相干性,均不能反映人的耳蜗对语音信号的时间编码方式。本研究提出了一种全新的刺激脉冲序列的合成方案,该方案能够在语音信号的小波变换域上的过零点处产生刺激脉冲合成脉冲序列,我们将之称为小波一过零刺激方案。小波一过零刺激方案可有效地克服电极之间的相互影响,同时刺激脉冲序列的时间间隔完全由语音信号的动态特性确定,从而保证了语音信号的时间相关性和相干性。  相似文献   

17.
传统语音信号检测方法是将噪声作为干扰信号来线性滤除,而在强噪声背景下,这些方法在去除噪声的同时也丢失了部分原始语音信号。随机共振能够利用噪声能量放大弱信号而抑制噪声,基于此原理,提出一种基于自适应随机共振提取弱语音信号的方法,并与二次采样相结合,实现强噪声背景下弱语音信号的检测。该方法通过评价系统输出信号的信噪比,自适应调节系统参数a、b,从而最优地检测出弱语音信号。实验仿真分析表明,强噪声背景下,输出信号的信噪比由初始信噪比-7dB提高到0.86dB,信噪比增益为7.86dB。该方法明显提高了输出语音信号的信噪比,为弱语音信号的检测提供了新的思路。  相似文献   

18.
基准点选择对三次样条插值法去噪的效果有重要影响。本文针对通常的三次样条插值滤波方法,提出一种改进的心电(ECG)信号滤波算法,能适应更宽范围的基线噪声频率分布。算法通过对原始ECG信号求一阶导数,得到每一个心拍周期内的最大和最小值点,其对应的位置作为基准点的位置。然后对原始ECG信号通过截止频率为1.5Hz的高通滤波器,将滤波前后基准点所对应信号幅值的差值作为基准点的幅度。对这些基准点进行三次样条插值曲线拟合,所得拟合曲线为基线漂移曲线。改进算法与原单点法相比,在模拟两种基线漂移情况下,改进样条差值的拟合基线漂移曲线对模拟基线漂移的相关系数分别提高了0.242和0.13;真实基线漂移的情况下,多个临床数据实验显示改进样条差值法平均相关系数达到0.972。  相似文献   

19.
为了克服传统广义分形维算法存在的边缘效应,提高低信噪比环境中语音信号起止点的检测能力,我们提出了一种分块耦合(Boxes-coupling)的广义维数计算方法,并将其应用于语音信号的端点检测中.首先确定各分块之间的耦合边长,利用耦合的分块覆盖待检测的语音信号,求得容量维数、信息维数和关联维数,以构成三维特征向量;然后根据特征距离和相似度之间的关系,用一般距离度量进行特征提取;最后采用双门限模式分类进行决策分类.实验结果表明,该方法适合多种噪声环境下的语音端点检测.与传统广义维数(Original generalized dimension, OGD)以及谱熵(Spectral entropy, SE)算法相比,在低信噪比情形下,具有检测精度高、抗干扰能力强以及强系统稳定性(Robustness)等优点.  相似文献   

20.
针对目前微血管运动的检测对设备要求较高,检测时间较长的问题,提出一种简便观测微血管自律运动频率的方法。通过手机摄像头拍摄人体舌面视频,预处理后提取每帧图片中的感兴趣区域,根据每个区域中像素灰度值的变化得到血液容积变化的时序曲线;然后通过小波分解对每个感兴趣区域颜色通道的血液容积变化信号进行降噪,对降噪后的信号进行独立成分分析以降低光照和环境因素影响;提取源信号频域中主要峰值点频率进行拟合,实验结果表明本课题所提取信号频率属于微血管自律运动频率范围。  相似文献   

设为首页 | 免责声明 | 关于勤云 | 加入收藏

Copyright©北京勤云科技发展有限公司  京ICP备09084417号