基于CNN-TDNN-F的低资源语音识别研究 - 参考网

APP下载 搜索

基于CNN-TDNN-F的低资源语音识别研究

2020-12-28张禹李建文

电脑知识与技术订阅 2020年31期收藏

张禹 李建文

摘要:为了解决语音识别系统在低资源语料下识别性能低下的问题,提出了一种采用因子分解时延神经网络的低资源语音识别方案,并从数据扩展和模型优化两个方面展开。在数据扩展方面提出了一种以语谱图增强、语音合成以及半监督学习为主的数据增强方案。在模型优化方面,在因子分解时延神经网络基础上,引入卷积神经网络。实验结果表明,在低资源语料环境下,与传统低资源语音识别解决方案相比,本方案对语音识别系统性能的提升具有更好的效果。

关键词: 时延神经网络; 半监督学习; 语音合成; 语音识别; 數据增强

中图分类号: TP18        文献标识码:A

文章编号:1009-3044(2019)31-0001-04

Abstract: To solve the problem of low recognition performance of speech recognition system in low resource corpus, a low resource speech recognition scheme based on factorized time delay neural network is proposed, which is developed from data expansion and model optimization. In the aspect of data enhancement, the common speech data enhancement methods are synthetically compared, and a data enhancement scheme based on spectrogram enhancement, speech synthesis and semi-supervised learning is proposed. In the aspect of model optimization, on the basis of factorized time delay neural network, convolution neural network is introduced to extract local semantic information from spectrogram and further improve the performance of model recognition. The experimental results show that in the low resource corpus environment, compared with the traditional low resource speech recognition solution, this solution has a better effect on improving the performance of speech recognition system.

Key words: Time Delay neural network eyword; Semi-supervised training; Speech synthesis; Speech recognition;Data augmentation

在研究某些低资源语言的语音识别时,能够收集到的数据集样本稀少且质量差。自行录制或者直接购买都会消耗大量的资源。碍于限制,研究人员试图寻求其他方法来解决问题,这就是低资源语音识别[1]。

解决低资源语料的语音识别问题,通常在两个方面入手:1)使用更为高效的声学模型[2]。Myat Aye等人使用时延神经网络(Time Delay Neural Network,TDNN)用于缅甸语语音识别,其性能优于传统的声学模型[3]。2)使用数据增强方法来扩充有限的训练数据,从根本上解决训练样本不足的问题。Ramazan Gokay等人通过语音合成有效解决了土耳其语训练样本缺乏问题,最终将词错率降低了14.8%[6]。

为进一步提升低语料资源环境下的语音识别率,本文同时在模型优化和数据增强两方面入手。在模型优化方面将卷……登录APP查看全文

杂志排行

  • 《师道·教研》2024年10期
  • 《思维与智慧·上半月》2024年11期
  • 《现代工业经济和信息化》2024年2期
  • 《微型小说月报》2024年10期
  • 《工业微生物》2024年1期
  • 《雪莲》2024年9期
  • 《世界博览》2024年21期
  • 《中小企业管理与科技》2024年6期
  • 《现代食品》2024年4期
  • 《卫生职业教育》2024年10期
电脑知识与技术 2020年31期

电脑知识与技术的其它文章

  • “互联网+”视阈下政务新媒体服务能力提升研究
  • 基于阴山文献数字化建设与信息共享的思考
  • 互联网信贷产品在大学生中的应用调查研究
  • 大数据环境下利用微信技术解决共享化妆间弊端的研究
  • 基于逆向分析的缓冲区溢出实验设计与研究
  • 大数据背景下的广告智慧监管

Tag » Cnn-tdnn-f