ASRT中文语音识别系统

项目:ASRT_SpeechRecognition
学习中…持续更新


系统流程


1.特征提取

  • 输入:语音.wav
  • 操作:分帧加窗等操作
  • 输出:语谱图(二维频谱图像信号)
    语谱图

2.声学模型

  • 参考VGG的深度卷积神经网络
    - 输入:语谱图
    - 操作:VGG模型训练
    - 输出:VGG输出
    在这里插入图片描述

3.CTC解码

  • 输入:VGG输出
  • 输出:汉语拼音序列
    CTC

4.语言模型

  • 基于概率图的最大熵隐马尔可夫模型
    • 输入:汉语拼音序列
    • 操作:隐含马尔可夫链
    • 输出:汉字文本
  • 无需中文分词算法的简单词频统计
def sub_run(path, n):  # n 记录每次切片的一组中包含的字符数
    f1 = open(path, 'rb')
    stxt = f1.read()
    stxt = str(stxt, 'utf-8')
    f1.close()
    tmp_str = {
   
   }
    
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值