ASRT中文语音识别系统

最新推荐文章于 2025-05-21 11:31:50 发布

绝版小哥

最新推荐文章于 2025-05-21 11:31:50 发布

阅读量5.4k

点赞数 7

CC 4.0 BY-SA版权

分类专栏：深度学习文章标签： python 语音识别

本文链接：https://blog.csdn.net/qq_36999834/article/details/103076886

项目：ASRT_SpeechRecognition
学习中…持续更新

系统流程

1.特征提取

输入：语音.wav
操作：分帧加窗等操作
输出：语谱图(二维频谱图像信号)

2.声学模型

参考VGG的深度卷积神经网络
- 输入：语谱图
- 操作：VGG模型训练
- 输出：VGG输出

3.CTC解码

输入：VGG输出
输出：汉语拼音序列

4.语言模型

基于概率图的最大熵隐马尔可夫模型
- 输入：汉语拼音序列
- 操作：隐含马尔可夫链
- 输出：汉字文本
无需中文分词算法的简单词频统计

def sub_run(path, n):  # n 记录每次切片的一组中包含的字符数
    f1 = open(path, 'rb')
    stxt = f1.read()
    stxt = str(stxt, 'utf-8')
    f1.close()
    tmp_str = {
   
   }

最低0.47元/天解锁文章

200万优质内容无限畅学

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

绝版小哥

关注关注

7
点赞
踩
36

收藏

觉得还不错? 一键收藏
8
评论
分享

复制链接

分享到 QQ

分享到新浪微博

扫一扫
举报

举报

专栏目录

ASRT语音识别系统的部署和模型训练

BinzTcl的博客

09-22

349

语音识别是一种将语音信号转换为文本的技术，在许多应用领域如智能助手、语音控制和语音转写中发挥着重要作用。ASRT（Automatic Speech Recognition Toolkit）是一个用于构建和训练语音识别系统的开源工具包，它提供了一套完整的工具和库，用于处理语音数据、模型训练和推理。以上就是使用ASRT进行语音识别系统的部署和模型训练的详细步骤。通过准备数据、配置模型、进行训练和部署推理，你可以构建一个完整的语音识别系统。在实际应用中，你可能需要根据自己的需求进行更多的调整和优化。

ASRT语音识别系统的部署和模型使用

JdkwOle的博客

09-22

410

语音识别是一种将语音信号转换为文本的技术，它在许多领域中都有广泛的应用，例如智能助理、语音控制和语音转写等。综上所述，我们介绍了ASRT语音识别系统的部署和模型的使用。上述代码定义了一个简单的ASRT模型，包括一个Transformer编码器、一个全连接层、一个双向GRU层和一个线性输出层。同时，准备好用于训练和测试的语音数据集。训练过程中，我们使用训练集进行模型训练，并使用测试集进行模型性能评估。最后，我们使用训练好的模型进行语音识别，并输出识别结果。上述代码中，我们加载了训练好的ASRT模型，并使用。

8 条评论您还未登录，请先登录后发表或查看评论

ASRT_SpeechRecognition：基于深度学习的中文语音识别系统

02-05

ASRT：基于深度学习的中文语音识别系统 ASRT是一个基于深度学习的中文语音识别系统，如果您觉得喜欢，请点一个“ Star”吧〜自述语言|中文版| | |||| 如果程序运行期间或使用中有什么问题，可以及时在issue中提出来，我将尽快进行响应。本项目作者交流QQ群： 894112051 提问前请仔细查看，以及避免重复提问以下问题AI柠檬博主和群友可能会拒绝回答，包括但不限于：询问已经写在ASRT语音识别项目文档和问题上解决过的已知重复问题。找不到重点，不知所云的问题，但不声明任何其他信息。跟ASRT项目没有直接相关的问题 “伸手党”类的问题请注意，开发者并没有义务回复您的问

ASRT语音识别项目

haima1998的专栏

07-17

1953

转自：https://www.zhihu.com/question/23473262/answer/812989806 作者：zahet 链接：https://www.zhihu.com/question/23473262/answer/812989806 来源：知乎著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。开源的语音识别首先推荐的当然就是ASRT语音识别项目这是一个基于中文的语音识别开源项目，GitHub地址为： nl8590687/ASRT_SpeechRec.

人工智能入门：语音识别技术与应用

最新发布

2501_91624122的博客

05-21

911

语音识别（ASR）是人工智能的重要分支，通过将语音信号转换为文本信息，广泛应用于智能助手、语音输入法、智能家居等领域。其技术框架包括语音信号采集、预处理、特征提取、声学模型、语言模型和解码器。常用的特征提取方法有梅尔频率倒谱系数（MFCC）和滤波器组能量（FBank），声学模型则包括隐马尔可夫模型（HMM）和深度神经网络（DNN）等。语言模型如N-gram和神经网络语言模型（NNLM）用于生成自然语言文本，解码器则结合声学模型和语言模型生成最终文本。本文还介绍了使用Python实现简单语音识别的步骤，包括环

ASRT语音识别系统的部署以及模型的使用(运用篇)

guigenyi的专栏

05-29

2141

ASRT是一个中文语音识别系统，由AI柠檬博主开源在GitHub上。ASRT语音识别工具文档教你如何使用ASRT训练中文语音识别模型并完成部署以及使用模型进行语音识别的操作步骤。文章作者比较惜字如金，文中很多细节之处没有细讲，我在windows上进行部署的时候踩了比较多的坑，特此记录下。本文适用对象：只想搭建一个语音识别服务端，来实现语音识别功能，而不需要训练出自定义的语音识别模型（如：训练出可识别某些方言的模型）。如需训练自定义模型，可参考文章ASRT语音识别系统的部署以及模型训练。

【亲测免费】 ASRT 中文语音识别系统使用教程

gitblog_00710的博客

08-09

912

ASRT 中文语音识别系统使用教程项目介绍 ASRT（Auto Speech Recognition Tool）是一个基于深度学习的中文语音识别系统，由nl8590687开发并开源在GitHub上。该项目利用深度卷积神经网络（CNN）、长短时记忆神经网络（LSTM）、注意力机制以及CTC（Connectionist Temporal Classification）实现高效准确的中文语音识别。AS...

ASRT语音识别系统的部署以及模型训练(模型训练篇)

guigenyi的专栏

04-17

2236

ASRT是一个中文语音识别系统，由博主开源在GitHub上。并完成部署和训练过程中的操作步骤。文章作者比较惜字如金，文中很多细节之处没有细讲，我在windows上进行部署的时候踩了比较多的坑，特此记录下。

语音识别之ASRT开源项目（一）

metasignory的博客

06-28

4708

ASRT开源项目的搭建和学习

ASRT：一个中文语音识别系统

q6q6q的专栏

10-27

1272

点击量：52833(在苹果系统下，如果文章中的图片不能正常显示，请升级Safari浏览器到最新版本，或者使用Chrome、Firefox浏览器打开。)ASRT是一套基于深度学习实现的语音识别系统，全称为Auto Speech Recognition Tool，由AI柠檬博主开发并在GitHub上开源(GPL 3.0协议)。本项目声学模型通过采用卷积神经网络（CNN）和连接性时序分类（CTC）方法，...

ASRT系统目录及函数

Littleflowers的博客

03-06

662

ASRT系统目录及函数general_functionfile_dict.pyfile_wav.pyreaddata24.py general_function file_dict.py 函数：GetSymbolList(datapath) 功能：加载dict.txt文件中的拼音符号列表，用于标记符号返回：list_symbol列表，[‘a1’,‘a2’,…] file_wav.py 函数：read_wav_data(filename) 功能：使用wav库读取xxx.wav 返回：wave

【亲测免费】 ASRT：一款强大的中文语音识别开源项目

gitblog_00610的博客

08-09

1130

ASRT：一款强大的中文语音识别开源项目在人工智能的浪潮中，语音识别技术已成为连接人与机器的重要桥梁。今天，我们向您隆重推荐一款基于深度学习的中文语音识别系统——ASRT。这款开源项目不仅技术先进，而且易于部署和使用，是开发者、研究者和企业的理想选择。项目介绍 ASRT，全称Automatic Speech Recognition Tool，是一个由深度卷积神经网络（DCNN）、长短时记忆神经...

华为云耀云服务器L实例：高级篇-部署自己的ASRT语音识别api

xiaojinyuya的博客

10-11

255

当然，我们正常使用语音识别功能不可能在这个测试界面使用，但只要我们已经在华为云耀云服务器L实例上部署并启动了这个功能，然后我们在需要使用的地方向我们的华为云耀云服务器L实例IP：2。之后，我们使用官方提供的测试工具，配置好我们的api接口，即可在客户端使用免费的语音识别api了！那么现在，让我们访问一下我们的api网页界面，在我们的浏览器中输入华为云耀云服务器L实例IP：2。搭建一个自己的语音合成API，以便将文字转换为自然流畅的语音，那么你来对地方了！在入方向规则中，点击添加规则，依旧将端口2。

【亲测免费】 ASRT语音识别系统常见问题解答

gitblog_07935的博客

09-13

415

ASRT语音识别系统常见问题解答项目基础介绍： ASRT（Automatic Speech Recognition Tool）是一个基于深度学习的中文语音识别系统，由nl8590687在GitHub维护。该系统采用TensorFlow和Keras框架，结合深度卷积神经网络、长短时记忆网络(LSTM)、注意力机制，以及CTC（Connectionist Temporal Classificatio...

ASRT从零搭建并测试

从产品出发，精益世界

09-17

304

1. Server默认没有很多工具，例如ifconfig【net-tools安装】、python3.7等。1. Ubuntu直接安装Python会安装3.8；完全卸载重启后，网络丢失，无法访问；我是用VM搭建使用的，用的Ubuntu20.04 Server。2.Python的版本，参考文章的配置，一定要是3.7。但是识别效果不甚理想，应该是学习不足的问题...最后填了这些认知坑后，还是部署完了....2.重新安装python3.7。

基于ASRT的开源实时语音转文本

阳宗德的博客

07-20

4693

基于ASRT的开源实时语音转文本文章目录基于ASRT的开源实时语音转文本ASRT语音识别系统相关资料实时转写客户端识别效果 ASRT语音识别系统相关资料 ASRT是AI柠檬博主（西安电子科技大学 · 西安市大数据与视觉智能重点实验室）从2016年起做的开源语音识别项目，相关的多个平台的客户端SDK也已经开源在GitHub和Gitee上。其中，ASRT语音识别API已经为AI柠檬站内搜索引擎提供了语音识别服务，用于该站语音搜索功能的实现。 ASRT项目能实现wav语音文件的文字识别，不能实现实时语音转文本，

从零开始搭建属于自己的语音识别API服务器（ASRT开源项目）

zhi_qian的博客

06-06

5348

材料准备云服务器（本人使用的的是阿里云服务器 Ubuntu（Linux操作系统））环境搭建 1. Python 3.7 话不多说直接上代码 sudo su yum -y install git yum -y install gcc yum -y install zlib-devel bzip2-devel openssl-devel ncurses-devel sqlite-devel readline-devel tk-devel gdbm-devel db4-devel libpcap-deve

语音基石模型Speech Foundation Models

Barbara‘s Blog

07-23

3588

语音自监督学习模型。

TACONTRON: A Fully End-to-End Text-To-Speech Synthesis Model

zxrttcsdn的博客

04-15

1022

Generate speech at the frame level 统计参数TTS: 文本前端：提取语言特征声学特征预测模型基于信号处理的声音合成器优点：减轻了复杂的工作可以应对复杂的条件和多种情况（语者，语种，情感）相较多阶段模型，鲁棒性更高 TTS：解压（文字->声音），输出是连续的，输出序列会比输入序列要长的多 Ta...

深入解析ASRT中文语音识别系统的核心技术

标题中提到的“ASTR-语音识别”指的是ASTR中文语音识别系统，它是一种应用于处理和识别中文语音的技术或软件。语音识别是计算机科学中的一个重要分支，它涉及到使用先进的算法和技术将人类的语音转化为可读的文本...