网站首页 > 技术文章 正文
前段时间分享了一篇语音转文字(科大讯飞篇)
今天尝试下开源的deepspeech,deepspeech是基于百度的深度语音论文和谷歌的深度学习框架Tensorflow来实现的。
DeepSpeech is an open source Speech-To-Text engine, using a model trained by machine learning techniques based on Baidu’s Deep Speech research paper. Project DeepSpeech uses Google’s TensorFlow to make the implementation easier.
安装过程比较简单,
1.首先安装python,virtualenv,去python官网下载即可(这里用的3.9版本,3.10版本无法用于deepspeech 0.9版本)
2.创建pyhon的虚拟环境
virtualenv -p python3 $HOME/tmp/deepspeech-venv/
source $HOME/tmp/deepspeech-venv/Scripts/activate
3.安装deepspeech,和下载训练好的模型,及语音文件。
pip3 install deepspeech
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.pbmm
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/deepspeech-0.9.3-models.scorer
curl -LO https://github.com/mozilla/DeepSpeech/releases/download/v0.9.3/audio-0.9.3.tar.gz
tar xvf audio-0.9.3.tar.gz
4.一切准备好后,我们就可以测试语音的识别效果了,如下的音频文件,识别出的结果为:why should one halt on the way,正确率还不错。#教育听我说##我要上 头条#
猜你喜欢
- 2025-03-14 一个用 Rust 开发的极快、易用的 Python 包和项目管理利器
- 2025-03-14 python解释器管理工具pyenv使用说明
- 2025-03-14 Linux命令手册:从青铜到王者,这30个命令让你成为终端高手
- 2025-03-14 python爬虫混肴DES案例:某影视大数据平台
- 2025-03-14 AI应用下一个风口:知识库(ai智能应用)
- 2025-03-14 使用vllm部署自己的大模型(如何部署模型)
- 2025-03-14 Python调用OpenDaylight REST API实验
- 2025-03-14 Java教程:gitlab-使用入门(java gitbook)
- 2025-03-14 接入5家DeepSeek模型提供商!边缘大模型网关助力一键畅享大模型
- 2025-03-14 python爬虫如何一键构造请求(python 构造)
- 最近发表
- 标签列表
-
- cmd/c (57)
- c++中::是什么意思 (57)
- sqlset (59)
- ps可以打开pdf格式吗 (58)
- phprequire_once (61)
- localstorage.removeitem (74)
- routermode (59)
- vector线程安全吗 (70)
- & (66)
- java (73)
- org.redisson (64)
- log.warn (60)
- cannotinstantiatethetype (62)
- js数组插入 (83)
- resttemplateokhttp (59)
- gormwherein (64)
- linux删除一个文件夹 (65)
- mac安装java (72)
- reader.onload (61)
- outofmemoryerror是什么意思 (64)
- flask文件上传 (63)
- eacces (67)
- 查看mysql是否启动 (70)
- java是值传递还是引用传递 (58)
- 无效的列索引 (74)