uis-rnn语音分离配置流程

网友投稿 752 2022-05-30

简介

谷歌研究人员的新方法通过递归神经网络(RNN)模拟发言者的嵌入(即,单词和短语的数学表示),RNN是一种机器学习模型,可以使用其内部状态来处理输入序列。每个发言者都以自己的RNN实例开始,该实例在给定新嵌入的情况下不断更新RNN状态,使系统能够学习在发言者和话语之间共享的高级知识。

“由于该系统的所有组件都可以以监督的方式学习,因此在可以获得具有高质量时间标记的扬声器标签训练数据的情况下,优于无监督系统,”研究人员在论文中写道。“我们的系统采用全面监督,并且能够从带有时间标记的发言者标签的示例中学习。”

在未来的工作中,团队计划优化模型,以便它可以集成上下文信息以执行离线解码,他们期望这能进一步降低DER错误率。谷歌团队还准备直接对声学特征进行建模,以便整个发言者diarization系统可以进行端到端的训练。

语音分离github uis-rnn网址

吹文链接

论文链接

博客链接

博客链接,可能是直接打不开的哟

最近做别的工作,后续有时间再跟进这个学习一波

推荐的一个Google UIS-RNN 的安装与测试

依赖项:

Dependencies This library depends on: python 3.5+ numpy 1.15.1 pytorch 0.4.0 scipy 1.1.0 (for evaluation only)

1

2

3

4

5

6

7

部署安装流程:

conda create -n uisRnn python=3.5.5 conda activate uisRnn

1

2

uis-rnn语音分离配置流程

3

直接安装 pytorch 会自动安装合适版本的 numpy

Installing without CUDA

最新版安装命令链接

0.4.1版本安装命令链接

conda install pytorch=0.4.1 -c pytorch

1

安装scipy

官网安装命令介绍

conda install scipy

1

下载之后解压,进入解压目录,按教程运行

python3 demo.py --train_iteration=1000 -l=0.001 -hl=100

1

第一次运行如下测试命令时,报错如下:

ImportError: cannot import name 'show_config'

1

预计是numpy与scipy版本冲突,于是删除该环境,按照如上步骤重新安装,测试运行成功

神经网络 语音通话

版权声明:本文内容由网络用户投稿,版权归原作者所有,本站不拥有其著作权,亦不承担相应法律责任。如果您发现本站中有涉嫌抄袭或描述失实的内容,请联系我们jiasou666@gmail.com 处理,核实后本网站将在24小时内删除侵权内容。

上一篇:【Binder 机制】进程通信-正常情况 | 进程通信- mmap 内存映射 | Binder 机制重要组件
下一篇:Redis地理位置、基数统计、位图场景使用详解
相关文章