深度学习概念——端对端

深度学习概念——端对端本文介绍了端对端学习在深度学习中的概念 强调了它与分治法的区别 以及在语音识别中的优势

大家好,欢迎来到IT知识分享网。

在读论文的过程中反复遇到端对端的概念,就需要理解深刻一些。在此将收集到的一些资料拿出来辅以自己的拙见,请大家多多批评指正!

1、端对端是什么

2、端对端有什么用

相比分治策略,“端到端”的学习方式具有协同增效的优势,有更大可能获得全局最优解。

3、例子

非端到端学习(传统的语音识别系统)
传统的语音识别需要把语音转换成语音特征向量,然后把这组向量通过机器学习,分类到各种音节上(根据语言模型),然后通过音节,还原出最大概率的语音原本要表达的单词,一般包括以下模块:

  • 特征提取模块 (Feature Extraction):该模块的主要任务是从输入信号中提取特征,供声学模型处理。一般也包括了一些信号处理技术,尽可能降低环境噪声、说话人等因素对特征造成的影响,把语音变成向量。
  • 声学模型 (Acoustic Model): 用于识别语音向量
  • 发音词典 (Pronnuciation Dictionary):发音词典包含系统所能处理的词汇集及其发音。发音词典提供了声学模型与语言模型间的联系。
    • 语言模型 (Language Model):语言模型对系统所针对的语言进行建模。
    • 解码器(Decoder):任务是对输入的信号,根据声学、语言模型及词典,寻找能够以最大概率输出该信号的词串。

传统的语音识别中的语音模型和语言模型是分别训练的,缺点是不一定能够总体上提高识别率。

端到端学习(端到端的语音识别系统)
端到端学习的思路则非常简单:音频→学习算法→转录结果;而现在,我们可以直接通过深度学习将语音直接对标到我们最终显示出来的文本。通过深度学习自己的特征学习功能来完成从特征提取到音节表达的整个过程。在给定了足够的有标注的训练数据时(语音数据以及对应的文本数据),端到端的语音识别方法的效果会很好。
【Tips】在训练样本很少的情况下,End to End的效果可能不如传统方法,但当训练样本数量足够多,End to End的优势越发明显。

4、引用

https://blog.csdn.net/SunshineSki/article/details/?utm_medium=distribute.pc_relevant.none-task-blog-2defaultbaidujs_baidulandingword~default-1–blog-.235v38pc_relevant_sort_base2&spm=1001.2101.3001.4242.2&utm_relevant_index=4


免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/116654.html

(0)
上一篇 2025-11-27 12:15
下一篇 2025-11-27 12:26

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信