大家好,欢迎来到IT知识分享网。
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档
前言
在上文提到目前国际上比较著名的几个数据集,在本文将讨论目前在GEC 领域存在的几种方法,包括分类器(统计和神经)、机器翻译(统计和神经)、基于编辑的方法和语言模型,本文将高度总结分类器方法和机器翻译,并介绍在用此两类方法构建GEC系统的重要模型。
一、分类器
1 基本原理
- articles (Lee 2004; Han, Chodorow, and Leacock 2006; De Felice 2008;
Gamon et al. 2008; Gamon 2010; Dahlmeier and Ng 2011b; Kochmar,
Andersen, and Briscoe 2012; Rozovskaya and Roth 2013, 2014); - prepositions (Chodorow, Tetreault, and Han 2007; De Felice 2008; Gamon
et al. 2008; Tetreault and Chodorow 2008; Gamon 2010; Dahlmeier and
Ng 2011b; Kochmar, Andersen, and Briscoe 2012; Rozovskaya and Roth
2013, 2014); - noun number (Berend et al. 2013; van den Bosch and Berck 2013; Jia,
Wang, and Zhao 2013; Xiang et al. 2013; Yoshimoto et al. 2013;
Kunchukuttan, Chaudhury, and Bhattacharyya 2014); - verb form (Lee and Seneff 2008; Tajiri, Komachi, and Matsumoto 2012;
van den Bosch and Berck 2013; Jia, Wang, and Zhao 2013; Rozovskaya
and Roth 2013, 2014; Rozovskaya, Roth, and Srikumar 2014).
2 方式
3 现状
二、机器翻译
随着网络模型的发展,越来越多的网络模型出世,其中我们所熟知的Seq2Seq模型,常常用于机器翻译领域,而在GEC领域,科学家也尝试将机器翻译与GEC相结合,目前来看,主要分为两大类,即基于神经机器翻译(NMT)与基于统计机器翻译 (SMT)。
1 SMT
eg:I are good --> I am good
2 NMT
总结
本篇介绍了两种语法纠错方法,阐述了其发展历史以及方法本身的优势和缺点,下篇将讲述另外两种方法基于编辑的方法和语言模型。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/122941.html