关于国内外语法纠错的研究(三)-方法篇(一)

关于国内外语法纠错的研究(三)-方法篇(一)在上文提到目前国际上比较著名的几个数据集 在本文将讨论目前在 GEC 领域存在的几种方法 包括分类器 统计和神经 机器翻译 统计和神经 基于编辑的方法和语言模型 本文将高度总结分类器方法和机器翻

大家好,欢迎来到IT知识分享网。

提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档


前言

在上文提到目前国际上比较著名的几个数据集,在本文将讨论目前在GEC 领域存在的几种方法,包括分类器(统计和神经)、机器翻译(统计和神经)、基于编辑的方法和语言模型,本文将高度总结分类器方法和机器翻译,并介绍在用此两类方法构建GEC系统的重要模型。

一、分类器

1 基本原理

  • articles (Lee 2004; Han, Chodorow, and Leacock 2006; De Felice 2008;
    Gamon et al. 2008; Gamon 2010; Dahlmeier and Ng 2011b; Kochmar,
    Andersen, and Briscoe 2012; Rozovskaya and Roth 2013, 2014);

  • prepositions (Chodorow, Tetreault, and Han 2007; De Felice 2008; Gamon
    et al. 2008; Tetreault and Chodorow 2008; Gamon 2010; Dahlmeier and
    Ng 2011b; Kochmar, Andersen, and Briscoe 2012; Rozovskaya and Roth
    2013, 2014);


  • noun number (Berend et al. 2013; van den Bosch and Berck 2013; Jia,
    Wang, and Zhao 2013; Xiang et al. 2013; Yoshimoto et al. 2013;
    Kunchukuttan, Chaudhury, and Bhattacharyya 2014);

  • verb form (Lee and Seneff 2008; Tajiri, Komachi, and Matsumoto 2012;
    van den Bosch and Berck 2013; Jia, Wang, and Zhao 2013; Rozovskaya
    and Roth 2013, 2014; Rozovskaya, Roth, and Srikumar 2014).

2 方式

3 现状

二、机器翻译

随着网络模型的发展,越来越多的网络模型出世,其中我们所熟知的Seq2Seq模型,常常用于机器翻译领域,而在GEC领域,科学家也尝试将机器翻译与GEC相结合,目前来看,主要分为两大类,即基于神经机器翻译(NMT)与基于统计机器翻译 (SMT)。

1 SMT

 eg:I are good --> I am good 

2 NMT

总结

本篇介绍了两种语法纠错方法,阐述了其发展历史以及方法本身的优势和缺点,下篇将讲述另外两种方法基于编辑的方法和语言模型。

免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://haidsoft.com/122941.html

(0)
上一篇 2025-10-12 21:00
下一篇 2025-10-12 21:15

相关推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

关注微信