文件名称:
基于归纳学习和汉字汉字映射表的汉日命名实体对等提取方法
开发工具:
文件大小: 384kb
下载次数: 0
上传时间: 2021-03-12
详细说明:命名实体翻译等效项提取在机器翻译(MT)和跨语言信息检索(CLIR)中起着至关重要的作用。 传统方法通常基于大规模并行或可比语料库。 但是,这些研究的适用性受到限制,主要是因为缺乏所需规模的平行语料库,特别是对于中文和日文的语言对。 在本文中,我们提出了一种基于中文和日文特征的方法,该方法基于单语语料库中的归纳学习(IL),自动提取中日命名实体(NE)的翻译对等词。 该方法采用中文汉字和日语汉字映射表(HKMT)来计算日语和汉语之间NE实例的相似性。 然后,通过从中文和日语的高相似性NE实例中提取不同部分,我们使用IL来获取NE的部分翻译规则。 最后,反馈处理将更新中文和日语NE实体相似性和规则集。 实验结果表明,该方法简单有效,克服了传统方法严重依赖双语资源的不足。 与其他方法相比,我们的方法将中文和日语的语言特征与IL结合使用,以自动提取NE对。 我们使用弱相关双语文本集和最少的附加知识来提取NE对有效地减少了构建语料库的成本和对附加知识的需求。 我们的方法可能有助于使用单语语料库构建大规模的汉日NE翻译词典。
(系统自动生成,下载前可以参看下载内容)
下载文件列表
相关说明
- 本站资源为会员上传分享交流与学习,如有侵犯您的权益,请联系我们删除.
- 本站是交换下载平台,提供交流渠道,下载内容来自于网络,除下载问题外,其它问题请自行百度。
- 本站已设置防盗链,请勿用迅雷、QQ旋风等多线程下载软件下载资源,下载后用WinRAR最新版进行解压.
- 如果您发现内容无法下载,请稍后再次尝试;或者到消费记录里找到下载记录反馈给我们.
- 下载后发现下载的内容跟说明不相乎,请到消费记录里找到下载记录反馈给我们,经确认后退回积分.
- 如下载前有疑问,可以通过点击"提供者"的名字,查看对方的联系方式,联系对方咨询.