您好,欢迎光临本网站![请登录][注册会员]  

搜索资源列表

  1. 基于枢轴语言的平行语料构建方法

  2. 平行语料库的规模对于统计机器翻译性能的提高具有重要作用,但是平行语料库的人工构建成本很高。针对这个问题,本文提出了一种低成本高效率的平行语料构建方法,利用枢轴语言作为桥梁,借助已有的机器翻译技术并融合主动学习方法构建目标语言对的大规模高质量平行语料库。本文通过以英语作为枢轴语言构建日汉平行语料库的实例研究,利用成熟的基于短语的统计机器翻译技术,描述了基于译文自动评测的良好译文选择方法、基于主动学习的语料选取方法、以及翻译系统的更新迭代和评价实验。实验结果表明,本文提出的方法能够快速构建日汉平行语
  3. 所属分类:其它

    • 发布日期:2021-03-12
    • 文件大小:633856
    • 提供者:weixin_38680247
  1. 基于随机行走N步的汉语复述短语获取方法

  2. 在利用大规模双语语料获取复述知识方面, 传统的基于\枢轴" 方法只能考虑两步以内的复述现象. 本文针对已有方法的局限性, 对不同语言之间互为翻译的短语对构建翻译关系图, 提出基于随机行走N 步的复述获取算法, 改进已有方法以获取更多潜在的复述知识. 本文描述了由汉英短语翻译表构建翻译关系图的方法、基于N 步的随机行走算法和基于期望步数的复述短语可信度计算方法. 同时, 本文提出面向多语言对的翻译关系图扩展方法. 在NTCIR 汉英和英日双语平行语料上进行了实验与评测, 并与传统方法进行了对比.
  3. 所属分类:其它

    • 发布日期:2021-02-22
    • 文件大小:2097152
    • 提供者:weixin_38599545