• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2008, Vol. 30 ›› Issue (9): 132-136.

• 论文 • 上一篇    下一篇

一种用于机器翻译的相似句对检索方法

巢文涵[1] 李舟军[2] 陈跃新[1]   

  • 出版日期:2008-09-01 发布日期:2010-05-18

  • Online:2008-09-01 Published:2010-05-18

摘要:

在基于语料库的机器翻译系统中,相似句对的检索对于翻译的质量具有非常重要的作用。本文提出一种新颖的方法,可以利用双语例句来帮助度量待翻译句子与例句的相似度 。为了提高检索的效率,我们还提供了一个双层的语料库索引方法。由于我们的相似度度量在计算相似度时考虑了例句对最终翻译结果的影响,因此在翻译实验中取得了较好好的效果。

关键词: 机器翻译 相似度度量 句对检索 语料库索引

Abstract:

The retrieval of similar sentence pairs is very important in the corpus-based machine translation for the translation quality. In this paper, we prese   nt a novel approach, which makes use of the bilingual examples to measure the similarity of the source input sentence and the examples. In order to rais  e the retrieval efficiency, we provide a two-level corpus indexing method. Because our metric considers the effects of the example on the final translat    ion, it will help to improve the translation results.

Key words: machine translation;metric of similarity, retrieval of sentence pair, corpus indexing