• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2010, Vol. 32 ›› Issue (5): 147-149.doi: 10.3969/j.issn.1007130X.2010.

• 论文 • 上一篇    下一篇

GIZA++计算性能分析

苏翔,李玉鑑   

  1. (北京工业大学计算机学院,北京 100124)
  • 收稿日期:2009-09-13 修回日期:2009-12-10 出版日期:2010-04-28 发布日期:2010-05-11
  • 通讯作者: 苏翔 E-mail:suxiang222@163.com
  • 作者简介:苏翔(1985),男, 山东潍坊人,硕士生,研究方向为自然语言处理;李玉鑑,博士后,教授,研究方向为模式识别、人工智能、算法分析和自然语言处理等。
  • 基金资助:
    国家自然科学基金资助项目(60775010,PHR(IHLB);BJUT高层人才建设和科技创新平台项目

Computational Performance Analysis of GIZA++

SU Xiang,LI Yujian   

  1. (School of Computer Science and Technology,Beijing University of Technology,Beijing 100124,China)
  • Received:2009-09-13 Revised:2009-12-10 Online:2010-04-28 Published:2010-05-11

摘要: 本文首先例举了句长限制一定、训练语料不同的情况下,GIZA++运行中的一些数据和图表,其中包括对运行时间、内存等资源消耗量的统计;然后统计了句长限制不同但训练语料相同的情况下,GIZA++的运行数据。通过使用最小二乘法对这些数据进行函数拟合,对GIZA++的计算性能进行初步的预测分析。该方法可以在过程运行前大致估计出所消耗的资源量,从而避免在运行中出现由于资源不足而导致程序崩溃的情况。

关键词: 机器翻译, GIZA++, 计算性能分析

Abstract: This article provides data and tables about time and memory for GIZA++ in the cases limiting the length of sentences as well as in the cases with a constant total number of sentences. The leastsquares method is also used to compute the approximating functions for them, by which some preliminary predicting analysis is further done for GIZA++.The method can predict the amount of resources to be consumed,and thus avoids the program collapse because of the shortage of resources in the running.

Key words: machine translation;GIZA++;computational performance analysis

中图分类号: