• 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

J4 ›› 2015, Vol. 37 ›› Issue (12): 2339-2344.

• 论文 • 上一篇    下一篇

现代维吾尔语句子成分分析技术研究

努尔艾合买提·艾买提1,艾孜尔古丽1,2,玉素甫·艾白都拉1   

  1. (1.新疆师范大学计算机科学技术学院,新疆 乌鲁木齐 830054
    2.中国科学院新疆理化技术研究所,新疆 乌鲁木齐 830011)
  • 收稿日期:2015-08-25 修回日期:2015-11-03 出版日期:2015-12-25 发布日期:2015-12-25
  • 基金资助:

    教育部人文社会科学一般项目(14YJC740001);新疆维吾尔自治区自然科学基金资助项目(2014211A045);新疆维吾尔自治区哲学社会科学研究规划基金资助项目(14CYY093);新疆维吾尔自治区高校科研计划青年教师科研启动基金资助项目(20140706213103147);国家自然科学基金重点项目(61132009);国家自然科学基金资助项目(61262066;61463048);国家社科基金重点项目(14AZD11)

Sentence component analysis of modern Uighur  

Nurahmat·Amat1,Azragul1,2,Yusup·Abaydulla1   

  1. (1.School of Computer Science & Technology,Xinjiang Normal University,Urumqi 830054;
    2.The Xinjiang Technical Institute of Physics & Chemistry,Chinese Academy of Sciences,Urumqi 830011,China)
  • Received:2015-08-25 Revised:2015-11-03 Online:2015-12-25 Published:2015-12-25

摘要:

句子成分分析是自然语言处理研究中的重点和难点。首先陈述现代维吾尔语短语和句子之间的关系、语类间的相互关系等现代维吾尔语单句成分划分问题;其次讨论现代维吾尔语语料库的预处理、短语标记集、句子成分划分基本思路、句子成分分析算法;探索现代维吾尔语谓语的识别算法设计、其他句子成分的识别、自动界定预测算法等研究现代维吾尔语句子成分分析问题;解决现代维吾尔语句子成分分析系统实现、实验数据分析等现代维吾尔语句子成分分析问题。

关键词: 信息处理, 维吾尔语, 短语结构, 句子成分

Abstract:

Sentence component analysis is important and difficult in natural language processing. We first discuss component division problems of single sentences in modern Uyghur, including the relationship between modern Uyghur phrases and sentences and the relationship among the parts of speech.  We then discuss the pretreatment of the modern Uyghur corpus, phrase tag sets, the basic idea of dividing sentence elements, and sentence component analysis algorithm. We further explore a recognition design for identifying modern Uyghur predicate elements, other sentence components, and automatical defining  prediction algorithms to solve the problems of modern Uighur statement analysis and experiment data analysis.

Key words: information processing;Uyghur words;phrase structure;sentence component