改进LPU用于蛋白质功能预测

J4 ›› 2011, Vol. 33 ›› Issue (12): 148-152.

改进LPU用于蛋白质功能预测

陈义明1，2,李舟军1,刘军万1

（1.国防科学技术大学计算机学院，湖南长沙 410073;2.湖南农业大学信息科学技术学院，湖南长沙 410128）

收稿日期:2009-09-07 修回日期:2009-12-15 出版日期:2011-12-24 发布日期:2011-11-25

CHEN Yiming1,2,LI Zhoujun1,LIU Junwan1

（1.School of Computer Science,National University of Defense and Technology,Changsha 410073;2.School of Information Science and Technology,Hunan Agricultural University,Changsha 410128,China）

Received:2009-09-07 Revised:2009-12-15 Online:2011-12-24 Published:2011-11-25

摘要/Abstract

摘要：

本文将蛋白质功能预测定义为典型的LPU问题。针对有很少正例的LPU算法存在的不平衡或过拟合问题，提出了基于最近邻和凸组合理论的创建人工正例扩充正例集合的方法，同时使用一类支持向量机获取初始最可能的负例，通过迭代两类支持向量机将分类超平面移到一个合适的位置，由交叉验证获得代表性的负例，从而改进了典型LPU算法学习最优分类器的过程。针对酵母基因组数据的实验表明：我们的算法在很少正例的功能类上的预测性能有显著提高，在其他类上的性能也有一定的改善。

关键词: 蛋白质功能预测, 支持向量机, LPU

Abstract:

This paper formulates the protein function prediction into a typical LPU. Aiming at imbalance or overfitting from LPU with few positive examples, it proposes a method creating synthetic examples to enlarge the set of positive examples based on the nearest neighbor and convex combination, and meanwhile modifies the procedure learning optimal classifier for the classic LPU algorithm by using oneclass SVM(support vector machine) to identify the most probable negative examples, running iteratively SVM to move the classification hyperplane to a suitable place and obtaining representative negative examples through cross validation. For the yeast genomic data, the experiments show that our algorithm outperforms several classic prediction methods, particularly, for function classes with few positive examples.

Key words: protein function prediction;SVM;LPU

陈义明1，2,李舟军1,刘军万1. 改进LPU用于蛋白质功能预测[J]. J4, 2011, 33(12): 148-152.

CHEN Yiming1,2,LI Zhoujun1,LIU Junwan1. [J]. J4, 2011, 33(12): 148-152.

[1]	吕小姣, 张玉梅, 杨红红, 吴晓军, . 基于距离排序的DUPSO-DSVM民歌快速分类算法研究[J]. 计算机工程与科学, 2023, 45(10): 1874-1833.
[2]	刘屹成, 刘晓燕, 严馨. 并行平衡级联支持向量机[J]. 计算机工程与科学, 2023, 45(07): 1170-1177.
[3]	唐宇, 代琪, 杨梦园, 陈丽芳, . 改进麻雀搜索算法优化SVM的异常点检测[J]. 计算机工程与科学, 2023, 45(02): 346-354.
[4]	仲臣, 余学祥, 邰晓曼, 韩雨辰, 肖星星, 刘清华, . 萤火虫算法优化支持向量机室内定位研究[J]. 计算机工程与科学, 2022, 44(11): 1968-1975.
[5]	马汉达, 朱敏. 改进SVM不平衡数据分类的IGWOSMOTE方法[J]. 计算机工程与科学, 2022, 44(06): 1133-1140.
[6]	韦修喜1，黄华娟1，周永权1,2. 基于AP聚类的约简孪生支持向量机快速分类算法[J]. 计算机工程与科学, 2019, 41(10): 1899-1904.
[7]	王云艳1,2，罗冷坤1，王重阳1. 基于流形学习的光学遥感图像分类[J]. 计算机工程与科学, 2019, 41(07): 1212-1219.
[8]	冯璋，裴东,王维. 基于改进灰狼算法优化支持向量机的人脸识别[J]. 计算机工程与科学, 2019, 41(06): 1057-1063.
[9]	崔建双，车梦然. 基于多分类支持向量机的优化算法智能推荐系统与实证分析[J]. 计算机工程与科学, 2019, 41(01): 153-160.
[10]	田勋，汪西莉. 基于聚类标签均值的半监督支持向量机[J]. 计算机工程与科学, 2018, 40(12): 2265-2272.
[11]	颜学龙，龚流青，汪斌斌. 基于DCQGA-SMKL-SVM的模拟电路故障诊断方法[J]. 计算机工程与科学, 2018, 40(11): 1944-1950.
[12]	张和杰,马维华. 基于贴近度等级的链路质量评估方法[J]. 计算机工程与科学, 2018, 40(11): 1991-1999.
[13]	王志华,罗齐,刘绍廷. 基于混沌灰狼优化算法的SVM分类器研究[J]. 计算机工程与科学, 2018, 40(11): 2040-2046.
[14]	邱云飞，李智义. 改进人工鱼群算法在SVM参数优化中的应用[J]. 计算机工程与科学, 2018, 40(11): 2074-2079.
[15]	任胜兵，廖湘荡. 基于代价敏感支持向量机的软件缺陷预测研究[J]. 计算机工程与科学, 2018, 40(10): 1787-1795.

改进LPU用于蛋白质功能预测

PDF

可视化

摘要/Abstract

引用本文

使用本文

相关文章 15

编辑推荐

Metrics

本文评价