计算机工程与科学

可信编译器关键技术研究

何炎祥1,2，刘陶1，吴伟1

2010, 32(8): 1-6. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 599 )

PDF (919KB) ( 899 ) 　　

软件的可信性很大程度上依赖于程序代码的可信性。影响软件可信性的主要因素包括来自软件内部的代码缺陷、代码错误、程序故障以及来自软件外部的病毒、恶意代码等，因此从代码角度来保证软件的可信性是实现可信软件的重要途径之一。编译器作为重要的系统软件之一，其可信性对整个计算机系统而言具有非常重要的意义。软件程序一般都需要经过编译器编译后方能执行，如果编译器不可信，则无法保证其所生成代码的可信性。本文主要讨论设计和实现可信编译器的主要思路和关键技术。

无线Mesh网络中基于局部信息的自适应信道分配策略

王嵚琦1,李宏建1,何新贵2,徐明1

2010, 32(8): 7-10. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 556 )

PDF (599KB) ( 385 ) 　　

在多无线接口多信道的无线Mesh网络中，信道分配问题将影响网络的整体性能。为充分利用无线Mesh的资源优势，已提出了许多信道分配策略。然而，大部分的研究假设都隐含需要全网拓扑或者流量模型等信息，这在分布式网络中很难准确获取。为此，本文提出基于局部信息的自适应信道分配策略LICA，在仅使用局部拓扑和节点间信道使用情况等启发式信息的基础上，动态指导信道分配。模拟实验结果表明，LICA算法能显著提高信道利用效率和端到端的数据吞吐量，且具备较低的时间复杂度和良好的可扩展性

随机分组抽样下子群体的流大小分布估计

张海1,2 ，朱旭阳2 ，郭文明2

2010, 32(8): 11-13. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 576 )

PDF (432KB) ( 470 ) 　　

随机分组抽样是网络管理和测量中最常见的抽样方法。已有的研究大都集中在此抽样方法下基于总体的流大小分布估计算法，但一些网络应用更关心总体流量中某个子群体的流大小分布。本文将总体的网络流划分成子群体S和子群体的补集，提出了一种在随机分组抽样下运用TCP协议信息的由S与共同组成流大小的联合分布的估计算法。实验证明，该算法能够较好地还原子群体及其在总体下的流大小分布的特征；另一方面，通过运用样本流中TCP协议信息，提高了子群体流大小分布估计算法的准确性。

无可信中心的自认证多代理签密方案

俞惠芳1，赵海兴2，王之仓1，乔小妮3

2010, 32(8): 14-16. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 572 )

PDF (337KB) ( 460 ) 　　

本文将自认证签密的概念引入到多代理签名中，构造了一种新的无可信中心的自认证多代理签密方案，其安全性依赖于有限域上离散对数问题的难解性。新方案不仅具有自认证签密的优点，而且原始签密人授权给一组代理签密人，授权代理签密组的所有成员一起可以代替原始签密人行使签密权。所提方案算法复杂度低、通信效率高，是一个安全实用的多代理签密方案。

入侵检测系统中的多模式精确匹配算法WDawgMatch

宁卓,龚俭

2010, 32(8): 17-21. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 531 )

PDF (536KB) ( 438 ) 　　

经典的多模式匹配算法如AC、BM，并不满足NIDS对报文负载中攻击特征串检测时做在线乱序流匹配的需求。著名的多模式精确匹配算法DawgMatch弥补了上述算法无法在扫描的同时获得分片摘要信息的缺点，因此在网络入侵检测系统（NIDS）的在线检测中得到普遍应用。尽管基于DAWA自动机使得DawgMatch可通过二元索引来提高空间使用效率，但它的匹配性能尚不能达到高速报文入侵检测线速匹配的要求。本文提出了新算法WDawgMatch，它牺牲预处理时间，引入加权边消除了DawgMatch匹配回溯现象，提升了匹配速度。性能分析和实验结果表明，WDawgMatch降低了原算法的最坏时间复杂度，缩小了与AC算法的差距，完全满足NIDS线速匹配的要求。

一种新型的门限多重秘密共享方案

杨捷，李继国

2010, 32(8): 22-23. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 549 )

PDF (309KB) ( 381 ) 　　

本方案对秘密恢复者而言是一个门限方案，对攻击者而言窃得足够多的子秘密仍不能恢复秘密数据，因而比传统的门限方案更安全。此外，本方案能有效检测秘密分发者和参与者的欺诈行为，在无需重新分配子秘密的情况下实现新成员的加入与成员的退出，且可一次性恢复全部秘密。

基于流量特征和载荷特征的P2P流量识别

焦小焦，钟诚，杨柳，柳永念

2010, 32(8): 24-28. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 606 )

PDF (516KB) ( 784 ) 　　

本文分析了目前的P2P 网络流量识别方法及其存在的问题。设计识别P2P流量的数据结构；在流量识别阶段，在传输层捕获TCP和UDP数据包，依据P2P流在传输层表现出来的主要流量特征，进行TCP/UDP流量特征的P2P流量识别；在载荷特征识别阶段，对载荷特征库定期更新，将在流量识别阶段中识别出的P2P流作精确载荷特征识别，并将流量识别阶段中漏掉的流量作载荷特征识别；在模式匹配过程采用比较指印函数值来加快识别速度；进而提出一个可准确识别出新生、加密的P2P流量及其名称的算法。实验结果表明，该算法具有较高识别和分类P2P流量的能力。

基于FPGA的3G数据包过滤算法设计及实现

张晓晓，黄杰

2010, 32(8): 29-31. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 543 )

PDF (509KB) ( 428 ) 　　

本文以FPGA为平台，设计了在TDSCDMA分组域中实现数据包截获和过滤的系统框架以及基本功能模块，结合Bloom Filter等算法的特点提出了Hash算法实现数据包过滤，并用Verilog语言实现，程序下载至FPGA开发板进行了实测。结果表明，在大规模用户群中均匀抽取部分用户进行监管时，过滤设备可以线速地处理GTP数据包并完成设定用户的过滤。

基于水印技术的隐蔽通信算法设计

梁强1，邱志宏2，张爱科2

2010, 32(8): 32-35. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 518 )

PDF (458KB) ( 432 ) 　　

本文研究了在音频信息上实现水印技术的难点与价值，分析和对比了利用音频信号进行信息隐藏的算法，探讨了隐蔽通信的编码策略，提出了一种基于混合模式的语音信号的信息隐藏编码算法。文中首先给出了编码过程中覆盖半径、覆盖编码等相关定义和信息隐藏编码的相关定理，从理论上分析了隐蔽通信编码策略的可行性和步骤；接着详细论证了该编码算法的基本原理、构造方法和算法的实现过程；然后以一段音频信息为例，阐述了隐蔽通信算法的实现方法和编码步骤；最后从算法的频谱分析、隐蔽信息嵌入量和听觉效果三个方面对算法性能进行测试。测试结果表明，算法隐蔽信息嵌入量可达2.1×103bps。

DolevYao攻击者模型的形式化描述

唐郑熠，李祥

2010, 32(8): 36-38. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 1003 )

PDF (372KB) ( 477 ) 　　

模型检测技术能够实现安全协议的自动化分析，是一种高效的形式化分析方法。然而，对于攻击者的建模却一直缺乏通用的方法，这导致了模型检测方法的自动化程度降低。本文为安全协议分析中，应用最为广泛的DolevYao攻击者模型建立了一套形式化描述方法。遵循这一方法，可以使用任何建模语言机械地建立DolevYao攻击者模型，从而大大地减少了人工分析的成份。同时，本文还使用该方法验证了两个目的完全不同的协议，证明了它的通用性。

准确高效的应用层协议分析识别方法

牟乔

2010, 32(8): 39-45. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 613 )

PDF (1122KB) ( 595 ) 　　

本文对现行应用层协议分析方法进行总结概述，并介绍了一套全新的、模块化的、分为低、中、高、补等4个级别12大类的协议分析识别方法，可准确高效地将网络上的各种通讯数据分门别类，以便于随后进行网络流量监控与管理。尤其针对加密或伪装类数据包，可不经过解密等需要深入进行数据剖析或产生过多计算量的复杂途径而进行分析。即使是不能分析的未知流量，亦有相关特殊方法进行强制性或使用者控制的非强制性操作而将其纳入可控范围进行管理。最后给出了本方法在Linux平台上的实现，并对实验得到的数据进行了比较，给出了整套系统在真实应用环境中的分析效果。

一种机载网络动态TDMA协议设计

韩勇1 ，陈强2，王建新2

2010, 32(8): 46-49. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 525 )

PDF (591KB) ( 439 ) 　　

机载网络是一种节点快速移动、拓扑频繁变化的新型Ad Hoc网络。本文提出了一种机载网络动态TDMA的接入协议，能够同时支持单播和广播方式，并通过RTS/CTS控制报文解决隐藏终端问题。协议将每帧分为前面的控制时隙和后面的数据时隙两部分，每个节点通过微控制时隙来竞争对应的数据时隙进行发送。同时，还可申请使用先前的空闲时隙或竞争失败时隙，采用消除报文来解决网络中可能存在的死锁情况，从而实现带宽的有效利用。最后，使用QualNet软件进行了仿真，结果显示新协议具有较好的性能。

基于主成分分析和模糊综合的入侵检测

张瑞霞，王勇

2010, 32(8): 50-51. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 589 )

PDF (353KB) ( 412 ) 　　

基于当前多分类器融合的入侵检测系统检测性能、训练时间和检测时间等问题，本文提出了利用主成分分析和模糊综合的入侵检测方法。该方法利用主成分分析在特征提取上的优势，首先利用基于总体协方差的PCA和基于总类内散布矩阵的PCA的两种主成分分析方法提取入侵特征；然后通过KNN分类器给出初步的识别结果，依据两个分类器存在的互补性，将此识别结果采用模糊综合方法进行融合，得出最终识别结果。利用KDD CUP’99的标准入侵检测数据集进行实验，实验结果验证了该方法的有效性。该方法提高了入侵检测的整体性能,降低了训练时间和检测时间。

电子政务系统安全域划分技术的研究与应用

王淼，凌捷，郝彦军

2010, 32(8): 52-55. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 897 )

PDF (495KB) ( 566 ) 　　

针对目前安全域的划分方法尚缺乏可操作性的问题，本文提出了一种新的电子政务系统安全域划分的方法。以电子政务系统资产价值相似性原则为主要依据，综合考虑系统功能及应用和系统的安全需求等要素，结合信息安全测评与风险评估中资产价值的赋值标准，建立了电子政务系统资产分类的三级指标体系及各类资产的资产价值相似性指标赋值体系。以某区电子政务系统为例，依据本文提出的电子政务系统资产分类指标体系及资产价值相似性指标赋值体系，运用模糊聚类分析方法，利用Matlab编程实现，并结合实际应用对运行结果进行具体分析，确定了系统安全域划分的结果。

基于机器学习的蜂窝网络节点定位算法研究

王鲁达1,高守平1,方芳1,2,李煜民1

2010, 32(8): 56-59. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 669 )

PDF (798KB) ( 786 ) 　　

蜂窝网络希望能在广泛的应用领域内实现复杂的大范围监测和追踪任务,而移动台节点定位是相关应用的基础。本文在对现有无线网络定位技术研究的基础之上,有针对性地分析当前几种机器学习经典算法,提出了一种基于支持向量机树型多分类的蜂窝通信系统节点定位算法,充当分布式定位的全局坐标算法。通过对算法原理的分析以及实验结果对比,证明了基于机器学习的定位算法在定位效果方面解决了困扰基于信号参数的定位技术的边界问题与集中洞问题，在定位的平均误差、标准偏差和分布式定位正确率以及实现代价几个方面的总体性能均优于基于信号参数的定位技术与GPS one定位技术。

一种精确匹配的全景图自动拼接算法

邹北骥，阮鹏，向遥，贺加贝

2010, 32(8): 60-63. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 894 )

PDF (566KB) ( 823 ) 　　

本文提出一种全景图像自动拼接算法，能够实现特征点对的精确筛选和匹配，以及输入图像的自动排序和拼接。首先提取输入图像的尺度不变特征变换SIFT特征点，并采用kd树搜索得到图像之间所有初始特征匹配对；利用欧氏距离比值和中值滤波器对初始特征点对进行筛选后，再应用随机抽样一致算法RANSAC得到图像间精确匹配的特征点对；计算出图像之间的单应性矩阵，在此基础上完成对输入图像的自动排序和配准，最终拼接合成全景图像。实验结果表明，该算法能获得比结合欧氏距离比值的RANSAC算法更高的配准精度，全景图拼接效果较好，具有良好的鲁棒性。

一种光栅图像SVG矢量化表示的方法

胡卫军1,刘昕2,陆永亮1,何昆1

2010, 32(8): 64-66. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 583 )

PDF (523KB) ( 366 ) 　　

本文借助于多边形图像区域表示，提出了一种将光栅图像转换为SVG表示的矢量图形方法。该方法借鉴种子生长法将光栅图像划分为若干等大小的正方形图像原子块，在原子块中寻找主块，并从主块开始利用块间的邻域关系和种子生长准则，将与主块颜色特征相近的块合并到主块所在的集合，再从这个集合中抽取能覆盖这个集合所有元素的多边形。然后对分割得到的多边形区域提取边界顶点，并对边界顶点进行优化。最后根据多边形区域的形状和颜色使用相应的SVG代码描述光栅图像。该方法采用矢量图形描述光栅图像，具有存储空间比较小、放大无锯齿、不易变形等特点。

基于Hough变换的实验数据坏点剔除方法

陈苏1，林嘉宇2

2010, 32(8): 67-70. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 850 )

PDF (579KB) ( 566 ) 　　

在实验测试中，除了获得包含误差的正常数据，实验员常常也可能观察到一些明显错误的点，我们称之为“坏点”。坏点的存在可能会严重影响实验最终结果的可靠性，所以在数据分析前，应该被处理掉。以往的常规坏点处理方法多为肉眼查看，手动排除。这种方法工作量大，并且判断依据不够明确，只靠“感觉”，另外，在接收到大量数据的时候，手动法无能为力。本文在使用计算机编程的基础上，应用Hough变换，提出了一种坏点剔除的新方法，可处理符合直线拟合特征的实验数据中的坏点；作为扩展应用，该方法也可以处理以下两种数据：可通过函数变换转化为符合线性分布的数据和Hough变换可处理的服从曲线分布的数据。仿真实验和实际应用表明，本方法具有较好的性能。

基于方向ROEWA算子的高分辨率SAR图像道路提取

吴禹昊，陈天泽，粟毅

2010, 32(8): 71-74. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 885 )

PDF (1003KB) ( 418 ) 　　

指数加权均值比率ROEWA算子是SAR图像阶跃边缘提取中较为常用的算法，但该方法只能提取边缘强度，不能得到边缘方向。本文在ROEWA算子的基础上，利用添加方向模板的方法，提出了获取边缘方向的ROEWA改进算法。并根据得到的边缘方向，分别提出了一种边缘筛选算法和快速的Hough变换算法，从而提取出图像中的直线信息。实验表明，本文方法准确、高效，且对SAR图像中的相干斑噪声具有很好的抑制作用。

海德堡视网膜断层扫描仪的三维点云去噪方法研究

马彩虹1，程〓昱1，何明光2，曾阳发2，刘东峰1

2010, 32(8): 75-77. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 574 )

PDF (793KB) ( 432 ) 　　

双边滤波法可以对海德堡视网膜断层扫描仪（HRT）扫描获得的三维点云数据进行有效的去噪处理。该算法在去噪的同时保留了图形的特征信息，缺点是多次迭代计算耗费了大量时间，所以该算法无法直接运用到实际的诊断中。邻域均值算法对位于某点一定邻域内所有点的Z坐标做均值处理，且根据距离中心点的远近取不同的权值，也能对图形进行去噪处理，只是单独使用虽耗费时间较少但效果远不及双边滤波算法。因此，本文提出采用邻域均值法作为双边滤波算法去噪的预处理。研究发现，该方法在保留图形特征的同时，并且在相同去噪效果的前提下可以显著减少计算时间，提高运行效率。

一种采用小波包分析及RBFN的民族文种识别方法

郭〓海,赵晶莹,韦宗伟

2010, 32(8): 78-80. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 518 )

PDF (519KB) ( 456 ) 　　

随着我国计算机技术的发展，少数民族信息处理已经逐渐成熟起来，少数民族文字识别研究已经成为一个热点。本文提出一种基于小波包特征与径向基网络的少数民族文字种类识别方法，该方法采用小波包能量和小波包能量比例分布的特征描述，利用径向基函数神经网络对少数民族文种进行分类识别。通过构建六种常用的少数民族文字及汉字、英文共八种文字的样本库，采用本文的方法对样本库进行了训练和测试。实验结果显示，本文的方法对于少数民族文种识别的平均精度好于小波特征及传统的分类方法。

结合Camshift和Kalman预测的运动目标跟踪

钱永青，谢勤岚

2010, 32(8): 81-83. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 717 )

PDF (437KB) ( 548 ) 　　

针对单一的CamShift跟踪算法在目标发生遮挡时非常容易致使跟踪目标失败的问题，本文提出了一种基于CamShift和Kalman预测的跟踪算法。首先，采用帧间差分阈值法来快速、精确地检测和提取出运动目标；然后，通过在CamShift算法中使用运动目标的颜色特征,在图像序列中找到运动目标的所在位置和大小；最后，使用Kalman滤波预测目标的位置，进而有效地解决了背景中大面积相同颜色的干扰和目标部分被遮挡等问题。用无线遥控车完成了运动目标的跟踪实验，实验证明结合CamShift算法和Kalman预测滤波能实时、准确地跟踪目标。

基于小波变换的ROI图像压缩改进算法研究

王晓芳，邱书波,张绪光

2010, 32(8): 84-86. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 730 )

PDF (520KB) ( 443 ) 　　

小波变换作为一种多分辨率分析方法，具有良好的空频局部特性，特别适合按照人类视觉系统特性设计图像压缩编码方案。基于小波变换的嵌入式编码算法能够有效地应用于基于感兴趣区域（ROI）的图像压缩与渐进传输。为了进一步提高效率并改善图像压缩传输的效果，本文在该算法的基础上提出了两点改进：（1）计算感兴趣区域模板时，将数学上的“排列组合”思想应用于传统的回溯法，使计算过程更加简单；（2）在对小波系数嵌入式编码时，牺牲图像背景区域的细节系数以获取感兴趣区域更高的解码质量。最后给出了改进算法的部分实验结果，证明了改进算法的有效性。

基于扩展数学形态学的车牌定位算法

熊春荣1,2，黄文明2

2010, 32(8): 87-89. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 660 )

PDF (661KB) ( 598 ) 　　

在汽车牌照识别系统中，车牌定位是整个识别模块实现的前提，目前车牌定位的方法多种多样，各有所长，但存在着计算量大或定位准确率不高等问题。边缘检测是常用的车牌定位方法，边缘检测的质量决定了车牌图像的最终定位结果。一般人们习惯于用基于梯度和基于模板的算子提取边缘，但这类算子都不能很好地滤除噪声，因而给噪声图像边缘检测带来了困难。根据数学形态学原理与方法，提出一种扩展数学形态学车牌图像边缘检测算子，并结合水平和垂直投影进行车牌定位。实验结果表明，该算法不仅能成功提取车牌图像边缘，而且能很好地滤除噪声，从而实现准确车牌定位。

文本多分类中的特征选择研究

王〓博，贾〓焰，杨树强，韩伟红 

2010, 32(8): 90-93. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 489 )

PDF (397KB) ( 724 ) 　　

特征选择是数据挖掘和机器学习等领域内重要的预处理步骤，近年来得到了广泛的关注。文本数据的高维性往往会影响分类等数据挖掘任务的效率，因此特征选择常被作为文本分类过程中的重要组成部分，以达到降维的目的。随着分类技术的快速发展，类别的日益细化，文本的多类分类问题为特征选择方法提出了更多的挑战。本文面向文本多类分类的应用背景，阐述了目前特征选择方法所面临的主要挑战，给出了多分类特征选择方法的主要种类。本文沿着相关研究的发展路线，由易至难，由浅入深，通过对目前多分类特征选择算法的应用情况进行总结，并进行综述评论，最后对全文进行了概括，提出了未来可能的研究方向。

一种高维数据聚类遗传算法

孙浩军，熊琅环

2010, 32(8): 94-97. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 525 )

PDF (695KB) ( 411 ) 　　

聚类分析是数据挖掘中的一个重要研究课题。在许多实际应用中，聚类分析的数据往往具有很高的维度，例如文档数据、基因微阵列等数据可以达到上千维，而在高维数据空间中，数据的分布较为稀疏。受这些因素的影响，许多对低维数据有效的经典聚类算法对高维数据聚类常常失效。针对这类问题，本文提出了一种基于遗传算法的高维数据聚类新方法。该方法利用遗传算法的全局搜索能力对特征空间进行搜索，以找出有效的聚类特征子空间。同时，为了考察特征维在子空间聚类中的特征，本文设计出一种基于特征维对子空间聚类贡献率的适应度函数。人工数据、真实数据的实验结果以及与kmeans算法的对比实验证明了该方法的可行性和有效性。

基于扩展概念格模型的文本分类规则提取的研究

周〓顽，周才学

2010, 32(8): 98-100. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 464 )

PDF (419KB) ( 452 ) 　　

文本分类是信息检索与数据挖掘领域的研究热点与核心技术，近年来得到了广泛的关注和快速的发展。概念格是规则提取和数据分析的有效工具，然而概念格的构造效率始终是概念格应用的一大难题。本文研究了基于扩展概念格模型的文本分类规则提取,利用粗糙集和扩展概念格模型来进行分类规则提取。该方法利用概念树，极大地除去了冗余的概念，只需要建造很少的概念就能够提取出全部的分类规则，不仅效率较高，而且同时提取的分类规则与概念格相同。本文算法在MATLAB7.0的环境中运行的实验表明，查全率比KNN算法和SVM算法稍低，但是查准率比它们都高，因此该分类规则用于文本分类时效果与KNN和SVM相当。

关于中文文档复制检测算法的改进

孙〓伟，邢长征

2010, 32(8): 101-103. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 509 )

PDF (382KB) ( 550 ) 　　

文本复制检测是这样一种行为：它判断一个文档的内容是否抄袭、剽窃或者复制于另外一个或者多个文档。文档复制检测领域的算法有很多，基于句子相似度的检测算法结合了基于字符串比较的方法和基于词频统计的方法的优点，在抓住了文档的全局特征的同时又能兼顾文档的结构信息，是一种很好的算法。本文在该算法的基础上对相似度算法进行了改进，提出了一种新的面向中文文档的基于句子相似度的文档复制检测算法。本算法充分考虑了中文文档的特点,选择句子作为文档的特征单元, 并解决了需要人工设定阈值的问题，提高了检测精度。实验证明,无论是在效率上，还是在准确性上，该算法都是可行的。

一种基于KEGG数据库重构代谢网络的新方法

周婷婷1,3，容健锋2，王正华1，董蕴源1，王勇献1，朱云平3

2010, 32(8): 104-107. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 592 )

PDF (731KB) ( 533 ) 　　

从代谢物、酶和生化反应信息重新构建正确的代谢网络是各项代谢网络相关研究非常关键的第一步。针对以往重构方法存在的数据难以及时更新、数据有冗余、获取数据慢等问题，本文采用分而治之的递归策略，提出了一种基于KEGG数据库自下而上重构全物种代谢网络的新方法。与以前的方法相比，本方法的优点在于：使用KEGG的Web服务获取数据，以保证数据的准确性和及时更新；依靠KEGG/PATHWAY库的数据选择机制选取数据，以保证构建网络的数据无冗余；整个方法基于Java实现，保证程序的跨平台通用性；通过构建MySQL本地数据库将远程数据本地化，大大降低数据读取的时耗。评估结果显示，该方法不仅能够保证重建网络数据的准确性和及时更新，而且有效地提高了多物种多次重构情况下的网络重构效率。

一种求ε-不敏感支持向量回归机光滑函数的新方法

陈〓勇,熊金志

2010, 32(8): 108-111. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 563 )

PDF (358KB) ( 300 ) 　　

2008年熊金志等人提出了一种求光滑函数的方法, 就理论而言可求得ε不敏感支持向量回归机的无穷个光滑函数，但该方法每次都需要对光滑函数的导数进行积分，推导过程很繁琐。为克服这个缺点，本文利用支持向量分类机的光滑函数，通过相关的理论推导，用新的递推方式来表示支持向量回归机的光滑函数，简化了原方法的推导过程，得到了一种求支持向量回归机光滑函数的新方法。通过用原方法和新方法分别求光滑函数的两个算例，表明了新方法的有效性。还用新方法导出了光滑函数的一个重要性质，即光滑函数关于光滑阶数是单调减函数，为进一步研究光滑支持向量回归机提供了理论依据。

一种新的度量生物复杂网络模块性的方法

刘齐军1, 2，王正华1，郭昊2，孙汉昌2, 3，刘万霖2，朱云平2

2010, 32(8): 112-116. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 668 )

PDF (504KB) ( 513 ) 　　

在生命科学领域，生物网络的概念也被大量引入，用以系统地表示复杂的生物过程。模块性是很多复杂网络都具有的特征，因此生物网络模块性的研究成为系统生物学一个重要的研究方向。为了更加深入地了解生物系统的组成和机理，本文提出了一种度量网络模块性的新方法，并将该序列指标应用于酵母转录因子调控网络和多个物种的代谢网络，结果发现酵母转录因子调控网络并不具有模块性而代谢网络具有显著的模块性。在应用中，代谢网络的功能模块度与平均聚类系数的相关性还说明我们的指标比平均聚类系数更适合刻画网络的功能模块性。另外，该指标的提出使得各种不同物种网络模块性的比较或者各种不同模块划分（或识别）方法的评价成为可能。

非负矩阵分解算法及其在生物信息学中的应用研究

石金龙,骆志刚

2010, 32(8): 117-123. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 864 )

PDF (530KB) ( 1038 ) 　　

非负矩阵分解是近年来快速发展的一类机器学习算法，能够实现对高维数据的维度规约及局部特征提取，在诸多生物信息问题的分析与处理中得到了广泛应用，并衍生出一系列实用算法。本文系统分析了非负矩阵分解的数学理论基础及其特有的局部表达属性，综述了标准非负矩阵分解与各种衍生算法的发展历程及算法初始化与参数选取方法的研究进展，并从序列特征分析、表达模式与功能模块识别、生物医学文献挖掘等几个方面总结了非负矩阵分解算法在生物信息学领域的应用成果。最后，指出了非负矩阵分解算法研究及其应用于生物信息处理所面临的问题，分析和预测了可能的发展方向。

一种具有高度可验证性的微阵列片间校准算

李非1，伯晓晨2，王升启2，彭宇行1

2010, 32(8): 124-126. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 527 )

PDF (413KB) ( 414 ) 　　

由于系统偏差的存在，多微阵列数据之间在进行差异比较分析前，首先需要进行片间校准，使不同微阵列的探针数据处于同一可比较的水平。目前片间校准算法的准确性依赖于看家基因表达水平的不变性，或者探针数据统计分布的稳定性。这些假设条件并非在所有条件下成立，如需要进一步实验验证，其算法的正确性又难以进行实验验证。本文提出一种具有高度实验可验证性的多微阵列数据校准的遗传选择优化方法。基于该方法所得到的优化校准基准子集，可以在仅假设少数看家基因表达水平不变的情况下，在不牺牲校准精度的前提下，完成多微阵列数据的片间校准，从而使得通过实验验证片间校准算法的正确性成为可能。

Agent识别矛盾问题核问题的方案研究

李卫华1，杨春燕2

2010, 32(8): 127-129. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 522 )

PDF (339KB) ( 399 ) 　　

由于传统软件识别矛盾问题的能力不足，限制了计算机在解决矛盾问题方面所发挥的能动作用。可以尝试利用Agent的自主性、社会性和反应性等特性，协助识别矛盾问题。针对Agent缺乏界定矛盾问题核问题的能力的缺点，本文提出一种方案，以可拓信息知识策略形式化体系作为Agent的知识链，利用Agent的通信能力与反应性进行人机交互，引导用户输入基元信息，减轻让Agent识别以自然语言描述的矛盾问题信息的困难，使矛盾问题核问题不断清晰，直到可以进行可拓变换解决矛盾问题。创新点在于结合了可拓学、Agent、本体等几种不同学科领域技术的优势，使得Agent有能力协助人们分析和解决矛盾问题。

基于BP网络的移动通信网络告警多级筛选算法

邹北骥,刘斌

2010, 32(8): 130-133. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 584 )

PDF (496KB) ( 414 ) 　　

本文通过分析移动通信网络中无线、交换、传输故障告警数据的分布模型和特点，提出了一种基于BP网络的多级告警筛选模型。该模型在实时采集移动通信网络中告警数据的基础上，通过对告警数据的过滤和预处理将告警数据归一化，并使用二进制编码机制将告警数据编码为可使用神经网络进行处理的类型，进而通过使用高斯感知器对告警数据进行预分类，有效降低BP网络需要处理的故障告警数据量，最后通过利用BP网络的自适应特点和模式识别能力，对告警进行模式识别分类，定位主要故障点，提高了移动网络告警的监控效率和网络的稳定性。

混沌时间序列的Anfis-量子网络预测

蒋文科,谭阳红

2010, 32(8): 134-137. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 532 )

PDF (507KB) ( 360 ) 　　

针对混沌时间序列的解析方程的不确定性，本文提出了Anfis量子组合预测网络。此网络不依赖混沌时间序列的确定性方程和初始条件，根据给定的训练数据，先采用Anfis网络对训练数据进行处理，再与量子神经网络组合预测，从而提高预测能力和精度。最后以MackeyGlass混沌时间序列进行实验，结果表明Anfis量子网络具有良好的局部泛化能力，其预测精度明显高于BP神经网络和量子神经网络。

一种改进的神经网络算法及其在烧结成本预测中的应用研究

何国强1,孙英1,王斌2

2010, 32(8): 138-140. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 634 )

PDF (455KB) ( 354 ) 　　

在烧结生产过程中，固体燃耗占据了生产能耗的70%左右，而与固体燃耗相关的工艺参数与固体燃耗之间呈现出非线性关系。为了实现优化生产和达到降低生产能耗的目的，本文采用改进后的BP神经网络挖掘两者之间存在的映射关系。本文提出了一种基于广义Curry原则非精确线搜索的共轭梯度算法，利用新的线搜索规则来确定算法的学习步长，在保证算法全局收敛的前提下，优化学习步长，提高了算法的收敛速度。利用改进的算法对烧结生产成本进行分析和预测，仿真结果说明改进算法具有很好的收敛性，预测的均方误差为0.009 8，准确率达到94.31%。

基于变学习率三角基函数神经网络的4型FIR滤波器设计

李目1,2，何怡刚2，刘祖润1，周少武1

2010, 32(8): 141-144. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 701 )

PDF (647KB) ( 323 ) 　　

本文提出一种基于变学习率三角基函数神经网络的线性相位4型FIR滤波器设计方法。该方法根据三角基函数神经网络与线性相位4型FIR滤波器幅频特性之间的关系，构建了一种变学习率三角基函数神经网络模型，在神经网络训练过程中引入变学习率算法自调整学习率取值，解决学习率通常依靠经验或试凑法确定带来的不确定性，提高神经网络的学习效率和收敛速度。通过训练神经网络的权值，使设计的FIR滤波器幅频响应与理想幅频响应在整个通带和阻带内的误差平方和最小。文中利用该方法对FIR高通滤波器和带通滤波器进行了优化设计，仿真结果表明了该方法设计FIR滤波器的有效性和优越性。

基于加权定量方法的产品配置解优化

安雪妹，张燕燕，王洁，刘椿年

2010, 32(8): 145-148. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 519 )

PDF (385KB) ( 293 ) 　　

加权逻辑程序可以很好地表示产品配置知识，在程序有解的情况下，可以很快地计算出产品配置问题的配置解。实际上，由于客户不了解领域知识，或者需求超出产品的配置范围等原因，客户所提出的需求往往不能完全被满足，造成程序无解。为了在无解情况下，找到最接近用户需求的最满意解，本文以加权逻辑程序为基础，提出了一种定量的优先关系，方便而简洁地给出了最满意解方案，并与相关的工作进行比较。

Web服务图及其在服务发现中的应用研究

陈海燕，覃事刚，巢炼，刘建勋

2010, 32(8): 149-153. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 504 )

PDF (587KB) ( 287 ) 　　

Web服务是一种崭新的Web应用。随着Web 环境下服务数量的快速增长，在海量的待选服务中发现所需的服务将十分耗时。UDDI V2 增加了一个新特征PublisherAssersion来描述UDDI注册中心中商业实体间的关系，类似于网页之间的超链接，由此可产生Web服务图。本文首先研究Web服务的新特征，然后提出与分析了Web服务图的构建原理和构建算法，最后利用Web服务图进行服务发现，提出了基于Web服务图的服务发现匹配算法，并对其进行了仿真实验。从仿真实验结果可以看出，本文提出的Web服务图对组合的Web服务发现是有效的。

基于本体相似度的构件查询算法研究

李文敬，元昌安，廖伟志

2010, 32(8): 154-157. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 487 )

PDF (438KB) ( 471 ) 　　

为了解决语义网环境下构件查询的查全查准率问题，本文提出了基于本体相似度构件查询算法。首先介绍了本体的形式化定义和构件的刻面描述方法，用本体语言（OWL）对构件本体进行形式化的描述；然后针对本体的概念相似度理论和构件刻面匹配度公式存在的不足，用构件本体的概念相似度代替公式中的匹配度，对构件刻面匹配度公式进行改进和分析，提出了本体相似度构件查询算法；算法通过计算查询树和构件树各子刻面本体概念的RDF描述相似度和RDF图结构相似度，再由构件本体相似度匹配公式进行相似度的比较，检索出相似度高的构件。实验结果表明，该算法具有理想的查全查准率。

基于MVDR和ICA的语音识别方法研究

马震1,谭业武1,陶立慧2,朱茜1

2010, 32(8): 158-160. doi: 10.3969/j.issn.1007130X.2010.

摘要 ( 598 )

PDF (428KB) ( 328 ) 　　

本文讨论了最小方差无失真响应建模方法，并与线性预测方法进行了比较，比较发现最小方差无失真响应滤波器能提供一个更好的原始语音包络。然后在研究ICA原理及FastICA快速算法的基础上，将MVDR参数提取方法与独立分量分析方法相结合，并与传统语音识别方法在有噪声和无噪声的情况下进行了比较，进而对识别率、计算时间等结果进行了分析。MVDR参数提取方法可以提高语音识别系统的识别率，但是会增加平均识别时间；而经过ICA特征变换后的语音识别系统具有较好的鲁棒性。

当期目录

作者中心

审稿中心

在线期刊