Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    目录
    2019年第2期目录
    2019, 41(02): 0-0. doi:
    摘要 ( 32 )   PDF (288KB) ( 96 )      评审附件
    高性能计算
    自顶向下聚集型代数多重网格预条件的边权选择
    吴建平,银福康,彭军,杨锦辉
    2019, 41(02): 191-196. doi:
    摘要 ( 188 )   PDF (418KB) ( 238 )      评审附件
    针对基于图划分的自顶向下聚集型代数多重网格预条件,考察了利用METIS软件包进行多重网格构建的方法,并就该软件包只能处理整型权重,不能处理实型权重的问题,提出了一种将实型边权转化为整型边权的有效方法。之后将这种转化方法应用到METIS图划分软件中的边权选择,并用其给出了对自顶向下聚集型代数多重网格预条件的一种改进算法。通过对二维与三维模型偏微分方程离散所得稀疏线性方程组的数值实验表明,带边权的改进型算法大大提高了多重网格预条件共轭斜量法的迭代效率,特别是对各向异性问题,改进效果更加显著。
     
    大数据环境下基于元模型控制的数据质量保障技术研究
    杨冬菊1,2,徐晨阳1,2
    2019, 41(02): 197-206. doi:
    摘要 ( 155 )   PDF (2553KB) ( 238 )      评审附件
    数据集成环节,越来越丰富的异构源数据给集成后数据质量的提升带来了新的挑战和困难。针对传统ETL模型在数据集成后出现的数据冗余、无效、重复、缺失、不一致、错误值及格式出错等数据质量问题,提出了基于元数据模型控制的ETL集成模型,并对数据集成过程中的各种映射规则进行了详细的定义,通过将抽取、转换、加载环节的元模型和映射机制相结合,能够有效地保证集成后数据的数据质量。提出的元模型已经应用到科技资源管理数据集成业务中。通过科技资源管理数据集成实例分析,验证了此数据集成方案能够有效地支撑大数据环境下数据仓库的构建和集成后数据质量的提升。
     
     
    基于权重堆排序的NAND Flash静态磨损均衡机制
    刘彦,徐骥龙,祝磊
    2019, 41(02): 207-213. doi:
    摘要 ( 223 )   PDF (894KB) ( 260 )      评审附件

    磨损均衡机制作为闪存转换层的基础机制之一,其主要功能是延长闪存块使用寿命和提高存储数据的可靠性。现有的磨损均衡机制着重于减少闪存块的擦除次数,忽略了在磨损均衡操作过程中选择擦除脏块的不合理所带来的不必要数据迁移开销,从而影响了固态硬盘的整体读写性能。针对该问题,提出了一种基于权重堆排序的 NAND Flash静态磨损均衡机制WHWL。首先,提出一种基于页数据访问频率和块擦除次数的权重的热度计算方法,有效地提高擦除次数少(冷块)且数据访问频率低(冷数据)的目标块命中率,避免了多余的数据迁移操作;其次,提出了一种基于权重的堆排序目标块选择算法,以加快目标块的筛选。实验结果表明,与现有的PWL和BET算法相比,在使用相同映射机制的条件下,WHWL能够分别提升固态硬盘寿命1.28、5.83倍,数据迁移次数也有明显的降低。

    高维数据的增量式聚类算法的距离度量选择研究
    邵俊健,王士同
    2019, 41(02): 214-223. doi:
    摘要 ( 218 )   PDF (510KB) ( 218 )      评审附件
    合适的距离度量函数对于聚类结果有重要的影响。针对大规模高维数据集,使用增量式聚类算法进行距离度量的选择分析。SpFCM算法是将大规模数据集分成小样本进行增量分批聚类,可在有限的计算机内存中获得较好的聚类结果。在传统的SpFCM算法的基础上,使用不同的距离度量函数来衡量样本之间的相似性,以得出不同的距离度量对SpFCM算法的影响。在不同的大规模高维数据集中,使用欧氏距离、余弦距离、相关系数距离和扩展的杰卡德距离来计算距离。实验结果表明,后3个距离度量相对于欧氏距离可以很大程度地提高聚类效果,其中相关系数距离可以得到较好的结果,余弦距离和扩展的杰卡德距离效果比较一般。
     
     
    一种基于快递大数据的异常检测系统
    张曼,於志文,郭斌,任思源,岳超刚
    2019, 41(02): 224-232. doi:
    摘要 ( 227 )   PDF (883KB) ( 271 )      评审附件

    随着信息时代的到来,快递行业迅速发展起来,推动着流通方式的转型和消费升级。人们在享受快递业发展带来巨大便捷的同时,也伴随着难以控制的流动性风险,给公共安全带来严峻的挑战。例如,偷窃的赃物通过快递方式进行销赃,利用快递方式运输毒品、爆炸物等危险物品。基于以上考虑,通过分析真实的历史快递记录,着力于研究利用快递方式进行销赃这一类犯罪行为,进而以识别该类嫌疑人为研究目标,从统计、时间和地理3方面特征进行了详细的分析。另外,提出了一种TwoStep异常检测方法用于嫌疑人的识别。该方法分为2步,第1步是过滤正常用户,第2步是识别嫌疑人。实验结果表明,通过该方法能够准确地识别出嫌疑对象,相比较传统方法,该方法能够有效地解决正负类数据不平衡问题,降低误检率,因此具有较高的实用价值。

    支持多种传输模式的双通路串行RapidIO设计与实现
    郭欣童,雷元武,郭阳
    2019, 41(02): 233-239. doi:
    摘要 ( 161 )   PDF (1325KB) ( 215 )      评审附件
    传统的串行RapidIO2.1接口支持3种通道模式(1×、2×、4×)。在2×或1×模式下,4条物理链路只有2条或1条在进行数据传输,其余链路被闲置,造成带宽浪费;另外,一个RapidIO接口只能与一个目的端互连。基于传统的串行RapidIO2.1接口协议,设计了一种支持双通路传输的串行RapidIO接口,通过PCS层的可配置交叉开关共实现14种传输模式,双通路模式下可同时和两个串行RapidIO接口互连。双通路RapidIO提高了RapidIO系统互连的灵活性和传输带宽。实验结果表明,在1×或2×模式下,双通路传输的传输带宽是传统设计的两倍;4×模式下,双通路RapidIO的有效带宽与传统单通路RapidIO的相同。
     
     
    大规模三角线性方程的高效求解
    贾迅,邬贵明,钱磊,谢向辉,吴东
    2019, 41(02): 240-245. doi:
    摘要 ( 128 )   PDF (707KB) ( 202 )      评审附件
    大规模三角线性方程求解是科学与工程应用中重要的计算核心,受限于处理器的缓存容量和结构设计,其在CPU和GPU等平台上的计算效率不高。大规模三角线性方程的分块求解中,矩阵乘是主要运算,其计算效率对提升三角线性方程求解的计算效率至关重要。以矩阵乘计算效率较高的矩阵乘协处理器为计算平台,针对其结构特点提出了矩阵乘协处理器上大规模三角线性方程分块求解的实现方法和性能分析模型。实验结果表明,矩阵乘协处理器上大规模三角线性方程求解的计算效率最高可达85.9%,其实际性能和资源利用率分别为同等工艺下GPU的2.42倍和10.72倍。
     
    自适应狼群算法优化ELM的模拟电路故障诊断
    颜学龙,汪斌斌
    2019, 41(02): 246-252. doi:
    摘要 ( 119 )   PDF (900KB) ( 217 )      评审附件

    为了能够更加高效地检测和诊断模拟电路中的故障元件,提出了自适应狼群算法优化极限学习机的方法。该方法采用自适应遗传算法对特征参数进行选择,从而生成最优特征子集,然后利用最优特征子集构造样本输入极限学习机ELM网络对故障进行分类。针对极限学习机的输入层和隐含层之间的连接权值、隐含层的偏差都将会使其学习速度和分类正确率受到影响的问题,采用本文方法对它们进行优化并选择相应的最优值,提高了极限学习机网络训练的稳定性与故障诊断的成功率。通过2个典型模拟电路的诊断实例,给出了这些方法的具体实现过程,故障诊断率均在99%以上。仿真结果表明使用该方法进行模拟电路故障诊断时具有良好的正确率和稳定性。

    计算机网络与信息安全
    基于最简子图的链接表示及预测
    尚振浩,程华,房一泉
    2019, 41(02): 253-259. doi:
    摘要 ( 123 )   PDF (695KB) ( 221 )      评审附件
    稀疏网络的传统链接预测准确率低,为了捕捉稀疏网络节点间建立链接的可能性,提出基于节点间最短路径的最简子图概念。最简子图反映了节点间的拓扑紧密关系,在采用node2vec节点向量化方法的基础之上,实现了基于最短路径的链接表示,并采取长短期记忆循环神经网络(LSTM)学习长链接节点序列的特征,最终实现链接的分类。实验结果表明,该方法与已有方法相比,在4种不同数据集上的预测AUC值平均提高了11.6%,AP值平均提高了13.3%。

     
    网络功能虚拟化技术综述
    苟建国1,吕高锋1,孙志刚1,苟丽萍2
    2019, 41(02): 260-267. doi:
    摘要 ( 237 )   PDF (741KB) ( 511 )     
    无论是企业网还是数据中心,为实现相关应用功能、提升网络性能和加强网络安全等部署了大量的网络功能设备,但这些网络功能设备大多基于硬件,存在功能固化、扩展能力差、统一管理困难等问题。为解决上述问题,学术界和工业界不约而同将目光投向了网络功能虚拟化NFV技术。通过解耦网络功能和物理设备,使网络功能不受物理设备的约束,便于网络设备服务的升级更新,同时,NFV为新的体系结构、系统和应用的产生提供了可能。首先介绍了NFV技术,并与云计算和SDN进行对比,然后从VNF的系统结构、数据平面、控制平面、部署方式、实现语言和应用6个维度详细阐述了当前的研究成果,最后总结并展望了NFV未来的研究发展方向。

     
    二次栅格扫描与三角形质心迭代的定位算法
    宋海声,周浩,朱长驹,吴佳欣
    2019, 41(02): 268-274. doi:
    摘要 ( 154 )   PDF (807KB) ( 242 )     
    为了提高无线传感器网络的定位精度,在Grid-Scan算法的基础上提出一种改进的二次栅格扫描定位算法,再利用三角形质心迭代法进一步提升定位精度。首先通过比较未知节点的所有邻居锚节点到该未知节点的信号强度,找到最近邻居锚节点,利用最近邻居锚节点对可再定位的未知节点所在的估计区域进行二次栅格扫描,再利用PIT法则对定位区域进一步缩减,最后对质心三角形质心进行迭代计算得到最终定位点。仿真结果表明,在相同的网络环境下,与传统算法相比,改进算法明显提高了平均相对定位精度。

     

     
    基于动态内容流行度的NDN缓存决策和替换策略研究
    于美菊,李茹
    2019, 41(02): 275-280. doi:
    摘要 ( 178 )   PDF (596KB) ( 206 )     
    命名数据网络(NDN)中的路由器节点具有缓存能力,这就极大地提高了网络中的数据发送与检索效率。然而,由于路由器的缓存能力是有限的,设计有效的缓存策略仍然是一项紧迫的任务。为了解决这个问题,提出了一种动态内容流行度缓存决策和替换策略(DPDR)。DPDR综合考虑内容流行度和缓存能力,利用一个和式增加、积式减少(AIMD)的算法动态调节流行度阈值,并将超过流行度阈值的内容存入缓存空间;同时提出了一个缓存替换算法,综合考虑了缓存空间中内容的流行度和内容最后被访问时间等因素,将替换值最小的内容移出内容缓存。大量仿真结果显示,与其他算法相比,本文所提的算法能够有效提高缓存命中率,缩短平均命中距离和网络吞吐量。
     
     
    一类线性码的完全重量分布
    杨淑娣1,2,岳勤1
    2019, 41(02): 281-285. doi:
    摘要 ( 145 )   PDF (349KB) ( 182 )     
    构造一类新的带有定义集的线性码,应用有限域上的指数和的计算技巧以及有限域上的分圆数理论,确定出这类线性码的完全重量分布以及重量分布,这类线性码是二重码,可应用于构造强正则图和秘密共享方案。
     
     
    基于势博弈的认知全双工中继选择策略研究
    李召义,刘占军,薛亚茹,刘红霞
    2019, 41(02): 286-292. doi:
    摘要 ( 127 )   PDF (586KB) ( 196 )     
    在对主用户干扰功率限制、自干扰限制和总功率干扰限制的网络中,针对认知中继选择算法复杂度较高的问题,提出基于势博弈理论的认知全双工协作网络下中继选择策略。认知中继选择问题被建模为使用认知协作网络的系统速率作为共同效用函数的势博弈模型,并分析出在没有不可行策略集信息的前提下,所提的博弈可以保证纯策略纳什均衡(NE)的存在性和可行性条件。在此基础上,给出全双工中继选择迭代算法,并对算法的复杂度进行讨论。仿真分析表明,所提算法在较低复杂度的情况下,能够获得最优或者接近最优速率的性能,并与传统的半双工中继模式相比,性能也有明显提升。

     
    图形与图像
    基于KCF相似度的TLD目标跟踪算法
    张晶1,2,熊晓雨1,鲍益波3
    2019, 41(02): 293-301. doi:
    摘要 ( 203 )   PDF (1724KB) ( 209 )     
    研究持续单目标跟踪算法时,TLD的架构是一种值得借鉴的方式,但由于其本身的一些缺陷,当跟踪的目标在出现遮挡、快速移动以及光照变化等复杂情况下,TLD跟踪算法容易发生目标跟丢的情况,并造成误差的逐渐累积。鉴于TLD跟踪算法以中值流跟踪算法作为跟踪器存在局限性,本文提出一种基于KCF相似度的TLD目标跟踪算法(TLDKCFS)。采用KCF算法对TLD跟踪进行实时监督,通过跟踪结果计算出相似度,利用相似度进行检测模块切换的判断,并结合两种结果调整目标跟踪框。通过对多类型的视频序列进行测试后可知,TLDKCFS算法在遇到模糊和快速移动、目标遮挡、光照变化等复杂情况时,可以稳定且良好地输出跟踪结果,鲁棒性较好,适用于长时间目标跟踪。
     
     
    双摄像机模组的组合式标定和校正方法
    杨风开1,杨红亮2,程素霞1
    2019, 41(02): 303-307. doi:
    摘要 ( 135 )   PDF (482KB) ( 234 )     
    提出了双摄像机模组的组合式标定和校正方法,能够将传统的标定和校正2道工序合并为1道工序,不需要借助于外部测量设备,仅利用双摄像机同时对目标模板拍摄的1幅图像,即可实现双摄像机模组的标定和校正。先基于交比不变性计算摄像机的径向畸变系数,将摄像机畸变成像模型转换为线性模型,利用线性模型分别对2个摄像机进行标定;然后计算2个摄像机之间的位姿偏移参数,调节右摄像机位姿,进行双摄像机之间的位姿校正;最后标定2个摄像机之间的位姿参数。实际应用结果表明,所提出的双摄像机模组校正和标定方法,校正和标定精度高,缩短了工艺时间,提高了工艺效率,能够满足双摄像机模组封装生产工艺的要求。
     
     
    各向异性带宽自适应水面运动目标跟踪算法
    金巧园,万磊,盛明伟,唐松奇
    2019, 41(02): 308-314. doi:
    摘要 ( 162 )   PDF (1147KB) ( 248 )     
    传统Mean-Shift跟踪算法缺少核函数带宽更新策略,故无法解决无人艇跟踪的水面运动目标轮廓变化各向异性问题,提出一种各向异性带宽自适应的Mean-Shift跟踪算法。先用黎曼积分将特征子模型概率密度的归一化常数Ch近似为积分形式,从而获得不同尺度参数h对应的Ch间关系式。然后用梯度上升法使目标模型和目标候选模型之间的相似度函数达到局部最大,由此估计目标在下一帧的带宽与位置。最后为防止带宽更新时结果过小或过大,引入两个正则化参数修正尺度参数。实验结果表明,所提算法对外形轮廓非同比变化的水面运动目标跟踪具有各向异性的带宽自适应调节能力,型心位置准确率较传统Mean-Shift和各向同性带宽自适应Mean-Shift提高了约77.2%和31.1%,运行速度可达20.7 fps,显示了其鲁棒性和实时性。
     
    人工智能与数据挖掘
    基于子句的动态检查强制文字的SAT求解器
    常文静1,2,徐扬2
    2019, 41(02): 315-320. doi:
    摘要 ( 113 )   PDF (1017KB) ( 181 )     
    检查强制文字是一种重要的预处理方法。结合学习子句,提出一种在求解过程中使用的策略—基于子句的动态检查强制文字(CNL),并且设计了一种易实现低成本的数据结构。分别实现了两个不同版本的求解器:Glucose_PRE和Glucose_CNL,前者在求解初始时将检查强制文字作为预处理,后者实现了基于子句的动态检查强制文字策略。实验测试结果表明,与Glucose_PRE和Glucose3.0求解器相比,求解器Glucose_CNL在求解2015年和2016年SAT竞赛的应用类型的实例时,求解实例个数更多,耗时更少,说明所提策略和所设计的数据结构均可提高求解器的求解性能。

     
    普通立体仓库的货位优化模型与算法研究
    李永伟1,2,刘树安3,郭晋秦1
    2019, 41(02): 321-327. doi:
    摘要 ( 159 )   PDF (640KB) ( 371 )     
    在物流仓储的总成本中,库存成本占很大比重。企业为了减少库存成本,不断设法去改进和优化仓库“存储”的过程。针对普通立体仓库的入库过程,在考虑叉车载重、货位容量和存储策略等限制条件下,建立了以入库作业过程中工作人员行走总路程最小为目标的货位优化模型。根据问题和模型特点,将货位优化问题分为两层优化:货位选择优化层和货位顺序优化层;然后将传统遗传算法同启发式算法相结合对模型进行求解;最后通过仿真实验验证了模型和算法的合理性和可行性。该成果可用于解决多数普通仓库的货位优化问题。
     
     
    集成学习算法在中医证型分类预测中的应用
    张守宾,朱习军
    2019, 41(02): 328-334. doi:
    摘要 ( 123 )   PDF (716KB) ( 206 )     
    为提高中医诊断的智能化以及辩证的准确度,提出一种基于多模态扰动策略的集成学习算法(MPEL算法)。首先,在样本域多次抽样产生不同的样本子空间;其次,在属性域采用改进的层次聚类特征选择算法,划分不同的属性子空间,进而训练出具有较大差异性的基分类器;然后,采用贪心策略选取最优的基分类器组合,提高算法整体性能。选择中医哮喘病症状证型病案进行验证,并与其它集成学习算法对比,实验结果表明,改进的集成学习算法在哮喘病症状证型分类预测中训练速度较快、识别准确率更高,最高识别率高达98.16%。
     
     
    基于精英种群策略的协同差分进化算法
    马永杰,朱琳,田福泽
    2019, 41(02): 335. doi:
    摘要 ( 153 )   PDF (596KB) ( 227 )     

    针对差分进化算法在处理函数优化时存在的过早收敛和易陷入局部最优的问题,提出了一种基于精英种群策略的协同差分进化算法。在优化过程中,首先对种群进行适应度值评估和排序,提取前N个优秀个体组成精英种群,其余个体随机分为3个等大的子种群,每个子种群采取不同的进化策略,以此来保证种群的多样性;然后每隔一定代数,根据新的适应度值更新精英种群和其余3个子种群,这样可以有效地避免算法陷入局部最优;最后,将所提出的算法与4个先进的差分进化算法在CEC2014的30个标准测试函数上进行对比实验。实验结果表明,所提出的算法能够有效提高收敛速度,具有较高的收敛精度和较好的优化性能。

    基于注意力机制的文本情感倾向性研究
    裴颂文1,2,王露露1
    2019, 41(02): 343-353. doi:
    摘要 ( 179 )   PDF (785KB) ( 307 )     
    社交媒体上短文本情感倾向性分析作为情感分析的一个重要分支,受到越来越多研究人员的关注。为了改善短文本特定目标情感分类准确率,提出了词性注意力机制和LSTM相结合的网络模型PATLSTM。将文本和特定目标映射为一定阈值范围内的向量,同时用词性标注处理句子中的每个词,文本向量、词性标注向量和特定目标向量作为模型的输入。PATLSTM可以充分挖掘句子中的情感目标词和情感极性词之间的关系,不需要对句子进行句法分析,且不依赖情感词典等外部知识。在SemEval2014Task4数据集上的实验结果表明,在基于注意力机制的情感分类问题上,PATLSTM比其他模型具有更高的准确率。
     
     
    基于二次网格优化的粒子群模糊聚类算法
    汪赫瑜,唐敏影,任建华
    2019, 41(02): 354-362. doi:
    摘要 ( 90 )   PDF (689KB) ( 179 )     
    针对模糊C均值聚类算法易受初始聚类中心影响且收敛速度慢的缺陷,提出一种基于二次网格优化的粒子群模糊聚类算法GridPFcm。该算法首先将数据空间网格化,依据深度优先遍历规则,连通相邻密集网格单元,计算连通网格的相对密度,选取相对密度值最大的连通网格,计算中心位置,初始化聚类中心。然后,按照基于网格空间的单维向量变化原理,实现最佳粒子全局寻优,进一步优化初始聚类中心,以降低初始聚类中心选取对聚类效果的影响度。最后,通过实验表明,该算法能够加快寻优收敛速度,提高聚类效率和效果。
     
    基于机器学习的能力评价与匹配研究
    张毅,张珉浩
    2019, 41(02): 363-369. doi:
    摘要 ( 144 )   PDF (753KB) ( 228 )     
    目前,高校学生就业形势严峻,针对企业看重的能力对学生做出评价,有助于企业选拔人才,同时也能提高学生的竞争力。
    采用层次分析法和模糊评价相结合的方式对高校学生的综合能力进行评价。为了解决模糊系统无法自动调整隶属函数参数的问题,有效结合模糊理论和神经网络架构的优点,提出了引入神经网络的综合评价改进算法;并设计具有时频局域化特性的小波神经网络,能够更好地模拟非线性函数,用于预测学生适合的职位。分析实验结果表明,基于改进模糊神经网络算法的能力评价模型与小波网络职位匹配模型,能够提升系统精度与自适应能力,评价结果客观,对学生的能力评价及就业选择具有指导意义。
     
    微博社区的动态节点自适应增量交互优化
    邱云飞,陈昂
    2019, 41(02): 370-377. doi:
    摘要 ( 91 )   PDF (1131KB) ( 184 )     

    大多数的社区发现方法是基于网络拓扑结构和边缘密度来进行最佳社区确定,但是这些方法具有非常高的计算复杂度,对网络的形式和类型非常敏感。为解决这些问题,提出基于动态节点自适应增量模型的微博社区交互优化算法,该算法在优化每个社区内成员的交互作用的基础上,利用贪婪算法有效地搜索最优社区的候选,无需遍历所有节点。该模型可快速、准确地测量社区内部和社区之间的交互作用差异。最后,在基准测试网络和搜狐微博平台抓取数据上的仿真测试显示,所提算法在召回率、准确率、算法计算时间以及网络覆盖率等指标上,要优于选取的对比算法。

    基于语义特征空间上下文的短文本表示学习
    脱婷1,马慧芳1,2,魏家辉1,刘海姣1
    2019, 41(02): 378-384. doi:
    摘要 ( 134 )   PDF (766KB) ( 226 )     
    文本表示是自然语言处理中的基础任务,针对传统短文本表示高维稀疏问题,提出1种基于语义特征空间上下文的短文本表示学习方法。考虑到初始特征空间维度过高,通过计算词项间互信息与共现关系,得到初始相似度并对词项进行聚类,利用聚类中心表示降维后的语义特征空间。然后,在聚类后形成的簇上结合词项的上下文信息,设计3种相似度计算方法分别计算待表示文本中词项与特征空间中特征词的相似度,以形成文本映射矩阵对短文本进行表示学习。实验结果表明,所提出的方法能很好地反映短文本的语义信息,能对短文本进行合理而有效的表示学习。