Please wait a minute...
  • 中国计算机学会会刊
  • 中国科技核心期刊
  • 中文核心期刊

当期目录

    论文
    SSDKV:一种SSD友好的键值对存储系统
    梅飞,曹强
    2016, 38(07): 1299-1308. doi:
    摘要 ( 219 )   PDF (648KB) ( 305 )     

    当前大量键值对(Key-Value)存储系统使用固态硬盘(SSD)改善系统的I/O响应速度。但是现有的键值对存储系统应用程序使用标准文件系统处理数据在固态硬盘上的存储,这对应用程序而言底层固态盘的物理特性被屏蔽,同时固态盘也无法针对应用程序的特定I/O模式进行优化,使得基于固态盘的键值对系统性能没有得到充分发挥。针对此问题,设计了同时考虑键值对应用程序存取行为和SSD存储器访问特性的存储管理模块,并与LevelDB结合实现了一种轻量级的、将上层应用与底层存储集成一体的键值对系统—SSDKV。它提供键值对接口给外部程序,结合键值对数据的特点构造适应SSD的数据布局。SSDKV简化了传统文件系统对键值对数据的额外处理,并根据键值对数据的类型及其存取模式对SSD存储空间进行有效管理,使得基于SSD设备的键值对系统性能进一步提高。通过基准程序测试,与运行于传统文件系统上的LevelDB相比,SSDKV使得写性能提高达4倍,读性能提高达1.5倍。

    一种基于可重用激励发生机制的SoC验证平台
    苏艺端,虞致国,顾晓峰
    2016, 38(07): 1309-1315. doi:
    摘要 ( 96 )   PDF (903KB) ( 228 )     

    在系统芯片的设计中,传统的激励发生机制耗费人工多且难以重用,严重影响了仿真验证的效率。针对此问题,构建了一种基于可重用激励发生机制的虚拟SoC验证平台。该平台利用可重用的激励发生模块调用端口激励文件,仿真时将端口激励文件转换成对应于验证电路端口的时序信号。通过对通用同步/异步串行接收/发送器、中断及定时器等功能模块的验证,证明了激励发生机制具有较强的可观察性、可控制性及可重用性。验证结果分析表明,在验证不同的功能点时仅需修改固件及端口激励文件,使验证平台在重用时减少代码修改量,提高了灵活性和验证效率,缩短了系统芯片的验证时间。

    基于多哈希算法的大规模图像快速检索方法
    唐小蔓1,王云飞1,邹复好1,周可2
    2016, 38(07): 1316-1321. doi:
    摘要 ( 121 )   PDF (594KB) ( 341 )     

    哈希技术被视为最有潜力的相似性搜索方法,其可以用于大规模多媒体数据搜索场合。为了解决在大规模图像情况下,数据检索效率低下的问题,提出了一种基于分段哈希码的倒排索引树结构,该索引结构将哈希码进行分段处理,对每段哈希码维护一个倒排索引树结构,并结合高效的布隆过滤器构建哈希索引结构。为了进一步提高检索准确性,设计了一种准确的排序融合算法,对多个哈希算法的排序结果分别构建加权无向图,采用PageRank的思想对基于多个哈希算法的排序列表的融合技术进行了详细的说明。实验结果表明,基于分段哈希码的倒排索引树结构能极大地提升数据的检索速度。此外,相比于传统的单个哈希算法排序技术,基于多个哈希算法的排序列表融合技术的检索准确率优势显著。

    基于HBase的领域本体存储方法及其应用研究
    王红,孙康
    2016, 38(07): 1322-1329. doi:
    摘要 ( 116 )   PDF (721KB) ( 258 )     

    在分析民航突发事件应急管理领域本体及其存储特点的基础上,提出了一种基于HBase的领域本体存储方法,采用将领域本体元数据与RDF实例数据分开存储的方式,给出了描述领域本体类及属性信息的元数据和RDF实例数据的存储模型,及其基于MapReduce的领域本体RDF数据并行加载过程。结合应用实现了领域本体基于HBase API的基本图模式查询,并在Hadoop环境下进行了实验与效果分析,为民航应急管理领域本体的海量数据存储提供了理论与方法支撑。

    面向高维微阵列数据的集成特征选择算法
    孙刚1,2,张靖1,3
    2016, 38(07): 1330-1337. doi:
    摘要 ( 139 )   PDF (514KB) ( 252 )     

    特征选择算法是微阵列数据分析的重要工具,特征选择算法的分类性能和稳定性对微阵列数据分析至关重要。为了提高特征选择算法的分类性能和稳定性,提出一种面向高维微阵列数据的集成特征选择算法来弥补单个基因子集信息量的不足,提高基因特征选择算法的分类性能和稳定性。该算法首先采用信噪比方法选择若干区分基因;然后对每个区分基因利用条件信息相关系数评估候选基因与区分基因的相关性,生成多个相关基因子集,最后,通过集成学习技术整合多个相似基因子集。实验结果表明,本文提出的集成特征选择算法的分类性能以及稳定性在多数情况下均优于只选择单个基因子集的方法。

    基于局部关键节点的大数据聚类算法
    曹阳,钱晓东
    2016, 38(07): 1338-1343. doi:
    摘要 ( 98 )   PDF (458KB) ( 289 )     

    为了能在大数据集中合理地寻找到网络结构,提出了一种适用于大数据集的通过局部核心节点进行社区发现的算法。对于初始节点不确定和适应度函数计算所带来的时间消耗,引入局部关键节点和对适应度公式进行改进来减少时间消耗。并在小规模数据网络和较大规模数据网络中与经典算法进行实验,由实验结果得出,在小规模的数据集中,本算法与经典算法效率相差不大,在测试数据集的规模不断变大的情况下,本算法执行效率明显提高。测试结果表明,本算法是可行和有效的,适用于大规模数据的网络结构发现。

    基于多核NPU的TCP数据接收卸载
    李杰,陈曙晖
    2016, 38(07): 1344-1349. doi:
    摘要 ( 177 )   PDF (576KB) ( 267 )     

    目前以太网的发展速度远高于存储器和CPU的发展速度,存储器访问和CPU处理网络协议已经成为TCP的性能瓶颈。网络带宽的不断增大对CPU造成了沉重的负担,大约需要1 GHz的CPU处理资源对1 Gbps的网络流量进行协议处理。为此,使用多核NPU作为NIC,实现TCP接收数据路径中的校验和计算、报文乱序重组功能,并将合并之后的大报文经Linux网卡驱动程序交由协议栈处理,从而减少协议栈处理报文和网卡产生中断的数量,提升端系统的TCP性能。在10 Gbps以太网络中,实验取得4.9 Gbps的TCP接收数据吞吐量。

    抗合谋攻击的服务器辅助验证签名方案
    杨小东,高国娟,李亚楠,鲁小勇,王彩芬
    2016, 38(07): 1350-1355. doi:
    摘要 ( 112 )   PDF (407KB) ( 245 )     

    服务器辅助验证签名能有效降低签名验证的计算量,非常适用于计算能力较弱的低端计算设备,但大多数标准模型下的服务器辅助验证签名方案不能抵抗服务器和签名者的合谋攻击。为了改进服务器辅助验证签名方案的安全性能,提出了一个新的服务器辅助验证签名方案,并在标准模型下证明了新方案在合谋攻击和选择消息攻击下是安全的。分析结果表明,新方案有效减少了双线性对的计算量,大大降低了签名验证算法的计算复杂度,在效率上优于已有的同类签名方案。

    一种基于深度学习的多尺度深度网络的场景标注算法
    马成虎,董洪伟
    2016, 38(07): 1356-1361. doi:
    摘要 ( 200 )   PDF (656KB) ( 452 )     

    针对场景标注中如何产生良好的内部视觉信息表达和有效利用上下文语义信息两个至关重要的问题,提出一种基于深度学习的多尺度深度网络监督模型。与传统多尺度方法不同,模型主要由两个深度卷积网络组成:首先网络考虑全局信息,提取大尺度图像低层特征;其次网络利用图像局部信息,结合低层特征获取一组稠密的、完备的图像特征,有效地捕获图像像素的纹理特征、颜色特征和上下文信息。对比许多经典方法,该算法不依赖图像分割技术和人工制作特征,在Stanford Background Dataset取得了很好的效果。

    TBMC:一种基于多探测器协同的DTNs目标追踪策略
    邓伊琴,赵明,唐枫枭,陈志刚
    2016, 38(07): 1362-1368. doi:
    摘要 ( 98 )   PDF (550KB) ( 247 )     

    延迟容忍网络中的目标追踪问题一直被广泛关注,目前的相关策略主要围绕单探测器追踪单个目标问题。有些搜索策略利用节点相遇的可能性,有些利用节点的地理位置信息,有些采用更加新颖的方法,比如利用目标节点留下的移动方位信息和时间。这些策略都直接或者间接地利用了目标节点的信息进行目标搜索,但是普遍不高的成功率使得这些搜索策略应用范围受到一定限制。设计了一套基于多探测器协同的分布式目标追踪策略,通过远距离协同探测机制DTRs与直接协同机制TRs进行多探测器协同追踪,有效避免探测冲突与冗余步骤,提高追踪效率。理论分析与实验表明,该策略相比传统策略能有效减少追踪步数,提高目标追踪成功率。

    基于博弈论的能量均衡路由算法
    蔡钊1,马林华1,黄绍城1,张嵩1,田雨2
    2016, 38(07): 1369-1375. doi:
    摘要 ( 120 )   PDF (621KB) ( 222 )     

    针对传感器网络能量不均衡且网络性能易受自私节点影响的问题,利用博弈论的思想,构建了均衡能耗的博弈模型(EBGM)。该算法从激励节点合作行为出发,引入能量关注因子,摒除传统博弈算法以剩余能量作为调整转发意愿的唯一标准,转而根据节点现有能量比例与邻居能量比例的差异程度进行调节。对EBGM模型进行理论分析,证明了纳什均衡点的存在性,且其能够趋于帕累托最优。仿真结果表明,EBGM模型能够促进节点合作行为、均衡能量开销、延长网络的整体生存周期。

    基于混沌加密的可同步更新RFID双向认证协议
    胡应梦,张小红
    2016, 38(07): 1376-1383. doi:
    摘要 ( 121 )   PDF (659KB) ( 231 )     

    针对日益突出的RFID系统安全隐私问题,提出了一个基于混沌序列的RFID双向认证协议。利用混沌对初始值的敏感性生成混沌序列,对密钥进行加密。该协议引入标签密钥动态更新机制,并设计了自同步解决方案,实现了对标签的二次认证。采用BAN逻辑对其安全性进行证明,并与已有的协议进行安全性分析和性能比较。其分析结果表明,该协议降低了标签成本,减少了标签和后端数据库的计算量,提高了后端数据库的检索效率。不仅有效地解决了RFID系统的隐私保护及安全问题,同时也提高了RFID协议认证的执行效率,更适合低成本的RF1D系统。

    联合编码开销与安全性能的网络编码优化方案
    徐光宪,杨冬丽,高嵩,许春燕,金钰博
    2016, 38(07): 1384-1390. doi:
    摘要 ( 102 )   PDF (645KB) ( 215 )     

    网络编码技术在提高网络吞吐量和传输效率等方面具有很大优势,但该技术需要在节点处进行额外编码操作,增加了编码开销。针对在保证最大多播速率的前提下,降低编码开销的同时兼顾网络编码安全程度的问题,现提出一种联合编码开销与安全性能的网络编码优化方案。该方案首先在基于预选择机制的小生境遗传算法的基础上加入了预处理机制。其次,构建了新的适应度函数。最后采用了一种更科学的种群规模的确定方式。仿真结果表明,该算法比传统的基于遗传算法的网络编码优化方案在收敛时间、进化代数、编码开销和安全程度四个方面更具优势。

    不同信息共享程度下交通拥塞控制研究
    李勇1,2,蔡梦思1,李黎1,邹 凯1
    2016, 38(07): 1391. doi:
    摘要 ( 91 )   PDF (659KB) ( 74 )     

    信息共享程度是影响交通通行效率的重要条件。分析了信息闭塞、局部信息共享和全局信息共享三种信息共享模式下的交通拥塞现象及其传播特征,并对网络节点行为进行动力学分析,采用概率母函数、分支过程和协调博弈的方法建立了交通拥塞传播模型,解析分析了交通拥塞传播的临界值,比较了不同信息共享模式下的交通拥塞控制策略。仿真实验表明,信息闭塞和局部信息共享下的拥塞控制在交通网络流量较小时更为有效,全局信息共享有利于抑制大规模的拥塞传播,但其可控难度较大。

    基于聚类的多目标遗传算法在类职责分配中的应用
    李雅琎1,刘伟1,2,胡志刚1
    2016, 38(07): 1398-1404. doi:
    摘要 ( 93 )   PDF (525KB) ( 257 )     

    在面向对象软件设计与实现过程中,类职责分配是其中最重要且复杂的步骤之一,它在很大程度上影响软件质量。为了实现类职责自动分配的目标,从软件内聚与耦合度量的角度出发,建立了类职责分配问题多目标优化模型。在基于快速非支配排序多目标遗传算法基础上,引入凝聚的层次聚类技术,保证群体多样性,避免陷入未成熟收敛。在实验中,通过对类职责自动分配并与一个已有的设计优良的软件系统进行对比,验证了此算法的正确性。另外,通过与单目标遗传算法、SPEA2算法对比表明,本算法在解决类职责分配问题上运行效果最好。

    取值于赋值幺半群的加权正则文法语言
    赵菲,李永明
    2016, 38(07): 1405-1412. doi:
    摘要 ( 110 )   PDF (398KB) ( 194 )     

    正则文法是研究自动机的重要工具。引入取值于赋值幺半群的加权正则文法、加权类正则文法的定义,讨论了赋值幺半群上加权正则文法、加权类正则文法和加权有限自动机(WFA)的关系。证明了在赋值幺半群上,已知一个加权正则文法或加权类正则文法,分别存在一个WFA与之等价。定义了可分配的赋值幺半群,证明了在可分配的赋值幺半群上已知一个WFA,存在一个加权正则文法和加权类正则文法与之等价,即证明了可分配的赋值幺半群上加权正则文法、加权类正则文法和WFA在生成语言上等价,并举例说明了赋值幺半群的可分配性不是已知WFA存在与之等价的加权正则文法或加权类正则文法的必要条件。

    装配公差综合领域本体知识库的构建
    钟艳如,卢宏成,曾聪文
    2016, 38(07): 1413-1418. doi:
    摘要 ( 88 )   PDF (802KB) ( 305 )     

    为了减少机械产品设计过程中的不确定性,解决装配公差信息在异构CAX系统中共享性差和传递不畅的问题,利用本体丰富的语义知识和语法结构,通过分析装配公差综合领域相关知识,采用网络本体语言OWL定义其中的概念和关系,并采用语义网规则语言SWRL定义其中的约束条件和分配经验。将基于OWL的结构化知识转换成事实、基于SWRL的约束化知识转换成规则,并在推理引擎的基础上构建装配公差综合领域本体知识库。同时开发了基于本体的装配公差综合原型系统,实现了装配公差类型和装配公差值的自动生成。

    基于工作流的第二课堂活动管理平台的研究与实现
    赵冬,张文宁,车战斌
    2016, 38(07): 1419-1424. doi:
    摘要 ( 97 )   PDF (861KB) ( 255 )     

    高校第二课堂活动在学生创新素质培养方面具有独特的优势,二课活动的信息化是高校信息化的重要组成部分。针对二课活动管理参与角色众多、业务流程多变的特点,提出了增强型的RBAC模型,并基于Petri网对二课活动的竞赛类活动及公益实践活动业务流程进行建模,采用.Net技术自主开发了工作流引擎,实现了基于工作流的高校第二课堂管理平台,增强了业务流程的可扩展性、灵活性和安全性。

    一种对象代理数据库的跨类查询优化方法
    蒋廉,李蓉蓉,彭智勇
    2016, 38(07): 1425-1433. doi:
    摘要 ( 119 )   PDF (726KB) ( 289 )     

    对象代理数据库中跨类查询可以充分发挥对象代理模型的灵活性,为用户提供个性化数据服务,其执行效率十分重要。然而在处理多个跨类属性查询时,现有基于路径表达式的跨类查询实现存在对公共路径节点对象进行重复获取的情形,执行效率较低。针对跨类查询中加快获取终点对象的问题,优化核心思想是减少对路径上节点对象的重复与不必要的遍历,包括两个关键策略:首先是将路径节点整体作为虚拟路径视图统一获取节点对象,避免了多跨类属性查询下公共路径节点的冗余遍历;其次是针对路径复杂过长的跨类查询,依据代价估计策略选择物化查询涉及起点与终点对象,利用缓存减少执行时路径上中间节点的遍历。分别在属性数目与结果集规模两方面进行了对比实验,实验结果表明了优化方法的有效性。

    养老社区环境健康预警系统的设计与实现
    李芷珊1,2,施润和1,2
    2016, 38(07): 1434-1439. doi:
    摘要 ( 96 )   PDF (756KB) ( 330 )     

    当前环境健康问题日益受到重视,尤其是基础体质较差的老年群体,易受环境健康风险的威胁。针对该问题,将现代化的信息技术与发展潜力巨大的养老社区相组合,给老年人提供动态化、个性化的环境健康信息服务,提升养老社区的智慧元素,具有重要的社会效益。基于Java Web技术,完成了养老社区环境健康预警系统,在实时和预报环境气象数据的支持下,实现了感冒、高血压、慢性支气管炎等常见老年疾病发病指数的动态预报与个性化预警。通过对老年人、家属、医务人员、管理员等不同角色的需求分析和功能设计,高效地实现了医务人员的统筹管理、社区老人的及时提醒和老人家属的远程通知。该系统不仅适用于养老社区,对于居家养老的集中管理也具有应用潜力。

    基于双空闲因子的RFID防碰撞算法研究
    杨帆1,徐焕良2,谢俊1,任守纲2
    2016, 38(07): 1440-1446. doi:
    摘要 ( 69 )   PDF (930KB) ( 209 )      评审附件

    为进一步提高标签的识别速度,在研究了几种典型的DFSA算法基础上,提出了一种双空闲因子参数的RFID防碰撞算法—DIFP,详细阐述了算法的思想、运算流程和关键参数的确定方法。DIFP算法不仅可以通过时隙预览、检测和消除空闲时隙,最大限度减少空闲时隙的开销,同时根据空闲率,对帧中的碰撞时隙立即进行相应处理,避免读写器对标签的多次操作,提高标签的识别速度。仿真结果表明,与标准QA算法相比,DIFP算法识别时延缩短了19%,识别速度提高了10%。

    基于ASM和肤色模型的疲劳驾驶检测
    何俊,房灵芝,蔡建峰,何忠文
    2016, 38(07): 1447-1453. doi:
    摘要 ( 112 )   PDF (737KB) ( 342 )      评审附件

    疲劳驾驶研究中,面部关键特征精确定位与跟踪是个难点。提出了一种基于主动形状模型ASM和肤色模型的疲劳驾驶检测方法。首先,利用肤色模型检测到人脸区域为ASM提供初始定位;然后基于ASM进行人眼和嘴巴跟踪获得眼睛与嘴巴区域;再利用Canny算子对两个区域精确定位,获得疲劳检测参数;最后根据PERCLOS方法实现疲劳检测。考虑到基于HSV颜色模型的人脸检测不受姿势和角度的影响,但容易受到背景干扰,而ASM的优点是人脸关键点跟踪效果好,但初始定位困难,将二者结合实现了眼睛与嘴巴精确定位与跟踪。实验表明,眼睛检测准确率可以达到90.7%,哈欠检测准确率可以达到83.3%,疲劳检测准确率达到91.4%。

    家谱成员关系的元图可视化
    陈国军1,蔺想红1,段淑凤2
    2016, 38(07): 1454-1461. doi:
    摘要 ( 109 )   PDF (823KB) ( 285 )      评审附件

    电子家谱用于统计与分析家族成员的情况与关系,其可视化形式是家谱信息化的重要组成部分。由于边的数量随节点数的增加而快速增长,在已有家谱可视化方法中会出现显示效率急速下降问题。针对这一问题,结合元图进行可视化优化,减少不必要存在的边。此外,结合实际情况提出“父母-独生子女”关系等可视化表示,对可视化形式进一步优化。实验表明,在相同家谱数据情况下,优化的家谱元图可视化方法中所需边的数量约为原有元图形式的1/2,小于通常可视化形式的1/4,有效提高了家谱可视化效率。同时运用节点图的树形层次结构对家谱进行可视化显示,增强了可视化效果的实用性。

    一种高精度高光谱图像分类方案设计
    魏利峰1,2,纪建伟1
    2016, 38(07): 1462-1470. doi:
    摘要 ( 75 )   PDF (1674KB) ( 263 )      评审附件

    为了有效改善高光谱图像数据分类的精确度,减少对大数目数据集的依赖,在原型空间特征提取方法的基础上,提出一种基于加权模糊C均值算法改进型原型空间特征提取方案。该方案通过加权模糊C均值算法对每个特征施加不同的权重,从而保证提取后的特征含有较高的有效信息量,从而达到减少训练数据集而不降低分类所需信息量的效果。实验结果表明,与业内公认的原型空间提取算法相比,该方案在相对较小的数据集下,其性能仍具有较为理想的稳定性,且具有相对较高的分类精度。

    一种基于距离变换的不规则区域匹配算法
    霍占强,朱婷,刘红敏,王志衡
    2016, 38(07): 1471-1478. doi:
    摘要 ( 53 )   PDF (1045KB) ( 251 )      评审附件

    针对不规则区域难以直接匹配的问题,提出了一种新颖的不规则区域匹配算法,即基于距离变换的不规则区域描述子DTIRD。为了避免椭圆拟合误差和主方向不准确产生的匹配错误,该算法采用区域边界附近纹理和区域内部纹理确定不规则区域的支撑区域;然后给出了一种基于距离变换的子区域划分方法,与传统方法相比,能够减少图像亮度变化带来的匹配错误;最后针对区域存在形状、尺寸大小不一且具有不同像素点数的问题,采用均值标准差MS构造描述算法。实验结果表明,该算法对旋转、光照、模糊以及压缩变化图像具有更好的匹配性能。

    带形状参数的类三次代数三角Hermite参数样条曲线
    刘成志,李军成
    2016, 38(07): 1479-1483. doi:
    摘要 ( 74 )   PDF (519KB) ( 275 )      评审附件

    基于空间{1,t,sin t,cos t,sin2t}提出了一类带形状参数的类三次代数三角Hermite参数样条曲线。该曲线不仅具有标准三次Hermite参数样条曲线的性质,而且在适当条件下能够精确表示圆、椭圆、抛物线等工程曲线。在给定插值条件时还可通过改变形状参数的取值对曲线的形状进行调控。同时,还基于光顺准则建立求解最优形状参数的数学模型,根据实际需要,该模型所求的形状参数能使得曲线达到C1或C2连续。实例表明,利用模型求解的最优形状参数能保证曲线具有良好的光顺性。

    差分进化混合粒子群算法求解装配式住宅项目进度优化问题
    赵平,吴昊
    2016, 38(07): 1495-1501. doi:
    摘要 ( 74 )   PDF (549KB) ( 236 )     

    针对装配式住宅项目进度优化问题,提出了基于差分算法(DE)和粒子群算法(PSO)的差分粒子群混合算法(DEPSO)。建立了以项目工期最优为目标的进度优化模型,通过在DE和PSO之间建立信息交流机制,避免了单一算法容易落入局部最优和精度低的缺陷。最后以某装配式住宅项目为例,通过三种算法的比较,结果表明DEPSO在求解装配式住宅项目进度优化中合理高效、鲁棒性较强,能有效地解决装配式宅项目工期优化问题,有较大的应用价值。

    一种基于混合特征的中文情感词典扩展方法
    谢松县1,赵舒怡 2
    2016, 38(07): 1502-1509. doi:
    摘要 ( 73 )   PDF (620KB) ( 339 )      评审附件

    覆盖面广且领域适应性好的情感词典可以有效提高文本情感分析效能。设计了基于连词语言特征和词性特征向量统计特征的中文情感词典扩展算法,提出了综合两种方法的混合特征算法。算法计算得到词语的细粒度的积极和消极情感极性值,并对通用情感词典在领域内进行扩展以提高覆盖度,对词典进行领域内调整以提高适应性。实验结果表明,算法在领域内扩展获得的词典比通用情感词典覆盖度和适应性更好,在情感分类任务中性能接近有监督方法。

    隐含概念漂移的不确定数据流集成分类算法
    张盼盼,尹绍宏
    2016, 38(07): 1510-1516. doi:
    摘要 ( 71 )   PDF (627KB) ( 249 )      评审附件

    近年来,数据流分类问题已经逐渐成为数据挖掘领域的一个研究热点,然而传统的数据流分类算法大多只能处理数据项已知并且为精确值的数据流,无法有效地应用于现实应用中普遍存在的不确定数据流。为建立适应数据不确定性的分类模型,提高不确定数据流分类准确率,提出一种针对不确定数据流的集成分类算法,该算法将不确定数据用区间及其概率分布函数表示,用C4.5决策树分类方法和朴素贝叶斯分类方法训练基分类器,在合理处理数据流中不确定性的同时,还能有效解决数据流中隐含的概念漂移问题。实验结果表明,所提算法在处理不确定数据流的分类时具有较好的鲁棒性,并且具有较高的分类准确率。