IRC僵尸网络是攻击者通过IRC服务器构建命令与控制信道方式来控制大量主机组成的网络。IRC僵尸网络的动态性以及动态IP地址的影响,给僵尸网络的大小度量带来很大的困难。本文采用基于概率的动态IP地址去重算法减小动态IP地址的影响,给出僵尸网络大小尽量准确的度量,实验验证了本文方法的有效性。
本文针对日益庞大复杂的企业内部网络应用,提出一种结合Esper和Nagios的系统网络监控平台。该平台将事件流技术应用到网络安全事件处理中,利用策略分析和规则引擎主动处理网络安全事件,高效支持大规模网络事件动态决策分析。实现了事前主动警告和实时被动通告,避免了静态监控和监视系统造成的固化效果,实现了规则的动态设定和更新,能够完美配合企业的业务需要。
在无线移动网络中,恶意节点可以通过发送虚假信息和假路由信息、广播假链接等中断路由操作对网络进行攻击。本文在分析了几种常见路由攻击的基础上,提出了一种基于遗传算法的路由优化策略。实验数据表明,这种优化策略可以较好地预防路由攻击,提高网络的整体性能。
端口扫描是最常见的网络异常流量,TRW是端口扫描检测中最有代表性的算法之一。在高速网络环境下,网络测量通常采用分组抽样技术。已有的研究表明,分组抽样对原始流的流大小分布有细化和扭曲的作用,使得TRW检测算法随着抽样率的增加,成功检测率和误检率呈现出先增加后减少的趋势。本文提出了一种TRW的改进算法,原理是利用抽样后样本流中包含的TCP协议信息改善分组抽样下的流大小分布估计,从而提高TRW检测算法的有效性。实验证明,新算法与原算法相比,在成功检测率差不多的情况下,误检率明显降低了。
目前,国内建筑中的网络主要以有线形式为主,安装麻烦、不易扩展。为了提高建筑环境控制的智能性,提供一个舒适、节能的办公环境,本文研究了智能办公环境的无线网络系统的构建问题,提出了一种基于多智能体(Agent)技术、ZigBee无线网络技术、模糊Q学习算法的无线网络系统。设计了系统的网络结构和多Agent系统模型,分析了模型中各种Agent的设计和通信方法,给出了系统的软硬件平台设计方案。最后进行了实验分析,验证了引入多Agent模糊Q学习加快了系统学习进程。另外设计了测试方案进行系统网络性能测试,测试结果表明该网络系统的丢包率较低。因此,系统具有可应用性。
BDD是布尔函数的图形表示形式,被广泛应用到网络可靠度的分析计算中。为了提升网络可靠度BDD分析算法的性能,本文根据边扩展图实例,识别两类无效边扩展路径:冗余节点型无效扩展路径和ST非连通型无效扩展路径,然后基于基本的网络可靠度BDD分析算法,实现了两类无效扩展路径的消除技术。实验结果表明,两种无效扩展路径消除技术能够提前识别无效扩展路径,避免无效扩展,有效减少中间子网的数量,缩减分析时间;通过把两种技术结合起来,可以有效地消除边扩展图中的这两类无效扩展路径,从而极大提升可靠度分析的性能。
本文选取了三维不可压缩流动方程的分步法(fractionalstep method),其中动量方程使用BiCGSTAB算法进行迭代求解,而压力泊松方程使用Fourier变换法进行直接求解。本文研究该算法在集群平台上的并行算法,从区域分解入手,分析一维、两维、三维区域划分三种情况下,各并行处理器上的计算量与通讯量,根据分析结果使用两维区域分解。分析BiCGSTAB算法和泊松Fourier变换法在GPGPU异构平台上的移植方法。最后,本文分析了BiCGSTAB和泊松方程Fourier变换法两种算法在CPU集群和GPGPU异构平台上的并行性能结果。
整合云和网格基础设施,增强科研机构现有网格系统的计算能力并向应用提供截止时间保障的服务是科学研究领域的热点。在这种“网格云”混合计算环境中,对何时租借云虚拟资源以及如何租借做出有效决策是一个难题。现有的一些调度策略主要在网格资源静态能力特征的基础上,以作业等待时间作为决策依据,缺乏对资源动态服务能力的有效评估,无法保证科学应用的截止时间需求。本文提出了一种混合环境下的科学工作流执行系统架构并对其核心组件进行了阐述。针对其中的工作流调度问题,利用随机服务模型建模已有网格系统中的资源的动态服务能力,以任务违约风险作为是否租借外部虚拟资源的判断指标,提出了一个科学工作流调度算法HCA_SASWD。实验结果表明,HCA_SASWD相对于其他算法,能有效保证用户的截止时间要求,为需要提供截止时间保障的系统架构提供了参考。
乐观时间同步机制能够显著提高并行仿真的性能,但是在乐观时间推进过程中会出现因果错误,需要根据保存的状态对事件进行回退,因此事件状态保存机制是影响乐观时间推进效率的重要因素。本文首先简要介绍了并行仿真中逻辑进程的执行过程,讨论了乐观时间推进的状态保存与回退机制;然后对全状态保存技术进行了建模和理论分析,并通过实验测试了全状态保存算法的性能,测试结果验证了理论分析的正确性。
新兴的P2P技术由于体现出许多新的特性及优点,一直受到工业界和学术界的共同关注。数据共享是P2P技术应用较多的领域之一,但大家所熟悉的P2P应用系统提供的是文件层次的数据共享,不能满足诸如关系型数据等结构化数据的共享需求,而数据库领域的传统数据集成方法在某些特定情形下难以实施。针对这一问题,P2P技术与数据库技术的结合成了解决问题的一条途径。本文介绍了P2P数据库系统产生的背景,并主要从P2P技术的特点和P2P重叠网络的分类两个方面简单介绍了P2P技术,重点分析P2P数据库与分布式数据库的异同点。然后介绍了一种P2P数据库系统原型实例——PeerDB。最后进行了简单的总结及展望。
随着集成电路工艺的等比例缩小,互连线延迟相对门延迟增加,导致报文在片上网络路由器之间的传输需要多个时钟周期。但是,在基于信用点流控策略中,物理链路中的寄存器在发生拥塞时不能够缓冲报文。因此,本文提出了一种自适应的通道双缓冲结构,能够在发生拥塞时缓冲报文。通过门级电路的设计和分析,根据逻辑努力方法建立了CDB的延迟模型。延迟模型的准确性利用Synopsys时序分析工具Prime Time在TSMC的65nm工艺库下被验证,两者相差不超过一个τ4。结果表明,在32nm工艺下,1mm长的半全局互连线通道双缓冲(CDB)和简单流水线(SPLS)所需要的级数相同。
稀疏矩阵向量乘是许多科学计算的核心,计算中大量的间接和随机访存成为计算的主要瓶颈。本文通过分析稀疏矩阵向量乘运算的数据结构和计算过程,得到计算中不同数据的访存特征,并提出了一种面向数据访存特性的Cache划分方法。对12个稀疏矩阵向量乘的测试表明,本文的Cache划分方法能有效地提高可重用向量的Cache命中率,同时减少计算对Cache空间的需求。
SIMD单元集成已经成为提高处理器性能的重要途径之一。虽然定点SIMD单元的硬件复用低成本设计技术已经较为成熟,但是,大部分浮点SIMD单元的硬件设计还停留在简单的硬件复制方法上。本文针对日益增长的128位高精度浮点操作的计算需求,提出了其相应的SIMD低成本硬件结构方案。综合实验结果表明,所提出的SIMD浮点乘加单元比传统128位高精度浮点乘加单元具有更加优化的性能与面积参数。
近年来,全球范围内恐怖主义活动愈发频繁,已经严重影响了地区稳定和世界和平。随着信息技术的发展,研究者们得以从多个方面获取恐怖袭击事件信息。然而,随着数据集规模的不断扩大,如何从大量数据中发掘隐含的信息、分析其中包含的不确定性,成为恐怖袭击事件分析过程中的重要问题。针对全球恐怖主义数据库,基于可视分析和不确定度量理论,提出了数据记录和属性不确定性的度量及可视分析方法。通过将不确定性度量结果与平行坐标、柱状图、面积图和交互式方法相结合,在不影响数据源表达的同时清晰地展示了其中包含的不确定性,为下一步基于不确定性理论的态势评估提供了信息基础。
脉冲耦合神经网络PCNN以其在图像分割、目标识别等领域的独特优势而成为当前的研究热点。本文对其在红外与可见光图像融合领域的应用进行了研究,并针对传统脉冲耦合神经网络参数无法自动设定的难题,提出了基于修正PCNN的参数自动设定方案。针对可见光与红外图像融合的大量实验结果表明,本文方法无论在主观视觉效果还是客观评价参数上均明显优于基于多分辨分析的融合算法,对于拓宽PCNN的应用领域有一定价值。
脉象作为人体一项基本的生理特征,反映了个体整体性的生理情况,尤其是个体血管与心脏的健康状况。由于脉象诊断自古以来就存在不够定量客观的现实问题,为了客观定量地对脉象这种微弱信号加以分析,本文利用小波变换在时域与频域多级分辨率的特性,对脉象信息进行多小波分离出高频噪声信号以及基线漂移,在此基础上对信号去噪滤波。利用小波变换奇异点突变,提取脉象周期信息作为一类特征值。通过三次样条拟合出单周期脉象波形,提取出脉象搏动微分、积分曲线以及极值点的信息,阐述了它们与脉形特征对应关系,并作为脉形特征值。通过样条建模计算出的特征值为进一步的脉象识别提供了数据信息。
PDF417条码作为一种应用广泛的二维条码,正在逐步应用于标识各种商品。目前,对于生活中很常见的圆柱体商品,其侧表面PDF417条码的识别还没有研究报导。本文提出了一种基于局部透视变换的图像矫正算法,将圆柱体侧表面PDF417条码分割为若干子区域,然后对各个子区域分别进行透视变换,将各个子区域分别矫正之后再行拼接,最后得到平面PDF417条码的图像。实验结果表明,该方法可以有效地将圆柱体侧表面的PDF417条码矫正为平面PDF417条码,并且正确地解码出条码所含信息。
沿着基线并具有大量附加部分书写是维吾尔文一大特点,这些特点使复杂背景的彩色图像中维吾尔文字行与字的切分和识别成为一个既困难又有趣的问题。本文首先对复杂彩色图像进行灰度化,其次将彩色图像转换为灰度化的边缘图像,再对图像进行局域二值化,然后进行区域检测和边缘调整,初步实现了图像中维吾尔文字行的定位,紧接着根据定位结果从图像中切分出文字行,统计切分后的文字行在水平和垂直方向上的像素累计情况,查找最佳切分点,分离出文字行中的字母独立形式或几个字母连成的连体字母段。实验结果表明,文字行的切分准确率达到96%,字切分准确率达到98%以上。
本文提出了一种使用二叉树组织多维数据的数据结构,在这种结构下提出了一个区域搜索算法,确定空间中给定点的区域内所有在给定数据集中的点,搜索效率与维数无关,算法的平均时间复杂性为O(logn),为了保证算法的效率,提出了一种平衡树操作算法。
在不考虑设置公交站点的情况下,城市公交网络设计问题主要可以分为城市公交路线设置问题和城市公交时刻表设置问题。前者主要通过使用已经设置好的公交站点和已有的城市道路网络来设置公交路线,后者则是设置合理的公交时刻表。本文只研究城市公交路线设置问题。本文提出了基于遗传算法的公交路线设置优化方法,实验表明结果比一些传统算法有较大的改善。
核函数是支持向量回归机的重要部分,每种核函数都有其优势和不足。本文基于支持向量机回归机模型相关参数的选取原则,给出了一种具有混合核函数的支持向量机,以基于网格搜索的多蚁群算法为基础,给出了此类混合核函数支持向量回归机参数优化的一种新方法。该方法以最小化交叉验证误差为目标,对包括混合比例和各类核函数的参数在内的5个参数进行优化。仿真结果表明,与遗传算法相比,本方法在参数优化方面有良好的性能,建立的预测模型精度较高。
本文提出了一种确定多项式实根的人工鱼群算法。利用随机K分法,对多项式的实根区间进行优化,来确定多项式方程全部实根位置。算例结果表明,所提出的确定多项式实根的人工鱼群算法能够快速地实现任意多项式的实根分离, 随机K分法能够较快地优化多项式实根所在区间,求出任意多项式的全部实根。该方法具有求解精度高、收敛速度快等优点。
针对物联网环境下的语义社区演化问题,提出了一种基于博弈论的语义社区动态演化模型。首先给出物联网语义社区(Internet of Things Semantic Community, ITSC)的定义和特征;然后提出了一种基于动态博弈论的物联网语义社区演化模型,给出了物联网语义社区预处理算法(SCPA)、博弈节点选择算法(GNSA)、基于博弈的语义社区演化算法(GTEA)及算法的性能分析。通过实际网络社区数据的仿真实验表明,演化模型能够真实地反映物联网语义社区的演化规律。
随着人们在互联网上的行为日益丰富,互联网上的社交行为和关系逐渐接近传统的客观世界的社交网络,并能够真实反映出人与人之间在客观世界的真实关系。可以从互联网中通过搜索的方式来构建一个真实客观世界的社会网络。社会网络搜索技术及其方法逐渐成为目前的研究热点,如何对每个Web进行人名同一性判断是社会网络搜索的关键技术。为了从文本中抽取准确的特征并降低向量维度,本文给出了一个基于Cvalue和逆文档频率IDF的特征向量权值计算方法;实现了基于余弦夹角的相似度计算的算法;通过对文本聚类算法中层次聚类算法和划分聚类算法的研究,给出一种改进的层次聚类算法来实现人名同一性判断。以搜索引擎的人名检索结果进行测试,说明了基于改进的层次聚类算法能有效地提高人名同一性判断的性能。
面对混合属性数据集的数据预处理需求,本文在给出若干定义及相关性质之后,提出了一种基于近邻连接的两阶段聚类算法。为提高算法的时间效率,给出了算法改进的思路与技术。多个人工数据集和UCI标准数据集的仿真实验结果表明,对于一些具有明显聚类分布结构的数据集,该算法经常能取得比kmeans算法和AP算法更好的聚类精度,说明它具有一定的有效性。为进一步推广并在实际中发掘出该算法的应用价值,最后给出了几点研究展望。
经典粗糙集方法的优点在于能够通过不可区分关系来获取知识,但其不足之处在于不能够处理定性属性、定量属性以及准则属性同时出现的定序分类问题。为此,本文对经典粗糙集进行扩展并提出了一个新的决策分析方法,该方法采用“不可区分相似优势”关系来代替经典粗糙集中的不可区分关系以获取知识的粗糙近似,从而不但能够解决上述定序分类问题,而且还能处理决策表中可能存在的不一致现象。实例验证了该方法的有效性与优越性。
为进一步解决应急预案编制中的规范性问题,本文将文本挖掘技术与预案编制结合,提出了一种改进的DBSCAN算法。该算法采用最小二乘拟合法拟合预案文本相似度曲线,在聚类迭代过程中采用可调整的Eps邻域阈值以提高算法的精度与召回率,从而为政务工作人员在编制预案过程中提供智能参考组方案。仿真结果表明,该算法能够为预案编制提供有效的参考预案组。
复杂网络分析已成为近年来的一个热点研究领域。如何快速有效地对复杂网络进行社区划分,并在社区划分的基础上找出网络中的重要节点有很强的现实意义。本文分析比较了近年来复杂网络分析中社区结构挖掘算法和社区节点等级排序算法的原理和特征,最后对复杂网络分析的发展进行了总结和展望。
本文基于二次情感特征提取算法,利用句法依存关系进行一次文本情感特征提取,在此基础上,利用情感词典,进行二次情感特征提取。构建朴素贝叶斯分类器,对采集的热门话题微博和酒店评论进行文本情感倾向性分类。主要比较了表情符号、标点符号,基于情感词典的特征提取和基于二次情感特征提取方法,在不同的组合下的分类性能,寻找更佳的微博文本情感分类预处理方法。并与酒店评论情感分类结果对比、分析,发现影响微博情感分类性能的原因。实验结果表明,二次特征提取方法在分类上取得更高的F1。实验最佳的分类预处理方式是“表情符号+标点符号+二次情感特征提取+BOOL值”。同时发现,朴素贝叶斯在酒店评论情感分类取得更高的分类性能,主要是微博评价对象多样化造成的。
本文针对网络学习中如何个性化使用资源库的问题,从解决用户真实需求获取的瓶颈问题出发,通过分析此类应用环境下资源特性和用户特性,引入资源分布矩阵和偏好矢量概念来表征个性化特性,进而构建用户属性结构特征模型。然后采用用户属性结构和资源特性描述之间的精准检索,以及针对学习资源实施多重相关度排序和定位,设计验证了一个基于JADE平台的个性化资源检索系统。模拟实验证明,随着用户检索次数的增加,用户属性模型不断更新和完善,资料的个性化匹配度良好,能够较好地处理需求获取的瓶颈,达到实施个性化学习的目的。
关联规则是数据挖掘研究中最主要、最活跃的领域之一。以Apriori算法为前提,借助AprioriTid算法事务压缩的思想,减少了重复扫描数据库的时间;并提出了一种利用事务标识列表,该列表长度即是对应候选项集的支持度计数,在计算支持度计数时,仅需要得到对应列表长度即可,从而缩短了计算计数时的比较时间;同时,在生成频繁项集时引入地址索引机制,在剪枝过程中,利用候选项集的首元素在地址索引表中快速定位,减少了多次扫描事务数据库,有效地缩短了计数时间和占用的内存空间。利用改进的算法对科研管理系统数据进行关联关系分析,从中萃取数据中隐含的、有价值的信息,辅助下一阶段的科研管理工作。并通过试验进行性能比较得出,改进后的算法效率更高。
互联网的迅速发展带动了信息量的爆炸性增加。如何更快地采集所需信息一直是国内外研究和开发的热点。近年来,不断增长的对特定信息(例如特定领域的新闻)的需求要求有针对性地从指定的网站即时采集相关信息。这些新闻一般具有不可预见性、更新频率较快、时效性强等特点。这要求我们必须能针对这些特点实现即时定向的采集。本文提出了一种有效抓取网页并进行分析的方法,实践表明取得了满意的效果。
本文基于 ΔPK复杂性类给出多项式时间谱系PH 的一个分解,并讨论了相关的一些性质。利用该分解给出PH 是否只有有限个层次这一重要计算复杂性理论问题的两个充分条件,并证明了NP中稀疏集构成的语言类在LP2∧中。
谓词的自动识别是浅层句法分析的重要内容。本文提出了基于支持向量机分类算法的谓词自动识别方法,重点描述了在特征构建过程中基于信息增益的特征筛选方法与基于同义词词林的特征词度量方法。信息增益方法选取对分类影响较大的特征,降低了特征维度;同义词词林的度量方法将特征词映射为深层次的语义概念,增强了特征的表达能力,强调了属性特征与模型的相关度。在小规模语料库上的实验表明,谓词识别的最好FScore达到了84.0%,相较于对数据无任何处理的情况FScore提高了4.6%。结果表明,这种新的特征筛选与特征度量方法在谓词识别中十分有效,可以极大提高分类器的性能。
本文提出了基于固态传感器的航姿系统设计方案,介绍了基于四元数的航姿求解方法,设计了多传感器融合的卡尔曼滤波器。仿真结果表明,该算法在保证精度的同时能有效地估算出陀螺漂移。以TMS320F28335处理器为核心构建了硬件系统。实验结果表明,该设计能满足航姿系统对精度和速度的要求。
为了满足速度、功耗等诸多限制的要求,数字信号处理算法常使用FPGA实现。而实现时由于硬件特点,通常将浮点运算转换成定点运算,但定点转换设计流程复杂、周期长,且存在数据范围和精度之间的矛盾。利用浮点数的优点,本文改进了基于FPGA的定点数的基本运算规则,有效解决了上述矛盾。本文详细论述了实现移位、加/减、乘、除基本运算模块的方法和步骤,最后以FIR数字滤波器为设计实例。仿真结果表明:改进的定点数算法比定点运算误差小、精度高、数据范围宽,能有效地防止溢出。