气象数据是一种典型的非结构化数据,在实际应用中其日增量达数十TB,基于关系数据库和传统文件系统的解析、存储与访问模式已成为制约天气预报系统信息化发展的瓶颈之一。为满足全国天气预报平台MICAPS用户对实时数据的及时、快速查询,介绍了能够7*24小时稳定工作、支撑数十TB/天的数据实时解析系统。根据气象数据的多维模型和用户行为,采用非关系型分布式KeyValue数据库,设计实现了高性能海量数据存储系统。实践证明,数据实时解析系统和基于分布式非关系型KeyValue数据库的存储系统能有效满足海量实时气象数据存储、查询和应用需求。该系统已成为中国天气预报业务流程中的核心系统,体现了优异的功能和性能。
海洋监测数据是具有强数据关联的大数据,如何高效地进行数据布局,是制约其有效管理和应用的关键问题之一。在云计算环境下,针对海洋监测大数据的特点,提出了一种基于数据关联度的海洋监测大数据布局策略。在保证数据中心存储均衡的情况下,综合考虑了监测任务、监测点和监测数据之间的关联,建立了海洋监测点间的关联度、监测数据间的关联度和监测数据全局关联度,从三个角度对海洋监测大数据进行布局,使得同一数据中心内的数据具有较高的关联度。通过实验分析,该 方法降低了用户访问海洋监测大数据的响应时间,为海洋监测大数据提供了一种有效的布局策略。
云数据中心异构物理服务器的能耗优化资源分配问题是NP难的组合优化问题,当资源分配问题规模较大时,求解的空间比较大,很难在合理时间内求得最优解。基于分而治之的思想,从调度模式方面提出可扩展分布式调度方法,即当云数据中心待调度的物理服务器的数量比较大时,将待调度的服务器划分为若干个服务器集群,然后在每个服务器集群建立能耗优化的资源分配模型,并利用约束编程框架Choco求解模型,获得能耗最优的资源分配方式。将提出的基于可扩展分布式调度方法的能耗优化云资源调度算法与非扩展调度算法进行实验比较,实验结果表明,提出的基于可扩展分布式调度方法的能耗优化云资源调度算法在大规模云资源分配上有明显的性能优势。关键词:
在高性能IC设计中对高低两种阈值电压技术进行比较,利用低阈值电压降低动态功耗的手段实现降低总功耗的目标,并分析出了两种阈值电压低功耗设计各自适应的电路类型。首先对40 nm工艺中标准单元的内部功耗、时序、尺寸进行分析。接着在相同延时下对高阈值和低阈值两种标准单元所设计的反相器链时序电路的功耗进行对比分析。最后基于Benchmark和AES两种类型电路,分别采用高阈值和低阈值进行综合,对比得出在相同时钟周期下更低功耗的设计所对应的阈值电压设计方式。结果显示,在相同的时钟频率下,对动态功耗占据总功耗比例极大的电路使用低阈值设计得到的功耗更低。同样,在动态功耗比例不是极大的电路中,当低阈值综合的slack为正时,以及当高阈值综合的slack为负、低阈值的slack为0时,用低阈值设计功耗更低;而当高阈值、低阈值综合的slack都为0时,用高阈值设计功耗更低。
硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是硬件预取技术实现中的主要难点。借鉴学术界对硬件预取技术的研究成果和工业界的应用现状,紧密结合申威处理器的结构特点,研究了申威处理器硬件预取技术的实现方法。以流预取为例,在处理器核心面积增加0.97%的情况下,硬件预取技术的应用可以将目前申威处理器的整数性能平均提升5.17%,最高提升28.88%;浮点性能平均提升6.39%,最高提升30.11%。
随着教学信息化的不断深化,高校云平台越来越普及,但是实际应用中资源利用率仍然较低,核心问题在于当前的虚拟机调度机制未考虑高校教学应用的特征,从而导致负载不均和资源浪费。为了解决这一问题,从高校教学应用需求出发,提出了一种虚拟机动态调度算法(CRS),定义了课程虚拟机模型和物理机负载模型,并实现了基于OpenStack开源云平台的可对虚拟机进行动态调度的校园云平台。实验表明,提出的虚拟机动态调度方法达到了降低能耗及实现负载均衡的目标。
采用加矩形窗的积累互相关法和基于Fourier变换频域移位性质的最小熵法进行一维距离像包络对齐。针对包络对齐算法数据量大、复杂度高、运行时间长等缺点,提出一种应用于多核处理器的包络对齐并行算法。该方法利用OpenMP编译指导指令#pragma omp section和#pragma omp for对积累互相关算法和最小熵算法进行多线程并行优化。理论分析和仿真实验表明,该方法大大提升了算法的执行效率。
全数字锁相环ADPLL拥有较高的集成度、灵活的配置性和快速的工艺可移植性,可以解决模拟电路中无源器件面积过大、抗噪声能力不强、锁定速度慢以及工艺的移植性差等瓶颈问题。在纳米工艺下,单级反相器的最小延时已经达到10 ps以内,大大改善了全数字锁相环的抖动性能。提出了一款面向高性能微处理器应用的全数字锁相环结构,并对该结构进行了频域建模和噪声分析。该结构完全采用标准单元设计,最高频率可达到2.4 GHz,抖动性能达到ps级别。
分布式流体系结构扩展了分布式环境下的流计算模型, 可在互联网上为大数据计算应用提供高效低成本的运行环境。互联网中较长的通信开销制约了计算性能。提出了一种数据流Eager传输的性能优化技术,以挖掘计算与通信之间的并行性,隐藏通信延迟。在分布式流体系结构原型系统中实现了该技术。实验结果表明,应用程序采用该优化技术之后的平均时间开销减少了19.58%,表明该优化技术能够显著提高应用的性能,具有良好的应用前景。
智能视频监控技术在公共安全、交通管理、智慧城市等方面有着广泛的运用前景,需求日益增长。随着摄像头安装的数量越来越多,采集的图像数据量越来越大,靠单台计算机处理已经远远不能满足需求了。分布式计算的兴起与发展为解决大规模的数据处理问题提供了很好的途径。使用一种基于Spark Streaming的视频/图像流处理的测试平台,阐述了平台的构成和工作流程,深入研究各个参数对集群性能的影响,创新性地提出了CPU时间占用率作为性能评估指标,与总的处理时间结合,更为全面反映集群性能和资源利用率。
目前我国正在大力推行“一带一路”航海战略,航海事业蓬勃发展,大量新码头正在修建中。如何快速、准确地更新码头的空间信息,对于分析进出口贸易、提高码头服务效率等具有很强的现实意义。当前我国主要通过人工测绘手段更新海图,更新间隔在3~12月,远不能满足需求。而利用包括国际海事卫星C系统、北斗卫星、Argos卫星等手段获取的船舶位置数据来进行码头挖掘 ,为解决获得码头空间信息问题提供了新手段。利用自动识别系统AIS获取的海量船舶位置数据,提出了一种基于自优化参数的码头挖掘算法DBSCAN。一方面能够面向不同船舶类型的不同密度分布进行自动学习优化DBSCAN核心参数,进而聚类出包含码头的停泊区域,具备很强的灵活性;另一方面,融合岸基结构物等空间数据,对停泊区域中的锚区和临时停泊区域等进行排除,获取码头的空间信息,并且达到很高的准确率。利用2012年4月至2014年4月两年中国滚装船的真实轨迹数据和国际滚装船真实轨迹数据进行了码头挖掘实验,准确率能够达到93%以上。
针对云环境下存在的信任问题,提出了一种基于Bayesian方法的主观信任模型,用于量化和评估节点的可信程度。该模型给出了信任传递与合成的数学表述和实现方法,同时考虑云资源节点具有动态性、异构性、欺骗性等特征,引入了惩罚机制和分级剪枝过滤机制。最后将该模型应用于DLS算法得到基于Bayesian主观信任模型的动态级调度算法(BSTDLS) 。分析及仿真实验结果表明,提出的BSTDLS算法能够以较小的调度长度为代价,有效地提高云环境下任务执行的成功率。
生化试验中如何将样品试剂配备过程转化成有效的数字生化芯片实现的协议,并给出相应的操作过程中的稀释/混合操作优化算法非常关键,是样品试剂配备过程的一个挑战。为减少操作步骤和节省药品,提出针对数字微流控生物芯片多液滴混合器稀释/混合操作优化算法,该算法允许多个液体参与混合分离操作,可以在误差允许范围内利用片上多液滴混合器用较少的操作步骤获得目标浓度的液滴。相对传统的两液滴混合方法,减少了稀疏/混合的步骤和稀释/混合时间,同时减少中间废弃液滴的数目。实验结果也表明可以在允许的误差范围内高效地进行混合/分离操作,获得目标浓度的液滴。
针对传统关系数据库处理海量空间文本数据的不足,基于HBase数据库提出了一种结合Geohash编码与分词技术的空间文本索引方案,并基于该空间文本索引提出了一种多边形区域内的空间关键字查询算法。通过与传统经纬度索引方案的实验比较,验证了算法的高效性和可扩展性。
网络可靠度BDD分析方法的计算性能与BDD尺度紧密相关,而BDD尺度严重依赖边排序质量。因此,边排序问题是网络可靠度BDD分析方法的重要问题。由于求解最优边排序是一个NP问题,在实际网络可靠度分析中,通常采用启发式边排序策略如BFS和DFS,它们适用不同类型的网络。然而,对于给定网络,采用何种边排序策略更优,有哪些因素影响边排序质量,迄今没有给出评判依据。利用边界集思想,提出 “边界长度(BSL)” 概念,并用边界长度BSL表征边排序质量,揭示边界长度BSL和BDD尺度(节点数目)之间的关系。实验结果表明,边界长度BSL与BDD尺度具有正相关性,即较小BSL对应的BDD尺度较小,较大BSL对应的BDD尺度较大,多数情况下,BSL取最值时,BDD尺度能取到(或接近)最值。这为特定网络选择(或设计)高性能边排序提供了重要的参考依据。
卫星信道的天然广播及广域覆盖等特性使得基于卫星网络开展组播服务具有很强的吸引力,然而,卫星链路长时延、高误码、非对称的特点容易导致报文大量丢失和重传,使得组播可靠性难于保证。提出了一种基于网络编码的卫星网络可靠组播机制(NCM)。NCM通过在发送端主动发送原始报文的冗余编码包,可实现接收端多个丢失报文的本地恢复;同时结合传统ARQ反馈重传,当出现原始报文和编码包同时丢失时,通过重传编码包,就可恢复多个丢失报文。理论分析和仿真实验表明了该机制的可行性和有效性。
在微博的传播过程中,关键节点起着意见领袖的作用,在社交网络中发现关键节点对舆情的分析、控制等方面是非常有意义的,作为社交网络的传播节点,用户不仅与用户本身属性有关,还与微博消息的传播属性有关。对两种属性分别选取三个指标,利用层次分析法中构造判断矩阵的方法评估各个指标的权重,将用户系数和传播系数分别作为传播网络的节点和边的权值,形成双加权的网络拓扑图,然后建立考虑用户和传播属性的影响力评估算法来计算转发节点的影响力。通过与现有算法进行比较,表明本文的算法能够更加客观准确地评估关键节点在传播过程中的重要程度。
访问控制技术是网络信息系统安全的核心技术之一。针对开放式网络下基于信任访问控制问题中的授权需求,提出了基于知识发现的风险最小化授权(信任权限)模型,对模型元素、关系、约束和规则、授权策略进行了形式化定义。RMAMKD模型引入信任和风险的概念,对权限进行细粒度划分,将交互中涉及到的实体属性及其信任值和风险值作为授权判断的重要参考依据,并加入时间约束限制,能够更好地支持动态的授权机制。最后,给出了RMAMKD模型授权的应用实例及安全性分析,表明RMAMKD模型能够有效地保证对客体资源的安全访问。
OAuth 2.0协议是一种开放授权协议,主要用于解决用户账号关联与资源共享问题。但是,其弱安全性导致各网络公司海量用户信息泄露,且OAuth 2.0传输数据采用的https通道效率低下,成为黑客攻击对象。提出采用http通道传输OAuth 2.0协议数据,基于Promale语言及DolevYao攻击者模型对OAuth 2.0协议建模,运用SPIN进行模型检测。形式化分析结果表明,采用公钥加密体系对OAuth 2.0协议进行加密不安全。上述建模方法对类似的授权协议形式化分析有重要借鉴意义。
针对GDSF替换算法中对访问频率缺少预测的不足,提出了一种基于协同过滤的GDSF缓存替换算法(GDSFCF)。该算法考虑了Web对象之间相似性与用户访问时间间隔,运用协同过滤算法生成Web对象的预测访问频率,并采用齐普夫定律参数对GDSF算法的目标函数进行了改进。当需要进行缓存替换时,利用目标函数价值计算缓存空间中的每个Web对象缓存价值,将最小缓存价值的Web对象进行替换。仿真实验结果表明,该算法的命中率HR和字节命中率BHR都有较大提升。
随着社交网络的发展,其节点影响力度量成为一个重要的研究领域。针对传统随机游走PageRank算法精确度不高的问题,提出一种逆向随机游走PageRank算法,该算法采用逆向查找消息传播源的思想,对网络中的每条有向边以概率ε进行逆向随机游走,通过迭代计算出每个节点的PageRank值。实验表明,本文提出的算法较传统的随机游走PageRank算法具有更好的稳定性,并在迭代次数较少时也能保持较高精度。
把长度为56的具有7(8,0)型自同构的二元双偶极值码看成二元域上的多项式,分解成一个收缩码和一个偶重量多项式的直和。利用已知的码长较短的编码构造出长度为56的具有7(8,0)型自同构的二元双偶极值码,并给出可能的生成矩阵。由于该双偶极值码的最小距离为12,根据两个码等价的类型,对生成矩阵运行Matlab程序,证明了在等价情况下,当E1(σ)*的维数K=2时,不存在有7(8,0)型自同构的二元双偶极值码;当E1(σ)*的维数K=4时,有7(8,0)型自同构二元双偶极值码共75种。对长度为56到70的具有类似型自同构的双偶极值码进行相似讨论,得到了其生成矩阵和分类情况。至此,长度在50到70之间的二元双偶极值码的生成矩阵和分类情况得到完全解决。
运用WIFI无线通信技术、ARM Cortex A8处理器嵌入式系统、TCP/IP协议以及无线局域网监控等技术设计并制作了一个Android平台的多用户无线投影控制系统。通过WIFI无线通信技术建立用户端与无线投影网关的无线通信,解决了数据连线对投影仪使用时的限制,极大地方便了有线投影仪用户使用无线投影功能。本系统通过无线局域网实现多用户、多平台的无线投影,采用一主多从的方式进行切换,适用于PC机和Android手持移动设备。系统经测试,达到使用要求。本文还详细描述了无线投影网关设计和无线投影管理软件设计。
信息技术的发展为人们生活带来便利的同时也带来了个人隐私泄露的风险,数据匿名化是阻止隐私泄露的有效方法。然而,已有的匿名化方法主要考虑切断准标识符属性和敏感属性之间的关联,而没有考虑准标识符属性之间,以及准标识符属性和敏感属性之间存在的函数依赖关系。针对隐私保护的数据发布中存在的问题,研究数据之间存在函数依赖时,如何有效保护用户的隐私信息。首先针对数据集中存在函数依赖情况,提出(l, α)多样性隐私保护模型;其次,为更好地实现用户隐私保护以及数据效用的增加,提出结合扰动和概化/隐匿的杂合方法实现匿名化算法。最后,实验验证了算法的有效性和效率,并对结果做了理论分析。
模型检测作为一种形式化验证技术,已被广泛应用于各种并发系统的正确性验证。针对具有非确定性选择和广义可能性分布的并发系统,引入广义可能性决策过程作为此类系统的模型;给出描述其性质的规范语言广义可能性计算树逻辑的概念;研究此类系统的广义可能性计算树逻辑模型检测问题。结论表明,其模型检测算法的时间复杂度也为多项式时间。所获得的结果扩大了广义可能性测度在模型检测中的应用范围。
为使汪培庄先生提出的因素空间理论便于应用,和基于该理论对多域值属性影响对象集合进行聚类分析,提出了以研究对象为中心的图形化域值属性表示方法,即属性圆。属性圆可以表示无穷多个域属性对对象的影响。先基于属性圆概念进行对象的相似性分析,后为计算方便将图形定义转化为数值相似性定义,进而研究了对象集合的聚类分析方法。实施的聚类原则为:严格遵照相似与不相似划分,参考模糊相似划分。列举了一个实际电气系统的系统可靠性表述群作为研究对象集合,对表述群进行聚类分析。结果表明:决策集D与对象集U的对应关系说明对对象集的划分就其决策属性而言是非奇异的、准确的。这说明尽管在不同环境下对系统进行了可靠性评价,但是这些评价语义是相对客观的,评价的语义可以相互佐证。
提出了一种基于词序的社会情感演变分析模型(BTMESE),模型通过引入文档中词与词之间的前后关联性,以期有效地揭示时间、文本、情感三种信息之间的潜在联系,进而追踪社会情感演变趋势,进一步提高情感分析的准确率。该模型可应用于情感预测、时间预测等领域。通过在真实世界的数据集上进行验证,结果证明该模型简单有效,能够较好地进行社会情感分析。
研究汽车数字化仪表技术。针对传统组合仪表的显示内容具有很大的局限性,且数据传输实时性差等问题,提出了一种基于CAN/LIN双总线纯电动汽车液晶实时显示系统,对系统网络分层架构和系统整体的硬件平台架构进行详细的分析设计。系统软件方面,对信息交换协议以及系统整体的流程进行了设计。经过实验室模拟环境和实际的装车运行测试,系统显示内容丰富、人机交互效果好,实时性强,从而验证了系统设计的合理性和正确性。
为解决甲骨文信息处理研究中对专家的依赖性高而专家知识共享率却很低这一突出矛盾,提出构建知识图谱的方案,其核心问题是如何发现实体和实体间的关联关系。基于甲骨文的古籍特征,先通过知识图谱MKD的共词分析发现实体及其关系,再利用甲骨文本体和规则推理发现隐含的语义关系,最后将其与MKD共词关系进行融合。实验结果表明,该方法可以有效解决甲骨文知识图谱中实体关系发现问题。