J4 ›› 2012, Vol. 34 ›› Issue (12): 134-139.
张晓琳,郑珍珍,刘立新,李玉峰
ZHANG Xiaolin,ZHENG Zhenzhen,LIU Lixin,LI Yufeng
摘要:
目前查询连续概率XML数据多采用离散化方法,需要处理大量直方图分段,查询效率较低。本文提出了一种基于p文档模型的连续概率XML数据查询处理技术,首先利用cont节点扩展p文档模型支持任意的连续分布,在cont节点中编码概率密度函数以及他们的参数;其次采用twig模式匹配找到符合用户要求的路径;然后根据要查询的连续分布类型确定概率查询应该使用符号表示法、积分法或直方图近似法:标准连续分布通过符号表示法中的参数或复杂的累积分布函数计算查询结果,满足积分条件的非标准连续分布采用积分法,其它情况采用直方图近似法。实验结果表明,该方法在概率查询的精确度以及响应时间上比现有方法更高效。