计算机工程与科学 ›› 2023, Vol. 45 ›› Issue (01): 17-27.
孙国璋1,2,3,黄山1,2,3,艾力卡木·再比布拉1,2,3,徐浩桐1,2,3,段晓东1,2,3
SUN Guo-zhang1,2,3,HUANG Shan1,2,3 ,ALKAM Zabibul1,2,3,XU Hao-tong1,2,3,DUAN Xiao-dong1,2,3
摘要: k-支配skyline算法弱化了数据点之间的支配关系,更适合高维数据。k-支配skyline体适应于多名用户使用k-支配skyline算法查询,而现有的求解算法在时间效率和代码扩展性方面都有待提高。因此,提出了面向多用户的k-支配skyline体求解优化算法MKSSOA,该算法对每名用户的候选集和中间集分别进行存储,同时在k-支配检查过程中利用2集合中数据点出现的先后次序将候选集中的非k-支配skyline点存储到对应用户的中间集中,以便下一名用户筛选使用,这样可以减少数据点之间的比较次数,避免重复计算,从而提升查询效率。同时,提出了面向多用户的k-支配skyline体并行求解算法MKSPSA,通过Apache Flink并行处理框架有效减少了数据点的比较时间。理论研究和实验结果显示,提出的算法具有较高的效率,能很好地处理多用户k-支配skyline问题。