J4 ›› 2014, Vol. 36 ›› Issue (06): 1011-1017.
李春江,黄娟娟,徐颖,董钰山
LI Chunjiang,HUANG Juanjuan,XU Ying,DONG Yushan
摘要:
主流通用处理器都已经实现了多核并行以及处理器核内的SIMD并行。虽然GCC编译器实现了面向SIMD并行的自动向量化,但是编译器针对OpenMP并行程序的自动向量化效果仍很不理想。针对多线程并行的OpenMP程序,基于GCC的OpenMP编译实现,扩展了数据对齐属性指导语句,使编译器在自动向量化时能够进行更准确的数据对齐与否的判断,优化了GCC编译器的自动向量化。