首页 理论教育 优化并行性能的分析方法

优化并行性能的分析方法

时间:2023-06-26 理论教育 版权反馈
【摘要】:但是,PDDDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中,PDDDP最优并行计算耗时均出现在4核超线程开启状态下;在核数较多的配置2中,PDDDP三个方案最优并行计算耗时出现的测试环境分别为4核超线程开启、8核超线程开启和16核超线程关闭。在配置1中,PDDDP方法三个测试方案最大加速比分别为2.00、3.61、3.80;在配置2中,PDDDP方法三个测试方案最大加速比分别为2.03、4.67、8.79。

优化并行性能的分析方法

从表8.4~表8.6中可以看到,在配置1中,随着电站规模的增加,DDDP方法计算耗时从10.4s增长到948s;在配置2中,DDDP方法计算耗时从15.6s增长到1565s。因此,DDDP串行方法的计算耗时随着计算规模的增加迅速增长。而且,DDDP串行方法在配置1中的计算时间少于配置2,一个主要原因是配置1(3.30GHz)的时钟频率大于配置2(2.27GHz),运算速度比配置2更快。

在计算耗时上,PDDDP方法比串行方法有非常明显的削减。在配置1中,PDDDP方法三个测试方案最优并行计算耗时比串行方法分别缩减5.2s、75.9s、698.5s;在配置2中,PDDDP方法分别缩减7.9s、114.2s、1387.0s。但是,PDDDP方法各方案出现最优并行性能的测试环境有所区别。在核数较少的配置1中,PDDDP最优并行计算耗时均出现在4核超线程开启状态下;在核数较多的配置2中,PDDDP三个方案最优并行计算耗时出现的测试环境分别为4核超线程开启、8核超线程开启和16核超线程关闭。出现上述现象的原因在于在并行环境下随着计算核数的增加,线程管理消耗及线程间通信时间急剧上升,对于计算规模较小的PDDDP,会导致计算效率明显下降,甚至造成计算时间大于串行计算(比如方案1在配置2并行环境核数大于8的测试结果)。因此,对于小规模计算任务的并行计算,当采用核数较多的机器配置运算时,需要通过一定的测试判断适用的并行核数。此外,在同一核数超线程关闭和开启状态下,并行算法的计算耗时有所差异。在配置1中,任意多核环境下超线程开启的计算耗时少于超线程关闭,“超线程”技术提高配置运算速度的优势能够充分发挥;在配置2中,当测试环境核数较多时,超线程开启会加剧线程管理消耗及通信时间,增加计算耗时。因此,超线程技术的开启或关闭,同样需要对算法进行测试。

在加速比上,PDDDP方法获得了较好的效果。在配置1中,PDDDP方法三个测试方案最大加速比分别为2.00、3.61、3.80;在配置2中,PDDDP方法三个测试方案最大加速比分别为2.03、4.67、8.79。PDDDP方法各方案最优加速比出现的测试环境与最优并行计算耗时相同。因此,随着计算任务规模的增加,并行计算的最优加速比逐步提高,且越接近理想加速比,越能更好地发挥并行计算的优势。在同一配置中相同测试环境下,计算规模更大的任务能够获得更优的加速比,而且,计算规模较小的任务在核数较多的情况下加速比难以持续增长,易达到一定的瓶颈,甚至可能会导致加速比逐步下降(比如方案1)。(www.xing528.com)

在效率上,当超线程技术启闭状态相同时,随着测试环境核数的增加,效率逐渐下降,主要原因除了管理消耗以及通信时间的影响外,PDDDP方法仅实现了算法整个求解过程的局部并行化,其他运行过程为串行计算,而且,为了避免数据同步,并行计算需在子线程中各自单独定义字段存储计算结果,造成更多的内存占用,影响并行效率。

总之,根据PDDDP方法测试结果,对于计算规模较小的任务,核数较少的配置即可获得较好的加速性能,核数较多易产生并行瓶颈,影响计算效率;对于计算规模较大的任务,核数较多可以显著提高加速性能。因此,在生产实际中,小规模计算任务的并行计算建议采购核数较少的配置,节省硬件投资;大规模计算任务的并行计算建议采购核数较多的配置,可充分发挥并行计算的优势。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈