软件技术与数据库

CPU-GPU并行矩阵乘法的实现与性能分析

作者:
程豪 张云泉 张先轶 李玉成

关键词:
混合并行 GPU技术 DGEMM程序 加速比

摘要:
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在 GPU和CPU上同时进行计算的方法来提高运算性能.实验结果证明,当矩阵规模较大时,在AMD Phenom Ⅱ X4 940和ATI FireStream 9270平台上,混合DGEMM性能相对于单独使用GPU平均提升了16%.通过实验验证了混合DGEMM性能、加速比、任务分配比例的估算方法,并探讨 了影响混合DGEMM性能的各种因素.

在线下载

相关文章:
在线客服:
对外合作:
联系方式:400-6379-560
投诉建议:feedback@hanspub.org
客服号

人工客服,优惠资讯,稿件咨询
公众号

科技前沿与学术知识分享