、演绎、

、演绎、

0个粉丝

3

问答

0

专栏

0

资料

、演绎、  发布于  2021-02-02 10:17:43
采纳率 0%
3个问答
3074

关于3559AV100 GPU+opencl2.0 性能

     

最近使用3559 gpu运算,首先使用opencl1.2,数据拷贝方式向gpu传递数据运算,然后再拷贝出计算结果。不过需求场景数据量有点大,需要传入8M和传出8M. 为了优化我尝试使用opencl2.0得 VM指针方式传递给gpu数据,发现总的耗时和1.2版本得copy方式一样。怀疑3559 gpu没有实现共享内存方式传递数据?有没有前辈使用过,我现在使用VM映射方式,向gpu传递8M数据,总计耗费7~14MS(7和14ms调动,不知道什么原因)。 单纯得cpu 使用memcpy 搬运8M数据基本上在4ms左右。这个时间差还能降低吗

我来回答
回答1个
时间排序
认可量排序

、演绎、

0个粉丝

3

问答

0

专栏

0

资料

、演绎、 2021-02-03 16:32:38
认可1

自问自答 也算解决了吧 还是使用VM方式传递指针,不过把数据拷贝的线程绑定到主核心上,8M数据搬运时间在4ms左右,可以接受

或将文件直接拖到这里
悬赏:
E币
网盘
* 网盘链接:
* 提取码:
悬赏:
E币

Markdown 语法

  • 加粗**内容**
  • 斜体*内容*
  • 删除线~~内容~~
  • 引用> 引用内容
  • 代码`代码`
  • 代码块```编程语言↵代码```
  • 链接[链接标题](url)
  • 无序列表- 内容
  • 有序列表1. 内容
  • 缩进内容
  • 图片![alt](url)
+ 添加网盘链接/附件

Markdown 语法

  • 加粗**内容**
  • 斜体*内容*
  • 删除线~~内容~~
  • 引用> 引用内容
  • 代码`代码`
  • 代码块```编程语言↵代码```
  • 链接[链接标题](url)
  • 无序列表- 内容
  • 有序列表1. 内容
  • 缩进内容
  • 图片![alt](url)
相关问答
无更多相似问答 去提问
举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

易百纳技术社区