搜索

会员中心

兑换商城

消息

创作中心

wangbencun

0个粉丝

1

问答

0

专栏

0

资料

wangbencun 发布于 2025-03-10 20:27:55

采纳率 0%

893

收藏
点赞
分享

微信扫码分享

QQ好友
举报

3403 nnn/svp npu相比一些2T算力的平台耗时为什么没有什么明显优势

3403默认配置下，实测nnn的fp16和int8推理耗时非常接近，为什么相比一些2T算力的平台耗时没有什么明显优势？nnn的fp16模型和svp nnn的int8模型耗时也差的很少，有什么办法可以提速么？

我来回答

回答2个

时间排序

认可量排序

温暖的抱抱MT

温暖的抱抱MT

0个粉丝

0

问答

0

专栏

0

资料

温暖的抱抱MT 2025-03-17 17:02:58

认可0 回复引用举报

3403 的 FP16 和 INT8 耗时相近，可能与计算单元优化、内存带宽瓶颈、指令调度、INT8 量化策略相关。要提升推理速度，可以：
确保完整 INT8 量化（避免 FP16 计算混入）。
调整 batch size 充分利用计算资源。
优化算子融合降低内存访问。
启用高性能模式提升计算能力。
你可以先用 NNN 提供的 profiling 工具查看算子执行时间，再针对慢速部分优化！

david

12个粉丝

49

问答

29

专栏

58

资料

david 2025-03-17 20:58:51

认可0 回复引用举报

具体是多少？有个地方要注意一下，内存copy. 默认内存拷贝函数是很耗时的。可以考虑用dma改写拷贝函数

相关问答

ev和 dv 相比，谁算力更高

2

2020-11-11 18:02:15
SS928开发板提供的NNN包和SVP_NNN包有什么区别以及在运行中出现的一些问题

2

2023-08-15 17:43:10
比1126算力更高的芯片和板子有啥推荐的没？想搞目标跟踪2T还是太慢了

7

2023-11-07 11:05:02
问一下扫描低矮障碍物应该把雷达放的高一些还是矮一些为什么？

1

2018-08-20 14:07:29
SS928的NPU的两个核怎么用？

0

2025-10-28 15:31:07
社区拿到一些君正T30上面的一些license

6

2019-01-04 00:03:13
请问一下 rv1126 的NPU算力比 rk3568 的高，但是为什么推理速度更慢？因为架构不一样？

1

2023-08-16 08:55:47
一个图像的频谱图，波纹怎么表现得更明显一些？

9

2018-12-25 15:10:11
hi3531DV200在两客一危市场应用

0

2020-08-14 16:34:07
有没有什么好的免费的vpn

2

2017-02-27 19:10:48
为什么大家都在发力AI ISP?

24

2023-07-11 12:10:05
linux 内核有没有什么必须的模块？

0

2012-12-17 10:55:50
易百纳海思Hi3516DV500开发板IPC算力2T图像ISP 替代Hi3516DV300跑yolo例程报错

4

2024-12-20 19:29:24
svp nnn目标检测不全

2

2026-01-27 21:43:46
瑞芯微RV1126 NPU算力水平实测如何？

5

2020-09-18 14:21:05
关于板子的一些说明

0

2013-06-28 20:51:02
SS928:再次请教SVP_NNN和NNN

5

2024-12-30 16:17:23
大佬们，我用这个命令在视频帧中做一些处理速度很慢，有没有什么命令可以加快转码速度呀，又能保证视频质量

0

2021-01-18 17:53:50
请问有没有什么轻量级的智能学习框架？

2

2018-11-18 09:06:31

无更多相似问答去提问

易百纳技术社区

点击登录

-- 积分

-- E币

提问

—

收益

—

被采纳

—

我要提问

社区问答

悬赏问答

易百纳技术社区

关注公众号

联系我们
社区问题咨询：Ebaina-CN
定制需求咨询：xxqk158820

易百纳技术社区