技术专栏
【爱芯元智】【系统】NPU 工作状态&带宽查询
背景
在客户支持过程中,发现客户并不清楚如何查询 NPU 工作状态。因此通过本文简单说明下 NPU Perf 如何使用。
包含一下内容(不定期更新)
- vNPU 各自使用了查询
- NPU DDR 带宽查询(其实是系统各模块 DDR 带宽查询)
详细操作
参考文档《AX 外围设备驱动开发指南》
支持平台
- AX650A
- AX650N
- AX630C
- AX620Q
vNPU 使用了查询
启用功能
/root # echo 1 > /proc/ax_proc/npu/enable
NPU空载时,查询结果
/root # cat /proc/ax_proc/npu/top
nputop info is empty!
NPU负载时,查询结果
/root # cat /proc/ax_proc/npu/top
core:vnpu_1
time:0
period:1000000
utilization:0%
core:vnpu_2
time:1
period:1000000
utilization:98%
其他说明
- 采用 AI-ISP 的 Pipeline 时。
- vNPU1,大多数情况下分配给 AI-ISP 的模型使用
- vNPU2,分配给用户使用
NPU带宽查询
启用带宽查询功能
在系统启动后加载ax_perf_monitor.ko,操作命令如下:
#insmod /soc/ko/ax_perf_monitor.ko
查询完带宽统计操作之后,建议卸载掉该 ko,否则将引入不必要的系统资源开销。
# rmmod ax_perf_monitor.ko
查看带宽
查看带宽可以通过cat文件节点显示:
# cat /proc/ax_proc/bw/bw
结果的显示如下:
/root # cat /proc/ax_proc/bw/bw
All BW:7MB(----)
cpu/common/debug BW:7766KB(100%), RD_BW: 5136KB(66%), WR_BW: 2629KB(33%)
isp/vdec BW:0KB(0%), RD_BW: 0KB(0%), WR_BW: 0KB(0%)
npu BW:0KB(0%), RD_BW: 0KB(0%), WR_BW: 0KB(0%)
venc/flash BW:0KB(0%), RD_BW: 0KB(0%), WR_BW: 0KB(0%)
vdsp/mm/pipe BW:0KB(0%), RD_BW: 0KB(0%), WR_BW: 0KB(0%)
- 第一行的“ALL BW”:表示 perf monitor 检测的所有模块的带宽总和;
- 第二行统计的是:cpu/dma 的带宽总和,其中括号中的百分比 100% 表示该通道的带宽占总的实际带宽的百分比;
- 第三行统计的是:isp 的带宽总和;
- 第四行统计的是:npu 的带宽总和;
- 第五行统计的是:mm 的带宽总和;
- 第六行统计的是:venc/jenc/vdec 的带宽总和;
- BW 字段后面的数字:该 monitor 统计的所有模块的读和写的带宽之和,括号中的数字表示该通道所有模块的读和写的带宽占实际中的带宽的百分比;
- RD_BW 字段后面的数字:该 monitor 统计的所有模块的读的带宽之和,括号中的数字表示该通道所有模块的读的带宽占实际中的带宽的百分比;
- WR_BW 字段后面的数字:该 monitor 统计的所有模块的写的带宽之和,括号中的数字表示该通道所有模块的写的带宽占实际中的带宽的百分比.
需要注意的问题
- 注意在不使用的时候需要卸载 ax_perf_monitor.ko,否则该 ko 会造成系统的模块功耗增加,原因是打开带宽统计功能后,monitor 模块工作以及软件的开销都会造成功耗增加;
- ax_perf_monitor 有打开关闭的 enable 节点,默认处于打开状态,可通过
echo 0 > /proc/ax_proc/bw/enable命令关闭,也可通过echo 1 > /proc/ax_proc/bw/enable再次打开; - bw_period 的统计周期需要在 100ms 和 2000ms 之间(包含 100ms 和 2000ms)。
声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
红包
1
收藏
评论
打赏
- 分享
- 举报
评论
1个
手气红包
-
david 2024-06-13 01:17:07回复 举报需要650N的PCIE算力卡-
圈圈虫 回复 david 2024-07-09 15:58:20回复 举报已有各种花式的算力卡,在 WAIC2024 的展会上展出了
-
相关专栏
-
浏览量:3708次2022-07-03 00:53:51
-
浏览量:5985次2022-03-31 11:34:19
-
2025-09-15 15:46:42
-
浏览量:3185次2023-12-08 19:59:30
-
浏览量:1406次2025-04-15 17:54:05
-
浏览量:1788次2024-01-10 14:39:54
-
浏览量:4093次2022-04-01 14:30:05
-
2022-04-01 14:34:37
-
浏览量:9855次2022-03-23 10:50:32
-
浏览量:461次2025-09-15 14:53:57
-
浏览量:3464次2022-08-02 09:49:57
-
浏览量:4090次2022-09-03 09:01:25
-
浏览量:1441次2022-09-03 09:01:27
-
浏览量:3504次2024-12-08 20:11:51
-
2025-09-06 19:29:31
-
浏览量:2452次2024-01-10 15:17:17
-
浏览量:3505次2022-08-05 10:18:56
-
浏览量:1583次2024-01-16 18:03:56
-
浏览量:6220次2021-05-11 17:35:27
切换马甲
上一页
下一页
TA最新文章
打赏用户
共 0 位
我要创作
分享技术经验,可获取创作收益
热门专栏
- 生产线的AI智能化难点在如何融进柔性生产!本文为你介绍一种思路
- 【爱芯元智】【AX650】【系统】如何修改 CMM 大小
- 【爱芯元智】【NPU】【解决方案】AX-Samples
- 【爱芯元智】【NPU】【解决方案】爱芯元智 NPU 初学者必看,少走弯路,提高效率(不定期更新)
- 【人才招聘】爱芯元智,期待您的加入!!!
- 爱芯元智入选GTIC 2022中国AI芯片企业50强 展现中国创新力量
- 爱芯元智亮相ICDIA 2022,解读AI视觉感知芯片如何带来消费领域新体验
- 爱芯力量 | 爱芯元智影像的专用芯片AX170A已成功进入消费领域,全面提升手机拍摄体验
- AX630A开发板的学习分享
- 【爱芯元智】【AX650】【解决方案】M.2算力卡简介
置顶时间设置
结束时间
删除原因
-
广告/SPAM
-
恶意灌水
-
违规内容
-
文不对题
-
重复发帖
打赏作者
圈圈虫
您的支持将鼓励我继续创作!
打赏金额:
¥1
¥5
¥10
¥50
¥100
支付方式:
微信支付
举报反馈
举报类型
- 内容涉黄/赌/毒
- 内容侵权/抄袭
- 政治相关
- 涉嫌广告
- 侮辱谩骂
- 其他
详细说明
审核成功
发布时间设置
发布时间:
请选择发布时间设置
是否关联周任务-专栏模块
审核失败
失败原因
请选择失败原因
备注
请输入备注

微信扫码分享
QQ好友