音视频基础及海思sample_venc解读

音视频基础及海思sample_venc解读   近 2024-02-22 15:52:02 464

文章目录

1、sample的整体架构

(1)sample其实是很多个例程,所以有很多个main

(2)每一个例程面向一个典型应用,common是通用性主体函数,我们只分析venc

(3)基本的架构是:venc中的main调用venc中的功能函数,再调用common中的功能函数,再调用mpp中的API,再调用HI3518E内部的硬件单元。

(4)sample的配置和编译,重点注意很多环境变量,目录结构不要乱动。

2、sample代码学习的关键

(1)得理解很多基础概念,譬如图像采集原理、模拟数字、通道、绑定、组、视频缓冲池、在线/离线模式等等

(2)得从宏观上理解整个视频采集、内部传递、处理、编码输出、网络传输等的过程。

(3)得反复看代码,熟才能生巧,才能帮助理解整个代码。

(4)得查阅mpp手册,熟悉海思这一套API的规矩和一般用法。

3、sample_venc的大体分析

(1)从main入手,main的传参分析

(2)几个重要的基本概念:

H.264 H.265 MJPEG 视频编码规范标准

1080P、720P、VGA、D1 视频分辨率(清晰度)

fps(frame per second) 帧率:每秒多少帧

4、图像像素格式深度理解

4.1 颜色的学问

(1)颜色是主观还是客观存在?是主观存在的,颜色的本质是光的波长,这些不同波长的光映射到人的眼中就成了不同的颜色,正因为有人去看才有了颜色这个概念

(2)颜色的三个关键:亮度、色度、饱和度

(3)人的眼睛并非理想完美的颜色识别器件,图像表达也有清晰度和质量高低的差异

(4)科学研究如何定义(或者表达、记录、计算)一种颜色?色彩空间的概念

色彩空间:如何用数字表达一种颜色,例如rgb888,rgb565等

4.2 rawRGB和图像采集过程

(1)图像采集的过程:光照在成像物体被反射->镜头汇聚->Sensor光电转换->ADC为rawRGB

光照到成像物体上被反射到镜头汇聚起来传到焦点,Sensor就在焦点处,Sensor是一个平面,被分成很多区域,每一个最小区域就是一个像素,这一路像素就是一路单独的光电转换器,转出来的电信号是一个模拟值,光照到每个像素上就生成了这个像素的模拟电压。

Sensor有个参数叫做分辨率,或者说叫做像素个数,比如买手机时经常说多少w像素,指的就是这里的意思。

这些模拟电信号再由ADC转换成数字的电信号(rawRGB)

(2)sensor上每个像素只采集一种颜色的光,因此sensor每个像素只能为R或G或B

也就是说手机摄像头上一个像素点是rgb的一个颜色。

而手机的LCD显示屏,一个像素点里面有三个小灯,rgb。

也就是说光电转换只能转换一种颜色分量,不可能一个点转换R、G、B三种分量。

(3)rawRGB和RGB都是用来描述图像的,图像采集时RGB是由rawRGB计算而来的

由rawRGB进行联合附近的分量进行加权平均计算得到RGB

(4)因为图像颜色本身有一定连贯性,而且人眼是非理想的,因此图像采集和再显示给人这整个构成中有三个要素:sensor分辨率、pitch(两个像素点中心的距离)、观看距离

(5)如果是视频,质量好坏还要加上帧率framerate

(6)图像的表达、压缩、修整等相关技术,就发生在rawRGB进来以后的各个环节

表达:rgb565、rgb888、1080p等

压缩:bmp、jpg、png等

修整:锐化、曝光等

5、RGB和YUV详解

5.1 RGB方式表示颜色

(1)RGB有RGB565和RGB888,ARGB等多种子分类

(2)RGB的本质:将色度分解为R、G、B三部分,然后记录下亮度数据,也就是说RGB没有记录颜色的色度,色度是固定的红绿蓝。

(3)RGB的优势:方便数字化表达,广泛用于数字化彩色显示器,计算机编程等领域。

(4)RGB的劣势:和传统的灰度图兼容不好,表达颜色的效率不高

灰度图只有亮度,没有颜色,而RGB又默认分解成三种基色,所以会兼容不好

5.2 YUV

(1)YUV是一种色彩空间,Y表示亮度,U和V表示色度。只有Y就是黑白图像,也就是灰度图,再加上UV就是彩色图像了。YUV的一个好处就是让彩色系统和传统黑白系统很好的兼容。

(2)YUV和RGB的相同点是:都是用来表达颜色的数学方法;不同点是:对颜色的描述思路和方法不同。RGB将一个颜色拆解为3个纯色的亮度组合,YUV将一个颜色分解为一个亮度和2个色度的组合。

(3)RGB和YUV之间可以用数学方法互相换算,是个典型的浮点运算过程。

(4)YUV和YCbCr几乎可以看做一个概念,详细的区分以后再去慢慢体会。

(5)YUV格式分为packed和planar两种。具体参考:http://blog.csdn.net/sunnylgz/article/details/7580628

(6)有多种YUV相关的概念需要弄清楚(以下均为planar格式)

YUV

YUV422(YUYV)

YUV420(YUV411)

YUV422 planar(YUV422P)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8][U1,U2,U3,U4][V1,V2,V3,V4]

YUV420 Planar(YUV420P)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8][U1,U2][V1,V2]

YUV422 semi planar(YUV422SP)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8][U1,V1][U2,V2][U3,V3][U4,V4]

YUV420 semi Planar(YUV420SP)

[Y1,Y2,Y3,Y4,Y5,Y6,Y7,Y8][U1,V1][U2,V2]

参考:http://blog.csdn.net/bingqingsuimeng/article/details/50716390
https://www.2cto.com/kf/201303/198023.html

6、海思MPP功能模块和视频缓存池

6.1 MPP功能模块框图

(1)找到MPP手册

麦克风声电转换AD转换采样-》AI音频输入并降噪-》AENC编码-》音频码流

音频码流-》ADEC解码-》AO音频输出-》喇叭放大

镜头-》Sensor光电转换得到模拟电信号-》AD转换得到rawRGB-》VI视频输入-》VPSS接收并输出多路分辨率不同的图像-》VENC编码成H.264码流

(2)详见系统概述1.3部分

6.2 sample中SAMPLE_VENC_1080P_CLASSIC函数开始看

(1)PAYLOAD_TYPE_E

(2)PIC_SIZE_E

(3)VB_CONF_S
7、视频缓存池
7.1、什么是视频缓冲池
(1)视频的本质是多帧图片,图片的本质是RGB或rawRGB数据,要占用一段连续内存

(2)视频的裁剪、缩放、修正处理(马赛克)等各种操作,本质上就是对内存中的数据进行运算

(3)视频缓存池(VB, video buffer)就是一段很大,又被合理划分和管理的内存,用来做视频数据的暂存和运算场地

(4)公共视频缓存池的公共2字,可以理解为全局变量,也就是各个模块都能访问的一段内存

(5)看似视频缓存块在各个模块之间流转,实际上并没有内存复制,而是指针在传递

(6)视频缓存池的内存由MPP来维护,我们在系统启动时就把整个SDRAM分成了2部分:系统部分(由linux kernel来维护管理)和mpp部分(由mpp系统来维护管理)

(7)缓存池需要几个,每个中包含几个缓存块,每个缓存块多大,都是可以由用户程序设置好参数,然后调用MPP的相应API来向MPP申请分配的。

7.2 相关的数据结构和API

(1)VB_CONF_S结构体

(2)HI_MPI_VB_SetConf
(3)HI_MPI_VB_Init

8、VI部分 知识要点

(1)常用Sensor的接口有三种:MIPI、LVDS、DC
(2)WDR宽动态:一副图像里面,局部曝光和其它地方是不一样的
(3)isp就是image signal process,图像信号处理。
(4)HI3518E内部的ISP单元是隶属于VI模块的。VI模块就包含3大部分:第一部分是和Sensor对接的部分(Sensor是什么接口的,mipi,dc等,怎么去操作),第二部分就是ISP,第三部分就是VI dev和channel
dev:就是用来采集图像的一个硬件单元

9、VPSS部分 知识要点

9.1 VPSS的手册部分解读

VI/VPSS 离/在线模式
VI 和 VPSS 的协作模式分为以下 2 种(模式切换由 load 脚本参数控制,对应 sys 模块参数 vi_vpss_online):

VI/VPSS 离线模式是指 VI 进行时序解析后将图像数据写出到 DDR,VPSS 从DDR 中载入 VI 采集的数据进行图像处理,是传统 Hi3518/Hi3520D 等芯片的VI/VPSS 的协作模式。

VI/VPSS 在线模式是指 VI 进行时序解析后直接在芯片内部将数据传递到 VPSS,中间无 DDR 写出的过程。在线模式可以省一定的带宽和内存,降低端到端的延时。需要注意的是,在线模式时,因为 VI 不写出数据到 DDR,无法进行CoverEx、OverlayEx、Rotate、LDC 等操作,需要在 VPSS 各通道写出后再进行Rotate/LDC 等处理,而且有些功能只在离线下能支持,比如 DIS。

总结:
离线模式:公共视频缓冲池-》VI模块处理缓冲池那一份-》复制到DDR-》VPSS处理DDR中的那一份
在线模式:公共视频缓冲池-》VI模块处理缓冲池那一份-》VI模块将缓冲池的指针传递给VPSS,VPSS处理缓冲池中的那一份

10、VENC部分 知识要点

有了以上,VENC部分代码就很简单

学习博文:
LCD常用接口:
https://blog.csdn.net/wocao1226/article/details/23870149

yuv格式:
http://blog.csdn.net/sunnylgz/article/details/7580628
http://blog.csdn.net/bingqingsuimeng/article/details/50716390
https://www.2cto.com/kf/201303/198023.html

图像编码原理:
http://blog.csdn.net/newchenxf/article/details/51693753

Qp:
http://blog.csdn.net/u013354805/article/details/51988171

VI、VPSS、VENC数据流向图

海思示例代码 函数调用关系

sample_venc.c
main
    SAMPLE_VENC_1080P_CLASSIC
        SAMPLE_COMM_VI_GetSizeBySensor(step1)        //获取Sensor采集图像的大小---》720P
        SAMPLE_COMM_SYS_CalcPicVbBlkSize            //计算缓冲块大小---》1280 * 768 * 1.5+HeaderSize        1.5是yuv420图像中一个像素的大小
            SAMPLE_COMM_SYS_GetPicSize        //获取Sensor图像的大小---》1280 * 720
            VB_PIC_HEADER_SIZE            //计算图像头的大小---》HeaderSize    
        SAMPLE_COMM_SYS_Init(step2)            //MPP系统初始化
            HI_MPI_SYS_Exit                //去除 MPP 系统。禁用一切模块
            HI_MPI_VB_Exit                //去除 MPP 视频缓存池
            HI_MPI_VB_SetConf                //设置 MPP 视频缓存池属性---》最大缓冲池个数为128,实际缓冲池个数为16,每个缓冲块的大小和个数
            HI_MPI_VB_Init                //初始化 MPP 视频缓存池
            HI_MPI_SYS_SetConf                //配置系统控制参数---》64字节对齐
            HI_MPI_SYS_Init                //初始化 MPP 系统
        SAMPLE_COMM_VI_StartVi(step3)            //启动vi dev & CHN进行捕获
            IsSensorInput                //传感器输入是 电视或Sensor
            SAMPLE_COMM_VI_StartIspAndVi        //启动Isp
                SAMPLE_COMM_VI_StartMIPI(1//mipi接口的配置---》3.3V
                    SAMPLE_COMM_VI_SetMipiAttr                //mipi接口的配置
                        fd = open("/dev/hi_mipi", O_RDWR);                //打开mipi的设备文件
                        ioctl(fd, HI_MIPI_SET_DEV_ATTR, pstcomboDevAttr)        //应用层操作Sensor的驱动,对Sensor做一些必要的初始化
                SAMPLE_COMM_ISP_Init(2//配置传感器和ISP(包括WDR宽动态模式)。  目的是启动3518e芯片内部的ISP单元
                    sensor_register_callback    //传感器寄存器回调
                    HI_MPI_AE_Register        //注册AE库,自动曝光
                    HI_MPI_AWB_Register    //注册AWB库,自动白平衡
                    HI_MPI_AF_Register        //注册AF库,自动对焦
                    HI_MPI_ISP_MemInit    //初始化 ISP 外部寄存器
                    HI_MPI_ISP_SetWDRMode    //设置 ISP 宽动态的模式---》不启用
                    HI_MPI_ISP_SetPubAttr    //配置 ISP 属性---》rawRGB的排列顺序---GRBG、帧率为30、图像区域的起始点、图像区域的宽和高
                    HI_MPI_ISP_Init        //初始化ISP系统
                SAMPLE_COMM_ISP_Run(3//运行isp线程  
                    pthread_create(&gs_IspPid, &attr, (void* (*)(void*))Test_ISP_Run, NULL)    //创建线程
                        Test_ISP_Run        //线程函数
                            HI_MPI_ISP_Run    //开始运行ISP系统
                SAMPLE_COMM_VI_StartDev(4//配置并打开Dev
                    HI_MPI_VI_SetDevAttr    //配置 Dev的属性---》接口模式为DC,单路工作方式,图像的扫描模式是逐行扫描,转换成yuv420,使用内部ISP,输入数据类型为RGB,不启用数据逆向
                    HI_MPI_ISP_GetWDRMode    //获取 ISP 宽动态模式
                    HI_MPI_VI_SetWDRAttr    //配置 WDR宽动态模式的 工作属性---》都不开启
                    HI_MPI_VI_EnableDev    //启用Dev
                SAMPLE_COMM_VI_StartChn(5//配置并打开通道chn(最多1个)
                    HI_MPI_VI_SetChnAttr    //设置 VI 通道chn属性---》通道支持的图像属性是720P,像素存储格式是yuv420sp,原始图像不镜像不翻转,不进行帧率控制,不压缩
                    HI_MPI_VI_SetRotate    //设置 VI 图像旋转属性--》图像从通道中出来后的旋转角度---不旋转
                    HI_MPI_VI_EnableChn    //启用通道chn            
        SAMPLE_COMM_SYS_GetPicSize(step4)        //获取Sensor图像的大小---》1280 * 720
        SAMPLE_COMM_VPSS_StartGroup            //启动VPSS的Group
            HI_MPI_VPSS_CreateGrp            //创建Group
            HI_MPI_VPSS_GetNRParam            //获取 vpss 3DNR 参数
            HI_MPI_VPSS_SetNRParam            //设置 vpss 3DNR 参数
            HI_MPI_VPSS_StartGrp            //启用Group
        SAMPLE_COMM_VI_BindVpss                //Group绑定VI模块中的Dev0中的chn0
            SAMPLE_COMM_VI_Mode2Param        //获取VI的参数---》是有1个Dev和chn
            HI_MPI_SYS_Bind                //VI通道chn0 绑定 vpss组Group0
        SAMPLE_COMM_VPSS_EnableChn            //在Group内部创建几路自己所用的chn
            HI_MPI_VPSS_SetChnAttr            //设置 VPSS 通道属性---》不进行帧率控制
            HI_MPI_VPSS_SetChnMode            //设置 VPSS 通道工作模式---》VPSS通道工作模式为USER模式,目标图像的像素格式是yuv420sp,目标图像的宽度是720,目标图像的高是1280,设置 256byte 段式压缩
            HI_MPI_VPSS_EnableChn            //打开chn
        SAMPLE_COMM_VENC_Start(step5)            //启动venc流模式(h264, mjpeg)  
            SAMPLE_COMM_SYS_GetPicSize        //获取Sensor图像的大小---》1280x720
            HI_MPI_VENC_CreateChn            //创建VENC chn---》编码通道的宽度是720、高度是1280,要编码的图片的宽度是720、高度是1280,流缓冲区的大小是1280x720,编码出的视频流的图像质量是高清还是啥啥,获取流的模式是切片模式,不支持B帧,设置码率控制模式:CBR、FIXQF、VBR,以及码率控制相关的参数;
            HI_MPI_VENC_StartRecvPic            //开始接收图片
        SAMPLE_COMM_VENC_BindVpss            //VENC的Dev绑定VPSS的chn
            HI_MPI_SYS_Bind                //VENC的Dev绑定VPSS的chn
        SAMPLE_COMM_VENC_StartGetStream(step6)        //获取流,然后将其保存到文件。 
            SAMPLE_COMM_VENC_GetVencStreamProc    //线程函数
                HI_MPI_VENC_GetChnAttr        //获取编码通道的编码属性。
                SAMPLE_COMM_VENC_GetFilePostfix    //获取文件名后缀--->.h.264
                HI_MPI_VENC_GetFd        //mpp内部把VENC编码好的视频流数据做成文件,然后把文件描述符通过这个API获取
                HI_MPI_VENC_Query        //查询编码通道状态---》判断当前这帧图像的码流包个数是否为0,为0则退出程序
                HI_MPI_VENC_GetStream        //获取编码码流。
                SAMPLE_COMM_VENC_SaveStream    //将帧保存到文件
                    SAMPLE_COMM_VENC_SaveH264
                        fwrite
                HI_MPI_VENC_ReleaseStream        //释放码流缓存。
        SAMPLE_COMM_VENC_StopGetStream(step7)        //退出程序
声明:本文内容由易百纳平台入驻作者撰写,文章观点仅代表作者本人,不代表易百纳立场。如有内容侵权或者其他问题,请联系本站进行删除。
  近
红包 点赞 收藏 评论 打赏
评论
0个
内容存在敏感词
手气红包
    易百纳技术社区暂无数据
相关专栏
置顶时间设置
结束时间
删除原因
  • 广告/SPAM
  • 恶意灌水
  • 违规内容
  • 文不对题
  • 重复发帖
打赏作者
易百纳技术社区
  近
您的支持将鼓励我继续创作!
打赏金额:
¥1易百纳技术社区
¥5易百纳技术社区
¥10易百纳技术社区
¥50易百纳技术社区
¥100易百纳技术社区
支付方式:
微信支付
支付宝支付
易百纳技术社区微信支付
易百纳技术社区
打赏成功!

感谢您的打赏,如若您也想被打赏,可前往 发表专栏 哦~

举报反馈

举报类型

  • 内容涉黄/赌/毒
  • 内容侵权/抄袭
  • 政治相关
  • 涉嫌广告
  • 侮辱谩骂
  • 其他

详细说明

审核成功

发布时间设置
发布时间:
是否关联周任务-专栏模块

审核失败

失败原因
备注
拼手气红包 红包规则
祝福语
恭喜发财,大吉大利!
红包金额
红包最小金额不能低于5元
红包数量
红包数量范围10~50个
余额支付
当前余额:
可前往问答、专栏板块获取收益 去获取
取 消 确 定

小包子的红包

恭喜发财,大吉大利

已领取20/40,共1.6元 红包规则

    易百纳技术社区