AVDataProcess/README.md

180 lines
6.4 KiB
Markdown
Raw Normal View History

# 视音频数据处理入门
<br>
<br>
## 准备
2017-10-17 01:56:00 +00:00
yuv视频下载
>http://trace.eas.asu.edu/yuv/
2017-10-17 01:56:00 +00:00
yuv播放器[修改了一个YUV/RGB播放器](http://blog.csdn.net/leixiaohua1020/article/details/50466201)
>注意:<br />
>本文中像素的采样位数一律为8bit。由于1Byte=8bit所以一个像素的一个分量的采样值占用1Byte。<br />
>输出的U、V分量在YUV播放器中也是当做Y分量进行播放的。<br />
2017-10-17 06:33:08 +00:00
<br>
<br>
## 分离YUV420P像素数据中的Y、U、V分量
> 如果视频帧的宽和高分别为w和h那么一帧YUV420P像素数据一共占用w*h*3/2 Byte的数据。其中前w * h Byte存储Y接着的w * h * 1/4 Byte存储U最后w * h * 1/4 Byte存储V。
2017-10-18 01:34:03 +00:00
yuv420p像素数据排列如下图。原图像分辨率为256 * 256所以Y分量分辨率为256 * 256U分量分辨率为128 * 128V分量分辨率为128 * 128
![](./images/yuv420p_data.png)
2017-10-17 06:33:08 +00:00
yuv420_split.cpp 程序中的函数可以将YUV420P数据中的Y、U、V三个分量分离开来并保存成三个文件。
调用方法:
> ./yuv420_split ./mediadata/lena_256x256_yuv420p.yuv 256 256
2017-10-17 06:33:08 +00:00
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件分离成为三个文件
- output_420_y.y纯Y数据分辨率为**256x256**。注意播放时设置播放器分辨率。
- output_420_u.y纯U数据分辨率为**128x128**。注意播放时设置播放器分辨率。
- output_420_v.y纯V数据分辨率为**128x128**。注意播放时设置播放器分辨率。
<br />
<br />
## 分离YUV444P像素数据中的Y、U、V分量
> 说明如果视频帧的宽和高分别为w和h那么一帧YUV444P像素数据一共占用w * h * 3 Byte的数据。其中前w * h Byte存储Y接着的w * h Byte存储U最后w * h Byte存储V。
调用方法:
> ./yuv444p_split ./mediadata/lena_256x256_yuv444p.yuv 256 256
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv444p.yuv的YUV444P格式的像素数据文件分离成为三个文件
- output_444_y.y纯Y数据分辨率为**256x256**。
- output_444_u.y纯U数据分辨率为**256x256**。
- output_444_v.y纯V数据分辨率为**256x256**。
2017-10-17 01:56:00 +00:00
<br />
<br />
## 分离YUV422P像素数据中的Y、U、V分量还有问题图像显示不完整
> 说明对于YUV422P的格式表示平面格式(Planar)即Y、U、V是分开存储的每个分量占一块地方其中Y为width * height而U、V合占width * height。根据U、V的顺序分出2种格式U前V后即YUV422P也叫I422V前U后叫YV16(YV表示Y后面跟着V16表示16bit)。
调用方法:
> ./yuv422p_split ./mediadata/lena_256x256_yuv422p.yuv 256 256
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv422p.yuv的YUV422P格式的像素数据文件分离成为三个文件
- output_422p_y.y纯Y数据分辨率为**256x256**。
- output_422p_u.y纯U数据分辨率为**128x128**。
- output_422p_v.y纯V数据分辨率为**128x128**。
<br />
<br />
## 将YUV420P像素数据去掉颜色变成灰度图
>说明如果想把YUV格式像素数据变成灰度图像只需要将U、V分量设置成128即可。这是因为U、V是图像中的经过偏置处理的色度分量。色度分量在偏置处理前的取值范围是-128至127这时候的无色对应的是“0”值。经过偏置后色度分量取值变成了0至255因而此时的无色对应的就是128了。
调用方法:
> ./yuv420p_gray ./mediadata/lena_256x256_yuv420p.yuv 256 256
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_gray.yuv的YUV420P格式的像素数据文件。
<br />
<br />
## 将YUV420P像素数据的周围加上边框
> 说明本程序将距离图像边缘border范围内的像素的Y分量、U分量、Y分量的取值设置成了最大值255。
调用方法:
> ./yuv420p_border ./mediadata/lena_256x256_yuv420p.yuv 256 256 30
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_border.yuv的YUV420P格式的像素数据文件。输入的原图如下所示。
![](./images/yuv420p.png) ![](./images/yuv420p_border.png)
<br />
<br />
2017-10-18 02:13:48 +00:00
## 将YUV420P像素数据的亮度减半
>说明如果打算将图像的亮度减半只要将图像的每个像素的Y值取出来分别进行除以2的工作就可以了。图像的每个Y值占用1 Byte取值范围是0至255对应C语言中的unsigned char数据类型。
调用方法:
> ./yuv420p_half_y ./mediadata/lena_256x256_yuv420p.yuv 256 256
上述代码运行后将会把一张分辨率为256x256的名称为lena_256x256_yuv420p.yuv的YUV420P格式的像素数据文件处理成名称为output_420p_half_y.yuv的YUV420P格式的像素数据文件。
<br />
<br />
## 分离RGB24像素数据中的R、G、B分量
> 说明与YUV420P三个分量分开存储不同RGB24格式的每个像素的三个分量是连续存储的。一帧宽高分别为w、h的RGB24图像一共占用w * h * 3 Byte的存储空间。RGB24格式规定首先存储第一个像素的R、G、B然后存储第二个像素的R、G、B…以此类推。类似于YUV420P的存储方式称为Planar方式而类似于RGB24的存储方式称为Packed方式。
调用方法:
> ./rgb24_split ./mediadata/cie1931_500x500.rgb 500 500
上述代码运行后将会把一张分辨率为500x500的名称为cie1931_500x500.rgb的RGB24格式的像素数据文件分离成为三个文件
- output_r.yR数据分辨率为**500x500**。
- output_g.yG数据分辨率为**500x500**。
- output_b.yB数据分辨率为**500x500**。
输入的原图是一张标准的CIE 1931色度图。该色度图右下为红色上方为绿色左下为蓝色如下图所示
![](./images/cie1931_500x500.png)
R数据图像如图所示 ![](./images/cie1931_500x500_r.png)
G数据图像如图所示 ![](./images/cie1931_500x500_g.png)
B数据图像如图所示 ![](./images/cie1931_500x500_b.png)
<br />
<br />
2017-10-17 01:56:00 +00:00
参考:[视音频数据处理入门RGB、YUV像素数据处理](http://blog.csdn.net/leixiaohua1020/article/details/50534150)
![](./images/leixiaohua_avDataProcess.png)