图像处理101教程:什么是图像?

翻译|使用教程|编辑:黄竹雯|2019-06-17 12:32:20.013|阅读 21 次

概述:本文是我们Image Processing 101(图像处理101)系列教程的一部分。

相关链接:

本文是我们Image Processing 101(图像处理101)系列教程的一部分。

图像处理和计算机视觉是计算机科学的热门趋势,由于其广泛的应用和乐观的发展前景,所以继续显示出未来的强劲势头。在该系列教程的第一篇文章中,我们将通过查看图像是什么以及如何存储图像来介绍图像处理的基础知识。

数字图像可以在计算机上显示和处理,并可根据其特征分为两大类:位图矢量图像

位图基于通常由数字阵列表示的像素图案。BMP,PNG,JPG和GIF都是位图。

Dynamsoft图标

矢量图像具有无限可伸缩性,并且没有任何像素,因为它们使用数学公式绘制线条和曲线。尺寸为M×N的位图图像由M行和N列的有限元组成。每个元素都有一个特定的位置和幅度,代表该位置的信息,如灰度和颜色。这些元素称为图像元素或像素。

色彩空间

根据每个像素表示的信息,图像可以分为二进制图像灰度图像RGB图像索引图像等。

1. 二进制图像

在二进制图像中,像素值由0或1表示。通常,0表示黑色,1表示白色。

2. 灰度图像

灰度图像在二值图像中添加黑色和白色之间的颜色深度以形成灰度图像。这些图像通常显示为从最暗的黑色到最亮的白色的灰度,并且每种颜色深度称为灰度,通常用L表示。在灰度图像中,像素可以取0到L-1之间的整数值。

3. RGB图像

在RGB或彩色图像中,每个像素的信息需要一个数字数组来表示。所以我们需要一个三维矩阵来表示图像。自然界中几乎所有颜色都可以由三种颜色组成:红色(R),绿色(G)和蓝色(B)。因此,每个像素可以由RGB图像中的红色/绿色/蓝色数组表示。

4. 索引图像

索引图像由色图矩阵组成,该矩阵使用数组中像素值的直接映射到色彩映射值。通过使用相应的值确定图像中每个像素的颜色。我们在下面会更详细地讨论这个问题。

图像如何存储在内存中

x86硬件没有访问多维数组元素的寻址模式。当将图像加载到存储空间中时,多维对象被转换为一维数组。通常使用行主要排序或列主要排序。

行主要排序

C / C ++和Python采用行主要排序。它从第一行开始,然后将第二行连接到它的结尾,然后连接第三行,等等。这意味着在行主要布局中,最后一个索引是最快的变化。在矩阵的情况下,最后一个索引是列。

对于灰度图像,我们可以使用矩阵来表示每个像素的灰度级。以4 * 4图像为例。

行和列的像素:

[0,0][0,1][0,2][0,3]
[1,0][1,1][1,2][1,3]
[2,0][2,1][2,2][2,3]
[3,0][3,1][3,2][3,3]

内存

5555555555555.jpg

对于彩色图像,我们需要多维数组来存储图像信息。

multi-dimension-mapping.png

列主要排序

在多维数组的行主要布局中,第一个索引是变化最快的。以下就是一个例子。

图像A有6个像素:

A[0][0]A[0][1]A[0][2]
A[1][0]A[1][1]A[1][2]

使用行主要排序,连续的内存地址将按如下方式分配:

Address(地址)Access(访问)
0A[0][0]
1A[0][1]
2A[0][2]
3A[1][0]
4A[1][1]
5A[1][2]

使用列主要排序,连续的内存地址将按如下方式分配:

Address(地址)Access(访问)
0A[0][0]
1A[1][0]
2A[0][1]
3A[1][1]
4A[0][2]
5A[1][2]

图像如何存储在文件中

真彩色(24位)

24位图像通常使用R,G和B中的每一个的8位。对于三种基色中的每一种,如灰度级,L级可以用于指示存在多少这种颜色分量。例如,对于256级的红色,0表示没有红色,255表示100%红色。同样,绿色和蓝色可分为256级。每种基色可以用8位二进制数据表示,因此总共3种基色需要24位。

未压缩的原始BMP文件是使用RGB标准存储的RGB图像。

索引颜色

对于高度和宽度为200像素和16种颜色的彩色图像,每个像素由RGB的三个分量表示。因此,每个像素由3个字节表示,整个图像为 200×200×3 = 120KB。由于彩色图像中只有16种颜色,因此可以使用颜色表(16×3二维数组)保存这16种颜色的RGB值。我们将在下面进一步详细讨论。数组中的每个元素都代表一种颜色,由其在数组中的位置索引。图像像素不包含其颜色的完整规范,但仅包含表中的索引。例如,如果颜色表中的第三个元素是0xAA1111,那么颜色为0xAA1111的所有像素都可以用“2”表示(颜色表索引下标从0开始)。这样,每个像素只需要4位(0.5字节),所以整个图像可以存储在200×200×0.5 = 20 KB。上面提到的颜色表是调色板,它通常也称为查找表(LUT)。

GIF是支持索引颜色模式的最具代表性的图像文件格式。

logo.gif

还有许多其他图像格式和存储方式,我们暂时不做详细了。下一篇中,我们将介绍颜色模型相关内容。



标签:

本站文章除注明转载外,均为本站原创或翻译。欢迎任何形式的转载,但请务必注明出处,尊重他人劳动成果

登录慧都网发表评论登录


暂无评论...

为你推荐

  • 推荐视频
  • 推荐活动
  • 推荐产品
  • 推荐文章
  • 慧都慧问
相关厂商
相关产品
Dynamsoft Barcode Reader

Dynamsoft Barcode Reader SDK是一款多功能的条码读取控件。

Dynamsoft Camera SDK

为你的应用程序提供支持,将iPhone或Android手机变成文档扫描仪

在线客服 在线QQ 电话咨询
400-700-1020
在线客服系统
live chat