读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章

2021/10/1 17:10:55

本文主要是介绍读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!

        第一卷 第二章 内容总结

        这一章叫做图像基础。对于图像和NumPy有了解的读者可以直接跳过这一章。

        这一章主要介绍了图像的一些基本知识、基本属性等;如何访问图像,表示图像;讨论图像的纵横比及其在准备用于训练神经网络的图像数据集时的关系。

        简单说一下内容:

        1、图像由像素组成,深度学习关心的图像或者是彩色,或者是灰度图,所以其它色彩空间的图像不讨论。

该图像宽1000像素,高750像素,总共1000 * 750=750000个像素

         2、图像的通道,在RGB颜色空间中表示图像,其中每个通道都是一个独立的矩阵,组合后形成最终图像。

        3、图像坐标系

放置在方格纸上的字母“I”。像素通过它们的(x,y)坐标访问,我们向右移动x列,向下移动y行,记住Python是零索引的。

         4、图像转Numpy数组

# 读取并显示一张图片
import cv2
image = cv2.imread("example.png")
print(image.shape)
cv2.imshow("Image", image)
cv2.waitKey(0)

# 读取图片的坐标上的rgb值
(b, g, r) = image[20, 100] # accesses pixel at x=100, y=20
(b, g, r) = image[75, 25] # accesses pixel at x=25, y=75
(b, g, r) = image[90, 85] # accesses pixel at x=85, y=90

         5、BGR和RGB的顺序,OpenCV的库读取图像的顺必须是BGR。

        6、又讲了一下保持纵横比图像的缩放、不保持纵横比的缩放、以及裁剪等。

 

 



这篇关于读书笔记《Deep Learning for Computer Vision with Python》- 第一卷 - 第3章的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!


扫一扫关注最新编程教程