目录
1 OpenCV介绍
1.1 OpenCV优势
1.2 OpenCV-Python
2 环境安装
3 图像表示
4 图像存储
4.1 彩色图像
5 基本图像操作
5.1 创建窗体
5.2 读取图像
5.3 显示图像
5.4 保存图像
5.5 创建黑白图像
5.6 图像切片(图片剪裁)
5.7 图像大小调整
6 图像绘制
6.1 绘制直线
6.2 绘制圆形
6.3 绘制矩形
6.4 绘制文本(向图片中添加文字)
6.5 读取视频
OpenCV(开放源代码计算机视觉库)是一个开源的计算机视觉和机器学习软件库。由一系列 C++ 类和函数构成,用于图像处理、计算机视觉领域的算法实现。
开源免费、多语言支持、跨平台、丰富API
OpenCV-Python使用Numpy,这是一个高度优化的数据库操作库。所有OpenCV数组结构都转换为Numpy数组。这也使得与使用Numpy的其他库(如SciPy和Matplotlib)集成更容易。
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple opencv-python
分类 | 详细信息 |
---|---|
像素定义 | 图像的基本单元,存储颜色、亮度和其他特征;一系列像素组合形成完整图像,在计算机中以像素形式存在,采用二进制格式存储,根据图像颜色不同,每个像素用不同二进制数表示。 |
编码方式 | 计算机采用 0/1 编码系统,数字图像利用 0/1 记录信息;平常接触的图像多为 8 位数图像,opencv 常用 8 位图像,大多数彩色和灰度图像每个通道像素值用 8 位表示,范围 0 - 255,其中 0 代表最黑,255 表示最白。 |
RGB图像 | 日常生活常见的图像类型,每个点由红(R)、绿(G)、蓝(B)三个颜色按比例混合而成;在计算机中,RGB 称为三通道,每个通道取值 0 - 255,通过三个通道存储的像素值对应不同颜色。 |
在OpenCV中,无论是读取还是创建图像,结果都是一个NumPy数组。
图像 | 说明 |
---|---|
形状(Shape) | 由图像的高(height)、宽(width)和通道数(channels)决定,可通过img.shape 属性获取。- 彩色图像(如 RGB):返回包含三个值的元组 (height, width, channels)。 - 灰度图像:返回包含两个值的元组 (height, width),因为只有一个通道。 |
数据类型(dtype) | 图像中每个像素值的数据类型决定可存储的最大值,如 8 位无符号整数(uint8)允许范围是 0 到 255。 |
像素表示 |
|
由于每一像素的颜色需由R、G、B三个分量来表示,M、N分别表示图像的行列数,三个M x N的二维矩阵分别表示各个像素的R、G、B三个颜色分量。RGB图像的数据类型一般为8位无符号整形,通常用于表示和存放彩色图像。
案例:
生成一个512*512大小的彩色图片 每一个像素点随机颜色
import cv2
import numpy as np
# 设置图像尺寸
height, width = 512, 512
# 创建一个空白的彩色图像
img = np.zeros((height, width, 3), dtype=np.uint8)
# 修改像素值
img[::] = np.random.randint(0, 256, img.shape)
# 显示图像
cv2.imshow('Random Color Image', img)
cv2.waitKey(0)
cv2.destroyAllWindows()
语法:
cv2.namedWindow(winname [,窗口属性])
参数:
参数名 | 说明 |
---|---|
winname | 窗口名 |
窗口属性:窗口大小是否可调整 |
|
案例:
import cv2 as cv
# 创建一个名为 "MyWindow" 的窗口,窗口大小不可调整
cv.namedWindow("MyWindow", cv2.WINDOW_AUTOSIZE)
# 如果你想让窗口大小可调整,可以使用 WINDOW_NORMAL
cv.namedWindow("MyResizableWindow", cv2.WINDOW_NORMAL)
语法:
**cv2.imread(path [,读取方式])
参数:filename:图像路径
读取方式:彩色·默认、灰色等
案例:
import cv2 as cv
path="./images/001.jpg"
img=cv.imread(path,cv.IMREAD_COLOR)
## 为什么读取的图像没有显示出来呢?
print(img)
print(type(img))
print(img.shape)
说明:
./
表示当前目录。
../
表示当前目录的上一级目录(即父目录)。当你需要引用或访问当前目录所在位置的上一层目录中的文件或文件夹时使用 ../
。
语法:
cv2.imshow(winname,img)
参数:
注意:
在调用显示图像的API后,要调用cv2.waitKey(0)给图像绘制留下时间,否则窗口会出现无响应情况,并且图像无法显示出来。
cv.waitKey(0):表示无限期地等待任何键盘按键。这种用法常见于图像显示窗口中,确保图像在窗口中显示直到用户决定关闭它。
cv.waitKey(n):n>0,意味着程序将等待n毫秒。这种方式常用于视频播放或实时摄像头捕获场景,以便控制每一帧停留的时间,同时允许用户通过按键来中断循环或发出命令。
cv2.destroyAllWindows([winname])
cv2.destroyAllWindows()
:会在当前程序执行到该语句时立即销毁打开的窗口,并释放与这些窗口相关的资源。
winname
:窗口名,关闭指定名称的窗口。可省略,销毁所有已打开的窗口。
案例:
import cv2 as cv
path="./images/001.jpg"
img=cv.imread(path,cv.IMREAD_COLOR)
cv.imshow("img",img)
cv.waitKey(0)
# cv.waitKey(1000)
cv.destroyAllWindows()
语法:
cv2.imwrite(path,img)
参数:
path:图片保存的路径和图片名
img:要保存的图像
案例:
import cv2 as cv
path="./images/001.jpg"
img=cv.imread(path,cv.IMREAD_GRAYSCALE)
cv.imshow("img",img)
cv.imwrite("./images/002.jpg",img)
img2=cv.imread("./images/002.jpg")
cv.imshow("img2",img2)
cv.waitKey(0)
cv.destroyAllWindows()
语法:
numpy.zeros((height,width,channels),dtype=np. uint8)
案例:
import numpy as np
import cv2
# 定义图像的宽度和高度(以像素为单位)
height = 500
width = 500
# 使用np.zeros创建一个空白图像
blank_image = np.zeros((height, width, 3), dtype=np.uint8)
cv2.imshow('Blan_Image', blank_image)
# 下面的例子是创建一个白色的图像:
blank_image[:,:,:] = 255
# 创建窗口并显示图像
cv2.imshow('White_Image', blank_image)
cv2.waitKey(0) # 等待按键事件
cv2.destroyAllWindows() # 关闭所有窗口
用途:从图像中提取一个子区域(矩形区域)。
说明:
假设你有一个图像img
,它的类型是numpy.ndarray
。img[y:y+h,x:x+w]
的含义如下:
x:子区域左上角的x坐标
y:子区域左上角的y坐标
w:子区域的宽度
h:子区域的高度
切片操作:
img[y:y+h,x:x+w]提取的是从`(x,y)`开始,高度为`h`,宽度为`w`的矩形区域
案例:
import numpy as np
import cv2 as cv
# 读取图像
img=cv.imread("images/001.jpg")
h,w,c=img.shape
print(img.shape)
# 定义剪裁后图像的宽度和高度(以像素为单位)
h = 300
w = 500
# 定义剪裁的起始点,坐标小于图片的宽高
y=100
x=200
# 剪裁
img2=img[y:y+h,x:x+w]
print(img2.shape)
cv.imshow("img",img)
cv.imshow("img2",img2)
cv.waitKey(0) # 等待按键事件
cv.destroyAllWindows() # 关闭所有窗口
注意:
边界检查:确保(y,x)
和(y+h,x+w)
都在图像的边界内,否则会出现索引越界错误。
数据类型:img
通常是numpy.ndarray
类型,切片操作返回的也是numpy.ndarray
类型。
语法:
cv2.resize(img,dsize,dts)
参数:
参数名 | 说明 |
---|---|
img | 输入图像,通常是二维或三位NumPy数组。 |
dsize | 输出图像的尺寸,是一个二元组(w,h) , |
dst | 缩放后的图像 |
用途:用于调整图像大小的函数,在图像处理中很常用,特别是在要对图像进行缩放以适应不同需求时。
案例:
import cv2 as cv
# 读取图片
img=cv.imread("images/001.jpg")
print(img.shape)
# 获取原图高和宽,(h,w,c)
size=img.shape[:2]
print(size)
cv.imshow("old",img)
dsize=(100,200)
new_img=cv.resize(img,dsize)
print(new_img.shape)
cv.imshow("new",new_img)
cv.waitKey(0)
cv.destroyAllWindows()
语法:
cv2.line(img,sart,end,color,thickness)
参数:
参数名 | 说明 |
---|---|
img | 要绘制直线的图像 |
start、end | 直线的起点和终点 |
color | 直线的颜色(对于彩色图像,使用 BGR 格式指定颜色) |
thickness | 线条宽度 |
案例:
import cv2 as cv
cat = cv.imread("images/640.jpeg")
# 绘制直线:cv2.line(图像,起点,终点,颜色,线条粗细)(w,h)
cv.line(cat,(200,100),(400,100),(255,0,0),2)
cv.imshow("cat",cat)
cv.waitKey(0)
cv.destroyAllWindows()
输出:
语法:
cv2.circle(img,centerpoint,r,color,thickness)
参数:
参数名 | 说明 |
---|---|
img | 要绘制圆形的图片 |
centerpoint、r | 圆心和半径 |
color | 线条颜色 |
tnickness | 线条宽度,为-1时生成闭合图案并填充颜色 |
案例:
import cv2 as cv
cat = cv.imread("images/640.jpeg")
# 绘制圆形:cv2.circle(图像,圆心坐标,半径,颜色,线条粗细(-1则填充为必和图形))
cv.circle(cat,(300,300),100,(0,255,0),2,cv.LINE_AA)
cv.imshow("cat",cat)
cv.waitKey(0)
cv.destroyAllWindows()
输出:
语法:
cv2.rectangle(img,leftupper,rightdown,color,thickness)
参数:
参数名 | 说明 |
---|---|
img | 要绘制矩形的图像 |
leftupper、rightdown | 矩形的左上角和右下角坐标 |
color | 线条的颜色 |
thickness | 线条的宽度 |
案例:
import cv2 as cv
cat = cv.imread("images/640.jpeg")
# 绘制矩形:cv2.rectangle(图像,左上坐标,右下坐标,颜色,线条粗细)
cv.rectangle(cat,(200,420),(500,600),(0,0,255),2)
cv.imshow("cat",cat)
cv.waitKey(0)
cv.destroyAllWindows()
输出:
语法:
cv2.putText(img,text,station,font,Fontscale,color,thickness,cv2.LINE_AA)
参数:
参数名 | 说明 |
---|---|
img | 要添加文字的图像 |
text | 要写入的文本数据 |
station | 文本的放置位置 |
font | 字体样式 |
Fontscale | 字体大小 |
thickness | 字体线条宽度 |
cv2.LINE_AA | 使用反走样技术绘制文本边框
|
案例:
import cv2 as cv
cat = cv.imread("images/640.jpeg")
# 向图像里面添加文字:cv2.putText(图像,文本,位置,字体样式,大小,颜色,线条粗细)
cv.putText(cat,"hello Wendy",(400,300),cv.FONT_ITALIC,3,(255,0,0),2,cv.LINE_AA)
cv.imshow("cat",cat)
cv.waitKey(0)
cv.destroyAllWindows()
输出:
语法:
cap = cv2.VideoCapture(path)
参数:
path:视频流资源路径设置为0,代表从默认摄像头捕获视频流
说明:
返回值cap调用read()方法得到一个布尔值和一帧图像,布尔值表示是否成功读取到帧,如果为False,可能是因为视频结束或读取失败,如果为True,frame则是当前帧的图像数据。
案例1,捕获摄像头的实时视频流 :
import cv2 as cv
# 创建VideoCapture对象,参数为摄像头索引(通常为0,如果为单一摄像头)
cap=cv.VideoCapture(0)
while True:
ret,frame=cap.read()
if not ret:
print("error")
break
cv.imshow("frame",frame)
# 等待40毫秒并检查按键事件,获取按键的ASCII码,判断按键是否为q键
if cv.waitKey(40) & 0xFF==ord('q'):
break
cap.release()# 释放摄像头资源
cv.destroyAllWindows()
案例2,读取视频文件:
import cv2 as cv
# 创建VideoCapture对象
cap=cv.VideoCapture('./images/视频1.mp4')
while True:
ret,frame=cap.read()
if not ret:
print("error")
break
cv.imshow("frame",frame)
# 等待40毫秒并检查按键事件,获取按键的ASCII码,判断按键是否为q键
if cv.waitKey(40) & 0xFF==ord('q'):
break
cap.release()
cv.destroyAllWindows()