案例-使用python实现基于opencv的图像拼接(合并)
2022/2/4 11:42:43
本文主要是介绍案例-使用python实现基于opencv的图像拼接(合并),对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
这是使用python实现的第二个综合性的案例了,希望自己能够坚持下去,也希望能够帮到有需要的朋友们。
图像拼接的的主要原理呢就是使用特征点匹配。简单点说呢,就是两幅图像中会有相同的部分,我们就是根据图像中相同的特征,进行图像的拼接,有些也被称为合并。
具体来说分为四个步骤:
- 读取文件并重置尺寸。读取文件大家都理解,之所以要重置尺寸呢就是因为如果两张图像的尺寸不同(img1是360p,img2是720p)会造成后续操作的不便捷。具体代码如下:
import cv2 import numpy as np #读取两张图片 img1 = cv2.imread("./img/airplane1.jpg") img2 = cv2.imread("./img/airplane2.jpg") if (img1 is None) or (img2 is None): print("路径问题") else: img1 = cv2.resize(img1,(430,480)) img2 = cv2.resize(img2,(430,480)) #把数据压到栈中 inputs = np.hstack((img1,img2)) cv2.imshow('input img',inputs) cv2.waitKey()
结果如图所示:
- 根据特征点和计算描述子,得到单应矩阵
这一步骤主要就是平时所学的特征点检测和匹配的基础知识的运用,具体的在代码中有详细的介绍,这里为了后期使用的方便,把获取单应性矩阵封装为一个函数,代码如下:
def get_homo(img1,img2): #创建特征转换对象 sift = cv2.xfeatures2d.SIFT_create() #获取特征点和描述子 k1,d1 = sift.detectAndCompute(img1,None) k2,d2 = sift.detectAndCompute(img2,None) #创建特征匹配器 bf = cv2.BFMatcher() #使用描述子进行一对多的描述子匹配 maches = bf.knnMatch(d1,d2,k=2) #筛选有效的特征描述子存入数组中 verify_matches = [] for m1,m2 in maches: if m1.distance <0.8*m2.distance: verify_matches.append(m1) #单应性矩阵需要最低四个特征描述子坐标点进行计算,判断数组中是否有足够,这里设为6更加充足 if len(verify_matches) > 6: #存放求取单应性矩阵所需的img1和img2的特征描述子坐标点 img1_pts = [] img2_pts = [] for m in verify_matches: #通过使用循环获取img1和img2图像优化后描述子所对应的特征点 img1_pts.append(k1[m.queryIdx].pt) img2_pts.append(k2[m.trainIdx].pt) #得到的坐标是[(x1,y1),(x2,y2),....] #计算需要的坐标格式:[[x1,y1],[x2,y2],....]所以需要转化 img1_pts = np.float(img1_pts).reshape(-1,1,2) img2_pts = np.float(img2_pts).reshape(-1,1,2) #计算单应性矩阵用来优化特征点 H,mask = cv2.findHomography(img1_pts,img2_pts,cv2.RANSAC,5.0) return H else: print("error")
- 根据单应性矩阵对图像进行变换,然后平移
4.图像拼接显示图像
两个步封装到一个函数中,方便调用调试,重点是在变换过程中存在的平移需要使用齐次变换矩阵。
代码如下:
def stitch_image(img1,img2,H): #1、获得每张图片的四个角点 #2、对图片进行变换,(单应性矩阵使) #3、创建大图,将两张图拼接到一起 #4、将结果输出 #获取原始图的高、宽 h1,w1 = img1.shape[:2] h2,w2 = img2.shape[:2] #获取四个点的坐标,变换数据类型便于计算 img1_dims = np.float32([[0,0],[0,h1],[h1,w1],[w1,0]]).reshape(-1,1,2) img2_dims = np.float32([[0,0],[0,h2],[h2,w2],[w2,0]]).reshape(-1,1,2) #获取根据单应性矩阵透视变换后的图像四点坐标 img1_transform = cv2.perspectiveTransform(img1_dims,H) #img2_transform = cv2.perspectiveTransform(img2_dims,H) #合并矩阵 获取最大x和最小x,最大y和最小y 根据最大最小计算合并后图像的大小; # #计算方式: 最大-最小 result_dims = np.concatenate((img2_dims,img1_transform),axis = 0) #使用min获取横向最小坐标值,ravel将二维转换为一维,强转为int型, # 最小-0.5,最大+0.5防止四舍五入造成影响 [x_min,y_min] = np.int32(result_dims.min(axis=0).ravel()-0.5) [x_max,y_max] = np.int32(result_dims.max(axis=0).ravel()+0.5) #平移距离 transform_dist = [-x_min, -y_min] #齐次变换矩阵 transform_arary = np.array([[1,0,transform_dist[0]], [0,1,transform_dist[1]], [0,0,1]]) #输出图像的尺寸 ww = x_max-x_min hh = y_max-y_min #透视变换实现平移 result_img = cv2.warpPerspective(img1,transform_arary.dot(H),(ww,hh)) #将img2添加进平移后的图像 result_img[transform_dist[1]:transform_dist[1]+h2, transform_dist[0]:transform_dist[0]+w2] = img2 return result_img
在最后分别调用两个函数,测试结果如下图:
H = get_homo(img1,img2) result_img = stitch_image(img1,img2,H)
如果觉得文章还不错,请点赞支持,创作不易,转载请标注,谢谢
这篇关于案例-使用python实现基于opencv的图像拼接(合并)的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-11-21Python编程基础教程
- 2024-11-20Python编程基础与实践
- 2024-11-20Python编程基础与高级应用
- 2024-11-19Python 基础编程教程
- 2024-11-19Python基础入门教程
- 2024-11-17在FastAPI项目中添加一个生产级别的数据库——本地环境搭建指南
- 2024-11-16`PyMuPDF4LLM`:提取PDF数据的神器
- 2024-11-16四种数据科学Web界面框架快速对比:Rio、Reflex、Streamlit和Plotly Dash
- 2024-11-14获取参数学习:Python编程入门教程
- 2024-11-14Python编程基础入门