OpenCV 1

news/2024/9/20 6:12:04 标签: opencv, 人工智能, 计算机视觉

 前言:开新坑辽,,


目录

计算机眼中的图像

视频的读取与处理

ROI区域

边界填充

数值计算

腐蚀操作 

膨胀操作

开运算与闭运算

梯度计算

礼貌与黑帽

Sobel算子 梯度计算方法

scharr与laplacian


计算机眼中的图像

灰色图片,只有一个颜色通道

彩色图片,有三个颜色通道,并且都以矩阵的形式展示出来


%matplotlib inline :notebook特有,方便展示图片,少写代码

cv2.imread : 读取图像


 cv2.imshow:展示图像

'image':给图像命名

cv2.waitKey(0):

“0”,指按键盘任意键都可以取消图片的展示。

“1000”or“10000”等等,指当图片展示时间到1000or10000时,图片会自动消失

cv2.destroyAllWindows():结束代码

视频的读取与处理

h(高):414

w(宽):500

c(通道数):3 说明是彩色图


若想读取图像为灰度图像,则

其中,


 保存代码:


问题1 :

if vc.isOpened():

open, frame = vc.read()

else: open = False,

这里的open和frame指的是什么?

  • open 是一个布尔变量,用来标记视频文件是否成功打开。
    • 如果 vc.isOpened() 返回 True,说明视频文件已被成功打开,此时 vc.read() 会返回两个值:第一个是一个布尔值 True 或 False 表示是否有正确读取到帧,第二个值是实际读取到的图像帧。
    • 如果 vc.isOpened() 返回 False,说明视频文件没有被成功打开,此时直接设置 open 为 False,而不调用 vc.read() 方法。
  • frame 是一个 NumPy 数组,代表从视频流中读取的一帧图像数据。如果成功读取了一帧,它将包含图像数据;如果没有成功读取或已经到了视频结尾,它的值将是 None

问题2:while open:

ret, frame = vc.read()

if frame is None:

break

这里的ret,frame指的是什么?

  • open 是一个布尔变量,用来控制循环的进行。
  • ret 是一个布尔值,表示是否成功读取到了一帧图像。如果 vc.read() 成功读取了一帧图像,它将返回 True;否则返回 False
  • frame 同上,是一个包含读取到的图像数据的 NumPy 数组,如果读取失败或达到视频末尾,其值为 None

问题3:ESC键是哪个键 

  • ESC 键通常位于键盘的左上角,全称为“Escape”,通常用来中断或退出当前操作。在很多程序中,按下 ESC 键可以关闭窗口或退出应用。ASCII码为27。

 问题4:waitKey(?)

?:若为数字100,则展示速度较缓快

?:若为数字1000,则展示速度较缓


ROI区域

cat =img[0:50,0:200]

 0:50,0:200:分别代表宽和长


r.shape:长宽是多少 


cv2.merge:

在OpenCV中,cv2.merge()函数是用来合并多个单通道图像(例如BGR)成一个三通道彩色图像。在这个例子中,(b,g,r)表示三个单通道图像数组,它们会被合并成一个新的三通道图像。

img.shape输出的是新合并后的图像的维度信息,包括高度、宽度和通道数。在这个例子中,结果为(414, 500, 3),表明合并后的图像有414行、500列以及3个颜色通道(即RGB)。

所以,cv2.merge()的主要作用就是将多个单通道图像组合成一个完整的彩色图像。


BGR:分别的索引为0,1,2

因此,不要什么通道就将通道设置为0

比如:只保留R通道,即不需要BG通道,即将BG通道设置为0,即将索引编号为0,1设置为0

:,:,:表示所有,即整个图片的长度和宽度都要包含


边界填充

 

cv2.BORDER_WRAP的方法下,cde|abcde|abc为什么这样循环?

 cv2.BORDER_WRAP: 用另一边的像素进行填充

假设我们有一个字符串 "abcde" 作为图像的一部分。在cv2.BORDER_WRAP模式下,边界像素会“环绕”,即当超出边界时,会从相反的一侧取像素

考虑以下几种情况:

  1. 原始字符串"abcde"
  2. 向左扩展一个像素:在这种情况下,我们需要取左边的像素。由于我们已经处于字符串的起始位置,我们需要从字符串的末尾取一个像素。因此,我们得到 "e|abcde"
  3. 向右扩展一个像素:在这种情况下,我们需要取右边的像素。由于我们已经处于字符串的末尾位置,我们需要从字符串的起始位置取一个像素。因此,我们得到 "abcde|a"

现在,让我们看看您提供的字符串 "cde|abcde|abc" 是否可以解释为某种特定的扩展方式:

  • 左边的扩展"cde"。这看起来是从原始字符串 "abcde" 的第三个字符开始,一直到字符串末尾。
  • 中间的原始字符串"abcde"
  • 右边的扩展"abc"。这看起来是从原始字符串的起始位置开始,一直到倒数第二个字符。

数值计算

 +10:矩阵里面的每一个值都加10


对于第一种相加的方式,要取模%256,即,若数值超过256,则取模

对于第二种相加的方式,若超过255,则计为255,若小于255,则就是那个数字


 若要融合两张图片,必须使得两张图片的尺寸一致,也就是size一致,利用resize进行调整

 第二种改变图片大小的方法,是放大or缩小多少倍数。(0,0)说明不指定具体数字


addWeighted(图片1,图片1的权重,图片2,图片2的权重,提亮多少) 

R = ax1 + bx2 + b


腐蚀操作 

 iterations 为1,2,3 有以上不同的效果


膨胀操作

 

 iterations 为1,2,3 有以上不同的效果 


开运算与闭运算


梯度计算

得到边缘信息


礼貌与黑帽

 

礼帽:结果是不带刺的图案

黑帽:结果不带刺,只剩下一点字的轮廓了


Sobel算子 梯度计算方法

获得图案的轮廓

 

上减下,右减左

用上cv2.CV_64F以及convertScaleAbs的用处就是,即便是负数也可以。

scharr与laplacian

scharr能捕抓到更加细腻的细节


http://www.niftyadmin.cn/n/5666716.html

相关文章

Text2SQL论文笔记 A Survey on Employing Large Language Models for Text-to-SQL Tasks

摘要 存储在关系数据库中的数据量不断增加,导致在各个领域中需要高效地查询和利用这些数据。然而,编写SQL查询需要专业知识,这对非专业用户来说是一个挑战,他们试图访问和查询数据库。文本到SQL解析通过将自然语言查询转换为SQL查…

Ubuntu22.04关闭631端口的方法

何为631端口? 631端口主要用于访问和控制网络打印服务,是linux下CUPS(Common UNIX Printing System,通用UNIX打印系统)服务的端口。Linux中的CUPS(Common UNIX Printing System,通用UNIX打印系统)是一个开源的打印系统,它提供了一套完整的管理打印设备、实现可靠打印…

【微服务-注册中心】

注册中心的作用: 微服务将业务拆分成了一个一个服务,当实现一个业务的时需要调用多个服务,那么每个服务的调用都需要知道它的URL。如何更方便的调用,注册中心就出现了。 我们可以把注册中心当作通讯录,通讯录中记录了服…

Leetcode 93-复原 IP 地址

有效 IP 地址 正好由四个整数(每个整数位于 0 到 255 之间组成,且不能含有前导 0),整数之间用 ‘.’ 分隔。 例如:“0.1.2.201” 和 “192.168.1.1” 是 有效 IP 地址,但是 “0.011.255.245”、“192.168.…

苹果为什么不做折叠屏手机?

苹果为什么不做折叠屏手机?折叠屏手机在最近这些年里边,可以说是市场的一个主要在手机上的增长点。你像华W最近推出这个三折叠手机,引起了整个市场的轰动。 可是,为什么苹果到今天为止不为所动,还在那不停地在现在的这…

PyCharm和VS Code 安装通义灵码,可本地安装包安装,解决插件安装不上问题

PyCharm和VS Code 安装通义灵码,可本地安装包安装,解决插件安装不上问题 PyCharm、VS Code 安装通义灵码介绍主要应用场景支持编程语言安装指南JetBrains IDEs 中安装指南步骤 1:准备工作步骤 2:在 JetBrains IDEs 中安装通义灵码…

asp.net core web api 使用apollo配置更改回调监听

安装依赖包 > Com.Ctrip.Framework.Apollo 2.10.0 2.10.0> Com.Ctrip.Framework.Apollo.ConfigAdapter.Yaml 2.9.0 2.9.0 > Com.Ctrip.Framework.Apollo.Configuration 2.10.2 2.10.2> Com.Ctrip.Framework.Apollo.…

QT----基于QML的计时器

赶上了实习的末班车,现在在做QML开发,第一天的学习成果,一个计时器.逻辑挺简单的,纯QML实现,代码在仓库QT-Timer 多线程优化 在使用的过程中发现自己的计时器时间会慢,并且一直点击记录的话时间1s可以走10s,排查发现是在计时器的间隔取得太小了,取了1太过于消耗资源,改成10的…