入门理解计算机视觉、图形学、图像处理
入门理解计算机视觉、图形学、图像处理
2019年后工作开始了,对于新的技术要求,盲目学习一阵子,发现还是得自己理清思路。
搞了opencv一段时间,还是对这些概念比较模糊,经过一些博客和知乎的帖子,别人的解释结合自己的理解,作为入门知识学习一下。
1.基本概念
维基百科中概念的定义。(英文直译)
计算机视觉(CV): Computer Vision
计算机视觉是一个学科/领域,它包括获取、处理、分析和理解图像或者更一般意义的真实世界的高维数据的方法;它的目的是产生决策形式的数字或者符号信息。
计算机图像学(CG):Computer Graphics
计算机图形学是计算机科学的一个子领域,它包括数字合成和操作可视内容(图像、视频)的方法。尽管这个术语通常指三维计算机图形学的研究,但它也包括二维图形学和图像处理。
图像处理(IP):Image Processing
在图像科学中,图像处理是用任何信号处理等数学操作处理图像的过程,输入时图像(摄影图像或者视频帧),输出是图像或者与输入图像有关的特征、参数的集合。
2.区别和联系
2.1 精简概括
Computer Graphics 和 Computer Vision 是同一过程的两个方向。
Computer Graphics 将抽象的语义信息转化成图像。
Computer Vision 从图像中提取抽象的语义信息。
Image Processing 是一个图像或者一组图像之间的互相转化和关系,与语义信息无关。
2.2 从输入输出角度看
(1)区别
Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。
[xyz xyz xyz ... xyz] -> 图片
Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌。
图片 -> dog or cat?
图片 -> [xyz xyz xyz ... xyz]
Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。
图片 -> ps后的图片
(2)联系
-
CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。
-
CV 更是大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点等等。
-
AR (增强现实),它既需要 CG,又需要 CV 和 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。
(3)图解
一张图,简明地表达了CV、CG、DIP和AI的区别和联系。
knowledge:”知识“,可以代表对图像的一种理解,一种从一堆像素中提取到的结构。
2.3 最后自己的理解:
我还是喜欢举例子的方式来理解这些东西。
- 计算机视觉 ≈ 计算机看外部的图。比如人脸识别,指纹识别,照相机笑脸识别这些技术。
- 计算机图形学 ≈ 计算机画图。比如迪士尼的各种3维动画片,好莱坞的各种特效, 3D游戏电影制作。
- 数字图像处理 ≈ 计算机看外部的图,利用自己的画图技术做出变更操作,再导出图。比如photoshop
以及App中的各种照片滤镜特效。ps把一幅图像去躁,做直方图均衡化之类的处理。
使用中的常用方式:
图像处理可以理解为输入是一副图像,输出还是一副图像。
计算机视觉可以理解为图像分析,其输入是图像,但输出是对图像的描述。
计算机图形学则与计算机视觉相反,其输入是描述性内容,输出是图像。
注:”图像“ 也可指像素。
图像和图形的区别:
图像一般指计算机类以位图形式存在的灰度信息,图形含有几何属性,例如点线面这些属性。
参考相关文献:
[1] csdn博客专家
[2] 张静, 知乎
[3] 知乎问题
我主要需要的是计算机视觉CV方面的技术。当然使用openCV是最多的了。
入门理解计算机视觉、图形学、图像处理
入门理解计算机视觉、图形学、图像处理
2019年后工作开始了,对于新的技术要求,盲目学习一阵子,发现还是得自己理清思路。
搞了opencv一段时间,还是对这些概念比较模糊,经过一些博客和知乎的帖子,别人的解释结合自己的理解,作为入门知识学习一下。
1.基本概念
维基百科中概念的定义。(英文直译)
计算机视觉(CV): Computer Vision
计算机视觉是一个学科/领域,它包括获取、处理、分析和理解图像或者更一般意义的真实世界的高维数据的方法;它的目的是产生决策形式的数字或者符号信息。
计算机图像学(CG):Computer Graphics
计算机图形学是计算机科学的一个子领域,它包括数字合成和操作可视内容(图像、视频)的方法。尽管这个术语通常指三维计算机图形学的研究,但它也包括二维图形学和图像处理。
图像处理(IP):Image Processing
在图像科学中,图像处理是用任何信号处理等数学操作处理图像的过程,输入时图像(摄影图像或者视频帧),输出是图像或者与输入图像有关的特征、参数的集合。
2.区别和联系
2.1 精简概括
Computer Graphics 和 Computer Vision 是同一过程的两个方向。
Computer Graphics 将抽象的语义信息转化成图像。
Computer Vision 从图像中提取抽象的语义信息。
Image Processing 是一个图像或者一组图像之间的互相转化和关系,与语义信息无关。
2.2 从输入输出角度看
(1)区别
Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。
[xyz xyz xyz ... xyz] -> 图片
Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌。
图片 -> dog or cat?
图片 -> [xyz xyz xyz ... xyz]
Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。
图片 -> ps后的图片
(2)联系
-
CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。
-
CV 更是大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点等等。
-
AR (增强现实),它既需要 CG,又需要 CV 和 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。
(3)图解
一张图,简明地表达了CV、CG、DIP和AI的区别和联系。
knowledge:”知识“,可以代表对图像的一种理解,一种从一堆像素中提取到的结构。
2.3 最后自己的理解:
我还是喜欢举例子的方式来理解这些东西。
- 计算机视觉 ≈ 计算机看外部的图。比如人脸识别,指纹识别,照相机笑脸识别这些技术。
- 计算机图形学 ≈ 计算机画图。比如迪士尼的各种3维动画片,好莱坞的各种特效, 3D游戏电影制作。
- 数字图像处理 ≈ 计算机看外部的图,利用自己的画图技术做出变更操作,再导出图。比如photoshop
以及App中的各种照片滤镜特效。ps把一幅图像去躁,做直方图均衡化之类的处理。
使用中的常用方式:
图像处理可以理解为输入是一副图像,输出还是一副图像。
计算机视觉可以理解为图像分析,其输入是图像,但输出是对图像的描述。
计算机图形学则与计算机视觉相反,其输入是描述性内容,输出是图像。
注:”图像“ 也可指像素。
图像和图形的区别:
图像一般指计算机类以位图形式存在的灰度信息,图形含有几何属性,例如点线面这些属性。
参考相关文献:
[1] csdn博客专家
[2] 张静, 知乎
[3] 知乎问题
我主要需要的是计算机视觉CV方面的技术。当然使用openCV是最多的了。