最新消息: USBMI致力于为网友们分享Windows、安卓、IOS等主流手机系统相关的资讯以及评测、同时提供相关教程、应用、软件下载等服务。

入门理解计算机视觉、图形学、图像处理

IT圈 admin 6浏览 0评论

入门理解计算机视觉、图形学、图像处理

入门理解计算机视觉、图形学、图像处理

2019年后工作开始了,对于新的技术要求,盲目学习一阵子,发现还是得自己理清思路。
搞了opencv一段时间,还是对这些概念比较模糊,经过一些博客和知乎的帖子,别人的解释结合自己的理解,作为入门知识学习一下。

1.基本概念

维基百科中概念的定义。(英文直译)

计算机视觉(CV): Computer Vision

计算机视觉是一个学科/领域,它包括获取、处理、分析和理解图像或者更一般意义的真实世界的高维数据的方法;它的目的是产生决策形式的数字或者符号信息。

计算机图像学(CG):Computer Graphics

计算机图形学是计算机科学的一个子领域,它包括数字合成和操作可视内容(图像、视频)的方法。尽管这个术语通常指三维计算机图形学的研究,但它也包括二维图形学和图像处理。

图像处理(IP):Image Processing

在图像科学中,图像处理是用任何信号处理等数学操作处理图像的过程,输入时图像(摄影图像或者视频帧),输出是图像或者与输入图像有关的特征、参数的集合。

2.区别和联系

2.1 精简概括

Computer Graphics 和 Computer Vision 是同一过程的两个方向
Computer Graphics 将抽象的语义信息转化成图像
Computer Vision 从图像中提取抽象的语义信息
Image Processing 是一个图像或者一组图像之间的互相转化和关系,与语义信息无关。

2.2 从输入输出角度看

(1)区别

Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。

[xyz xyz xyz ... xyz] -> 图片

Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌。

图片 -> dog or cat?
图片 -> [xyz xyz xyz ... xyz]

Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。

图片 -> ps后的图片

(2)联系

  1. CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。

  2. CV 更是大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点等等。

  3. AR (增强现实),它既需要 CG,又需要 CV 和 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。

(3)图解
一张图,简明地表达了CV、CG、DIP和AI的区别和联系。

knowledge:”知识“,可以代表对图像的一种理解,一种从一堆像素中提取到的结构。

2.3 最后自己的理解:

我还是喜欢举例子的方式来理解这些东西。

  • 计算机视觉 ≈ 计算机看外部的图。比如人脸识别,指纹识别,照相机笑脸识别这些技术。
  • 计算机图形学 ≈ 计算机画图。比如迪士尼的各种3维动画片,好莱坞的各种特效, 3D游戏电影制作。
  • 数字图像处理 ≈ 计算机看外部的图,利用自己的画图技术做出变更操作,再导出图。比如photoshop
    以及App中的各种照片滤镜特效。ps把一幅图像去躁,做直方图均衡化之类的处理。

使用中的常用方式:

图像处理可以理解为输入是一副图像,输出还是一副图像。
计算机视觉可以理解为图像分析,其输入是图像,但输出是对图像的描述。
计算机图形学则与计算机视觉相反,其输入是描述性内容,输出是图像。

注:”图像“ 也可指像素。

图像和图形的区别:

图像一般指计算机类以位图形式存在的灰度信息,图形含有几何属性,例如点线面这些属性。

参考相关文献:
[1] csdn博客专家
[2] 张静, 知乎
[3] 知乎问题


我主要需要的是计算机视觉CV方面的技术。当然使用openCV是最多的了。

入门理解计算机视觉、图形学、图像处理

入门理解计算机视觉、图形学、图像处理

2019年后工作开始了,对于新的技术要求,盲目学习一阵子,发现还是得自己理清思路。
搞了opencv一段时间,还是对这些概念比较模糊,经过一些博客和知乎的帖子,别人的解释结合自己的理解,作为入门知识学习一下。

1.基本概念

维基百科中概念的定义。(英文直译)

计算机视觉(CV): Computer Vision

计算机视觉是一个学科/领域,它包括获取、处理、分析和理解图像或者更一般意义的真实世界的高维数据的方法;它的目的是产生决策形式的数字或者符号信息。

计算机图像学(CG):Computer Graphics

计算机图形学是计算机科学的一个子领域,它包括数字合成和操作可视内容(图像、视频)的方法。尽管这个术语通常指三维计算机图形学的研究,但它也包括二维图形学和图像处理。

图像处理(IP):Image Processing

在图像科学中,图像处理是用任何信号处理等数学操作处理图像的过程,输入时图像(摄影图像或者视频帧),输出是图像或者与输入图像有关的特征、参数的集合。

2.区别和联系

2.1 精简概括

Computer Graphics 和 Computer Vision 是同一过程的两个方向
Computer Graphics 将抽象的语义信息转化成图像
Computer Vision 从图像中提取抽象的语义信息
Image Processing 是一个图像或者一组图像之间的互相转化和关系,与语义信息无关。

2.2 从输入输出角度看

(1)区别

Computer Graphics,简称 CG 。输入的是对虚拟场景的描述,通常为多边形数组,而每个多边形由三个顶点组成,每个顶点包括三维坐标、贴图坐标、rgb 颜色等。输出的是图像,即二维像素数组。

[xyz xyz xyz ... xyz] -> 图片

Computer Vision,简称 CV。输入的是图像或图像序列,通常来自相机、摄像头或视频文件。输出的是对于图像序列对应的真实世界的理解,比如检测人脸、识别车牌。

图片 -> dog or cat?
图片 -> [xyz xyz xyz ... xyz]

Digital Image Processing,简称 DIP。输入的是图像,输出的也是图像。Photoshop 中对一副图像应用滤镜就是典型的一种图像处理。常见操作有模糊、灰度化、增强对比度等。

图片 -> ps后的图片

(2)联系

  1. CG 中也会用到 DIP,现今的三维游戏为了增加表现力都会叠加全屏的后期特效,原理就是 DIP,只是将计算量放在了显卡端。

  2. CV 更是大量依赖 DIP 来打杂活,比如对需要识别的照片进行预处理,增强对比度、去除噪点等等。

  3. AR (增强现实),它既需要 CG,又需要 CV 和 DIP。它用 DIP 进行预处理,用 CV 进行跟踪物体的识别与姿态获取,用 CG 进行虚拟三维物体的叠加。

(3)图解
一张图,简明地表达了CV、CG、DIP和AI的区别和联系。

knowledge:”知识“,可以代表对图像的一种理解,一种从一堆像素中提取到的结构。

2.3 最后自己的理解:

我还是喜欢举例子的方式来理解这些东西。

  • 计算机视觉 ≈ 计算机看外部的图。比如人脸识别,指纹识别,照相机笑脸识别这些技术。
  • 计算机图形学 ≈ 计算机画图。比如迪士尼的各种3维动画片,好莱坞的各种特效, 3D游戏电影制作。
  • 数字图像处理 ≈ 计算机看外部的图,利用自己的画图技术做出变更操作,再导出图。比如photoshop
    以及App中的各种照片滤镜特效。ps把一幅图像去躁,做直方图均衡化之类的处理。

使用中的常用方式:

图像处理可以理解为输入是一副图像,输出还是一副图像。
计算机视觉可以理解为图像分析,其输入是图像,但输出是对图像的描述。
计算机图形学则与计算机视觉相反,其输入是描述性内容,输出是图像。

注:”图像“ 也可指像素。

图像和图形的区别:

图像一般指计算机类以位图形式存在的灰度信息,图形含有几何属性,例如点线面这些属性。

参考相关文献:
[1] csdn博客专家
[2] 张静, 知乎
[3] 知乎问题


我主要需要的是计算机视觉CV方面的技术。当然使用openCV是最多的了。
发布评论

评论列表 (0)

  1. 暂无评论