Home

zhangyiqun

Thoughts, stories and ideas.

翻译 2014年以前 スーパーマリオ 关于

27 Feb 2020
手写机器学习图片识别算法1:机器如何阅读一张图

机器学习入门系列,预计会写三四篇,争取不烂尾。

电脑显示图片的原理

随便打开一张图片,将图片放大到最大尺寸,你会发现每张图片都由一堆小格子组成

image

图片源文件中存储着每个格子对应的RGB颜色,如果不知道RGB是什么可以把它简单理解成一串类似于身份证的数字,每个数字对应一个颜色

image

2D图 vs 3D图

2D图用平面直角坐标系就能表示出来(x,y),3D图不过是又增加了一个维度(z)

image

将图片存进容器给机器看

人可以直接看图识别,但是机器不行,机器需要人把图片转成数字给他看。

转化很简单,因为本来在电脑里的图片就是数字,所以给机器看只是需要把这些数字装进容器即可。

常用的容器是数组,在机器学习领域,为了显得更高大上一些,所以发明了新词 Tensor,它的本质其实就是个多维数组。

image

比如这是在二维数组中的一张图,数字3。

image

Reference

How do digital images work?

cs101 Introduction to Digital Images

NumPy Tensors, Slicing, and Images

Deep Learning for Coders with Fastai and PyTorch: AI Applications Without a PhD

翻译 2014年以前 スーパーマリオ 关于