基础操作-图像读取及视频读取
《AI未来星球》陪伴成长的人工智能社群,价值过万的各种内部资源及活动,限时特惠中,点击查看。
求职跳槽福利:为了便于大家求职、跳槽的准备,大白花了一年多时间准备了《人工智能算法岗江湖武林秘籍》,限时开放下载,点击查看下载。
本文目录
1 项目简介&应用场景
2 原理简述
3 项目实践
3.1 软件安装
3.2 conda安装
3.3 库文件安装
3.4 代码文件编写
3.5 代码运行测试
1 项目简介&应用场景
作者:江大白
项目简介:读取图像和视频,是计算机视觉领域,算法处理的第一步,因此学习基础操作,非常重要。
因此本项目,就和大家一起,学习一下图像处理最基本的操作,读取图像、读取视频、视频跳帧。
学习目的:通过代码,知道如何读取图像?如何读取视频?这里在不同的项目中,才能灵活运用。
可应用场景:不同项目中的图像处理,视频处理
2 原理简述
图像读取:在算法操作中,首先要获得图像,才能进行相关的算法操作,比如目标检测、人脸识别等。
视频读取:视频是由一帧帧图像组成的(比如一秒25帧),但是在项目中,并不需要对所有的视频都进行读取处理,所以要学会跳帧操作(比如隔5帧使用一帧)。
3 项目实践
很多同学刚开始进入计算机视觉领域,因此大白主要从三个方面教大家一步步入门。
大白主要从软件安装(用于编写代码)+conda安装(代码运行环境)+库文件安装(代码运行需要的函数),总共三个方面讲解。
注意:如软件、环境、库文件已经安装,可跳过第三章,直接进入第四章。
3.1 软件安装
(1)Pycharm的安装
计算机视觉算法入门,大白首推Python语言进行编程,超级简单方便。
而在编程中,为了便于管理代码,推荐大家使用Pycharm软件。
考虑到很多人刚入门时,通常使用Window环境。
关于Pycharm的安装,可以参考大白的文章,《Window系统安装Pycharm软件详细教程》。
3.2 conda安装
(1)Conda
在工作中,常常会遇到,不同项目所依赖环境不一样的情况。
比如有的项目需要用python2.7,有的项目需要用python3.8等等。
为了不同的项目互不干扰,非常推荐大家使用Conda环境。
这里关于Conda环境的安装,可以参考大白的文章,《Window系统安装Conda详细教程》。
3.3 库文件安装
(1)Opencv库
Opencv是计算机视觉领域,非常常用的图像算法库。
安装方式:进入Conda终端环境。(如不知如何进入,可以查看文章《Window系统安装Conda详细教程》)
输入代码:pip install opencv-python
安装参考:(如果没有安装过numpy,同时也会顺带下载numpy库,用于数值转换)
4 代码文件编写
(1)代码获取方式
① 关注微信公众号:江大白
② 回复关键词:图像采集,即可收到代码。
(2)部分代码详情
(3)文件详情
main_image.py:用来读取图像的代码
main_video.py:用来读取视频的代码
目的:通过代码,可以完成对girl图像的读取,和对video视频的读取及跳帧。
5 代码运行测试
图像读取:在Pycharm中,运行main_image.py文件即可,大家也可以在最下方的配置信息中,更换不同的图片,进行尝试。
视频读取:在Pycharm中,运行main_video.py文件即可,也可以修改不同的视频路径,或者调节跳帧数,学习使用方式。