cv机器视觉(CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念)、早期/中期/近期应用领域(偏具体应用)、经典CNN架构(偏具体算法)概述、常用工具/库/框架/产品、环境安装、常用数据集、编程技巧)
CV:计算机视觉技最强学习路线之CV简介(传统视觉技术/相关概念) 、早期/中期/近期应用领域(偏具体应用) 、经典CNN架构(偏具体算法)概述 、常用工具/库/框架/产品 、环境安装 、常用数据集 、编程技巧
导读:计算机视觉技最强学习路线 ,博主花了三个晚上精心整理 ,终于结束了 ,真心不容易……希望能够对家学习计算机视觉技术有所帮助 。
目录
计算机视觉技最强学习路线
1 、CV市场岗位要求
Interview之CV:人工智能领域求职岗位—计算机视觉算法工程师的职位简介 、薪资介绍 、知识结构之详细攻略
Interview之ML:机器学习算法工程师结构知识思维导图集合 、求职九大必备技能之【数学基础 、特征工程能力 、模型评估和优化、机器学习基本概念/经典算法 、深度学习算法 、业务与应用】(持续更新)
Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础、ML算法简介 、DL算法简介)来理解技术交互流程
Interview之AI:深度学习算法工程师面试之常见专业知识考点(参数初始化策略(Lecun 、Xavier/Glorot 、Kaiming 、基于BN的随机的参数初始化) 、图像算法基础(ROI)
2 、CV综合应用领域(自动驾驶等)
AI:人工智能领域之国内外人工智能产业应用图谱应用层/基础层详解—AI八大应用领域之医疗/家居/驾驶/零售/城市/教育/金融/交通 、(AI三大基础(算法【计算机视觉/自然语言处理/机器学习 、科研院所/开源社区】 、数据【IOT/互联网/手机/传感器/音视频】 、计算【计算芯片/服务器及存储器/AI软件框架/云服务】)
(1) 、安防领域—疑犯追踪 、视频结构化
(2)、金融及互联网领域—刷脸认证
(3) 、手机及娱乐领域—影像分类/影像处理/AR特效
(4) 、零售领域—商品识别
(5)、广告营销领域—自动化挖掘影像内容广告位
(6) 、工业领域—产品质检/3D分拣
(7) 、医疗领域—医疗影像分析
(8) 、自动驾驶领域—环境感知/高精地图/定位
CV:无人驾驶/自动驾驶汽车中涉及的软硬件技术(摄像头 、雷达 、激光雷达) 、计算机视觉技术(检测 、分类 、跟踪 、语义分割)的简介
High&NewTech:基于人工智能的自动驾驶技术的前世今生之Why 、What 、How最强分析与总结(包括自动驾驶L5个分级详细标准 ,非常建议收藏)
(9) 、无人机/机器人领域—环境感知/定位/自动避障
3、基本必备技能(5+1大基础)——AI人才的基本属性
(1) 、领域概念术语基础
AI:人工智能领域之AI基础概念术语之《Google发布机器学习术语表 (中英对照)》——持续更新ML 、DL相关概念2018年4月!
AI:人工智能领域之AI基础概念术语之机器学习、深度学习 、数据挖掘中常见关键词 、参数等5000多个单词中英文对照(绝对干货)
AI:人工智能领域主要方向(技术和应用) 、与机器学习/深度学习的关系 、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)
(2) 、学术知识基础——懂理论
ML与math:机器学习与高等数学基础概念 、代码实现 、案例应用之详细攻略——基础篇
ML与math:机器学习与高等数学基础概念 、代码实现 、案例应用之详细攻略——进阶篇
(3) 、编程语言基础——能实践
Computer:少儿编程—每个人都应该学习编程 ,它能教你如何思考—编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言) 、编程应用 、编程意义之详细攻略
Computer:C语言/C++语言的简介、发展历史 、应用领域 、编程语言环境IDE安装、学习路线之详细攻略
Python:Python语言的简介(语言特点/pyc介绍/Python版本语言兼容问题(python2 VS Python3)) 、安装 、学习路线(数据分析/机器学习/网页爬等编程案例分析)之详细攻略
Matlab:Matlab编程语言的简介 、安装 、学习路线(几十项代码编程案例分析)之详细攻略
(4) 、深度学习框架基础—会优化
AI:Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介 、案例应用之详细攻略
(5) 、人工智能领域算法背景基础——领域项目经验
AI:全球人工智能领域代表性学者简介及大佬们的关系圈—向大佬们学习(国外内分开,持续更新/建议收藏)
AI:人工智能领域之《A Simple Tool to Start Making Decisions with the Help of AI—借助人工智能开始决策的简单工具》翻译与解读
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法) 、分类/回归/聚类/降维算法模型选择思路 、11类机器学习算法详细分类之详细攻略
(6) 、传统的数字图像处理及OpenCV基础——传统专业基础
4 、计算机视觉算法工程师基本技能
一 、计算机视觉的简介
二、计算机视觉相关概念简介
三 、传统的计算机视觉技术之机器视觉/计算机图形学
四 、CV早期、中期 、近期具体应用领域(偏具体应用)及其应用案例
五 、经典CNN算法(偏具体算法)简介及其应用案例
六 、CV领域常用工具 、库/框架 、现有产品
七 、CV计算机视觉环境安装
八 、CV领域常用数据集
九 、CV编程代码技巧
☆☆一 、计算机视觉的简介
CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊 、主要研究方向) 、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略
☆☆二 、计算机视觉相关概念简介
1、计算机视觉的语义鸿沟概念
(1) 、跨越语义鸿沟的几大挑战
2 、卷积概念
DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍)、架构详解 、案例应用等配图集合之详细攻略
DL之CNN:卷积神经网络算法简介之卷积矩阵 、转置卷积(反卷积Transpose) 、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略
☆☆三 、传统的计算机视觉技术之机器视觉/计算机图形学
1 、基础知识
CV:传统视觉知识—机器视觉系统的基础知识(机器视觉三要素+典型的工业机器视觉系统五大组件
CV:计算机视觉技术之图像基础知识(一)—以python的cv2库来了解计算机视觉图像基础(傅里叶变换-频域-时域/各种滤波器-线性-非线性-均值-中值-高斯-双边)
CV:计算机视觉技术之图像基础知识(二)—以python的skimage和numpy库来了解计算机视觉图像基础(图像存储原理-模糊核-锐化核-边缘检测核 ,进阶卷积神经网络(CNN)的必备基础)
CV:计算机视觉技术之图像基础知识(二)—图像内核的九种卷积核可视化解释(blur/bottom sobel /emboss/identity /sobel /outline/sharpen)
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础—视频操作相关案例及其代码实现(将多张图片存为视频/另存为avi视频/录制摄像头)
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础(边缘检测算子+平滑+轮廓标注+形态学+金字塔+傅里叶变换)—代码实现
CV之HOG:图像特征提取之基于方向梯度直方图HOG算法的简介 、代码实现(计算图像相似度)之详细攻略
2 、像素检测
CV之cv2:基于python语言利用cv2库对几何形状图像边界进行识别检测并计算周长/面积以及输出颜色/形状类型之详细攻略
CV之FD之HOG:图像检测之基于HOG算法 、简介 、代码实现(计算图像相似度)之详细攻略
3 、图形可视化
4 、数据预处理
CV之FE:基于TF框架对图像进行数据预处理—去除异常(被损坏)图像 和单通道图像代码实现
CV:利用python的cv2库实现图像数据增强—随机裁剪 、随机旋转、随机hsv变换 、随机gamma变换代码实现
5 、图像生成
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据随机指定七个字符生成逼真车牌图片数据集(自然场景下+各种噪声效果)可视化
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符生成逼真车牌图片(自然场景+各噪效果+对应txt说明文档)
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
6、其他相关技术(如SLAM)
CV之VSLAM:SLAM/VSLAM的简介 、视觉SLAM的五大流程之详细攻略
☆☆四 、CV早期 、中期 、近期具体应用领域(偏具体应用)及其应用案例
A 、CV早期应用领域
1 、OCR文字识别
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测
DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—预测过程
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别
2 、计算图像相似度
CV之Hog+HamMingDistance:基于Hog提取和汉明距离对比实现计算图像相似度案例—for循环将多个成对图片依次对比并输出相似度
ML之Hog_HammingDistance:基于Hog特征提取“RGB ”图像的768个值的单向vector利用汉明距离算法实现计算图像相似度案例
ML之Hash_EditDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用编辑距离算法实现计算图像相似度案例
ML之Hash_HamMingDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用汉明距离算法实现计算图像相似度案例
ML之SSIM:基于输入图片RGB的三维向量利用SSIM(结构相似性度量)算法实现计算图像相似度案例
ML之SIFT_FLANN:FLANN算法的简介 、使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略
CV之kNN/flann:基于ORB提取+kNN检测器 、基于SIFT提取+flann检测器实现计算图像相似度并可视化代码实现
CV之FR:基于百度API接口实现计算图像相似度(以计算两张人脸图片相似度判断否为同一个人为例)代码实现
B 、CV中期十大应用领域
1 、图像分类(Image Classification)
CV之IC:计算机视觉之图像分类(Image Classification)方向的简介 、使用方法、案例应用之详细攻略
(0) 、手写数字识别
CV之IC之SpatialTransformer:基于ClutteredMNIST手写数字图片数据集分别利用CNN_Init 、ST_CNN算法(CNN+ST)实现多分类预测案例训练过程记录
CV之IC:基于sklearn 框架利用xgboost算法对手写数字图片数据集digits实现图像分类案例代码(多分类 ,模型训练、评估 、调优 、保存)
(1) 、猫狗分类
CV之IC:基于OpenCV的CascadeClassifier级联分类器利用python语言加载猫脸检测文件haarcascade_frontalcatface.xml实现对猫脸检测并标注文本标签
CV之IC之VGG16:基于Keras框架利用卷积神经网络VGG16算法的迁移技术实现猫狗分类识别(图片数据增强→保存h5模型)案例训练过程记录
CV之IC之AlexNet:基于Keras框架利用卷积神经网络类AlexNet算法实现猫狗分类识别(图片数据增强→保存h5模型→加载模型)案例应用
CV之IC之AlexNet:基于tensorflow框架采用CNN卷积神经网络算法(改进的AlexNet,训练/评估/推理)实现猫狗分类识别案例应用
(2) 、人脸识别(Face Recognition)
CV之FR:人脸识别(Face Recognition)方向的简介 、常用算法模型 、常用函数 、案例应用之详细攻略
CV之FR之ME/LF:人脸识别中常用的模型评估指标/损失函数(Triplet Loss 、Center Loss)简介 、使用方法之详细攻略
CV之FR:基于cv2和dlib库自带frontal_face_detector(人脸征检测器)利用landmarks.dat文件实现人脸检测与人脸标记之《极限男人帮》和《NBA全明星球员》案例应用
CV之FR之dlib:基于dlib库利用dlib.get_frontal_face_detector函数实现人脸检测和人脸标记
CV之FR:基于DIY人脸图像数据集(每人仅需几张人脸图片训练)利用Hog方法提取特征和改进的kNN算法实现人脸识别并标注姓名(标注文本标签)—(准确度高达100%)
CV之FR:基于face和cv2库调用摄像头(或视频)实现人脸识别并标注姓名标签包装为GUI界面产品(先指定要识别已知人脸的文件夹转为numpy_array+输入新图片遍历已有numpy_array)
CV之FR:基于某AI公司的API接口基于人脸识别实现计算人脸相似度(计算两张人脸图片相似度进而判断否为同一个人)—利用人工智能算法判断相似度极高的国内外明星案例应用
CV之FR之MTCNN:基于TF框架利用MTCNN算法检测并对齐人脸图像进(人脸识别/人脸相似度)而得出人脸特征向量从而计算两张人脸图片距离案例应用之详细攻略
CV之FD&FA:利用MTCNN的脚本实现对LFW数据集进行FD人脸检测和FA人脸校准
CV之FR:基于某AI公司的API接口基于人脸识别实现人脸性别预测/人脸年龄预测/人脸颜值预测—利用人工智能算法对国内外明星/企业家预测案例应用
CV之FR:基于dlib 、cv2库利用warpPerspective函数和shape_predictor_68_face_landmarks.dat文件实现AI换脸渐变融合的视频效果
CV之FR之FAN:基于人工智能算法实现AI换脸渐变融合的视频效果(以偶像和明星渐变卡通形象为例)
(3) 、人脸表情识别 、性别识别
CV之FR:基于cv2库两步法利用haarcascade_frontalface_default.xml文件人脸检测/_smile.xml检测器笑脸实现对NBA球星同时进行人脸检测和笑脸识别
CV之FR:基于cv2(加载人脸识别xml文件及detectMultiScale得到人脸特征)、keras的load_model(加载表情hdf5 、性别hdf5)实现表情识别和性别识别
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理实现人脸表情识别/脸部表情识别 、性别识别(gradcam可视化)案例应用
CV之FR/Keras之CNN:基于Keras框架和cv2库(调用摄像头)利用卷积神经网络模型(2+1)算法实现实时人脸识别并标注姓名标签
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理(cv2自带两步检测法)实现对《跑男第六季第五期》之如花视频片段(或调用摄像头)进行实时脸部表情识别
CV之FR:基于Keras框架利用训练好的hdf5模型直接进行人脸识别推理(cv2自带两步检测法)实现对《跑男第六季第五期》之如花视频片段(或调用摄像头)进行实时性别、脸部表情识别
(4) 、AI换脸
CV之Face Change:基于人工智能实现国内众多一线美女明星换脸(基于Face++输出4*106个特征点定位+融合代码 、deepfake技术)
AI黑科技:目前最流行的人工智能换脸软件(FakeAPP/Faceswap/Openfaceswap/Deepfacelab)的简介 、对比之详细攻略
(5) 、人脸口罩识别
CV之FR:基于paddlehub 框架利用mobile_mask人工智能算法实现人脸口罩图像识别(二分类识别 ,可结合无人机可 ,实现实时检测实时警告提醒)
2 、目标检测(Object Detection)
CV之OD:计算机视觉之目标检测(Object Detection)方向的简介 、使用方法 、案例应用之详细攻略
CV之OD之SSD:基于tensorflow框架利用SSD算法实现目标检测(21类)案例应用
CV之OD之YOLOv3:基于Tensorflow框架利用YOLOv3算法实现目标检测(以热播新剧《庆余年》为例)案例应用
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《跑男第六季》第四期片视频段进行实时目标检测
DL之Yolov3:基于深度学习Yolov3算法实现视频目标检测之对《俄罗斯总统普京对沙特王储摊的“友好摊手 ”瞬间—东道主俄罗斯5-0完胜沙特》视频段实时检测
CV之OD:基于深度学习算法实现目标检测之GUI界面产品设计并实现图片识别 、视频识别 、摄像头识别(准确度非常高)
3 、图像分割(Image Segmentation)
CV之IS:计算机视觉之图像分割(Image Segmentation)/语义分割算法的简介 、使用方法 、案例应用之详细攻略
CV之IS:计算机视觉中图像分割(语义分割)最diao炸(完)天(整)的思维导图
CV之IS:基于pixellib库和coco数据集且加载.h5文件利用Mask RCNN算法实现图像实例分割简单代码全实现(以热播电视剧《庆余年》视频片段为例)案例应用
CV之IS:基于pixellib库和coco数据集且加载.h5文件利用deeplabv3和xception算法实现图像语义分割/图像分割简单代码全实现(以热播电视剧《庆余年》视频片段为例)案例应用
DL之Panoptic Segmentation:Panoptic Segmentation(全景分割)的简介(论文介绍)、全景分割挑战简介 、案例应用等配图集合之详细攻略
CV之IS:计算机视觉之图像分割(Image Segmentation)算法的挑战任务 、算法演化、目标检测和图像分割(语义分割/实例分割/全景分割)的对比
DL之MaskR-CNN:基于类MaskR-CNN算法(RetinaNet+mask head)利用数据集(resnet50_coco_v0.2.0.h5)实现目标检测和目标图像分割(语义分割)
Keras之Mask R-CNN:《极限挑战》第四季第2期助力高考—使用Mask R-CNN代替Photoshop抠图 、颜色填充框出目标检测/图像分割/语义分割
4 、图像增强(Image Enhancement ,图像修复/超分)
(1) 、图像修复(Image Inpainting)
(2) 、超分辨率(Super Resolution)
CV之SR:超分辨率(Super resolution)的简介 、使用方法 、案例应用之详细攻略
CV之SR:基于TF框架实现图像超分辨率源代码(提高图像的分辨率 ,源自pix2pix模型中的部分代码)
(3) 、图像上色
DL之pix2pix:基于food_resized数据集利用TF框架的pix2pix模型实现Auto Color黑白图像上色/老照片上色/黑白变彩色技术—训练&测试过程全记录
CV之IE之NoGAN:基于fastai框架利用NoGAN算法实现图像增强技术(图片上色实现对旧图像和电影片段进行着色和修复,以爱因斯坦旧照/鲁迅旧照/清末官员生活场景旧照为例)案例应用
5 、图像生成(Image Generation)
CV之IG:图像生成(Image Generation)的简介 、使用方法 、案例应用之详细攻略
CV之IG之DCGAN:基于keras框架利用深度卷积对抗网络DCGAN算法对MNIST数据集实现图像生成(保存h5模型→加载模型)案例应用
CV之IG:基于TF框架利用ResNet算法网络DIY自定义图像生成网络(定义卷积和反卷积)实现代码
DL之GAN:High&NewTech基于计算机视觉领域GAN技术—最新黑科技之秒变宝宝——回到最初的样子
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成原始的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更大尺寸的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成更高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例应用
CV之IG之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成带背景的不同尺寸高质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)案例
CV之IE之Inception:基于TF框架利用Inception模型+GD算法的某层网络图像生成不同尺寸和质量的Deep Dream幻觉梦境图片(特征可视化实现图像可解释性)—五个架构设计思维导图
6 、图像检索(Image Retrieval)
CV之IR:计算机视觉之图像检索(Image Retrieval)方向的简介 、使用方法、案例应用之详细攻略
7 、图像描述(Image Captioning) —(多模态领域)
CV之IC: 图像描述(Image Captioning) 的简介 、使用方法、案例应用之详细攻略
CV之IC:Image Caption图像描述算法的相关论文 、设计思路 、关键步骤相关配图之详细攻略
8 、图像风格迁移(Image Neural Style 图像风格变换) CycleGAN
CV之NS之ME/LF:图像风格迁移中常用的模型评估指标/损失函数(内容损失 、风格损失)简介 、使用方法之详细攻略
CV之NS:图像风格迁移(Neural Style 图像风格变换)算法简介 、过程思路 、关键步骤配图 、案例应用之详细攻略
CV之NS之CycleGAN:基于apple2orange数据集利用TF框架的CycleGAN算法实现图像风格迁移/图像转换—训练&测试过程图文教程全记录
CV之NS之VGG16:基于预训练模型VGG16训练COCO的train2014数据集实现训练《神奈川冲浪里》风格配置yml文件
CV之NS之VGG16:基于TF Slim库利用VGG16算法的预训练模型实现七种不同快速图像风格迁移设计(cubist/denoised_starry/mosaic/scream/wave)案例
CV之NS之VGG16:基于Keras框架利用VGG16算法实现图像风格迁移设计(以设计《复仇者联盟3》灭霸图像风格迁移为例)案例应用
9 、姿态估计(Image Pose Estimation)
CV之IPE之PoseEstimation:Pose Estimation人体姿态估计的简介(AI识人,OpenPose+DeepCut+RMPE+Mask RCNN) 、案例应用(活动识别)之详细攻略
CV之IPE之DNN:基于OpenPose和OpenCV利用DNN算法的.pb文件实现对视频单个体进行实时姿态估计检测(以詹姆斯扣篮+美女跳舞为例)案例应用
CV之IPE之MobiLenet:基于openpose利用CMU/MobilenetV2算法实现对多人体姿态估计检测(以勒布朗詹姆斯扣篮姿态为例)案例应用
CV之IPE之MobilenetV2:基于keras利用Mobilenet V2算法实现局部相似域的多人实时二维姿态估计(以詹姆斯扣篮+美女跳舞为例)案例应用
10 、动作识别/行为识别(行为检测和行为分类)
(1) 、手势识别
CV之API:利用Face++的人体识别接口 ,实现摄像头实时手势识别
(2)、行人追踪
C 、CV近期新的具体应用领域
1 、图像标题生成
CV之ICG:计算机视觉之图像标题生成(Image Caption Generator)算法的简介、使用方法 、案例应用之详细攻略
2 、图像动画(Image Animation)
Paper/CV之IA:《First Order Motion Model for Image Animation图像动画的一阶运动模型》翻译与解读
CV之IA:利用人工智能算法实现图像动画(以让古代皇帝画像以及古代四大美女画像动起来-来模仿偶像胡歌剧中角色表情动作为例-照片嗨起来)案例应用
3 、立体视觉
4 、多模态 、大模型(大预训练模型)
Paper:《NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion,女娲:用于神经视觉世界创造的视觉》翻译与解读
Paper:《Multimodal Machine Learning: A Survey and Taxonomy ,多模态机器学习:综述与分类》翻译与解读
Paper:《Pre-Trained Models: Past, Present and Future大规模预训练模型的发展历史 、最新现状和未来发展三个方向》翻译与解读
AI:人工智能的多模态融合模型的简介 、发展以及未来趋势
AI:大力出奇迹?Bigger is better?AI下一代浪潮?—人工智能的大语言模型(LLMs)的简介 、发展以及未来趋势
5 、知识蒸馏 、可解释性
AI:模型蒸馏/知识蒸馏(Knowledge Distilling,KD)算法的简介 、案例应用之详细攻略
DL之CNN:模型可解释性之卷积神经网络算法的卷积原理可视化——CNN网络的3D可视化(LeNet-5为例可视化)
Paper之RegNet:《Designing Network Design Spaces》的翻译与解读—2020年3月30日来自Facebook AI研究院何恺明团队最新算法RegNe
☆☆五 、经典CNN算法(偏具体算法)简介及其应用案例
1、人脸识别
Paper之CV之FR&FA:《One Millisecond Face Alignment with an Ensemble of Regression Trees》的翻译与解读
CV之FR/FD:人脸识别之Face Detection人脸检测原理及其常见分类技术
CV之FR之FAN:FAN人脸对齐网络(Face Alignment depth Network)的论文简介 、案例应用之详细攻略
DL之MTCNN:MTCNN算法的简介(论文介绍) 、架构详解、案例应用等配图集合之详细攻略
2 、图像分类
DL之LeNet-5:LeNet-5算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之VGGNet:VGGNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之ResNet:ResNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
3 、目标检测
DL之FasterR-CNN:Faster R-CNN算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之Yolo:Yolo算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之YoloV2:Yolo V2算法的简介(论文介绍)、架构详解 、案例应用等配图集合之详细攻略
DL之YoloV3:Yolo V3算法的简介(论文介绍) 、各种DL框架代码复现、架构详解 、案例应用等配图集合之详细攻略
DL之YoloV3:YoloV3论文《YOLOv3: An Incremental Improvement》的翻译与解读
DL之DSSD:DSSD算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之R-FCN:R-FCN算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
4 、语义分割
DL之DeconvNet:DeconvNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之U-Net:U-Net算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之DeepLabv1:DeepLabv1算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之DeepLabv2:DeepLab v2算法的简介(论文介绍)、架构详解 、案例应用等配图集合之详细攻略
DL之DeepLabv3:DeepLab v3和DeepLab v3+算法的简介(论文介绍) 、架构详解、案例应用等配图集合之详细攻略
DL之PSPNet:PSPNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之SegNet:SegNet图像分割/语义分割算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之GCN:GCN算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之RefineNet:RefineNet和Light-Weight RefineNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之RetinaNet:RetinaNet算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之PanopticFPN:Panoptic FPN算法的简介(论文介绍)、架构详解 、案例应用等配图集合之详细攻略
5 、图像生成
DL之CycleGAN:CycleGAN算法的简介(论文介绍)、架构详解 、案例应用等配图集合之详细攻略
DL之pix2pix:pix2pix(cGAN)自动上色算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
6 、综合总结
Pytorch之CNN:从代码认知CNN经典架构—基于Pytorch框架的代码实现经典轻量化卷积神经网络的算法集合(SqueezeNet/MobileNet3/ShuffleNet)
Pytorch之CNN:从代码认知CNN经典架构—基于Pytorch框架的代码实现经典卷积神经网络的算法集合(LeNet/AlexNet/VGG/NIN/GoogleNet/ResNet)
Pape之DL之CNN:2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》翻译并解读第一章~第三章
Pape之DL之CNN:2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》翻译并解读第四章
Pape之DL之CNN:2019《A Survey of the Recent Architectures of Deep Convolutional Neural Networks》翻译并解读第五章~第八章
DL之CNN:计算机视觉之卷积神经网络经典算法简介 、重要进展 、改进技巧之详细攻略(建议收藏)
Paper之CVPR&ICCV&ECCV:2009年~2019年CVPR&ICCV&ECCV(国际计算机视觉与模式识别会议&国际计算机视觉大会&欧洲计算机视觉会议)历年最佳论文简介及其解读
☆☆六 、CV领域常用工具 、库/框架 、现有产品
1 、常用工具
CV之LabelImg:图片标注工具之LabelImg(图像标注工具)的简介 、安装 、使用方法详细攻略
2、常用库/框架
Py之cv2:cv2(OpenCV ,opencv-python)库的简介 、安装 、使用方法(常见函数、图像基本运算等)最强详细攻略
CV之OpenCV:HALCON机器视觉软件简介&OpenCV的基础概念 、常用案例(打开图片/摄像头/视频) 、常用函数解释大全(C++/python语言)之详细攻略
CV之detectron2:detectron2的简介 、安装 、使用方法之详细攻略
CV之face_recognition:Py之face_recognition库安装 、介绍 、使用方法详细攻略
3 、现有产品
AI:华为云HiLens Kit试用测评—全栈全场景的人工智能
AI之API:人工智能领域之国内外各大人工智能平台(百度云/华为云/阿里云/Face++等)及其API的简介 、使用方法之详细攻略
☆☆七 、CV计算机视觉环境安装
CV:查看本地的电脑显卡是否支持GPU以及需要安装匹配的CUDA版本 、tensorflow_gpu版本等
CV:深度学习环境安装之Visual Studio 2015版本+CUDA8.0+Cudnn8.0+OpenCV 3.1.0版本完美搭配安装图文教程之详细攻略
CV:Win10下深度学习框架安装之Tensorflow/tensorflow_gpu+Cuda+Cudnn(最清楚/最快捷)之详细攻略(图文教程)
☆☆八 、CV领域常用数据集
Dataset之CV:人工智能领域数据集集合(计算机视觉CV方向数据集)之常见的计算机视觉图像数据集大集合(包括表面缺陷检测数据集,持续更新)
Dataset之CelebA&man2woman:CelebA&man2woman 数据集的简介 、安装、使用方法之详细攻略
☆☆九 、CV编程代码技巧
1 、模型训练过程记录
CV之OD之YOLO:深度学习之计算机视觉神经网络tiny-yolo-5clessses训练自己的数据集全程记录
CV之OD之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录
CV之OD之YOLOv3:深度学习之计算机视觉神经网络Yolov3-5clessses训练自己的数据集全程记录(第二次)
2、模型转换/导出技巧
CV之OD之YOLO:将yolo的.weights文件转换为tensorflow 、keras等深度学习框架模型所需的.h5文件的图文教程(源代码来自YOLO)
CV之IC:基于Keras框架利用mini_XCEPTION算法实现训练性别分类hdf5模型导出并保存到指定文件夹下代码实现
DL:基于keras和tensorflow 框架保存网络结构/网络拓扑图/网络模型(json 、yaml 、h5等文件)注意事项及代码实现(保存和加载.h5模型文件案例)之详细攻略
计算机视觉技最强学习路线
1 、CV市场岗位要求
Interview之CV:人工智能领域求职岗位—计算机视觉算法工程师的职位简介 、薪资介绍 、知识结构之详细攻略
Interview之CV:人工智能领域求职岗位—计算机视觉算法工程师的职位简介 、薪资介绍 、知识结构之详细攻略_一个处女座的程序猿的博客-CSDN博客_计算机视觉算法工程师简历
Interview之ML:机器学习算法工程师结构知识思维导图集合 、求职九大必备技能之【数学基础 、特征工程能力 、模型评估和优化 、机器学习基本概念/经典算法、深度学习算法 、业务与应用】(持续更新)
Interview:机器学习算法工程师求职九大必备技能之【数学基础 、工程能力、特征工程 、模型评估 、优化算法 、机器学习基本概念 、经典机器学习模型 、深度学习模型 、业务与应用】(建议收藏 ,持续更新)_一个处女座的程序猿的博客-CSDN博客_机器学习中的工程能力
Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础 、ML算法简介 、DL算法简介)来理解技术交互流程
Interview之AI:人工智能领域岗位求职面试—人工智能算法工程师知识框架及课程大纲(AI基础之数学基础/数据结构与算法/编程学习基础 、ML算法简介 、DL算法简介)来理解技术交互流程_一个处女座的程序猿的博客-CSDN博客
Interview之AI:深度学习算法工程师面试之常见专业知识考点(参数初始化策略(Lecun 、Xavier/Glorot 、Kaiming、基于BN的随机的参数初始化) 、图像算法基础(ROI)
Interview之AI:深度学习算法工程师面试之常见专业知识考点(参数初始化策略(Lecun 、Xavier/Glorot、Kaiming 、基于BN的随机的参数初始化) 、图像算法基础(ROI)_一个处女座的程序猿的博客-CSDN博客
2 、CV综合应用领域(自动驾驶等)
AI:人工智能领域之国内外人工智能产业应用图谱应用层/基础层详解—AI八大应用领域之医疗/家居/驾驶/零售/城市/教育/金融/交通 、(AI三大基础(算法【计算机视觉/自然语言处理/机器学习 、科研院所/开源社区】 、数据【IOT/互联网/手机/传感器/音视频】 、计算【计算芯片/服务器及存储器/AI软件框架/云服务】)
AI:人工智能领域之国内外人工智能产业应用图谱应用层/基础层详解—AI八大应用领域之医疗/家居/驾驶/零售/城市/教育/金融/交通 、(AI三大基础(算法【计算机视觉/自然语言处理/机器学习 、科研院所/_一个处女座的程序猿的博客-CSDN博客_ai应用层
(1) 、安防领域—疑犯追踪 、视频结构化
(2) 、金融及互联网领域—刷脸认证
(3)、手机及娱乐领域—影像分类/影像处理/AR特效
(4) 、零售领域—商品识别
(5) 、广告营销领域—自动化挖掘影像内容广告位
(6)、工业领域—产品质检/3D分拣
(7) 、医疗领域—医疗影像分析
(8) 、自动驾驶领域—环境感知/高精地图/定位
CV:无人驾驶/自动驾驶汽车中涉及的软硬件技术(摄像头 、雷达 、激光雷达) 、计算机视觉技术(检测 、分类 、跟踪 、语义分割)的简介
CV:无人驾驶/自动驾驶汽车中涉及的软硬件技术(摄像头 、雷达 、激光雷达) 、计算机视觉技术(检测 、分类、跟踪 、语义分割)的简介_一个处女座的程序猿的博客-CSDN博客_无人驾驶中的计算机视觉技术
High&NewTech:基于人工智能的自动驾驶技术的前世今生之Why 、What、How最强分析与总结(包括自动驾驶L5个分级详细标准 ,非常建议收藏)
High&NewTech:基于人工智能的自动驾驶技术的前世今生之Why 、What 、How最强分析与总结(包括自动驾驶L5个分级详细标准 ,非常建议收藏)_一个处女座的程序猿的博客-CSDN博客
(9) 、无人机/机器人领域—环境感知/定位/自动避障
3 、基本必备技能(5+1大基础)——AI人才的基本属性
(1) 、领域概念术语基础
因为AI发展较快 ,大多数都不是学生时代就能学到的 ,即课本上没有的 ,比如
优化相关:分箱 、正则化 ,BP 、激活函数 ,卷积 、池化等;
算法名称:LoR/SVM 、CNN-LeNet/Alexnet 、RNN-LSTM/GRU 、Attention-TransformerGPT/BERT等;AI:人工智能领域之AI基础概念术语之《Google发布机器学习术语表 (中英对照)》——持续更新ML 、DL相关概念2018年4月!
AI:人工智能概念之《Google发布机器学习术语表 (中英对照)》——持续更新ML、DL相关概念2018年4月!_一个处女座的程序猿的博客-CSDN博客
AI:人工智能领域之AI基础概念术语之机器学习 、深度学习 、数据挖掘中常见关键词、参数等5000多个单词中英文对照(绝对干货)
AI:人工智能概念之机器学习 、深度学习 、数据挖掘中常见关键词 、参数等5000多个单词中英文对照(绝对干货)_一个处女座的程序猿的博客-CSDN博客_人工智能中英文对照
AI:人工智能领域主要方向(技术和应用) 、与机器学习/深度学习的关系 、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)
AI:人工智能领域主要方向(技术和应用) 、与机器学习/深度学习的关系 、数据科学关键技术与知识发现/数据挖掘/统计学/模式识别/神经计算学/数据库的关系(几张图理清之间的暧昧关系)_一个处女座的程序猿的博客-CSDN博客
(2) 、学术知识基础——懂理论
数学基础【会推导】包括
:
高等数学:凸函数/最优化 、求导/偏导数;
线性代数:矩阵/向量运算;
概率统计:贝叶斯等;
英语基础【看论文】包括:至少也要个英语六级 ,目的是要紧跟时代 ,多去看AI技术前沿paper;一般大学期间 ,多少都会学过 ,如果有基础,此处可以略过 ,因为在计算机视觉中 ,常用的主要与卷积相关
ML与math:机器学习与高等数学基础概念 、代码实现 、案例应用之详细攻略——基础篇
ML与math:机器学习与高等数学基础概念 、代码实现、案例应用之详细攻略——基础篇_一个处女座的程序猿的博客-CSDN博客
ML与math:机器学习与高等数学基础概念 、代码实现 、案例应用之详细攻略——进阶篇
ML与math:机器学习与高等数学基础概念、代码实现 、案例应用之详细攻略——进阶篇_一个处女座的程序猿的博客-CSDN博客
(3) 、编程语言基础——能实践
C++和python,至少会一门编程语言 ,还要懂数据结构和会写机器学习算法代码;
Computer:少儿编程—每个人都应该学习编程 ,它能教你如何思考—编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言) 、编程应用 、编程意义之详细攻略
Computer:少儿编程—每个人都应该学习编程 ,它能教你如何思考—编程入门的简介(编程语言的特点&种类&开发工具&对比人类语言) 、编程应用 、编程意义之详细攻略_一个处女座的程序猿的博客-CSDN博客
Computer:C语言/C++语言的简介 、发展历史 、应用领域 、编程语言环境IDE安装 、学习路线之详细攻略
Computer:C语言/C++语言的简介 、发展历史 、应用领域、编程语言环境IDE安装 、学习路线之详细攻略_一个处女座的程序猿的博客-CSDN博客
Python:Python语言的简介(语言特点/pyc介绍/Python版本语言兼容问题(python2 VS Python3)) 、安装、学习路线(数据分析/机器学习/网页爬等编程案例分析)之详细攻略
Python:Python语言的简介(语言特点/pyc介绍/Python版本语言兼容问题(python2 VS Python3)) 、安装 、学习路线(数据分析/机器学习/网页爬等编程案例分析)之详细攻略_一个处女座的程序猿的博客-CSDN博客
Matlab:Matlab编程语言的简介 、安装 、学习路线(几十项代码编程案例分析)之详细攻略
Python:Python语言的简介(语言特点/pyc介绍/Python版本语言兼容问题(python2 VS Python3)) 、安装 、学习路线(数据分析/机器学习/网页爬等编程案例分析)之详细攻略_一个处女座的程序猿的博客-CSDN博客
(4) 、深度学习框架基础—会优化
AI:Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介 、案例应用之详细攻略
AI:Python与人工智能相关的库/框架(机器学习&深度学习&数据科学/计算机视觉/自然语言处理)的简介 、案例应用之详细攻略_一个处女座的程序猿的博客-CSDN博客
(5) 、人工智能领域算法背景基础——领域项目经验
AI:全球人工智能领域代表性学者简介及大佬们的关系圈—向大佬们学习(国外内分开,持续更新/建议收藏)
AI:全球人工智能领域代表性学者简介及大佬们的关系圈—向大佬们学习(国外内分开,持续更新/建议收藏)_一个处女座的程序猿的博客-CSDN博客
AI:人工智能领域之《A Simple Tool to Start Making Decisions with the Help of AI—借助人工智能开始决策的简单工具》翻译与解读
AI:人工智能领域之《A Simple Tool to Start Making Decisions with the Help of AI—借助人工智能开始决策的简单工具》翻译与解读_一个处女座的程序猿的博客-CSDN博客_如何安装xlrd库
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法) 、分类/回归/聚类/降维算法模型选择思路 、11类机器学习算法详细分类之详细攻略
AI:人工智能领域算法思维导图集合之有监督学习/无监督学习/强化学习类型的具体算法简介(预测函数/优化目标/求解算法)、分类/回归/聚类/降维算法模型选择思路 、11类机器学习算法详细分类之详细攻略_一个处女座的程序猿的博客-CSDN博客
(6) 、传统的数字图像处理及OpenCV基础——传统专业基础
4、计算机视觉算法工程师基本技能
一 、计算机视觉的简介
二 、计算机视觉相关概念简介
三 、传统的计算机视觉技术之机器视觉/计算机图形学
四 、CV早期 、中期 、近期具体应用领域(偏具体应用)及其应用案例
五 、经典CNN算法(偏具体算法)简介及其应用案例
六 、CV领域常用工具 、库/框架 、现有产品
七 、CV计算机视觉环境安装
八 、CV领域常用数据集
九、CV编程代码技巧
☆☆一 、计算机视觉的简介
CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊 、主要研究方向)、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略
CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊 、主要研究方向) 、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略_一个处女座的程序猿的博客-CSDN博客_计算机视觉的研究方向
☆☆二 、计算机视觉相关概念简介
1 、计算机视觉的语义鸿沟概念
计算机看到的图像 ,是由许多[0,255]之间的数值组成的 。如果要让计算机像人类一样去识别和感知 ,之间会存在语义鸿沟 。
(1) 、跨越语义鸿沟的几大挑战
视角变化
光照变化
背景凌乱
图像变形
图像遮挡
类内差别:比如同样是猫 ,但是有的之间也是差别很大 。2 、卷积概念
膨胀卷积/扩张卷积
DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略
DL之DilatedConvolutions:Dilated Convolutions(膨胀卷积/扩张卷积)算法的简介(论文介绍) 、架构详解 、案例应用等配图集合之详细攻略_一个处女座的程序猿的博客-CSDN博客
DL之CNN:卷积神经网络算法简介之卷积矩阵 、转置卷积(反卷积Transpose) 、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略
DL之CNN:卷积神经网络算法简介之卷积矩阵、转置卷积(反卷积Transpose) 、膨胀卷积(扩张卷积Dilated/带孔卷积atrous)之详细攻略_一个处女座的程序猿的博客-CSDN博客
☆☆三 、传统的计算机视觉技术之机器视觉/计算机图形学
计算机图形学(Computer Graphics ,简称CG)是一种使用数学算法将二维或三维图形转化为计算机显示器的栅格形式的科学 。简单地说 ,计算机图形学的主要研究内容就是研究如何在计算机中表示图形、以及利用计算机进行图形的计算 、处理和显示的相关原理与算法 。
1 、基础知识
CV:传统视觉知识—机器视觉系统的基础知识(机器视觉三要素+典型的工业机器视觉系统五大组件
CV:传统视觉知识—机器视觉系统的基础知识(机器视觉三要素+典型的工业机器视觉系统五大组件)_一个处女座的程序猿的博客-CSDN博客_传统机器视觉
CV:计算机视觉技术之图像基础知识(一)—以python的cv2库来了解计算机视觉图像基础(傅里叶变换-频域-时域/各种滤波器-线性-非线性-均值-中值-高斯-双边)
CV:计算机视觉技术之图像基础知识(一)—以python的cv2库来了解计算机视觉图像基础(傅里叶变换-频域-时域/各种滤波器-线性-非线性-均值-中值-高斯-双边)_一个处女座的程序猿的博客-CSDN博客
CV:计算机视觉技术之图像基础知识(二)—以python的skimage和numpy库来了解计算机视觉图像基础(图像存储原理-模糊核-锐化核-边缘检测核 ,进阶卷积神经网络(CNN)的必备基础)
CV:计算机视觉技术之图像基础知识(二)—以python的skimage和numpy库来了解计算机视觉图像基础(图像存储原理-模糊核-锐化核-边缘检测核 ,进阶卷积神经网络(CNN)的必备基础)_一个处女座的程序猿的博客-CSDN博客
CV:计算机视觉技术之图像基础知识(二)—图像内核的九种卷积核可视化解释(blur/bottom sobel /emboss/identity /sobel /outline/sharpen)
CV:计算机视觉技术之图像基础知识(二)—图像内核的九种卷积核可视化解释(blur/bottom sobel /emboss/identity /sobel /outline/sharpen)_一个处女座的程序猿的博客-CSDN博客_图像内核
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础—视频操作相关案例及其代码实现(将多张图片存为视频/另存为avi视频/录制摄像头)
https://yunyaniu.blog.csdn.net/article/details/103552458
CV:计算机视觉技术之图像基础知识—以python的cv2库来了解计算机视觉图像基础(边缘检测算子+平滑+轮廓标注+形态学+金字塔+傅里叶变换)—代码实现
https://yunyaniu.blog.csdn.net/article/details/102751382
CV之HOG:图像特征提取之基于方向梯度直方图HOG算法的简介 、代码实现(计算图像相似度)之详细攻略
CV之HOG:图像特征提取之基于方向梯度直方图HOG算法的简介 、代码实现(计算图像相似度)之详细攻略_一个处女座的程序猿的博客-CSDN博客
2 、像素检测
CV之cv2:基于python语言利用cv2库对几何形状图像边界进行识别检测并计算周长/面积以及输出颜色/形状类型之详细攻略
CV之cv2:基于python语言利用cv2库对几何形状图像边界进行识别检测并计算周长/面积以及输出颜色/形状类型之详细攻略_一个处女座的程序猿的博客-CSDN博客_cv2 形状
CV之FD之HOG:图像检测之基于HOG算法 、简介 、代码实现(计算图像相似度)之详细攻略
CV之FD之HOG:图像检测之基于HOG算法 、简介 、代码实现(计算图像相似度)之详细攻略_一个处女座的程序猿的博客-CSDN博客
3 、图形可视化
待定
4 、数据预处理
CV之FE:基于TF框架对图像进行数据预处理—去除异常(被损坏)图像 和单通道图像代码实现
CV之FE:基于TF框架对图像进行数据预处理—去除异常(被损坏)图像 和单通道图像代码实现_一个处女座的程序猿的博客-CSDN博客
CV:利用python的cv2库实现图像数据增强—随机裁剪 、随机旋转、随机hsv变换 、随机gamma变换代码实现
https://yunyaniu.blog.csdn.net/article/details/102884978
5 、图像生成
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据随机指定七个字符生成逼真车牌图片数据集(自然场景下+各种噪声效果)可视化
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据随机指定七个字符生成逼真车牌图片数据集(自然场景下+各种噪声效果)可视化_一个处女座的程序猿的博客-CSDN博客
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符生成逼真车牌图片(自然场景+各噪效果+对应txt说明文档)
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符生成逼真车牌图片(自然场景+各噪效果+对应txt说明文档)_一个处女座的程序猿的博客-CSDN博客
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
Dataset之图片数据增强:设计自动生成(高级封装之命令行解析实现)汽车车牌图片算法(cv2+PIL+argparse)根据随机指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)_一个处女座的程序猿的博客-CSDN博客
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)
Dataset之图片数据增强:设计自动生成汽车车牌图片算法(cv2+PIL)根据指定七个字符自动生成逼真车牌图片数据集(带各种噪声效果)_一个处女座的程序猿的博客-CSDN博客
6、其他相关技术(如SLAM)
CV之VSLAM:SLAM/VSLAM的简介 、视觉SLAM的五大流程之详细攻略
CV之VSLAM:SLAM/VSLAM的简介 、视觉SLAM的五大流程之详细攻略_一个处女座的程序猿的博客-CSDN博客
☆☆四 、CV早期 、中期 、近期具体应用领域(偏具体应用)及其应用案例
A 、CV早期应用领域
1 、OCR文字识别
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测
MXNet之CNN:自定义CNN-OCR算法训练车牌数据集(umpy.ndarray格式数据)的模型实现一张新车牌照片字符预测_一个处女座的程序猿的博客-CSDN博客
DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—预测过程
DL之CNN:基于CRNN_OCR算法(keras,CNN+RNN)利用数据集(torch,mdb格式)训练来实现新图片上不定长度字符串进行识别—预测过程_一个处女座的程序猿的博客-CSDN博客
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别
DL之CNN:利用CNN(keras, CTC loss, {image_ocr})算法实现OCR光学字符识别_一个处女座的程序猿的博客-CSDN博客
2 、计算图像相似度
CV之Hog+HamMingDistance:基于Hog提取和汉明距离对比实现计算图像相似度案例—for循环将多个成对图片依次对比并输出相似度
CV之Hog+HamMingDistance:基于Hog提取和汉明距离对比实现计算图像相似度案例—for循环将多个成对图片依次对比并输出相似度_一个处女座的程序猿的博客-CSDN博客
ML之Hog_HammingDistance:基于Hog特征提取“RGB ”图像的768个值的单向vector利用汉明距离算法实现计算图像相似度案例
ML之Hog_HammingDistance:基于Hog特征提取“RGB ”图像的768个值的单向vector利用汉明距离算法实现计算图像相似度案例_一个处女座的程序猿的博客-CSDN博客
ML之Hash_EditDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用编辑距离算法实现计算图像相似度案例
ML之Hash_EditDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用编辑距离算法实现计算图像相似度案例_一个处女座的程序猿的博客-CSDN博客
ML之Hash_HamMingDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用汉明距离算法实现计算图像相似度案例
ML之Hash_HamMingDistance:基于输入图片哈希化(均值哈希+差值哈希)即8*8个元素的单向vector利用汉明距离算法实现计算图像相似度案例_一个处女座的程序猿的博客-CSDN博客
ML之SSIM:基于输入图片RGB的三维向量利用SSIM(结构相似性度量)算法实现计算图像相似度案例
ML之SSIM:基于输入图片RGB的三维向量利用SSIM(结构相似性度量)算法实现计算图像相似度案例_一个处女座的程序猿的博客-CSDN博客
ML之SIFT_FLANN:FLANN算法的简介 、使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略
ML之SIFT_FLANN:FLANN算法的简介 、使用方法(对图片提取SIFT特征并利用FLANN方法实现计算图像相似度并可视化案例)之详细攻略_一个处女座的程序猿的博客-CSDN博客_sift flann
CV之kNN/flann:基于ORB提取+kNN检测器 、基于SIFT提取+flann检测器实现计算图像相似度并可视化代码实现
创心域SEO版权声明:以上内容作者已申请原创保护,未经允许不得转载,侵权必究!授权事宜、对本内容有异议或投诉,敬请联系网站管理员,我们将尽快回复您,谢谢合作!