对象检测

使用卷积神经网络(CNNs，或ConvNets)执行分类，目标检测，转移学习，创建定制的探测器

物体检测是一种计算机视觉技术，用于定位图像或视频中的物体实例。对象检测算法通常利用机器学习或深度学习产生有意义的结果。在观看图像或视频时，人类可以在瞬间识别并定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量标记的训练图像，因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets)，如R-CNN和YOLO，或使用单次检测(SSD)。您可以训练一个自定义的对象检测器，或者使用一个预先训练的对象检测器转移学习，这种方法使您能够从预先训练的网络开始，然后针对您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测^®有能力的GPU。推荐使用GPU，并需要并行计算工具箱™。有关更多信息，请参见计算机视觉工具箱首选项而且MathWorks产品中的并行计算支持2022世界杯八强谁会赢？(并行计算工具箱)．

用于物体检测的机器学习技术包括聚合通道特征(ACF)，使用定向梯度直方图(HOG)特征的支持向量机(SVM)分类，以及人脸或上半身检测的Viola-Jones算法。您可以选择从一个预先训练的对象检测器开始，或者创建一个自定义的对象检测器以适应您的应用程序。

应用程序

图片标志	为计算机视觉应用程序标记图像
贴标签机视频	计算机视觉应用的视频标签

功能

全部展开

检测对象

深度学习检测器

`rcnnObjectDetector`	使用R-CNN深度学习检测器检测对象
`fastRCNNObjectDetector`	使用快速R-CNN深度学习检测器检测对象
`fasterRCNNObjectDetector`	使用Faster R-CNN深度学习检测器检测对象
`ssdObjectDetector`	使用SSD深度学习检测器检测对象
`yolov2ObjectDetector`	使用YOLO v2对象检测器检测对象
`yolov3ObjectDetector`	使用YOLO v3对象检测器检测对象
`yolov4ObjectDetector`	使用YOLO v4对象检测器检测对象
`maskrcnn`	使用Mask R-CNN实例分割检测对象

基于功能的探测器

`光学字符识别`	使用光学字符识别识别文本
`readAprilTag`	检测和估计图像中AprilTag的姿态
`readBarcode`	检测和解码图像中的一维或二维条码
`acfObjectDetector`	使用聚合通道特性检测对象
`peopleDetectorACF`	使用聚合通道特性检测人员
`愿景。CascadeObjectDetector`	使用Viola-Jones算法检测对象
`愿景。ForegroundDetector`	使用高斯混合模型的前景检测
`愿景。PeopleDetector`	使用HOG功能检测正直的人
`愿景。BlobAnalysis`	连通区域的性质

使用点特征检测对象

`detectBRISKFeatures`	检测BRISK特征并返回`BRISKPoints`对象
`detectFASTFeatures`	使用FAST算法检测拐角并返回`cornerPoints`对象
`detectHarrisFeatures`	使用Harris-Stephens算法检测拐角并返回`cornerPoints`对象
`detectKAZEFeatures`	检测KAZE特征并返回`KAZEPoints`对象
`detectMinEigenFeatures`	利用最小特征值算法检测拐角并返回`cornerPoints`对象
`detectMSERFeatures`	检测MSER特征并返回`MSERRegions`对象
`detectORBFeatures`	检测ORB关键点并返回一个`ORBPoints`对象
`detectSIFTFeatures`	检测尺度不变特征变换(SIFT)特征和返回`SIFTPoints`对象
`detectSURFFeatures`	检测SURF特征并返回`SURFPoints`对象
`extractFeatures`	提取兴趣点描述符
`matchFeatures`	找到匹配的特征

选择检测对象

`selectStrongestBbox`	从重叠的集群中选择最强的边界框
`selectStrongestBboxMulticlass`	从重叠的集群中选择最强的多类边界框

训练自定义对象检测器

负荷训练数据

`boxLabelDatastore`	绑定框标签数据的数据存储
`groundTruth`	地面真值标签数据
`imageDatastore`	图像数据的数据存储
`objectDetectorTrainingData`	为对象检测器创建训练数据
`结合`	合并来自多个数据存储的数据

训练基于特征的对象检测器

`trainACFObjectDetector`	训练ACF对象检测器
`trainCascadeObjectDetector`	训练级联对象检测器模型
`trainImageCategoryClassifier`	训练一个图像分类器

训练基于深度学习的对象检测器

`trainRCNNObjectDetector`	训练一个R-CNN深度学习对象检测器
`trainFastRCNNObjectDetector`	训练一个快速R-CNN深度学习对象检测器
`trainFasterRCNNObjectDetector`	训练一个更快的R-CNN深度学习对象检测器
`trainSSDObjectDetector`	培训SSD深度学习对象检测器
`trainYOLOv2ObjectDetector`	训练YOLO v2对象检测器
`trainYOLOv4ObjectDetector`	训练YOLO v4对象检测器
`trainMaskRCNN`	训练掩码R-CNN网络执行实例分割

用于深度学习的训练数据扩充和预处理

`balanceBoxLabels`	平衡边界框标签的对象检测
`bboxcrop`	裁剪边框
`bboxerase`	删除边框
`bboxresize`	调整边框的大小
`bboxwarp`	对边界框应用几何变换
`bbox2points`	转换矩形到角点列表
`imwarp`	对图像进行几何变换
`imcrop`	作物图像
`imresize`	调整图像
`randomAffine2d`	创建随机化的二维仿射变换
`centerCropWindow2d`	创建矩形中心裁剪窗口
`randomWindow2d`	随机选择图像中的矩形区域
`integralImage`	计算二维积分图像

设计目标检测深度神经网络

R-CNN(卷积神经网络区域)

`rcnnBoxRegressionLayer`	盒子回归层的快速和更快的R-CNN
`fasterRCNNLayers`	创建一个更快的R-CNN对象检测网络
`rpnSoftmaxLayer`	区域提议网络(RPN)的Softmax层
`rpnClassificationLayer`	区域提议网络(RPNs)的分类层
`regionProposalLayer`	区域建议层更快R-CNN
`roiAlignLayer`	Mask-CNN的非量化ROI池化层
`roiInputLayer`	快速R-CNN的ROI输入层
`roiMaxPooling2dLayer`	神经网络层用于输出矩形roi的固定大小的特征映射
`roialign`	的非量化ROI池`dlarray`数据

YOLO v2(只看一次版本2)

`yolov2Layers`	创建YOLO v2对象检测网络
`yolov2TransformLayer`	为YOLO v2对象检测网络创建转换层
`yolov2OutputLayer`	为YOLO v2对象检测网络创建输出层
`spaceToDepthLayer`	空间到深度层

焦损耗层

`focalLossLayer`	使用焦损耗函数创建焦损耗层
`focalCrossEntropy`	计算焦交叉熵损失

SSD(单发探测器)

ssdMergeLayer 创建SSD合并层用于对象检测

锚箱

estimateAnchorBoxes 估计深度学习对象检测器的锚盒

可视化检测结果

`cuboid2img`	从三维世界坐标投影长方体到二维图像坐标
`insertObjectAnnotation`	注释真彩色或灰度图像或视频流
`insertObjectMask`	在图像或视频流中插入掩码
`insertShape`	在图像或视频中插入形状
`showShape`	在图像、视频或点云上显示形状

评估检测结果

`evaluateDetectionAOS`	评价目标检测的平均方向相似度度量
`evaluateDetectionMissRate`	评估目标检测的脱靶率指标
`evaluateDetectionPrecision`	评估目标检测的精度指标
`bboxOverlapRatio`	计算包围盒重叠比
`bboxPrecisionRecall`	计算边界框精度和根据地面真理的召回
`evaluateInstanceSegmentation`	评估实例分割数据集与地面真相
`instanceSegmentationMetrics`	实例分割质量度量

块

深度学习对象检测器

使用训练过的深度学习对象检测器检测对象

主题

开始

开始使用深度学习进行对象检测
利用深度学习神经网络进行目标检测。
点特征类型
为几种类型的特征选择返回和接受点对象的函数。
坐标系统
指定像素索引、空间坐标和3-D坐标系
局部特征检测与提取
学习局部特征检测和提取的好处和应用。
用视觉词袋进行图像分类
使用计算机视觉工具箱™功能，通过创建一个视觉单词包来进行图像类别分类。
开始使用级联对象检测器
训练自定义分类器
选择函数来可视化检测到的对象
比较可视化功能。

面向对象检测和语义分割的训练数据

开始使用图像标签
交互式标记矩形roi用于对象检测，像素用于语义分割，多边形用于实例分割，场景用于图像分类。
开始使用视频标签
交互式标记矩形roi用于对象检测，像素用于语义分割，多边形用于实例分割，场景用于视频或图像序列中的图像分类。
用于深度学习的数据存储(深度学习工具箱)
了解如何在深度学习应用程序中使用数据存储。
开始使用掩码R-CNN实例分割
使用Mask R-CNN和深度学习进行多类实例分割。
面向对象检测和语义分割的训练数据
创建用于对象检测或语义分割的训练数据图片标志或贴标签机视频．

开始学习深度学习

深度网络设计器(深度学习工具箱)
深度学习层列表(深度学习工具箱)
在MATLAB中发现所有的深度学习层^®．
MATLAB中的深度学习(深度学习工具箱)
在MATLAB中使用卷积神经网络进行分类和回归，包括预先训练的网络和转移学习，以及在gpu、cpu、集群和云上的训练，发现深度学习能力。
预训练深度神经网络(深度学习工具箱)
学习如何下载和使用预先训练的卷积神经网络进行分类，转移学习和特征提取。