主要内容

对象检测

使用卷积神经网络(CNNs,或ConvNets)执行分类,目标检测,转移学习,创建定制的探测器

物体检测是一种计算机视觉技术,用于定位图像或视频中的物体实例。对象检测算法通常利用机器学习深度学习产生有意义的结果。在观看图像或视频时,人类可以在瞬间识别并定位感兴趣的物体。物体检测的目标是用计算机复制这种智能。对象检测的最佳方法取决于您的应用程序和您试图解决的问题。

深度学习技术需要大量标记的训练图像,因此建议使用GPU来减少训练模型所需的时间。基于深度学习的目标检测方法使用卷积神经网络(cnn或ConvNets),如R-CNN和YOLO,或使用单次检测(SSD)。您可以训练一个自定义的对象检测器,或者使用一个预先训练的对象检测器转移学习,这种方法使您能够从预先训练的网络开始,然后针对您的应用程序对其进行微调。卷积神经网络需要深度学习工具箱™。CUDA支持训练和预测®有能力的GPU。推荐使用GPU,并需要并行计算工具箱™。有关更多信息,请参见计算机视觉工具箱首选项而且MathWorks产品中的并行计算支持2022世界杯八强谁会赢?(并行计算工具箱)

用于物体检测的机器学习技术包括聚合通道特征(ACF),使用定向梯度直方图(HOG)特征的支持向量机(SVM)分类,以及人脸或上半身检测的Viola-Jones算法。您可以选择从一个预先训练的对象检测器开始,或者创建一个自定义的对象检测器以适应您的应用程序。

目标检测,神经网络

应用程序

图片标志 为计算机视觉应用程序标记图像
贴标签机视频 计算机视觉应用的视频标签

功能

全部展开

深度学习检测器

rcnnObjectDetector 使用R-CNN深度学习检测器检测对象
fastRCNNObjectDetector 使用快速R-CNN深度学习检测器检测对象
fasterRCNNObjectDetector 使用Faster R-CNN深度学习检测器检测对象
ssdObjectDetector 使用SSD深度学习检测器检测对象
yolov2ObjectDetector 使用YOLO v2对象检测器检测对象
yolov3ObjectDetector 使用YOLO v3对象检测器检测对象
yolov4ObjectDetector 使用YOLO v4对象检测器检测对象
maskrcnn 使用Mask R-CNN实例分割检测对象

基于功能的探测器

光学字符识别 使用光学字符识别识别文本
readAprilTag 检测和估计图像中AprilTag的姿态
readBarcode 检测和解码图像中的一维或二维条码
acfObjectDetector 使用聚合通道特性检测对象
peopleDetectorACF 使用聚合通道特性检测人员
愿景。CascadeObjectDetector 使用Viola-Jones算法检测对象
愿景。ForegroundDetector 使用高斯混合模型的前景检测
愿景。PeopleDetector 使用HOG功能检测正直的人
愿景。BlobAnalysis 连通区域的性质

使用点特征检测对象

detectBRISKFeatures 检测BRISK特征并返回BRISKPoints对象
detectFASTFeatures 使用FAST算法检测拐角并返回cornerPoints对象
detectHarrisFeatures 使用Harris-Stephens算法检测拐角并返回cornerPoints对象
detectKAZEFeatures 检测KAZE特征并返回KAZEPoints对象
detectMinEigenFeatures 利用最小特征值算法检测拐角并返回cornerPoints对象
detectMSERFeatures 检测MSER特征并返回MSERRegions对象
detectORBFeatures 检测ORB关键点并返回一个ORBPoints对象
detectSIFTFeatures 检测尺度不变特征变换(SIFT)特征和返回SIFTPoints对象
detectSURFFeatures 检测SURF特征并返回SURFPoints对象
extractFeatures 提取兴趣点描述符
matchFeatures 找到匹配的特征

选择检测对象

selectStrongestBbox 从重叠的集群中选择最强的边界框
selectStrongestBboxMulticlass 从重叠的集群中选择最强的多类边界框

负荷训练数据

boxLabelDatastore 绑定框标签数据的数据存储
groundTruth 地面真值标签数据
imageDatastore 图像数据的数据存储
objectDetectorTrainingData 为对象检测器创建训练数据
结合 合并来自多个数据存储的数据

训练基于特征的对象检测器

trainACFObjectDetector 训练ACF对象检测器
trainCascadeObjectDetector 训练级联对象检测器模型
trainImageCategoryClassifier 训练一个图像分类器

训练基于深度学习的对象检测器

trainRCNNObjectDetector 训练一个R-CNN深度学习对象检测器
trainFastRCNNObjectDetector 训练一个快速R-CNN深度学习对象检测器
trainFasterRCNNObjectDetector 训练一个更快的R-CNN深度学习对象检测器
trainSSDObjectDetector 培训SSD深度学习对象检测器
trainYOLOv2ObjectDetector 训练YOLO v2对象检测器
trainYOLOv4ObjectDetector 训练YOLO v4对象检测器
trainMaskRCNN 训练掩码R-CNN网络执行实例分割

用于深度学习的训练数据扩充和预处理

balanceBoxLabels 平衡边界框标签的对象检测
bboxcrop 裁剪边框
bboxerase 删除边框
bboxresize 调整边框的大小
bboxwarp 对边界框应用几何变换
bbox2points 转换矩形到角点列表
imwarp 对图像进行几何变换
imcrop 作物图像
imresize 调整图像
randomAffine2d 创建随机化的二维仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomWindow2d 随机选择图像中的矩形区域
integralImage 计算二维积分图像

R-CNN(卷积神经网络区域)

rcnnBoxRegressionLayer 盒子回归层的快速和更快的R-CNN
fasterRCNNLayers 创建一个更快的R-CNN对象检测网络
rpnSoftmaxLayer 区域提议网络(RPN)的Softmax层
rpnClassificationLayer 区域提议网络(RPNs)的分类层
regionProposalLayer 区域建议层更快R-CNN
roiAlignLayer Mask-CNN的非量化ROI池化层
roiInputLayer 快速R-CNN的ROI输入层
roiMaxPooling2dLayer 神经网络层用于输出矩形roi的固定大小的特征映射
roialign 的非量化ROI池dlarray数据

YOLO v2(只看一次版本2)

yolov2Layers 创建YOLO v2对象检测网络
yolov2TransformLayer 为YOLO v2对象检测网络创建转换层
yolov2OutputLayer 为YOLO v2对象检测网络创建输出层
spaceToDepthLayer 空间到深度层

焦损耗层

focalLossLayer 使用焦损耗函数创建焦损耗层
focalCrossEntropy 计算焦交叉熵损失

SSD(单发探测器)

ssdMergeLayer 创建SSD合并层用于对象检测

锚箱

estimateAnchorBoxes 估计深度学习对象检测器的锚盒
cuboid2img 从三维世界坐标投影长方体到二维图像坐标
insertObjectAnnotation 注释真彩色或灰度图像或视频流
insertObjectMask 在图像或视频流中插入掩码
insertShape 在图像或视频中插入形状
showShape 在图像、视频或点云上显示形状
evaluateDetectionAOS 评价目标检测的平均方向相似度度量
evaluateDetectionMissRate 评估目标检测的脱靶率指标
evaluateDetectionPrecision 评估目标检测的精度指标
bboxOverlapRatio 计算包围盒重叠比
bboxPrecisionRecall 计算边界框精度和根据地面真理的召回
evaluateInstanceSegmentation 评估实例分割数据集与地面真相
instanceSegmentationMetrics 实例分割质量度量

深度学习对象检测器 使用训练过的深度学习对象检测器检测对象

主题

开始

面向对象检测和语义分割的训练数据

开始学习深度学习

  • 深度网络设计器(深度学习工具箱)
  • 深度学习层列表(深度学习工具箱)
    在MATLAB中发现所有的深度学习层®
  • MATLAB中的深度学习(深度学习工具箱)
    在MATLAB中使用卷积神经网络进行分类和回归,包括预先训练的网络和转移学习,以及在gpu、cpu、集群和云上的训练,发现深度学习能力。
  • 预训练深度神经网络(深度学习工具箱)
    学习如何下载和使用预先训练的卷积神经网络进行分类,转移学习和特征提取。
Baidu
map