主要内容

视频分类

使用深度学习实现视频分类和活动识别

使用深度学习将包含在来自可视数据源(如视频流)的图像序列中的活动或动作分类到一组类别中。基于视觉的活动识别涉及使用一组视频帧预测一系列图像中的动作,如走路、游泳或坐着。视频活动识别在人机交互、异常检测和监控等方面有着广泛的应用。要了解更多,请参见开始使用深度学习进行视频分类

应用程序

贴标签机视频 计算机视觉应用的视频标签
地面真相标签 为自动驾驶应用程序标记地面真实数据

功能

全部展开

groundTruth 地面真值标签数据
writeVideoScenes 将视频序列写入视频文件
sceneTimeRanges 从地面真实数据的场景标签的时间范围
VideoReader 创建对象读取视频文件
fileDatastore 具有自定义文件读取器的数据存储
变换 变换数据存储
结合 合并来自多个数据存储的数据
folders2labels 从文件夹名称获取标签列表
splitlabels 查找索引按指定比例拆分标签
inflated3dVideoClassifier 膨胀- 3d (I3D)视频分类器。需要计算机视觉工具箱膨胀三维视频分类模型
slowFastVideoClassifier SlowFast视频分类器。需要计算机视觉工具箱慢速视频分类模型
r2plus1dVideoClassifier R(2+1)D视频分类器。需要计算机视觉工具箱R(2+1)D视频分类模型
预测 计算视频分类器预测
向前 为训练计算视频分类器输出
imwarp 对图像进行几何变换
imcrop 作物图像
imresize 调整图像
randomAffine2d 创建随机化的二维仿射变换
centerCropWindow2d 创建矩形中心裁剪窗口
randomCropWindow2d (不推荐)创建随机矩形裁剪窗口
classifyVideoFile 给视频文件分类
classifySequence 视频序列分类
updateSequence 更新视频序列进行分类
resetSequence 重置视频流分类的视频序列属性
愿景。放像机 播放视频或显示图像
愿景。DeployableVideoPlayer 显示视频
insertText 在图像或视频中插入文本

主题

Baidu
map