作者简介: Willi Richert 机器学习和机器人学博士,目前任职于微软Bing搜索核心研发团队。他从事多种机器学习领域的研究,包括主动学习和统计机器翻译。 Luis Pedro Coelho 计算生物学家,主要关注生物图像信息学和大规模图像数据的处理,致力于生物标本图像分析中机器学习技术的应用,他还是Python计算机视觉库mahotas的主要开发人员。他于1998年开始开发开源软件,2004年起从事Python开发,并为多个Python开源库贡献了代码。另外,Luis拥有机器学习领域
计算机视觉注释工具(CVAT)
CVAT是用于计算机视觉的免费,在线,交互式视频和图像注释工具。 我们的团队正在使用它来注释数百万个具有不同属性的对象。 许多UI和UX决策都是基于专业数据注释团队的反馈。 在线尝试 。
文献资料
截屏
支持的注释格式
单击“上传注释”和“转储注释”按钮后,可以选择格式。 数据集框架允许通过其命令行工具和Python库进行其他数据集转换。
有关支持的格式的更多信息,请参阅。
注释格式
进口
出口
X
X
X
X
X
X
X
分割蒙版
X
X
X
视频中主题的时间本地化
Google Research x Kaggle
官方Kaggle比赛: ://www.kaggle.com/c/youtube8m-2019
此仓库包含在YouTube-8M数据集上训练和评估机器学习模型的第13位解决方案。 这是我们针对Kaggle上的第三届Youtube8M视频理解挑战的解决方案,并在国际计算机视觉会议(ICCV) 2019上进行了介绍。该代码提供了一个端到端的工作示例,用于读取数据集,训练TensorFlow模型以及评估模型的性能。
请检查
近年来,以深度学习算法为基础的计算机视觉技术的进步为视频大数据分析提供了强有力的武器,反过来,视频大数据也为机器训练提供了丰富的资源(大数据是人工智能的燃料)。该领域正处于萌发期,大公司和初创团队都有机会。由于先进的算法技术主要发端于学院,所以目前国内外专注于计算机视觉技术的团队主要来自于科研院所。 预计仍然会以项目制为主,但云计算的引入提供了更好选择。例如,视频监控即服务(Video Surveillance as a Service,VSaaS)模式、旷视科技的智能云平台、极视角的计算机视