DINOv2:Meta AI 开源的自监督计算机视觉模型-每日观点
(资料图片仅供参考)
编程客栈() 5月25日消息:Meta AI Research 发布了 DINOjavascriptv2 开源项目,这是一款用于计算机视觉(CV)任务的基础模型。DINOv2 在一个由 1.42 亿张图像构成的筛选数据集上进行了预训练,可用作图像分类、视频动作识别、语义分割和深度估计等多个任务的骨干模型。
Meta 基于 Vision Transformer(ViT)架构构建了该模型,并对其进行了自监督学习目标的修改。团队建立了一个自动化流程,从网络上获取图像并构建了一个筛选数据集来训练模型。其中一个重要的贡献是改进了训练过程,该方法的速度是之前方法的两倍,内存使用量减少了三分之一。在计算机视觉基准测试中,DINOv2 优于其他自监督学习(SSL)模型,并显示出与弱监督模型相媲美或更好的性能。根据 Meta 的说法:
计算机视觉任务的深度学习模型通常依赖于带有人工注释的大型图像数据集,例如 ImageNet。2021 年,OpenAjavascriptI 发布了 CLIP,这是一个使用弱监督训练方法的计算机视觉基础模型,其中的注释是通过爬取与源图像相关的 html 标签和其他网络元数据自动生成的。同年,Google 发布了 ViT 模型,它使用自监督学习进行训练。Meta 也发布了DINO 的原始版本的研究成果,将 ViT 模型与知识蒸馏相结合,从而获得了性能相当但更小的模型。
对于 DINOv2,Meta 专注于收集更多训练数据并扩大训练过程。对于训练数据,Meta 从互联网上收集了 1.2B 个独特的图像,然后根据它们与 ImageNet 数据集中图像的相似性对它们进行聚类,以获得最终的 142M 图像集。为了扩大训练规模,Meta 实施了自定义版本的 FlashAttention,并使用 PyTorch 进行完全分片数据并行 (FSDP) 训练。总体而言,该项目消耗了大约 20 万个 GPU 日的计算量。
为了评估 DINOv2 作为基础模型的性能,该团队在各种 CV 任务上对其进行了测试,并将其与几个基线 SSL 模型以及 CLIP 等弱监督模型进行了比较。在 ImageNet-1k 分类任务上,DINOv2 与其他 SSL 模型相比表现出「非常显著的改进」,并且表现优于弱监督模型。它还在三个视频动作识别基准测试中创造了新的 SSL 最先进记录,并在实例级识别基准测试和三个单眼深度估计基准测试中表现优于基线。
在 Hacker News 关于这项工作的讨论中,一些用户称赞了 Meta 最近在计算机视觉方面的工作以及 PyTorch 等过去的贡献。有人确实注意到 Meta 围绕他们的工作进行交流的转变:
github 上提供了 DINOv2 代码和模型。该项目站点托管了使用 DINOv2 的多个计算机视觉任务的交互式演示。
DINOv2 开源模型 GitHub 地址:https://github.com/facebookresearch/dinov2
DINOv2 开源项目: https://dinov2.metademolab.com/
标签:
-
25
2023-05战国四君子是指哪四个 四君子是指什么
1、“四君子”是中国画的传统题材,以梅、兰、竹、菊谓四君子。2、是传统寓意纹样。3、明代黄凤池辑有《梅 -
25
2023-05天天看点:金达莱:5月24日融资买入47.18万元,融资融券余额7549.62万元
5月24日,金达莱(688057)融资买入47 18万元,融资偿还101 3万元,融资净卖出54 12万元,融资余额7549 62万元。 -
25
2023-05当前速讯:监管趋严叠加旺季来临 化妆品行业景气度有望改善
同时,随着化妆品消费旺季到来,叠加“618”促销活动临近,行业景气度有望边际改善 -
25
2023-05廉价氮化铁替代贵金属降低制氢成本
科技日报首尔5月24日电 (记者薛严)韩国科学技术研究院研究人员开发出一种新结构零件,可大幅减少用于水 -
25
2023-05全球滚动:文旅局长当“网红”,搞搞清楚为啥先?(上)——打造数字孪生是谋划县乡发展的现实契机(一百五十)
从一个与网红脸没什么关系的文旅局长出镜宣传突然走红开始,某些传统媒体上大量涌现所谓的“某某文旅局长为 -
25
2023-05河南新科学院是几本_河南新科学院 天天新要闻
1、河南科技学院新学院占地586亩。2、河南科技大学新科学院是经教育部批准按新机制、新模式组建的独立学院 -
25
2023-05我会很爱你歌词完整版(我会很爱你歌词)_世界微动态
来为大家解答以上的问题。我会很爱你歌词完整版,我会很爱你歌词这个很多人还不知道,现在让我们一起来看看 -
25
2023-05艺术 | 鲁鄂冀澳四地青少年联袂演绎,澳门原创舞剧《少年星海》巡演为内地观众带来澳门风情|今日报
澳门现代芭蕾舞团原创现代芭蕾舞剧《少年星海》于5月20日、5月21日在山东省会大剧院、德州大剧院圆满演出, -
25
2023-05看热讯:呵呵什么意思是骂人吗_呵呵什么意思
1、“呵呵”一词在流行网络之前,有些人也用”呵呵“作为口头禅,表达自己高兴的心情。2、有时候却是带有令 -
25
2023-05当前热议!动物世界的奇异很简单_浅谈那些奇怪现象的生存与竞争
1、适者生存2、近距离战斗(用武器)3、以平等的态度看待动物的生存手段以上就是【动物世界的奇异很简单,浅 -
24
2023-05新能源“下沉”,打不起“价格战”
安下沉,方能安市场。 -
24
2023-05“阳光桑榆驿站”落户青海贵德县达尕羊村|短讯
民主与法制网讯(记者董耀平)今年初,当青海高远慈善帮扶救助会得知海南藏族自治州贵德县常牧镇达尕羊村村
苹果考虑将iPhone系列进一步延伸 2024年上市?
卷出一块好曲屏 真我10系列新品发布会举行
英国猴痘病例数预计将大幅上升
上海:视情适当延长毕业生在校生身份时间
国家电网确定新型电力系统科技攻关十大重点项目
比亚迪发布CTB电池车身一体化技术
商务部:坚定致力于实现全面、高水平的亚太自贸区
中办国办印发《意见》 推进实施国家文化数字化战略
初夏看市场:“菜篮子”产品生产供应充足 蔬菜在田面积达9877.2万亩
上海浦东重点生产企业复工复产超1100家
-
1
Intel最新处理器Arrow-S曝光 最高可达24核
-
2
配置拉满的电竞神机 雷神ZERO2023大黄蜂发布
-
3
真我10Pro系列发布 首发量产2160Hz超高频调光技术
-
4
阿富汗塔利班组建正规军
-
5
萨赫勒地区反恐形势面临新变数
-
6
北约北扩加剧欧洲安全风险
-
7
贵州毕节七星关区百所学校创办百个“红军班”
-
8
湖北省孝感军分区组织军地联合应急救援研究性演练
-
9
青藏高原等区域将新设一批国家公园
-
10
河北省承德军分区退役军人担纲教练主力
-
DINOv2:Meta AI 开源的自监督计算机视觉模型-每日观点
2023-05-25
-
【热闻】同仁堂:5月24日融资买入4088.88万元,融资融券余额7.21亿元
2023-05-25
-
环球实时:所谓修行
2023-05-25
-
每日消息!儿童的生长发育遵循什么规律_儿童的生长和发育
2023-05-25
-
NBA晚报|莫兰特告别社媒 阿里纳斯痛批拉塞尔 库里致敬甜瓜
2023-05-25
- DINOv2:Meta AI 开源的自监督计算机视觉模型-每日观点
- 【热闻】同仁堂:5月24日融资买入4088.88万元,融资融券余额7.21亿元
- 环球实时:所谓修行
- 每日消息!儿童的生长发育遵循什么规律_儿童的生长和发育
- NBA晚报|莫兰特告别社媒 阿里纳斯痛批拉塞尔 库里致敬甜瓜
- 单次季后赛700分有多难?杜兰特609分,库里621分,詹姆斯多少分 全球今日报
- 每日头条!股市2023年中秋国庆放假安排 中秋国庆股市放假调休时间安排2023
- 泰勒斯威夫特学历介绍 泰勒middot汉斯布鲁的介绍
- 环球微动态丨宁波海事法院送法进渔港
- 全球滚动:win10系统如何关闭自动修复(win10系统如何关闭uac)