Meta 开源计算机视觉基础模型 DINOv2
2023-5-24 18:23:5 Author: www.solidot.org(查看原文) 阅读量:21 收藏

solidot新版网站常见问题,请点击这里查看。

Meta 开源计算机视觉基础模型 DINOv2

开源 人工智能

Wilson (42865)发表于 2023年05月24日 18时23分 星期三
来自先知

Meta 开源了它的计算机视觉基础模型 DINOv2,源代码托管在 GitHub 上,和 Meta 近期开源的其它 AI 模型一样,采用的是非商用的 CC-BY-NC 4.0 许可证。DINOv2 是基于 Vision Transformer (ViT)架构,使用一个包含 1.42 亿幅图像的精选数据集进行预训练,可用于图像分类、视频动作识别、语义分割和深度估计等任务。Meta 称 DINOv2 模型的速度是旧方法的两倍,使用的内存只有旧方法的三分之一。测试显示它相比其它同类模型有显著改进。

https://ai.facebook.com/blog/dino-v2-computer-vision-self-supervised-learning/
https://github.com/facebookresearch/dinov2




文章来源: https://www.solidot.org/story?sid=75044
如有侵权请联系:admin#unsafe.sh