One post tagged with "vit"

ViT ChatGPT 问答

May 17, 2023

一颗向上的水滴

熟悉 ViT（Vision Transformer）训练视觉模型的基本原理以及其典型方法（如 MAE，Mask Autoencoding）

文中以下面形式引用 ChatGPT 答复：

提问

ChatGPT 的回答

ViT 模型出现的时间、paper、提出人

ViT 模型是由 Anish Athalye、Nicholas Carlini 和 David Wagner 等人于 2020 年在《Advances in Neural Information Processing Systems》会议上发布的论文**《An Image is Worth 16x16 Words: Transformers for Image Recognition at Scale》**中提出的。该论文开创性地将 Transformer 应用于计算机视觉领域，提出了一种名为 Vision Transformer（ViT）的模型，用于图像分类等计算机视觉任务。

paper 链接：http://arxiv.org/abs/2010.11929: v1(2020.10), v2(2021.6)