Vision Transformer (ViT) 用于图片分类 | Shusen Wang | Podwise