微软推出预训练模型 VLP,可通过模仿人类来理解图片与视频内容

  • 2019-10-10
  • 本文字数:2253 字

    阅读完需:约 7 分钟