据新智元 1 月 14 日报道,最近斯坦福大学的研究团队合作开发了一款 AI 工具 PIGEON,将语义地理单元创建(semantic geocell creation)与标签平滑(label smoothing)相结合,对街景图像进行 CLIP 视觉转换器的预训练,并使用 ProtoNets 在候选地理单元集上细化位置预测。PIGEON 在「照片猜国家」的子任务上实现了 91.96% 的正确率,40.36% 的猜测在距离目标 25 公里以内,这也是过去五年来第一篇没有军事背景资助的、最先进的图像地理定位相关的论文。
相关文章