據新智元 1 月 14 日報道,最近斯坦福大學的研究團隊合作開發了一款 AI 工具 PIGEON,將語義地理單元創建(semantic geocell creation)與標籤平滑(label smoothing)相結合,對街景圖像進行 CLIP 視覺轉換器的預訓練,並使用 ProtoNets 在候選地理單元集上細化位置預測。PIGEON 在「照片猜國家」的子任務上實現了 91.96% 的正確率,40.36% 的猜測在距離目標 25 公里以內,這也是過去五年來第一篇沒有軍事背景資助的、最先進的圖像地理定位相關的論文。
相關文章