摘要:近日,一位身兼數職的斜槓青年Cyril Diagne設計了一個複製粘貼的工具,只要你擁有一個支持AR功能的智能手機,在手機上預裝這款名爲  AR Cut & Paste 的工具,然後拍下你想複製的東西,便可將圖像複製粘貼進 Photoshop。取最後一層精度最高的圖作爲預測模塊的輸出。

聰明的人確實是可以做很多事的。

近日,一位身兼數職的斜槓青年Cyril Diagne設計了一個複製粘貼的工具,只要你擁有一個支持AR功能的智能手機,在手機上預裝這款名爲  AR Cut & Paste 的工具,然後拍下你想複製的東西,便可將圖像複製粘貼進 Photoshop。


圖自:視頻截圖

正如上面幾張圖片所示,這款工具什麼都可以一鍵複製,設計師們再也不用擔心素材不夠用了!

不過,目前該工具的剪切延遲大約爲2.5秒,粘貼延遲大約爲4秒,流程還可以進一步加速。

令人期待的是,作者還給大家留了一個小驚喜:下週將會發布另一個 AI+UX 原型!

平面設計師的福音

也許是設計師出身的緣故, Cyril Diagne 總是有很多出人意料的想法。

比如,他曾經研究出一種人臉塗鴉工具,藉助 Tensorflow.js、FaceMesh 和 Three.js 即可在網頁瀏覽器上使用 AR 對臉部進行塗鴉。


圖自:github

還有一款可在 Instagram 個人主頁圖像上添加3D 效果的 chrome 擴展程序,效果生成類似於 Facebook 3D 照片功能,讓2D 照片也能呈現多角度的景象。


圖自:github

那麼,這款工具又是如何實現將現實照片直接複製進 Photoshop 的呢?

據作者上傳到 github 的資料顯示,AR Cut & Paste 工具是一個 AR+ML 原型(prototype),它可以從周圍環境中拷貝固定對象,並粘貼在圖像編輯軟件中(Photoshop)。不過,這款工具目前只適用於  Photoshop 軟件,未來可能支持處理不同的輸出。

該原型作爲3個獨立模塊運行:即移動應用、本地服務器和顯著性檢測和背景去除服務。

具體使用方法如下:

首先,你需要在手機上預裝這款工具;

npm install

其次,你需要更新一下 IP 地址,並指向你的本地配置;

3: const URL = "http://192.168.1.29:8080";

最後,顯著目標檢測和背景移除由外部服務執行(即 BASNet 技術)。

curl https://download.pytorch.org/models/resnet34-333f7ec4.pth -o resnet34-333f7ec4.pt

docker build -t basnet .docker run --rm -p 8080:8080 basnet

BASNet 是什麼?

BASNet 是一種關於邊界的顯著性檢測,其聚合了多層深度特徵的網絡,它更關注整個圖像的全局對比度上,而不是局部或像素特徵,所以,相比其他的顯著性檢測方法,能夠大大減少誤差。

在架構上,主要分爲兩個模塊:

圖自:BASNet : Boundary-Aware Salient Object Detection 論文

預測模塊:設計成編解碼網絡,因爲這種結構能同時捕獲高層次的全局上下文和低層次的細節。編碼器有一個輸入卷積層和由基本res塊組織稱的六部分。爲了更進一步捕捉全局信息,在編碼器和解碼器之間加了一個橋接塊,包含三個卷積層。解碼器與編碼器基本對稱,每個階段的輸入是解碼器的前一階段的上採樣和編碼器相應階段輸出的級聯。取最後一層精度最高的圖作爲預測模塊的輸出。

優化模塊:通過殘差塊優化粗糙的顯著圖。粗糙包括:1)模糊有噪聲的邊界;2)不均勻預測的區域概率。實際的粗糙預測圖兩種都包含。殘差優化模塊最初被提出用來用於邊界優化,然而,由於設計的模塊很淺,難以捕獲高級信息進行優化。RRM採用殘差編解碼器架構,包含輸入層,編碼器,橋接層,解碼器和輸出層,編碼器和解碼器包含4個階段,每個階段只有一個卷積層。

總的損失等於每個輸出圖的損失的加權和。共有8個輸出,7個來自預測模塊,1個來自優化模塊。

每層的損失包括三個部分:BCE loss、SSIM loss 和 IoU loss。

這樣一來,就能獲得高置信度顯著圖和清晰邊界。

然後,利用 OpenCV SIFT 找出手機在電腦屏幕上對準的位置。只需要一張手機照片和截圖,就可以得到準確的 x, y 屏幕座標系。

這就是這款軟件的全部使用細節及技術細節,感興趣的童鞋可以自己輸入代碼嘗試下。

需要注意的是,該設計的作者也表示,目前這只是一個研究原型,但根據 Diagne 視頻的回覆,似乎已經有數家公司在開發類似的軟件。相信在不久的將來你可能會在應用商店看到類似的工具。

而這項設計的深遠意義則在於它巧妙地顛倒了通常的增強現實範式,不是將數字圖像投射到物理世界,而是將物理世界帶入數字世界。

相關文章