Github 項目推薦 | 科研人必看!盤點那些最好用的 AI 學術科研工具
來源:https://github.com/bighuang624/AI-research-tools
目錄
-
AI-research-tools
-
趨勢關注
-
論文查找
-
論文閱讀
-
編碼實驗
-
論文寫作
-
會議投遞
-
其他
趨勢關注
RSS 閱讀器
-
irreader 閱讀器 - FATECORE:這是我現在在使用的 RSS 閱讀器。一個非常大的優點是,對於一些沒有提供 RSS 訂閱源的網站,irreader 可以自定義 RSS 訂閱源。另外,訂閱的 RSS 更新時,有彈窗提醒。還有一個我暫時用不到的功能是,irreader 同時支持訂閱播客和播放有聲媒體。
論文查找
搜索引擎
-
Google scholar:搜索論文的首選,可以在這裏查看論文統計和引用參考文獻,還能通過關注作者或者論文獲得新論文更新提醒,以及利用自動化推薦來提供一個基本庫。
-
Semantic scholar:可以結合外部材料整合進行論文的語義分析。功能包括:展示引用和參考文獻、度量論文影響力、展示論文圖表、自動生成關鍵詞(根據標題)、分析作者、在互聯網尋找額外資源(例如,相關 youtube 視頻),以及推薦論文。
-
dblp: computer science bibliography:專爲 CS 設計的論文查詢網站,收錄比較頂級並可以被檢索到的論文。可以根據會議、期刊等分類查詢作者的論文,想搜一個計算機會議的所有文章時好用。
arXiv 相關
-
arXiv: 論文預印本收錄網站。
-
arXiv-sanity:在功能上相比於 arXiv 有很大的改進,包括在瀏覽中顯示摘要、評論和非常基本的社交、推薦、庫功能。搜索也更好用。
-
Semantic Sanity: A Personalized Adaptive Feed:創建自己的個性化 arXiv 選讀 Feed。創建每個 Feed 時,會讓您先選擇幾篇論文,然後根據這幾篇論文開始推薦,對於推薦結果可以點贊或者不喜歡來幫助調整推薦結果。
-
賣萌屋Arxiv服務: 只包含 arxiv 當日更新的論文。優點在於把作者機構也展示出來。仍在改進。
-
Paper Digest – AI for tracking and summarizing papers: 提供郵件訂閱前一天出的論文的列表,附有每篇論文的一句話總結。在會議論文公佈時,這個網站也會整理。
代碼實現查找
-
Papers With Code:自動把論文連接到實現代碼的 GitHub 資源庫和數據集,並根據 GitHub 的收藏量排序。展示各任務上的 SOTA 以供比較。
-
rasbt/deeplearning-models:使用 TensorFlow 和 PyTorch 實現各種深度學習模型的合集。
論文閱讀
查閱下載
-
SCI-Hub 科研論文全文下載可用網址
文獻管理
-
Mendeley:支持 web、PC、Mac 和移動手機等多個平臺,可以直接註釋和高亮顯示 PDF,有限額的免費雲存儲。另外有每週郵件推薦論文。
文獻翻譯
-
CopyTranslator:最大的優點在於有置頂、點按複製、監聽剪貼板等功能,閱讀文獻配合使用時可以無縫切換,非常方便。
-
Saladict 沙拉查詞:瀏覽器翻譯插件,有非常豐富的設置來配合用戶的使用習慣。除了官方文檔,也可以看 沙拉查詞 + Alfred,打造最佳文獻翻譯體驗!- 知乎 來了解。我還在探索如何在 Windows 系統上實現瀏覽器外翻譯。
筆記工具
我個人習慣使用印象筆記。
編碼實驗
Pytorch 相關
功能配置封裝
-
williamFalcon/pytorch-lightning:將 PyTorch 開發中的各種通用配置(訓練驗證邏輯、超參搜索、分佈式訓練等)全部包裝起來,以更高級的形式快速搭建模型。功能強大,有些複雜,正在摸索。機器之心寫的簡介
項目參考
-
ritchieng/the-incredible-pytorch:有關 PyTorch 的各種教程、項目、視頻等資源。
-
microsoft/computervision-recipes:微軟出品,基於 PyTorch 的各種 CV 任務的教程。
-
donnyyou/torchcv:基於 PyTorch 的 CV 模型框架,包含圖像分類、語義分割、目標檢測、姿態檢測、實例分割、生成對抗網絡等任務中的多個常見模型。
項目管理
-
torchtracer:一個管理 PyTorch AI 實驗項目的工具,主要用於保存各類訓練數據(模型 checkpoints、超參數組合、日誌、loss 變化曲線圖像等)。
風格指南
-
IgorSusmelj/pytorch-styleguide:一份 PyTorch 的非官方風格指南和最佳實踐總結。
項目模板
-
moemen95/Pytorch-Project-Template:一個可擴展的 PyTorch 項目模板,包括圖像分割、目標分類、GANs 和強化學習等實例。
-
lyakaap/pytorch-template:另一份 PyTorch 項目模板。
神經網絡分析器
-
sksq96/pytorch-summary:打印 PyTorch 模型信息,包含模型每層的參數量、輸出張量大小等。
-
sovrasov/flops-counter.pytorch:計算模型總共的 FLOPs(浮點運算數,理解爲計算量,可以用來衡量算法/模型的複雜度)以及每層的佔比。缺點是似乎不支持 RNN 相關層,另外打印下來的信息不是很方便看。
-
Swall0w/torchstat:PyTorch 專用的輕量級神經網絡分析器,可以展示網絡的參數,空間大小,MAdd,FLOPs 等指標。 【支持的層種類過少,只包含卷積網絡中常用的那些層】【有一個 bug 需要修改】
-
Tramac/torchscope:同樣是 PyTorch 專用的神經網絡分析器,看起來展示時比上面的 torchstat 更加清晰。 【對 Linear 層報錯,貌似是 torchstat 帶來的 bug】【同樣不支持 RNN 相關層】【感覺有時間自己可以 fork 然後修改一下】
可視化
-
PyTorch 最新版本已經帶有 tensorboard。官方 tutorial。
-
facebookresearch/visdom:【待嘗試】用於創建、組織和共享實時豐富數據可視化的靈活工具。
-
Convolution Visualizer:如果卷積層配置比較複雜,不方便計算輸出大小時,可以利用這個可視化工具輔助。
實驗記錄
-
fastnlp/fitlog:【待嘗試】架構無關的實驗記錄工具,可以看邱錫鵬老師在知乎寫的介紹。
數據集查找
-
Google Dataset Search
特徵工程
-
Featuretools:【待嘗試】自動化特徵工程庫。
超參搜索
-
optuna:自動超參數優化框架。
-
microsoft/nni:【待嘗試】用於神經模型搜索和超參數調優的開源自動機器學習(AutoML)的工具包,支持絕大多數主流框架和運行環境。
-
Hyperopt:【待嘗試】分佈式異步超參數優化。看到知乎上有人推薦,不過根據文檔來看,目前支持的優化算法只有兩種,且不包括貝葉斯優化。
-
BoTorch:【待嘗試】基於 PyTorch 的貝葉斯優化庫。
-
automl/Auto-PyTorch:【待嘗試】基於 PyTorch 的自動結構搜素和超參數搜索。
Debug 工具
-
cool-RR/PySnooper:【待嘗試】致力讓用戶拋棄
print
函數來 debug(然而,至少目前我還是習慣用 logging 模塊,和print
差不了多少)。機器之心寫的簡介
論文寫作
LaTeX 模板
包括論文、報告、海報等在內的各種 LaTeX 模板。
-
Templates from Overleaf
-
LaTeX Templates
LaTeX 編輯器
-
我個人習慣使用 VSCode 進行離線的 LaTeX 寫作,配合 Github 私有庫進行版本管理。
-
Overleaf:支持多人協作的 在線 LaTeX 編輯器。但是對網絡要求較高。
語言表達
搭配查找
可以看一下這篇文章的推薦:有了這些網站,英文論文再也不難寫了(15個英文論文寫作輔助網站介紹和使用技巧) - 知乎
-
Linggle:搜索最常出現的英文詞語搭配。不確定自己的表達方式是否正確時使用。
-
Corpus of Contemporary American English (COCA):可以查詞彙搭配的 美式 英語語料庫,可以查看具體的用了這個詞的句子。British National Corpus (BYU-BNC):英式英語的語料庫,語料比美式的少一些
-
Thesaurus:將低端詞彙轉換爲同義的高端詞彙。
-
易搜搭ESODA:清華HCI Lab工作室出品的一款適合國人英語寫作的詞組搭配查詢工具。可切換具體研究方向的論文語料庫,展示相關的可替換用法,支持中英混搜。
-
Words and phrases: frequency, genres, collocates, concordances, synonyms, and WordNet:用不同顏色區分高中低頻詞,展現代表文章類型的詞彙,並歸類出相關可替換的詞。雖然說是英文寫作措辭輔助工具,感覺最大的用途是學習相關領域論文常用的詞彙和搭配。
句式推薦
-
Academic Phrasebank:學術用語庫,告訴你各個章節適合用哪些句式搭配。
寫作檢查
請注意在線檢測工具的泄露風險,謹慎處理關鍵文字。
-
Grammarly:語法、句型、標點、選詞檢測修改,有瀏覽器插件。
-
Nounplus.net:免費的在線英文語法檢測。
-
LongGang Pang/proofread:【待嘗試】對科學文章草稿自動檢查,尋找不符合英文科學寫作標準的部分,並提出修改意見。作者寫的介紹:分享一個自己做的英文科學寫作檢查器 - 知乎。
公式編輯
-
Mathpix:通過截取複雜數學方程式的截圖將其轉換爲 LaTeX 代碼。可以處理 PDF 的印刷體和照片中的手寫公式等。
-
MyScript Webdemo:Math 模塊可以將手寫公式轉爲 LaTeX 代碼;同時,Diagram 模塊可以將手繪的框圖轉化爲工整的框圖。
-
Detexify LaTeX handwritten symbol recognition: 忘記某些字符用 LaTeX 怎麼表示時,可以在這個網站上通過手寫來查詢。
截屏懸浮
寫論文時經常會遇到需要參考多個文獻或代碼的情況,同時查看多個文件並頻繁切換會非常麻煩。這裏是別人推薦的兩個能夠將截圖懸浮置頂的工具,並隨時調整位置和大小,方便寫作時參考。
-
Snipaste:【待嘗試】有 Windows 和 Mac 版,暫時沒有 Linux 版。
-
Snappy:【待嘗試】有 Mac 和 iPhone & iPad 版,暫時沒有 Windows 版。
表格轉 LaTeX
-
Excel2LaTeX:用在 Excel 上的宏工具,能夠將 Excel 表格轉換爲 LaTeX 代碼,節省很多時間。能夠滿足大多數效果的轉換,有些效果可能需要微調。
模型繪圖
-
PPT 通常是我的第一選擇:入手快,種類多,支持導出矢量圖。
-
Inkscape with latex equation extensions:【待嘗試】
-
http://Lucidchart.com:在線畫矢量圖,可以導出 png、pdf,也支持各種顏色,組合和圖層等。
-
xinychen/academic-drawing:Matlab/Python 繪圖,主要用於畫時序數據。
-
xinychen/awesome-latex-drawing:LaTeX 繪圖,主要用於畫貝葉斯網絡、張量分解等。
-
HarisIqbal88/PlotNeuralNet:Python 得到可用於 LaTeX 的圖,主要畫 CNN。
PPT 插件
-
IguanaTex:幫助插入 LaTeX 公式的 PPT 插件。將輸入的 LaTeX 代碼轉換爲高質量的 png 圖片來插入。
圖片轉換
-
Convert PNG/JPEG (Raster) to EPS/PDF (Vector) Format:將 jpg、png 格式的圖片文件轉換爲 eps 文件。
-
EPS到PDF轉換器:也可以將 eps 文件轉換爲別的格式的圖片。
-
Crop PDF files online - PDF Tools:裁剪 pdf 文件的白邊。
會議投遞
會議查找篩選
-
Conference List:根據截稿時間排序,過期的會議不在首頁出現。有一頁可以看每個研究方向有哪些會議,但是沒有辦法根據研究方向篩選還沒過期的會議。
-
AI Conference Deadlines:可以根據研究方向篩選會議。但是好像需要科學上網才能看到全部信息。
-
Conference Partner (會伴):計算機最新國際會議和期刊列表。可以註冊以關注會議或期刊。比較全,但目前信息更新不及時。
-
Call4Papers - CCF推薦列表:按照 CCF 類別展示各會議和期刊的截稿時間。
-
lixin4ever/Conference-Acceptance-Rate:主要會議近年錄取率統計。
匿名鏈接
出於論文盲審考慮,有時候文件(如源碼)鏈接需要是匿名的。有些人會選擇在 Github 上創建一個匿名用戶,但爲每一個會議的每一篇論文都創建一個之後再用不到的用戶過於繁瑣。我查到有一些工具支持匿名分享文件如下。
-
Dropbox:應該是最常用的。
-
Open Science Framework
-
Figshare
代碼開源
爲已發表的論文提供清晰、可復現的代碼能夠有效推動領域發展。這裏推薦一些對開源代碼有幫助的工具。
-
Damnever/pigar:Python 項目 requirements 文件自動生成工具。
其他
專利檢索
-
Google Patents:免費檢索和下載中英文專利。具體可見 Google Patents,免費檢索和下載中英文專利的最佳工具。
專注工作
-
番茄·人生:Windows PC 端待辦事項軟件,番茄工作法時鐘。