多所高校共同推出天文学专业大模型 AstroLLaMA

据品玩 9 月 13 日报道，HuggingFace 页面显示，来自宾夕法尼亚大学、澳大利亚国立大学、清华大学等机构的研究者们近日共同推出了一款面向天文学专业的大模型 AstroLLaMA。 AstroLLaMA 是一个 70 亿参数的大模型，使用 LLaMA 2 进行微调，研究者使用了来自 arXiv 的 30 多万篇天文学摘要为这款模型进行训练。AstroLLaMA 针对传统因果语言建模进行了优化，其复杂度比 Llama-2 低 30%，显示出明显的领域适应性。研究团队表示，AstroLLaMA 的公开发布旨在促进以天文学为重点的研究。