藥企英矽智能將量子計算和生成式AI結合，發現明顯量子優勢

5月17日，生成式AI驅動的臨牀階段生物醫藥科技公司英矽智能（Iinsilico Medicine）宣佈，公司的研究小組業界首次將量子計算和生成式人工智能兩項快速發展的技術相結合，探索藥物研發過程中的先導化合物的發現，併成功證明量子生成對抗網絡（QuGAN）在生成化學中的潛在優勢。

英矽智能於2014年在美國約翰斯·霍普金斯大學的新興技術中心成立。此前，英矽智能宣佈與跨國藥企賽諾菲達成合作，獲得預付款2150萬美元、潛在價值達12億美元的訂單，創下亞洲AI製藥的最高合作協議金額紀錄。

此項研究發表在計算化學領域權威期刊美國化學學會旗下《化學信息與建模》雜誌。

此項研究發表在計算化學領域權威期刊美國化學學會旗下《化學信息與建模》雜誌，由英矽智能專注於計算機輔助藥物研發工作的臺灣研發中心和鴻海研究院量子計算研究所（富士康科技集團）共同領導。本文通訊作者、英矽智能臺灣研發中心負責人林彥竹博士對澎湃科技（www.thepaper.cn）介紹，此次合作的課題是由英矽智能發起，主要的工作由英矽智能的量子計算和計算機輔助藥物研發團隊完成，鴻海研究院量子計算研究所擔任顧問，幫助英矽智能熟悉以及建立量子計算平臺。

林彥竹認爲，量子計算是下一個將對所有行業產生巨大影響的技術突破，製藥業被認爲將是第一波受益於這一技術進步的行業之一。

然而，“目前的量子計算機由於硬件上的限制離真正的商業用途還有一段距離，能進行的複雜計算很有限，所以在這個基礎下，我們優先探索量子機器學習混合模型，在不使用過多的量子qubit（量子位，量子計算器中的最小信息單位）下，能否在現階段帶來實質的幫助，並且在不遠的將來能及時在真正的量子計算機做計算，解決藥物研發的現實問題。”林彥竹對澎湃科技解釋道。

研究結果顯示，在一些情況下，量子對抗生成網絡混合模型展現出可能的量子優勢，即在50個learnable parameters（在訓練過程中被學習的參數）下，就可以比擬傳統MolGAN（使用生成對抗網絡和強化學習生成分子圖）具有2萬個learnable parameters的表達能力。

生成式對抗網絡是藥物發現和設計中最成功的生成模型之一。經典的GAN模型由一個生成器（生成網絡）和一個判別器（判別網絡）組成，生成器通過學習訓練集數據的特徵，將隨機噪聲分佈儘量擬合爲訓練數據的真實分佈，從而生成具有訓練集特徵的相似數據。而判別器負責區分輸入的數據的真實性，並反饋給生成器。期間生成器與判別器交替訓練，分別提高各自的生成能力和判別能力，直到生成器生成的數據能夠以假亂真。

對於量子對抗生成網絡表現優於生成式對抗網絡的原理，林彥竹解釋道，“原因可能來自於量子系統本身的特性，即單一量子位可以同時存在兩種狀態，並且量子間具有量子糾纏的特性，相比傳統計算機，所需要的訓練數據大幅減少，本篇論文並沒有深入探討觀察到的量子優勢可能的原因，必須要設計更完整的實驗，才能精確探知可能的原因。”

量子對抗生成網絡的理論架構在2018年被首次提出，在2021年首次成功於真正的量子計算機上進行訓練以產生圖片。在相同時期美國賓夕法尼亞大學和IBM的科學家合作，第一次將量子對抗生成網絡用於小分子生成。“但在論文中，作者並沒有發表經由他們的QuGAN產生的小分子，我們實際使用他們的模型，亦無法產生出任何有效分子。英矽智能團隊藉由本篇研究，系統性地探索QuGAN在藥物分子生成的潛力，也是第一次實質上使用QuGAN模型生成出有效藥物分子，並且在特定的情況下觀察到可能的量子優勢。”林彥竹說。

在這項研究中，研究人員通過3個實驗，逐步以變分量子線路（由含參數的量子門組成的量子線路，是進行量子機器學習的途徑之一）取代MolGAN（一種用於小分子圖的隱式生成式模型）的各個部分，包括作爲噪聲生成器、切片法下的生成器和判別器，並用一致的標準比較混合模型與經典GAN模型生成的小分子質量，證明了量子生成對抗網絡在生成化學中的潛在優勢。

英矽智能創始人兼首席執行官亞歷克斯 · 扎沃隆科夫（Alex Zhavoronkov）博士表示，“英矽智能目前正在探索以多種量子模型驅動的藥物化學發現突破性實驗。”這項前瞻性探索將進一步支持英矽智能的研發團隊將量子GAN模型整合到英矽智能自主研發的小分子生成引擎Chemistry42中，以便更高效和精準地推進人工智能驅動的藥物發現。