"\u003Cdiv\u003E\u003Cp\u003E\u003Cstrong\u003E來源 | QuantamaGazine\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E作者 | John Pavlus\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E編譯 | 科技行者\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002Fe6122fe850b44545bb0feca6ab2aba47\" img_width=\"600\" img_height=\"337\" alt=\"他的人工智能工具,能夠窺探活體細胞內部的奧祕\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E▲ 圖:來自艾倫細胞科學研究所的計算機視覺研究員Greg Johnson已經證明,深度學習神經網絡能夠從未經標記的顯微照片中提取細胞解剖結構細節,並據此創建出複雜的細胞模型。(Chona Kasinger\u002F圖片來源)\u003C\u002Fp\u003E\u003Cp\u003E首先聲明一點,大家在高中生物教科書裏學習到的細胞知識基本都是錯的。典型的體細胞——例如能夠分化爲肌肉、神經乃至皮膚等人體組織的多能幹細胞——並不是那種簡單的半透明球體。其內部構成,也絕不是像懸浮在明膠中的菠蘿切塊那種便於區分的靜態結構。相反,活體細胞更像是一塊被塞進小小三明治裏的半融化果凍豆,其內部構成一直在不斷變化,而且編排機制遠比計算機芯片更精確也更復雜。\u003C\u002Fp\u003E\u003Cp\u003E簡而言之,即使是在二十一世紀,我們仍很難了解細胞內部究竟是什麼樣子——更不用說其中各組成部分間的相互作用。艾倫細胞科學研究所計算機視覺與機器學習研究員Greg Johnson說道,“我們可以把一個細胞看作像是汽車那樣的複雜機器。除了24小時不斷運作之外,有時候兩輛車會並排前行,有時候甚至是四輛車齊頭並進。即使是世界上最聰明的工程師,也無法重現如此精密複雜的機器——想到人類對細胞的運作方式始終知之甚少,我總會萌生出這樣的感慨。”\u003C\u002Fp\u003E\u003Cp\u003E爲了觀察活體細胞的內部運作方式,生物學家們目前選擇將基因工程與先進的光學顯微鏡加以結合。(電子顯微鏡能夠非常詳細地對細胞內部進行成像,但卻無法拍攝動來動去的活體樣本。)一般來講,對細胞進行基因修飾能夠使其產生熒光蛋白,該蛋白會附着於特定的亞細胞結構當中,例如線粒體或者細胞微管。當細胞被特定波長的光線照射時,熒光蛋白即會發光,相當於對相關結構進行視覺標記。然而,這種技術昂貴、極爲耗時,而且每次只能觀察到細胞中的一部分結構特徵。\u003C\u002Fp\u003E\u003Cp\u003E但憑藉着自己在軟件工程方面的專業背景,Johnson希望瞭解:如果研究人員能夠教會人工智能識別細胞內部特徵並自動進行標記,結果又會如何?2018年,他和艾倫研究所的幾位合作者開始了這場探索之旅。利用熒光成像樣本,他們訓練出一套深度學習系統,用以識別十幾種亞細胞結構,直到該系統能夠在前所未見的細胞中分辨這些結構。更重要的是,經過訓練,Johnson’的這套系統甚至能夠處理細胞的“明場圖像”——即通過普通光學顯微鏡直接獲得的圖像,其內容“像是手電筒照射之下的細胞”。\u003C\u002Fp\u003E\u003Cp\u003E不同於以往昂貴的熒光成像實驗,如今科學家們可以利用這種“無標記測定”高效拼湊出活體細胞內部的高保真3D影像。\u003C\u002Fp\u003E\u003Cp\u003E這些數據還可用於構建理想化的細胞生物學精確模型——基本上類似於高中教科書裏那種規整的圖像,但具有更高的科學準確性。這也是本次項目的最終目標。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp1.pstatp.com\u002Flarge\u002Fpgc-image\u002Fa8eedc817e0a4b9a81dfa1c521257c98\" img_width=\"600\" img_height=\"336\" alt=\"他的人工智能工具,能夠窺探活體細胞內部的奧祕\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E\u003Cbr\u003E\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp9.pstatp.com\u002Flarge\u002Fpgc-image\u002F3b90bf89fdeb4c02be6d804ec7a7ff6d\" img_width=\"600\" img_height=\"335\" alt=\"他的人工智能工具,能夠窺探活體細胞內部的奧祕\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-center\"\u003E▲ 圖:在簡單的活細胞“明場”光學顯微鏡圖像中,Johnson的系統能夠識別出未經標記的DNA、核仁、核膜、細胞膜以及線粒體(該系統會以多種顏色進行突出顯示)。此後,系統還能夠爲這些細胞創建動態3D模型。\u003C\u002Fp\u003E\u003Cp\u003EJohnson表示,“我們希望能夠拿出一個普通的細胞,認真觀察它、進行解剖並分析其中的具體構造。此外,由於結果基於統計數據,因此結果當中還包含我們期望的所有變化。大家可以說,讓我們看看這個異常版本的細胞,弄清它是如何構成的。” \u003C\u002Fp\u003E\u003Cp\u003EJohnson利用機器學習實現細胞內部可視化的嘗試早在2010年就已經在卡耐基梅隆大學開始了,當時深度學習技術還沒有在人工智能領域引發一系列突破。近十年之後,Johnson認爲他的AI增強活細胞成像方法能夠顯著提高軟件模型的準確度,從而減少甚至完全消除某些實驗需要。他表示,“我們希望儘可能降低細胞圖像的拍攝成本,同時儘可能多地對細胞形態做出預測。它是如何構成的?基因表達情況如何?它的近鄰細胞又與它存在哪些交互?對我來說,無標記測定只是實現未來更多複雜目標的基礎。”\u003C\u002Fp\u003E\u003Cp\u003E我們採訪了Johnson,希望瞭解基礎細胞生物學中存在的挑戰,以及AI在顯微學領域的未來發展。對話內容經過編輯以確保清晰流暢。\u003C\u002Fp\u003E\u003Cdiv class=\"pgc-img\"\u003E\u003Cimg src=\"http:\u002F\u002Fp3.pstatp.com\u002Flarge\u002Fpgc-image\u002Ff264676b8c9643a5bd05f52740d636fc\" img_width=\"600\" img_height=\"389\" alt=\"他的人工智能工具,能夠窺探活體細胞內部的奧祕\" inline=\"0\"\u003E\u003Cp class=\"pgc-img-caption\"\u003E\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E\u003Cp class=\"ql-align-right\"\u003E(Chona Kasinger\u002F圖片來源)\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:觀察活體細胞內部結構爲什麼如此困難? \u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:如果要觀察活體細胞內部,我們必須克服兩大限制。我們雖然可以利用激光照射細胞以使各個熒光蛋白標記發光,但這種特定的激光具有危害性,對細胞來講就像沙漠中的陽光一樣殺傷力巨大。\u003C\u002Fp\u003E\u003Cp\u003E另一個限制在於,這些標記會附着在細胞中的原始蛋白質上。這些蛋白質本來需要移動到其它位置併發揮作用,但由於附着了這個體形龐大的熒光分子,蛋白質的活動將受到影響,所以標記過多會改變細胞的運作方式。有時候,熒光標記的引入會令實驗無法完成;有時候,這些標準甚至會殺死目標細胞。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:但能起作用還不夠嗎?畢竟這種方法支持生物學走到了今天。\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:讓我們再次回到之前的汽車比喻當中。這就像是我們擁有了一輛完全由玻璃製成的汽車,我們能夠看到車裏的東西,但卻弄不清楚這些組件之間如何相互作用。在此基礎上,我們利用熒光分子突出標記汽車中的一到兩種組件。現在,我們可以明確區分出哪些是門把手,或者是汽車有幾個輪胎。然而,有時候我們會發現自己的“汽車”只有兩個輪子,而且一個門把手也沒有。研究人員會好奇,“這到底是什麼東西?”好吧,事實證明這可能是一輛摩托車,但我們甚至連摩托車是什麼都不清楚,因爲我們只看到過那些擁有四個輪子和門把手的細胞。大概就是這麼回事。\u003C\u002Fp\u003E\u003Cp\u003E如果我們能夠對活體細胞進行成像,就能夠同時看到所有構造,這將推動生物學領域上升至新的高度。我們可以拆開這輛車,使用X射線透視車輛結構,甚至親自開起來試試。也許我們有一天可以打造出自己的引擎。總之,這至少能讓我們更好地瞭解細胞當中到底發生了什麼。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:是什麼激發了你利用深度學習技術標記細胞內部的靈感?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:在我看到人們開始利用深度學習(2014年首次使用生成對抗網絡)生成仿真面孔時,我突然意識到“哦,我們也可以用它生成細胞。”這就是我的工作內容:模擬細胞結構。我想,“如果我們能夠通過特定標記實驗生成細胞圖像,並使其質量達到生物學家們也無法判斷真僞的水平,結果會怎樣?”如果能夠實現這項目標,那麼在某種意義上,可以說我們建立起了一套能夠真正實驗內容的模型。 \u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:是否存在這樣一種風險,AI生成了某些並不存在的結構?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:我們真正需要的是預測實驗結果,以幫助科學家們優先進行他們認爲最有價值的實驗方向。\u003C\u002Fp\u003E\u003Cp\u003E假設我有一份細胞圖像,該軟件將預測細胞內物質的位置排布模式——例如線粒體。我們在無標記模型中觀察線粒體時,看到的實際是AI對於線粒體所在位置的預測結果。換言之,這類似於給出了細胞內線粒體的平均位置。\u003C\u002Fp\u003E\u003Cp\u003E我們也可以換一種使用方式:假設我打算進行一項實際實驗,利用熒光蛋白標記某些細胞。但我並沒有真正執行實驗,而是直接採用那些成本低廉的明場顯微鏡圖像,並利用機器預測這一標記實驗的可能結果。接下來,如果我在生成的預測圖像中看到了值得深入挖掘的結果,我可以再推進到實際實驗階段。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:那麼,您是打算使用AI技術改善實驗,還是要替代實驗?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:我認爲這兩個答案都不算錯。一位科學家曾說,“實驗的目的在於證明你的模型是錯的。”因爲我們的深度學習模型完全利用熒光成像實驗數據的訓練,所以我們每一次收集到的新實驗數據都將指出該模型的錯誤。我可以將這些數據添加到模型當中,以確保其在下一次預測時做得更好。 \u003C\u002Fp\u003E\u003Cp\u003E這是一種雙贏書面,因爲無論該模型能否正確預測實驗結果,其獲得的新數據都能幫助我們未來做出更準確的預測。\u003C\u002Fp\u003E\u003Cp\u003E如果把這個過程推向極端,我們最終會得到一套機器學習模型,我們可以向其中輸入任何想要運行的實驗參數。接下來,它會給出大家想要測量的一切結果。而如果這些結論與實際實驗中的真實數據相同,那麼我們就擁有了一套從基本面來講能夠準確反映生物學原理的模型。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:這種方法是否存在爭議?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:大約兩到三年之前,人們可能會看着它說,“我不太相信這玩意。”我參加過不少會議,展示了自己的成果,而有些人的反饋是“把這垃圾扔出去。”但現在,人們開始接納這種基本思路。事實上,AI技術在整個細胞生物學成像領域正得到迅速推廣。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:爲什麼會發生這樣的改變?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:我的博士課題主要就是利用經典統計建模完成這類工作。雖然統計確實是一種非常非常強大的工具,但統計工具可能會也可能不會產生能夠達到真實質量的細胞圖像。我可以在細胞之內進行模糊分佈,然後指定某個亮度更高的位置認爲其就是線粒體的所處位置。但人們會說,“可是,這看起來根本不像真正的細胞。”這確實讓我非常沮喪,因爲我所使用的數學與概率計算都正確無誤。 \u003C\u002Fp\u003E\u003Cp\u003E但在我們看到第一張來自無標記預測模型的圖像時,其看起來真的非常真實。我們能夠明確看到細胞中各個組成部分的分佈位置。人們驚訝得合不攏嘴,然後我們就決定沿着這個方向探索下去。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:眼見是否爲實?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:是的,當然爲實。實際上,我們使用明場圖像作爲指導的結果讓人們感到震驚,因爲在成像領域,明場圖像主要充當一次性數據。當我們拍攝這些組織圖像時,僅僅需要在上面照射正常的光線,目的是弄清楚顯微鏡是否正常聚焦在樣品之上。然後,這些圖像就被保存在磁盤上的某個地方,再也沒人拿出來用了。相較於極爲昂貴的熒光分子標記實驗,明場圖像的成本幾乎可以忽略不計。如果能夠利用這些昂貴的數據訓練深度學習模型,而後藉此預測所拍攝明場圖像的細胞內部結構,將爲我們節約下大量的時間與金錢。 \u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:您是否需要訓練多個獨立的深度學習模型,以識別細胞內的不同部分?這些模型在識別效果上是否確有差別?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:與細胞膜結合的細胞器,例如細胞核與線粒體,一般比較容易預測。其它非膜結合細胞器,例如微管或者高爾基體,則很難預測。究其原因,在於這些細胞器的密度與細胞內周邊區域的密度差別不大。 \u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:那您是如何克服這些侷限的?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:一般我們會利用偏振光或者其它光學性成像技巧以獲得不同級別的圖像內對比度,而不僅僅使用正常的透射光。\u003C\u002Fp\u003E\u003Cp\u003E或者,如果我們當前的實驗只能使用三個熒光標記,我會刻意避免利用它們標記系統已經擅長預測的結構,而是用在相對較難預測的結構身上——例如肌動蛋白與微管等細胞內結構。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:我們觀察到,您與艾倫研究所(the Allen Institute)的其他科學家可以不斷改進這些模型,而“集成細胞”正是這項工作的後續成果。那麼,艾倫研究所之外的科學家們也能享受由此帶來的便利嗎? \u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:可以的,這也是我們整個項目中的一大重要組成部分。當谷歌構建AlphaGo並擊敗全球最強的圍棋選手時,這套系統已經擁有相當於人類200年的訓練積累。除了亞馬遜或者微軟之外,沒有其它機構能夠拿出同樣的資源進行如此充分的訓練。我們希望其他人也能在自己的實驗室中利用我們的細胞系與技術進行自己的研究——當然,他們不一定需要像我們這樣設置非常精細的操作流程。\u003C\u002Fp\u003E\u003Cp\u003E我們的努力方向之一,是在商業硬件上構建這類模型——也就是一臺帶有顯卡的普通計算機。系統需要的訓練圖像,則可以在正常實驗室中由普通研究人員輕鬆獲取。我們所有的模型都只需要大約30張熒光標記細胞結構圖像即可訓練完成,一位研究生在一個下午時間裏就能搞定。另外,完成這項工作的計算機大約只需要2000美元成本,就實驗室設備而言這無疑相當便宜。如果真的需要構建一套實用性模型,這樣的前提條件已經非常寬鬆了。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:您如何看待這項技術進步?您希望細胞生物學家在AI的幫助下獲得怎樣的觀察能力?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:我們想做的是拍攝一部關於細胞的影片,觀察其內部結構之間的關係如何在預測層面發生變化。\u003C\u002Fp\u003E\u003Cp\u003E以微管與DNA爲例。當細胞分裂爲兩個時,通常由負責幫助細胞保持形態的微管取出DNA,並將其拆分爲細胞兩側的兩份副本。這種現象已經得到大家的認可,也是細胞生物學家們的必修課。但是,這兩種結構之間存在諸多關聯,這些關係非常微妙,人們可能很難直接進行觀察。我們希望利用這些前沿計算機視覺與機器學習方法自動解析不同結構之間的相互關係。\u003C\u002Fp\u003E\u003Cp\u003E\u003Cstrong\u003E問:這項成果是否僅適用於圖像數據?\u003C\u002Fstrong\u003E\u003C\u002Fp\u003E\u003Cp\u003EJohnson:不,我們沒必要給自己設限。我們可以對細胞中的各種信號進行提取,測量細胞形態,並建立起各結構間的相互關係。再次用玻璃汽車來做比喻:我們不僅能夠看到所有部件都打上了明顯的標籤,還可以看到車輛的里程數、組裝時間、部件工作時長、是否進行過更換等等。\u003C\u002Fp\u003E\u003Cp\u003E大家可以將這項技術培訓視爲顯微鏡的數據驅動機制,未來的顯微鏡可能會配上虛擬現實顯示器。我們能夠在自己的細胞或者任何其它測量過程中測量任何對象,並瞭解這些對象之間的關係。這完全改變了我們對於生物學乃至一般性科學的思考方式。當科學家們觀察自己的組織樣本時,我希望他們能夠用上這樣的顯示器,並預測出我們能夠在細胞當中測量得到的一切結論。\u003C\u002Fp\u003E\u003C\u002Fdiv\u003E"'.slice(6, -6), groupId: '6720496206490894852
相關文章