中國網/中國發展門戶網訊 隨着測序技術的發展及測序成本的降低,越來越多物種的基因組被測序,人類對生物基因組的測序“讀取”取得了空前的突破。而隨着 DNA 合成技術及基因編輯技術的發展,人類“編寫”生物基因組也逐漸成爲現實。基因組的編輯,甚至全基因組的重設計與合成,一方面可以作爲研究手段探索基因的功能,促進功能基因組學的發展;另一方面則可以獲得新的生命體用於疾病治療、藥物生產等,服務人類。全基因組的從頭合成作爲當前合成生物學研究的熱點之一,其涉及基因組的從頭設計、構建和功能表徵等,屬於自下而上的生物學研究策略。新生命體系的從頭設計與合成不僅需要合成組成基因組的小片段 DNA 片段,還需要通過後續的組裝與拼接獲取完整的合成基因組,隨後還涉及合成基因組往宿主細胞的轉移及功能分析。DNA 合成及基因組拼裝、轉移技術是合成基因組學乃至整個合成生物學領域的核心技術體系,其突破將極大地推動合成生物學的發展。

DNA合成技術

DNA 合成技術是合成基因組學,乃至現代分子生物學的根基。PCR(聚合酶鏈式反應)或者酶切手段只侷限於獲得自然界已有的 DNA 片段,而 DNA 的從頭合成則可以通過 Oligo(寡鏈核苷酸)的拼接獲得人工設計的特定 DNA 片段。如何提高 Oligo 合成的長度和效率、降低合成成本是後續進行大規模基因組合成的關鍵突破點。根據合成原理,目前 Oligo 的合成方法可分爲已經成熟並商業化的化學法和正在研發中的酶促合成法。

化學法

Oligo 的化學合成研究始於 20 世紀 50 年代,Michelson 和 Todd首次報道採用磷酸二酯法實現了寡聚二核苷酸的合成。到 20 世紀 80 年代,Beaucage 和 Caruthers開發了基於亞磷酰胺的 DNA 合成法,也是今天 Oligo 自動化生產所採用的主要方法。該方法包括去保護、偶聯、加帽(可選)及氧化 4 個步驟(圖 1)。由於隨着鏈延長所帶來的化學反應效率、合成純度以及產率的下降,目前該方法合成的 Oligo 長度一般不超過 200 個核苷酸(nt)。爲了提高通量,從 20 世紀 90 年代開始發展起來的基於微陣列芯片的 DNA 合成策略,使得合成成本降低了若干個數量級。然而由於芯片特有的不均一性及邊緣效應等原因,相較於柱法合成,芯片法合成在長度、準確性方面均有所下降。爲了增加芯片合成的精確度,2010 年 Kosuri 等和 Matzas 等分別採用不同的技術策略,從各異的芯片產物中挑選出正確合成的寡核苷酸原料。Kosuri 採用了多重 PCR 策略,選擇性擴增目的寡核苷酸片段,結合酶促糾錯等方法,可以合成長度超過 200 nt 的寡核苷酸原料,實現了更大規模和更高精度的合成;Matzas 等則是藉助 454 測序儀,先通過測序挑選出序列正確的寡核苷酸產物,然後對這些產物進行大量擴增,從而使得樣品的錯誤率降低到基本可以忽略。

圖 1 固相亞磷酰胺法從頭合成寡聚核苷酸鏈的 4 步反應

這 4步反應包括:(1)去保護。酸催化去除 DMT(二甲氧基三苯基甲基)基團,以便下一輪鹼基(dA、 dC、 dG和 dT)添加。(2)鹼基偶聯。將含有 DMT保護基團護的亞磷酰胺通過四唑活化劑加到未保護的 5′ OH末端。(3)加帽。將遊離的 5′ OH乙酰化,以防止進一步的鏈延伸所造成的單鹼基缺失。(4)氧化。通過碘液將磷酸三酯氧化爲磷酸鹽,進入一個反應循環

酶促從頭合成法

目前亞磷酰胺法是商業化 Oligo 合成的主流方法,但其合成的長度限制在 200 nt 左右,而且合成過程中亦會大量使用有毒化學試劑。由於在合成準確性及不需要使用毒性化合物等方面的潛在優勢,酶促合成方法受到了越來越多的關注。酶促法從頭合成寡聚核苷酸的提出至少可以追溯到 20 世紀 60 年代。與化學法相比,酶促法的作用條件溫和,對 DNA 的損傷較少,有助於準確性的提高,同時減少了副產物的產生,可實現更長 Oligo 的合成。然而,酶促法的發展緩慢,至今未能實現商業化。根據 Jensen 和 Davis對 DNA 酶促從頭合成發展的總結,末端脫氧核苷酰轉移酶(TdT)介導的酶促合成法是較好的選擇,但還需要更進一步優化。TdT 介導的 DNA 合成技術開發中首先需要解決單個 dNTP 添加後的終止效率及末端重新活化的問題。近期,Palluk 等提出了一種解決方案,他們將 dNTP 通過可光誘導剪切的連接子與 TdT 連接,所得 dNTP-TdT 複合物可在 10—20 s 的時間完成 DNA 鏈的延伸,而且可以重複進行,實現特定 DNA 鏈的合成。該方法將爲具有實際應用價值的酶促 DNA 合成法的開發打下基礎。

合成 DNA 拼裝技術

受當前合成技術的限制,目標基因組只能以短鏈 Oligo 的形式得以從頭合成,依賴後續的逐步拼接才能獲得。根據原理區別,以下對現有的 DNA 拼接技術進行了分類總結。

胞外組裝

根據組裝片段的大小、序列特性、是否接受額外序列殘留等,目前有衆多的策略可以採用。而衆多體外 DNA 組裝技術的共同點在於均需要工具酶的使用,以實現 DNA 鏈的切割、單鏈黏性末端的產生、雙鏈連接及缺口的補齊等。本文根據所用工具酶體系的不同將其歸爲 5 類。

基於DNA聚合酶的策略。該方法首先合成有互補配對重疊區的 Oligo,利用 PCR 擴增的原理,可以對有互補重疊區的 Oligo 進行延伸連接獲得小 DNA 片段,然後小 DNA 片段以重疊 PCR 的方式進行逐步連接獲得目的 DNA 片段,以其作爲模板,進一步 PCR 擴增可以大量獲得目的片段(圖 2a)。此方法(polymerase cycling assembly,PCA)無須依賴額外的 DNA 連接酶,直接從人工合成的 Oligo 開始組裝,操作簡單、快速。Stemmer等曾用此法實現基因及質粒的一步拼裝。Smith 等則通過增加 Taq 連接酶的步驟用此法合成了 ФX174 噬菌體的基因組。

基於同尾酶的BioBrick法和BglBrick法。同尾酶是識別不同的 DNA 序列但是能切出相同黏性末端的一類限制性內切酶,比如 XbaI 和 SpeI,但其切開的末端相互連接後不會再形成原酶切位點。利用這種“單向”的連接特性,可設計多輪連接以實現 DNA 片段組裝。根據此原理設計的 BioBrick(生物積塊)法(圖 2b)可用於合成生物學中相關元件的標準化組裝,但因其連接處會留下能編碼終止密碼子的痕跡序列,故不適用於融合蛋白的組裝。爲此 Anderson等採用 BglII 和 BamHI 替代 XbaI 和 SpeI,其切割末端連接後產生的痕跡序列可以編碼對大多數融合蛋白無影響的“甘氨酸-絲氨酸”連接肽,此策略命名爲 BglBrick 法。

基於 IIS型限制性內切酶的策略。BioBrick 和BglBrick 法雖然可以實現高效率的基因部件組裝,但是其無法避免引入額外的痕跡序列。除了同尾酶,限制性內切酶中還存在一類 IIS 型限制性內切酶,其識別位點和切割位點不在同一個位置,因此可以根據需要放置內切酶的識別位點,以產生所需的黏性末端,用於多片段的無縫連接。2008 年,Engler 等根據此原理設計了 Golden Gate 拼接法,其可在一個反應體系裏面實現多片段的高效無縫連接(圖 2c)。筆者實驗室在 Golden Gate 拼接法的基礎上,設計了 YeastFab和 EcoExpress兩個組裝系統,用於工程細胞的代謝通路優化和蛋白表達,可達 90% 以上的 DNA 拼裝效率。

基於多工具酶聯合體系。無論是基於同尾酶還是 IIS 型限制性內切酶的連接法,由於其產生的黏性末端鹼基數有限,難以支持更大片段的連接。實際上,體外的 DNA 片段連接,其核心都在於單鏈重疊區的產生和利用。爲克服內切酶產生黏性末端長度不足的缺陷,Gibson 等直接放棄限制性內切酶,採用 5′ 核酸外切酶,聯合 DNA 聚合酶以及 DNA 連接酶,開發了 Gibson 組裝法(圖 2d)。此方法一方面可以實現無縫連接,沒有痕跡序列的殘留;另一方面其能連接獲得的片段大小可達幾百 kb(千鹼基對),大大提高 DNA 體外組裝所能達到的量級。

圖2 基於不同工具酶的胞外DNA 組裝方法

(a)基於DNA聚合酶的PCR組裝法;(b)基於XbaI和SpeI同尾酶的 BioBrick組裝法;(c)基於BsaI限制性內切酶的GoldenGate組裝法;(d)基於5′核酸外切酶、DNA聚合酶及連接酶的Gibson組裝法

DNA元件的標準化設計。爲了最大化的降低對 DNA 片段的重新合成,提高對已有 DNA 片段的利用率,合成生物學的一個重要研究方向是推進合成片段(生物元件)的標準化。上述提及的 BioBrick 就是標準化的實現形式之一,是合成生物學領域最早建立的 DNA 標準化組裝方法。但是 BioBrick 法在被連接的元件之間留下的痕跡不利於蛋白元件的組裝。BglBrick 法就是爲解決 BioBrick 的缺陷而產生的標準化策略。我國王金課題組用歸位內切酶代替常規的 II 型限制性內切酶建立了 iBrick 標準,同時基於 CRISPR/Cpf1 技術開發了 C-Brick 拼接標準。基於 IIS 型限制性內切酶的Golden Gate 標準,包括 MoClo和 GoldenBraid 2.0,也能通過統一的方式進行元件的組裝。針對 Golden Gate 等標準的不足,王金課題組建立了 MASTER 連接法以實現更大片段的無縫克隆。此外,還有與 iBirck 標準類似的 HVAS 法,與 MASTER 類似的 GreenGate 法等。不同的實驗室如果都按照上述的方式對生物元件進行標準化,將能促進生物元件的流通和共享,提高複雜生命系統合成的效率。

胞內組裝

儘管體外拼裝的片段大小可達幾百 kb,但是所得的量往往不足以進行後續實驗,需要使用大腸桿菌等進行擴增。對於 Mb(百萬鹼基對)級別的體外組裝尚未見報道,即使假設能體外組裝成功,可能也無法導入到大腸桿菌內進行擴增。而枯草芽孢桿菌、酵母及工程改造的部分細菌(超表達 T4 DNA 連接酶或整合 λRed 重組酶)等微生物本身就可以介導 DNA 的胞內重組連接,可直接將需要組裝的 DNA 片段導入這些宿主細胞內進行組裝。酵母作爲常用的 DNA 重組宿主,其高效的同源重組性能早在 40 多年前就已被髮掘。1991 年,Silverman 等報道酵母可以實現長達 2 Mb 的人工染色體組裝。而 2010 年,Gibson 等報道合成世界上第一個人造生命體,其長達 1.1 Mb 的合成基因組也是由酵母拼裝獲得。藉助於酵母強大的同源重組能力,Sc2.0 項目(酵母基因組合成計劃)利用 SwAP-In 的方法實現了天然染色體的置換,獲得完全合成的人工染色體。2018 年 8 月,Shao 等報道其將釀酒酵母 16 條染色體合併爲 1 條長度達 11.8 Mb 的染色體,並獲得有正常功能的單染色體酵母菌株。帶有 1 條染色體的酵母,可作爲一個新的研究平臺,增進我們對染色體重組、複製和分離機制的解析,具有重要的意義。此外,該研究的結果也說明釀酒酵母對染色體長度驚人的容忍度(至少可以長達 12 Mb),這爲利用酵母構建高等生物的超長染色體提供了理論依據,有利於後續 GP-write 項目(基因組編寫計劃)的開展。

合成染色體轉移技術

由於需要進行基因組合成的生物體本身存在生長速度慢,DNA 重組能力不足,或者轉化效率低等問題,難以直接在目標細胞中進行基因組的拼裝。這也是爲何要使用大腸桿菌或者酵母等微生物進行拼裝的原因。隨着合成基因組學從低等生物向高等生物的拓展,除了更大合成染色體拼裝帶來的挑戰,超大染色體的轉移也將是一項艱鉅的任務。相關報道顯示,陽離子脂質和聚合物、顯微注射、微細胞法(microcell-mediated chromosome transfer,MMCT)都可以介導 Mb 級別的染色體轉移。此外,電轉化也是經常用於細胞系及原代細胞的轉染方法,尤其能勝任對脂質體轉染法等有抵抗性的細胞的轉染。在細菌方面,電轉化可介導超過 700 kb 的 BAC 的轉化。聚乙二醇(PEG)介導的裸 DNA 轉移法也是常用的 DNA 轉染法,Gibson 等成功利用此法將絲狀支原體長達 1.1 Mb 的人工合成染色體移植到山羊支原體受體細胞,獲得人類史上首個人工合成的生命體。然而,陽離子聚合物、PEG等基於化合物的轉染方法,顯微注射、電轉化等物理操作,以及微細胞介導的轉染方法均有其侷限性。

PEG 除了可以直接介導裸 DNA 的轉染,還可以通過誘導細胞融合實現間接轉染,即 PEG 介導的細胞融合法。例如,PEG 可以介導酵母原生質體球與哺乳動物細胞的融合,從而將位於酵母細胞的酵母着絲粒質粒轉移到受體細胞。細胞融合可以繞開受體細胞膜的阻礙,直接將載體送入胞漿,但是受體細胞核核膜依然是一個屏障,因此此法也面臨效率低的問題。Brown 等認爲,將受體細胞同步化至 M 期(有絲分裂期),此時的細胞核膜和骨架正處於重塑狀態,有望提高轉移的效率。實驗證據表明,利用同步化到有絲分裂期的哺乳動物細胞進行膜融合轉移,效率可以提高近 300 倍,且不受被轉移載體大小的影響。PEG 介導的細胞融合法可直接利用酵母系統進行 Mb 級別的合成染色體體內組裝,因此不需要載體的分離純化,可以避免載體受到剪切力的損傷,並且其效率受轉移 DNA 大小的限制不大。基於以上優點,對此法進行改良來進一步提高其轉移效率將更能滿足越來越高的合成染色體移植要求。

野生型基因組清除技術

合成生物學目前尚未能完全從頭合成一個完整的細胞結構,只能借用已有的宿主細胞。爲獲得只含有人工合成基因組的生命體,需要採取一定的策略將野生型染色體清除。

基於負篩選的染色體清除策略

即使在人工染色體已經植入宿主細胞並能發揮功能的情況下,對應內源染色體在自然狀態下丟失的概率依舊極低,需要通過篩選才有可能獲得這類細胞。Li等曾報道用正負篩選聯合的策略成功去除 21 三體綜合徵患者誘導多功能幹細胞(iPSCs)中的一條 21 號染色體,使其核型恢復正常。他們把一個同時編碼負篩選標記和正篩選標記的雙功能融合基因敲入到 21 號染色體;通過正篩選獲得融合基因整合的細胞株,並從中進一步篩選獲得融合基因單拷貝的細胞株;接着在無正篩選藥物的條件下培養,產生攜帶融合基因的染色體丟失的細胞。由於負篩選基因能將無毒的負篩藥物轉化成有毒的物質,進而把宿主細胞殺死,故可以通過負篩選富集獲得一條 21 號染色體丟失的細胞株。通過正負篩選策略進行合成染色體轉移後的內源染色體的清除,需要依賴於首先將正負篩選融合基因插入指定的內源染色體。近年來,基因編輯技術的飛速發展有望進一步提升該策略的效率。

Cre-loxP 介導的染色體清除

Cre是一種重組酶,能識別 DNA 上的 loxP位點,並能根據兩個loxP 位點的排列方向將其之間的 DNA 片段進行刪除、倒置等。此方法也可用於內源染色體的清除。通過與鼠胚胎幹細胞(ESCs)融合,人成體細胞細胞核可以被重編程,獲得多能性,但需要在重編程後將 ESC 來源的相關染色體清除。爲達到此目的,Matsumura 等設計了一個基於 Cre-loxP重組系統的策略——CEC(chromosome elimination cassette)。CEC的中部攜帶一個熒光報告基因和一個抗藥篩選標記,其兩端分別加入一個 loxP 位點,二者相向排列。Cre 介導的姐妹染色體重組,可以產生雙着絲粒染色體和無着絲粒染色體,此類異常染色體可在細胞分裂中被清除。然而,與基於正負篩選融合基因的策略類似,都需要事先對目標染色體進行相關基因的敲入操作。

CRISPR/Cas9介導的染色體清除

CRISPR/Cas9 是基於細菌 II 型 CRISPR/Cas 免疫防禦系統開發的基因編輯技術,由於其操作簡單,並能高效介導精確的基因敲除、敲入等而被廣泛用於各物種的基因編輯研究。鑑於上述方法的複雜和低效性,Zuo 等嘗試將 CRISPR/Cas9 技術用於染色體的靶向清除。CRISPR/Cas9 系統包括兩個核心部件,本身無靶向性的 Cas9 核酸內切酶以及引導 Cas9 進行靶向切割的引導 RNA(single guided RNA,sgRNA),Cas9 和 sgRNA 結合,以複合物的形式在特定位置切斷雙鏈 DNA。他們發現通過多個位點的 CRISPR/Cas9 靶向切割,細胞系、胚胎和體內組織的性染色體,以及腫瘤細胞等的常染色體能被選擇性清除。這個方法可爲特定染色體缺失動物模型的構建,以及相關人類遺傳病的治療提供新的策略[49],也是合成基因組學中內源染色體靶向清除的潛在技術手段。

當前,全基因組合成已經在病毒及細菌上獲得成功,首個全人工合成的真核生物——Sc2.0 也已經接近完成,對於更高等生物的全基因組合成也已經提上日程。然而,由於基因組極其龐大,要實現這些基因組的合成將依賴於上述各項技術的突破以及新技術的出現。

獲得自然界不存在的基因組,DNA 合成是目前唯一的手段;對於龐大基因組的合成需要更高效率、更高精度的 DNA 合成技術,同時需要進一步降低合成成本。與化學法相比,DNA 的酶促合成有着諸多優勢,但是距離商業化應用尚需時日。在大基因組的設計與合成中,如果可以直接使用自然界存在的 DNA 片段,可以節省 DNA 合成的成本,但同樣需要相應的技術支撐。常規長度的 DNA 片段可以通過 PCR 或者酶切等方式獲取,但對於超大片段,這些策略難以勝任。CRISPR/Cas9 技術的出現使得直接從天然基因組中特異切割獲取大片段 DNA 成爲可能。例如,我國清華大學朱聽和中國科學院微生物研究所婁春波等就聯合開發了基於 CRISPR/Cas9 和 Gibson 組裝的克隆策略,可獲得長達 150 kb 的DNA 片段。

在合成基因組拼裝方面,酵母由於本身具備很強的 DNA 重組能力,是合成基因組學的重要分子操作工具,而對於未來超大基因組的合成,酵母能否勝任需要我們探討驗證。此外,合成基因組的分離提取,轉移技術都會隨着目的基因組的增大而面臨效率減低,甚至不適用等問題,新型技術亟待開發。野生型基因組的清除是獲得完整基因組合成生物體必經步驟,CRISPR/Cas9 技術有望勝任超大內源基因組的清除,但對於內源基因組不同的位點,其切割效率可能不一致,可能需要優化篩選;另外,技術本身存在的脫靶效應可能會作用於植入的合成基因組,這些問題都需要在基因組設計階段予以考慮。

當前,我國在合成生物學領域已經取得一定的成就,尤其在 Sc2.0 計劃上,我國科學家作出了重大貢獻。作爲新興交叉學科,除了基本技術體系,合成生物學的發展還面臨其他衆多技術難題,這也是我們產出原創性成果、培養交叉型人才的機遇。(作者:盧俊南,中國科學院深圳先進技術研究院合成生物學研究所合成基因組學研究中心深圳市合成基因組學重點實驗室;羅周卿,中國科學院深圳先進技術研究院合成生物學研究所合成基因組學研究中心深圳市合成基因組學重點實驗室;姜雙英,中國科學院深圳先進技術研究院合成生物學研究所合成基因組學研究中心深圳市合成基因組學重點實驗室;沈玥,華大基因(深圳);吳毅,天津大學化學工程與技術學院教育部系統生物工程重點實驗室;楊煥明,華大基因(深圳);元英進,天津大學化學工程與技術學院教育部系統生物工程重點實驗室;戴俊彪,中國科學院深圳先進技術研究院合成生物學研究所合成基因組學研究中心深圳市合成基因組學重點實驗室。《中國科學院院刊》供稿)

查看原文 >>
相關文章