摘要:電子遊戲、互動式數據庫、以及各種應用軟件的保存難度比起前者難得多,原因在於這些軟件不光需要一臺能夠讀取二進制位和字節的計算機,而且未來的硬件一定要能夠輸入指令並解讀程序中的各種變化。解決辦法之一是保存所有硬件的至少其中一種版本,這種做法雖然過火,但是未來我們可以重新創造出恢復數據所需要的硬件生態系統。

 

  在網絡上一張圖片被轉化爲0和1的序列,數字化的信息可以傳播、複製、下載和儲存。以前我們還可以焚書,現在已經不可能焚燒電子書,雲計算的概念讓數據可以在多地儲存、備份,讓意外再也無法破壞你的數據。

  數據的數字化讓數據免於現實世界中的各種災難,然而電子數據離永恆存在還差得遠。

 

  問題是數據本身很可能不會丟失,但未來的人們可能無法讀取這些數據。

 

  試試看在Vista\Win7\Win8中打開WordPerfect文件看看,Microsoft已經不再支持這些格式。Apple也從2004年起停止支持ClarisWorks,丟棄了自己使用了13年的辦公軟件套件。2013年末推出的PlayStation 4也無法讀取1996年的古惑狼CD。想從軟盤裏恢復一些數據,太難了。

 

  Internet之父和Google“首席因特網布道者” Vint Cerf說:“保存二進制位難度並不大,問題是這些位代表什麼意思?”

 

  從原始軟盤發明之初到現在也不過50年左右的時光,今天許多筆記本連軟盤的後繼者光驅都不再配備。紙質文件的長久保存優點瞬間凸顯。Cerf提出了一個問題,如果往後1000年或者3000年,我們怎麼知道如何正確將這些數字數據轉化成我們需要的信息?Cerf認爲如果不找到合適的解決辦法,那麼21世紀將成爲信息黑洞。

 

  卡耐基·梅隆大學的Mahadev Satyanarayanan正在開發一套專門歸類和記錄數字對象的平臺,對解讀軟硬件進行描述。他的平臺名爲“The Olive Archive”,設計的目的是爲了解決最難保存的數據:可執行文件。

 

  圖片和文字等靜態文檔數據保存起來是一回事,但是許多今天的重要信息都是動態的。電子遊戲、互動式數據庫、以及各種應用軟件的保存難度比起前者難得多,原因在於這些軟件不光需要一臺能夠讀取二進制位和字節的計算機,而且未來的硬件一定要能夠輸入指令並解讀程序中的各種變化。當玩家按下PS手柄上的方塊按鈕時,古惑狼會原地轉圈,然而計算機並沒有方塊按鈕。隨着GPU、CPU、主板和其它硬件的不斷進化,同樣的問題也會影響計算機。

 

二十一世紀將成信息黑洞 信息無法保存

  解決辦法

  解決辦法之一是保存所有硬件的至少其中一種版本,這種做法雖然過火,但是未來我們可以重新創造出恢復數據所需要的硬件生態系統。Olive Archive平臺做的就是相同的工作,但是他們的解決辦法高大上很多,而且用不着修個大倉庫,堆滿老硬件,要知道如果真這麼做,過個幾十年,這些硬件就壞了。Satya想建造“虛擬機”,通過描述硬件或者繪製示意圖,讓老舊的程序通過軟件再生。用當前的軟件模擬老舊硬件早已有之,但是搭建這樣一個這樣一個可以打開並執行任意數字對象的知識庫,這是個浩大的工程。

 

  我們如何確保這篇文章在下個千年裏還能存在呢?Satya首先提出了用PDF這種便於儲存的格式存放文件。那麼要打開一個?.pdf文件,就需要使用Adobe Reader,未來的人類如果想要打開,就要使用保存PDF文件同版本號的Adobe Reader(在這個案例裏是10.1.12)。Adobe Reader軟件只有在操作系統的環境下才能運行,所以還需要能兼容PDF reader 的Windows(或者MacO\Linux),最後,操作系統還需要在硬件上運行。我(原文)在輸入這些文字的時候,使用的是聯想ThinkPad Y470,虛擬機可以模擬我這臺計算機裏的硬件,不過任何能夠執行Windows的計算機,只要能夠兼容Adobe Reader也可以。所以數字文件中的每一位數據都是由軟件、操作系統和硬件構成。Satya的目標是創造出這些構成元素的檔案,可以根據需求組合,上傳到服務器,供用戶通過網絡讀取。

 

  從2013年起開始工作,團隊已經完成了Windows3.11、DOOM、Oregon Trail、TurboTax 1997等元素的文檔編制。Satya說Olive的數字對象錄入幾乎是不受限制的,系統可以與時俱進,如果量子計算機發明出來了,甚至是不用二進制了都不要緊。未來的機器如果要運行早期的計算機程序,只需要簡單模擬當時的硬件。

 

  現在全世界普遍使用的是Intel的X86兼容硬件。幾乎每一臺個人電腦上都用着不同版本的X86架構。Intel對向下兼容做得很好。Satya認爲X86架構的絕對普遍性讓其在不遠的將來內會繼續發揮重要作用。不過在一千年之後,什麼都是可能的。

 

  Olive還要能夠通過添加新的模擬層保持存檔跟得上變化。Satya說他們相信不管是什麼取代了Intel的X86架構,鑑於目前有太多的遺留軟件根據X86架構編寫,所以X86模擬器是註定要有的。如果沒人來做這件事,那麼Olive的維護人員會做。他說只要繼續疊加,就能實現模擬,公元5000年的時候,也許要5層模擬才能運行2015年編寫的軟件。

相關文章