永久保存人類歷史文化,永遠有多遠?

試想像,一群狂蜂浪蝶向你展開熱烈追求,你讓他們想辦法表達其永恆的愛意,於是 Alex 把「I love you」刻在石頭上,Bob 把「我愛你」寫在區塊鏈,Carlos 則說「永遠」只是騙人的把戲,沒可能做到,你會選誰?

Alex 的石頭

2015 年,劉慈欣憑《三體》英譯本獲科幻小說的最高榮譽「雨果獎」,其第三部曲有這樣的一幕(劇透出沒注意):眼見人類行將滅絕,聯邦政府成立地球文明博物館,保存人類的文化遺產和訊息,目標十億年後宇宙間的文明路經此地,至少能知道人類這個物種曾經存在。

全球多個科學家參與研究,發現特殊訂製的光碟能保存訊息十萬年,特殊紙張和油墨的印刷品反而好一點,能保存二十萬年,但依然跟目標相距非常遠。後來,研究終於找到一個能保存訊息一億年的方法,科學家幾乎不好意思說出口,就是把字刻在石頭上。於是,存有《星夜》、《蒙羅麗莎》等名作,牆上刻有人類歷史文化的地球文明博物館就在冥王星的地底成立。最後,冥王星躲不過外星攻擊,博物館遭到毀滅,倒是僥倖在外太空存活下來的少數人類同樣利用石刻,成功傳達訊息予近二千萬年後到達現場的主角。

當然,《三體》再精彩都只是小說而並非嚴謹科學;儘管如此,我相信在眾多儲存媒介中,石頭的確最為持久。從某種意義上,近代人類也透過類似的方法接收到來自一億多年前的訊息:恐龍的化石。

把訊息刻在石頭流傳千古看似落伍又不切實際(刻在鑽石另當別論),事實上卻隱含大智慧,「low tech 撈嘢」。

古代的「區塊鏈節點」:羅塞塔石碑(Rosetta Stone),CC-BY-SA 4.0 Hans Hillewaert

Bob 的區塊鏈

不過,石頭要怎麼保存,才不會像《鐵達尼號》的海洋之心,被扔到海裡再也找不回來?為免丟失而製作備份,額外的石頭還算不算同一份愛意?若有其他人找來相似的石頭,刻上相同的字樣,要怎麼分辨?真偽由誰說了算?一連串問號,正是區塊鏈試圖解決的難題。

有趣的是,我曾多次以石頭為比喻,向沒有技術背景的受眾解釋區塊鏈的特性。假設原始人的部落有一面大石牆,每個人都看到,每個人都可以自由在上面寫字句,一旦寫上永不磨滅,因此其他人沒法刪除已有的紀錄,只能刻上更多的訊息接龍,所有訊息一直流傳下去;這就是原始人的「區塊鏈」。

引喻失義,區塊鏈這塊「數碼大石」當然不可能在所有層面跟物理石頭一模一樣,除了不可竄改,區塊鏈最常被提及的特性是一般石頭不可能具備的去中心化。事實上,「不可竄改」和「去中心化」這兩大特性必須相提並論才有意義,「不可竄改」指的並非是內容上了鎖無法修改,正好相反,任何人不但可以自由讀取數據,也可以複製並修改;問題是一旦未經社群共識而私下刪改數據,會與分散地由多個節點儲存的數據不吻合,繼而被群眾發現。

去中心化和不可竄改唇齒相依,前者帶來後者,後者讓前者變得有共識、有意義,任何群體都可以去中心化,但如果連共識都被「去中心化」,那不過一盤散沙,並無意義。

Carlos 的永遠

區塊鏈相當脆弱,只要全球斷電就沒法讀取,刻在石頭可望延續一億年,但一旦地球毀滅也將付諸一炬,即使是刻在冥王星,同樣會有消失的一天。Carlos 說對了。

犬儒主義者都很清楚一點,徒勞無功論能讓自己立於不敗之地。不敗,卻不代表勝,甚至不代表活得有意義。不可能達到永遠所以不去嘗試,這個說法不但不解溫柔、毫不浪漫,最大問題是忽略了人與人之間交往的語境。

情侶說的永恆,意義得放回一段關係去理解,去感受,去付出,這並非數學,一下子拉到絕對的度量衡去討論,唯一的效果是顯得貌似見多識廣。這種人,問他今天幾度,他會說三百多度,相對的是絕對零度;問他吃午飯了沒有,他總說吃過了,相對的是出生以來。

再說,即便是數學,物理世界中沒法達到的概念往往非常有用,比如虛數單位 i,即√-1,就是不存在於物理世界但有助解決很多難題的數學概念。無限,♾️,跟永遠就更加可比。假設無限是 x,任你說出一個數字 y,x 都會比 y 大;問題來了,如果我說 x+1 呢?無論你說的數字有多大,我總能找到一個更大的數字,可見無限也是不存在的。永遠也一樣,無論說的是一百年、一萬年還是宇宙大爆炸之初至今的一百多億年,總能找到一個更長的時間,因此永遠也是不存在的,尤其是相對於小小的地球、渺小的人類而言。

然而,「永遠」這個概念卻確實存在。作為一個概念,「永遠」可以用於表達想像中的遙遠未來,促進人與人之間的溝通,更可以用作「永遠」都在追求的目標。比如,永久保存人類藝術、文化與歷史。

丟失、竄改與磨損

現在,讓我們試著想像,假設有一位記者拍下了 1989 年柏林圍牆倒下的照片和寫下了詳盡報導,並把兩者都數碼化發表,我們要如何確保 2089、2189 年甚至更遠的後世讀到這筆資料。

讓資料流傳後世,要面對丟失、竄改及磨損三種挑戰。丟失可再分自然流失和歷史清洗,前者大概不會發生在柏林圍牆倒下這種國際大事,但每天的事件和資料恆河沙數,就說你居住的小村莊被滅好了,殘酷的是即使那對你來說是一切,也不見得就會引起國際關注。在注意力極度稀缺的分眾年代,每個個體都需要抱有「自己歷史自己救」的覺悟。

雖然現在看來柏林圍牆的歷史保存得很好,但沒人說得準再一百年後的德國由誰執政,如果這段歷史令屆時的政權難堪,銷毀歷史文獻和屏蔽民間報導屢見不鮮,不論是獨裁政權還是民主政體。

如果你認為歷史清洗是邪惡的極致,那麼你還是天真了;相對於刪,更具破壞性的是改。紀錄被刪除,至少你知道自己不知道;但當紀錄被竄改,受眾將連自己不知道都懵然不知,被誤導了還以為自己清楚實況。

過往,篡改歷史是獨裁政權的「專利」,來到每個人都能成為自媒體的年代,發佈假訊息成為大眾的武器甚至玩具,而且隨著 AI 普及,門檻愈來愈低。現在生成式 AI 才剛起步,ChatGPT 已經出口成文,Midjourney 製作的圖片連專業評審都能騙過,贏取藝術獎項,「有圖有真相」的年代一去不復返,2089 年的後世讀到柏林圍牆倒下的報導,憑甚麼肯定照片確實於 1989 年拍攝,而不是後來憑空生成的,或者基於事實篡改 1% 的史料?

相對於丟失與竄改,電子檔案的「磨損」很容易被忽略。以「Universal Access to All Knowledge」(普及所有知識)為使命的「互聯網檔案館」(Internet Archive),其創辦人 Brewster Kahle 去年發表題為〈Digital Books wear out faster than Physical Books〉[1] 的文章,提出有趣的觀點:百年前的書現在仍能閱讀並不稀奇,但十年前的電子書卻往往已經沒法閱讀。

紙本書的潛在磨損不用多解釋,Kahle 舉出多種原因使電子書不能再被閱讀,除了數據儲存媒介的物理損耗,還有諸如硬體的更新、格式的改朝換代等。比如說,如果前人留下一片 5-¼ 寸軟碟的資料,就算數據還在,今時今日要閱讀也不是一件易事;何況那之前還有 8 寸磁碟、磁帶、打孔卡,之後還有3.5寸軟碟、硬盤、CD、MD、Zip Drive、固態硬盤、SD 卡、U 盤、Blu-ray 等等,短短三十年,儲存媒介已經出現多番革新,在2089、2189 年讀取 1989 年的檔案,顯然不是一件理所當然的事。

文件格式亦不遑多讓,Kahle 文中只列出書籍常用的 djvu、daisy、epub1、epub2、epub3、pdf-a 等,還沒有提到聲音、圖片、影片、壓縮檔在過去幾十年的變化。假設你成功找到帶 5-¼ 寸磁盤的個人電腦去讀取前人留下的數據好了,假如裡面存了一個 arj壓縮檔,你還要有本事找到解壓的軟體。讀取昔日數位資料需要過的五關斬的六將,就是電子書的「wear out」。

Brewster Kahle與「互聯網檔案館」伺服器(攝影:Rudy Rucker,照片來源:The Long Now Foundation)

與遺忘鬥爭的必要條件

分散式出版正是在這個脈絡下誕生,嘗試應對保存人類歷史文化的阻力。

相對於尋找一種永久保存資料的媒介,分散式出版乾脆反過來,前設任何儲存媒介和節點都有可能因為天災、人禍、政治、經濟等各種因素被破壞,因此不依賴任何單一組織中心化儲存,而讓出版物分散由不同的單位與個人儲存在世界各地。

分散式出版強調的不是單點的強度,而是總體的韌性,追求在沒有中心的前提下「野火燒不盡,春風吹又生」,同時透過數學去取得共識,確保資料完整、一致及可延續。透過分散式出版,任何人都能夠發表作品,一經發表後所有人都能讀取,但沒有人可以刪除或竄改,因此,資料得以原汁原味地永久保存。

技術上,分散式出版利用區塊鏈及分散式存儲系統,分別儲存元資料(metadata)和內容主體。區塊鏈讓人只要付出相應的成本,就能借助整個區塊鏈網絡永久儲存資料,但由於儲存成本很高,只適宜用作儲存元資料,至於圖片等內容需要另行使用分散式存儲系統,其中最通行的為 IPFS(Interplanetary File System),這個系統讓網絡上任何人都能參與備份,並以數學確保資料完整而且一致。

為綁定元資料跟內容主體,相當於內容指紋的雜湊值(hash)會存於區塊鏈作為其中一項元資料;當日後遇上內容更新或者格式維護,元資料也會更新以記錄新檔案的雜湊值,以標註檔案為原檔案的新版本,達到溯源的效果。

說回柏林圍牆的例子,傳統出版方式依賴中心化機構記錄,即使你願意協力長久儲存照片和報導,也不一定能找到源頭;即使找到源頭也保存好,需要資料的人也不知道往哪裡找儲存了資料的你;最後,就算有幸能找到你,也難以證明報導就是當年的「真跡」。一連串協作的難題,正是分散式出版的核心關注。

不過,分散式出版畢竟剛起步,實作上有很多瑕疵。最為人詬病的是使用困難,不過隨著研發和設計,操作介面正逐步獲改善。其次,IPFS 雖然提供了協作儲存的基礎,但如果全世界都沒有一個人儲存某檔案,它始終還是會丟失,它滿足了群體記憶的必要條件,讓記憶得以跟遺忘鬥爭,但當整個社會都不在乎,事情終將被遺忘。

最後也是最難解決的是用戶使用習慣。分散式出版所使用的區塊鏈及 IPFS 等技術,就像跨國界的「人類文明博物館」,即是技術真的能避免人類文化歷史被刪除或被竄改,但正如沒有人會天天逛博物館,一般人日常都是透過 TikTok、Twitter、Facebook、YouTube 等最為簡便的方式接收資訊,而這些方式即使不是由體制主導,至少必須接受體制的約束和審查。要是 2089 年的德意志政權不願讓人民讀到 1989 年柏林圍牆的報導,定能輕鬆地把相關資訊從主流平台下架;更甚者,捏造有利於政權的論述,透過只著重傳播率的演算法大量散佈。

分散式出版的目標是永久保存人類歷史文化,但無論技術發展得多成熟,都只是必要而非充分的條件;記憶要與遺忘鬥爭,還必須仰賴人民的科技新知、媒體素養和公民意識。

*原文發表於國際演藝評論家協會(香港分會)


《區塊鏈社會學》週報,金錢、媒體與民主的再想像,實踐財富自由、出版自由和民主自由。文章逢週四刊出,直接送到訂戶郵箱。


Comments

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *