「敦煌者,吾國學術之傷心史也。」1930年,陳寅恪在給陳垣新編的《敦煌劫餘錄》的序言中提到了這句話。儘管陳寅恪本人並不十分認同此話,但它背後所反映出的,正是當時人的一種時代情緒——敦煌遺書的流散,確是一段傷心往事。
1900年,位於敦煌莫高窟第17窟的藏經洞被發現,數年之內,洞內所藏的幾萬卷文書被當時的外國探險家們車載瓜分,流散至海外多個國家。從此,敦煌文書成為國際收藏機構的重要藏品,敦煌學也成為一門國際顯學。
關於這一段敦煌遺書的「流散史」,人們已經耳熟能詳。然而,自敦煌遺書流散之日起,人們試圖使其重聚的願望和行動就沒有停止過。不論是1930年代王重民、向達等學者遠赴歐陸拍攝敦煌遺書,還是此後各個收藏機構購入微縮膠捲,一代又一代的學者們都在努力讓敦煌遺書重回完璧。
在這一系列的努力中,1994年成立的國際敦煌專案(International Dunhuang Project,以下簡稱IDP)是一個多世紀以來最引人矚目,也是成就最大的敦煌學國際合作行動。
敦煌是溝通東西方文明的絲綢之路上的樞紐式綠洲城市,它的國際化與多元化早已被人們所熟知,而由中、英、法、德、俄、日等國專家學者組成的國際化團隊,讓IDP成為了一個世所罕見的文獻數位化專案——各國的收藏機構將百年前從中國拿走的幾萬卷文書,再次拿出來掃描、上傳互聯網,讓全世界的人們免費看到、下載。很多學者認為,IDP的國際化的精神內核,直接繼承自那個千年前的沙漠綠洲。
2024年,IDP成立三十周年,作為IDP的發起機構,英國圖書館在館內舉辦了一個展覽,「絲路綠洲——古代敦煌的生活」(展期為2024年9月27日到2025年2月23日),展出了五十多件英藏的敦煌文獻以及複製品。英國圖書館中文藏品首席策展人、IDP專案經理杜美樂(Mélodie Doumy)對南方週末記者說,她想要在展覽中強調的是「敦煌非凡的世界性,每一件展品都是敦煌活躍思想交流的見證」。
IDP的資料庫和網站還遠稱不上完善。經過二十多年的掃描、上傳,各家機構都已經有了基數龐大的數字資源,但是和出土文獻的數量相比,依然有著不小的距離。IDP資料庫中不僅有敦煌文書,它還要將絲綢之路東段各遺址點出土的大量文書收羅其中。
據學者估算,僅就敦煌的漢文文獻來說,英藏大約14000號,法藏3700號,俄藏18790號,中國國家圖書館藏16000號,日本及其他國家散藏5000號。中國國家圖書館古籍館副館長劉波向南方週末記者介紹,法藏敦煌文獻已經基本數位化完畢,日本的大穀文書也基本做完,收藏數量最多的三家則還需要大量的時間與人力——中國國家圖書館完成了一半左右,英國圖書館完成了大約三分之一,俄羅斯則只完成了一小部分……
乘著互聯網的東風
任何研究工作的起點可能都是收集材料,敦煌研究也不例外。由於那段「傷心史」,敦煌文獻分藏世界各地,學者們想查閱一件文書,不免有關山險阻之歎。北京大學教授榮新江2024年出版了新書《滿世界尋找敦煌》,講述的就是在還沒有網路的20世紀八九十年代,他於歐洲各國和日本的圖書館裏,探查一件又一件敦煌文書的故事。儘管當時國內少數圖書館已經購置了敦煌文書的微縮膠捲,但膠捲在鏡頭下,「很多材料看不清,有一點油污,就是一團一團的黑。」榮新江回憶。
學者們追尋敦煌遺書的努力可以上溯至20世紀初。1909年9月4日,就在伯希和獲得眾多敦煌文書後不久,中國學者在北京宴請伯希和,希望他將文書拍照,照片寄給中國。伯希和當場表示,敦煌卷子雖為法國政府所得,「但學問為天地公器,國內學術界如欲攝影謄寫,自可照辦。」伯希和歸國後,履行承諾,拍得敦煌遺書照片千張左右,寄給中國。羅振玉所編《石室秘寶》《鳴沙石室佚書》等書,大多據伯希和所提供的照片編成。然而,伯希和代為拍攝照片之事因故中斷,未能完成。
1930年代,北平圖書館以交換館員的名義,分別派王重民、向達前往法國、英國收集敦煌文獻。從1935年初到1939年,四年多時間裏,他們陸續在巴黎、倫敦及德國的一些城市拍攝了上萬張敦煌文書和吐魯番文書的照片,他們是首批系統地收集英、法、德所藏敦煌遺書乃至西域文獻的中國學者。
這批照片中,尤為珍貴的是德國藏的吐魯番文書照片,因為有不少德藏文獻在二戰的柏林轟炸中被毀,這些照片成為了「孤品」。
二戰後的冷戰時代,分屬東西方兩個陣營的學者,要看到對方陣營的藏品,又變得尤其困難。直到蘇聯解體,讓分屬兩個陣營的敦煌文獻重新聚到一起,成為了可能。
1993年,中國國家圖書館、英國圖書館、法國國家圖書館、俄羅斯科學院東方學研究所聖彼得堡分所、柏林國家圖書館等幾大收藏機構的專家學者彙聚英國薩塞克斯,倡議成立國際合作組織,以促進敦煌文獻的保護與研究。第二年,國際敦煌專案正式成立,秘書處設在英國圖書館。
魏泓(Susan Whitfield)第一次來到敦煌是在1984年,當時她剛剛大學畢業,敦煌石窟的美讓她深受震撼,也讓她產生了從事絲綢之路學術研究的想法。1992年,已經成為年輕學者的魏泓加入了英國圖書館,她也成為了IDP的第一任專案主管。
魏泓在一篇回憶文章中說,IDP建立之初有兩個主要目標:通過國際合作來加強敦煌、吐魯番等絲路東段沿線出土物的保護工作,以及讓全球學者能夠更加便利地利用。當時,國際互聯網還沒有建立,如何「讓全球學者能夠更加便利地利用」,其實並沒有多少實質性的進展。
但她清楚地記得,互聯網技術在20世紀末突飛猛進,IDP的發展乘著這股東風,快速進入了數字文獻的共用時代。1998年10月,IDP網站正式運行,當時的學者們可以在這個網站上免費檢索到文獻的目錄資訊。
短短幾年間,當初倡議合作的幾家收藏單位紛紛加入IDP:2001年,英國圖書館和中國國家圖書館簽訂協議,開始專案合作,建立中國國家圖書館IDP數位化工作室。次年,資料庫及網站的中文版發佈。
此後,俄羅斯科學院東方研究所聖彼得堡分所、日本龍穀大學、德國柏林勃蘭登堡科學與人文科學院、中國敦煌研究院、法國國家圖書館、韓國高麗大學也加入了進來。這八個中心維護著七種文字版本的網站與資料庫,世界上大部分人口都可以通過IDP網站瞭解絲綢之路歷史與文獻。如此廣泛的覆蓋面,在全世界的古籍文獻資料庫中,是獨一無二的。
法國國家圖書館負責中日韓三語文獻的主管人羅曼·勒夫布福爾(Romain Lefebvre)對南方週末記者說,IDP網站內不僅有敦煌文獻,還有大量絲綢之路東段遺址出土的文獻,IDP最重要的任務,就是「要把全世界所有收藏有敦煌及東段絲綢之路文獻的機構聯繫起來,讓它們形成合作,以增進人們對這一區域歷史的瞭解」。所以,除了八家主要機構,還有27家其他收藏單位為IDP提供資料,比如在斯坦因的故鄉,匈牙利科學院圖書館也是合作單位。
超高清圖片有必要嗎?
2024年4月份,各家IDP成員機構在敦煌開了一次年會。這樣的會議在過去每兩年開一次,這次是疫情之後的第一次年會。劉波也出席了這次會議,並報告了目前國家圖書館IDP專案的最新進展。
中國國家圖書館每天都會有新上傳的圖片,五年前總的上傳量是18萬拍,「截止到2024年4月,已經有24.3萬拍。」劉波對南方週末記者說。「拍」是一個拍照的動作,也是文書照片上傳資料庫的單位,一個小殘片至少有正反面兩拍,一個長卷則可多達幾十拍。在IDP資料庫現有總量的60.1萬拍中,國圖上傳的數量超過40.4%,在各合作機構中是最多的。
IDP專案的伺服器結構和別的國際合作專案不太一樣,7個國家合作,有7個伺服器,每家各一個,然後用網路技術把它們連接在一起。比如國圖上傳的照片就放在國圖的伺服器上,英國圖書館上傳的照片就放在英國的伺服器上,然後在網路上相互訪問。劉波覺得,由於各個國家的工作習慣都不一樣,這個專案能夠成功,能讓各個國家合作起來,「這種特殊的後臺伺服器架構是非常關鍵的因素」。
有分必有合。數據分在各伺服器,數據的規範則一定要合。IDP從一開始就建立了一套統一的工作規範,修圖的時候怎麼換底色,怎樣調整顏色、解析度等等,所有的合作單位都用同一個規範來做工作,都採用同樣的程式,「你看英國人做的、俄羅斯人做的,還有我們做的,在資料庫裏面看起來都差不多。」劉波說。
以英國圖書館為例,某些殘損嚴重的文書,在拍攝工作之前就需要非常複雜的準備工序。工作室在地下好幾層的恒溫室中,杜美樂介紹,工作人員首先要拆除前人施加的「痕跡」,如去除背膠、外框或某些補丁,然後,他們將文書包裹在一種柔性聚酯薄膜中,這種薄膜可以保護碎片不受環境影響,同時又不會造成翹曲或化學浸蝕。最後,才是為每份檔拍攝高解析度的照片。
然而流程規範,有時候也意味著繁瑣,拍照之後要做修圖,修圖之後要做拼接,拼接完了以後按一定的程式把它傳到資料庫裏面去,《IDP專案操作規範程式》中列明的拍照、修圖、拼接的流程有二十多個步驟。一個工作室順利的話一天也只能做40拍左右。
負責拍照和修圖的人員,每天都要重複一套同樣的動作幾十次,就這樣持續幾十年,「你要是做一天、兩天,可能不覺得,一年一年這麼做是極其枯燥的。講起來很高大上,給學術提供很大的幫助,但是具體的工作是極其枯燥的。」劉波說,「速度就起不來,而且經費又比較有限,每個單位都是只有兩三個人在做這個事情,只能把戰線拉長。」
劍橋大學榮休教授、浙江大學求是講席教授高奕睿(Imre Istvan Galambos)2002年從加州大學伯克利分校博士畢業,第一份工作就是進入英國圖書館,參與到了IDP的建設之中。他親歷了當時IDP資料庫的迅猛增長,但是也開始反思為什麼二十多年過去了,拍照的工作還沒有做完。
現在想起來,高奕睿覺得當初的操作規範過於追求圖片的精度了,「當時用盡可能高的清晰度去數位化,這樣攝影的時候就非常慢,掃描一張圖片需要10分鐘」,而處理這個圖像則需要更長的時間,如果遇到一幅長卷,可能要拍上好幾天。
「當時應該用不那麼高的精度先把數位化全部做好,這樣的話現在所有的資源都能利用起來。我們當初掃描了那麼高的精度,其實也並沒有放到網路上,而是存放在圖書館,為出版用的。放在網頁上的是次一級精度的。原來那麼高的精度,用戶也使用不了,一個圖片一個G,用戶下載不了。」高奕睿對南方週末記者說。
當時放在網頁上的次一級的高清照片,足以為此後文書研究的另一個方向打開了方便之門。中國社會科學院考古研究所助理研究員何亦凡告訴南方週末記者,之前研究文書,很多學者是基於文獻的層面,主要是要識別出文字,但現在的前沿研究,會更側重於文書的形態、樣式,即「寫本的物質形態」,「所以IDP給我們呈現的高清彩圖是很有幫助的」。
高奕睿個人的學術轉向也受益於此。他原本的專業是中國古文字學,在IDP工作十年,高奕睿結合敦煌文獻,發展出了新的研究方向。高奕睿曾經寫過一本關於西夏文的書,法國的戴仁教授(Jean-Pierre Drège)寫書評指出他沒有注意到西夏文書的裝訂方式。這個書評讓他注意到古代文書的物質形態,即文書的紙張、剪裁、裝訂等,而敦煌文獻在這方面有著大量的實例,從此他的研究方向轉向了敦煌文獻的物質形態的研究。
「經費上很不到家」
2024年2月20日,IDP網站迎來了最新一次的升級,新網站增強了搜索功能和對長卷的流覽能力,同時通過採集準確的用戶數量,後臺得知 IDP 平臺的核心受眾來自世界各地,其中最大的流量來自中國、英國和美國。
普林斯頓大學助理教授文欣主要關注的材料是絲綢之路出土的「世俗」文書,包括政府公文、民間契約,以及社團條例等。最新的這次網站升級,讓文欣感到圖片的排版更好了,而且很多長卷可以線上直接流覽了,「以前要一張一張圖下載下來,然後拼接起來」。
IDP的身影也漸漸在學術論文中出現,何亦凡記得以前寫論文的註腳,某圖片的引用出處是要寫到紙質圖版的,某某書、第幾頁,「但現在有時候也會寫IDP的一個文書網址,這樣讀者也更容易找到」。
但是也有學者感覺到,「最近IDP的更新速度好像慢下來了。」高奕睿每天都要使用這個資料庫,他對數據的變化相對敏感,「在疫情之前,IDP上傳新圖片的速度已經大不如前。」
杜美樂向南方週末記者承認,目前網站的伺服器確實出了一些問題,導致每個國家的伺服器都不再能訪問另外6家伺服器的最新上傳,「2023年10月,英國圖書館遭受網路攻擊,我們的網站和部分線上系統和服務目前仍受到影響,因此我們的工作持續受到干擾。我們正在與 IDP 的夥伴合作,以恢復元數據和圖像在各個 IDP 平臺上順利共用,同時繼續恢復向世界各地的人們提供服務。」在此之前,7個伺服器之間的相互訪問是非常順暢的。
據劉波說,目前各個國家能訪問到的外國伺服器上的數據停留在了2021年底,「資訊同步這一塊有一點滯後了」。
杜美樂沒有正面回應恢復進度緩慢是否經費原因造成的,但大多數接受採訪的學者都認為,目前IDP正面臨著經費問題。「雖然我不是IDP系統的,但是我感覺,如果還想繼續做,經費上很不到家,包括英國圖書館和中國國家圖書館,德國更沒有錢。」榮新江對南方週末記者說。
德國的吐魯番文獻主要由柏林國立圖書館收藏,目前這批文獻已經數位化,成為了IDP的一部分。維也納大學教授梅勒妮·馬爾燦(Melanie Malzahn)對南方週末記者說,除了吐魯番文書,目前德藏的其他絲路文獻的編目與調查工作還遠遠沒有結束,「當時絲路上的語言有二十多種,而德國的編目工作是按照手稿類型與語言來分類的」,每一種古代語言都要找到合適的專家來做判定與釋讀,編目的進度因此無法快速推進。
高奕睿回憶21世紀初的十年,那時候經費充足,正好也是IDP高速發展的十年,「專職IDP的工作人員最多的時候超過10位,其中有三位全職攝影師。」他說,「法藏文獻可以做完,也是因為他們拉到了錢,梅龍基金會(Mellon Foundation)資助了他們,他們的文書數量也相對較少。」
外部基金對IDP的資助主要為專案制,如前幾年香港北山堂基金資助了《法華經》的保護和數字化專案,使得IDP在2017年至2022年期間,上傳了近800份敦煌《法華經》的圖像。而對於其他手稿、經卷,可能就需要等待其他專案的資助。
中國國家圖書館的上傳進度也與外部基金的支持密切相關,劉波說,2019年之後的兩年,專案的基金支持斷了,上傳的進度也就停滯了。但從2023年年初開始,隨著新的基金會贊助的到來,上傳的效率又高了起來,「重新回到了三個人的配置,一個攝影師,兩個修圖師。和英國圖書館相比,目前中國國家圖書館的進展較為穩定,」劉波說,「未來最大的挑戰就是工作量比較大,短期內可能還看不到它能徹底做完。」
針對這種情況,榮新江提出了他個人的建議:「我特別建議中國應該把它接過來,因為中國現在熱情很高漲,經費上也有。」但這個建議在具體實施上還有諸多現實的掣肘,對羅曼·勒夫布福爾來說,IDP不僅是不同文化的人群之間的合作,也是圖書館、博物館和研究機構之間的合作,「這種合作的理念具有重要意義,為了向世界提供更豐富的文獻收藏,這種合作應該繼續下去。」
IDP還能做什麼?
從敦煌出發向西,沿著絲綢之路,可以到達另一個中古時期的佛教重鎮龜茲。龜茲也在20世紀初經歷過和敦煌相仿的命運。現新疆庫車地區總計有十座古龜茲佛教石窟寺院,克孜爾石窟是其中規模最大且最為著名的一處。1902、1906和1913年,德國探險隊三次來到庫車地區,割下並帶走了大量石窟壁畫。這批壁畫在二戰的柏林大轟炸中損失嚴重,二戰結束後,又有一大批壁畫被搬運至蘇聯,現藏於聖彼得堡艾爾米塔什博物館。如今,龜茲石窟的壁畫分散在全世界至少15家博物館。
梅勒妮·馬爾燦告訴南方週末記者,和IDP一樣,世界各地的收藏機構也為龜茲地區的石窟壁畫建立了一個跨國的資料庫,即「北方絲綢之路上的庫車佛教壁畫」專案。這個專案依託於萊比錫大學,「絲綢之路研究本身就是跨國、跨學科的,因此只有通過國際合作才能推動知識的進步。」梅勒妮·馬爾燦說。
從某種意義上說,IDP的國際化合作模式為其他絲路上的文化遺產提供了借鑒,IDP的未來探索也將為類似專案提供寶貴的先行經驗。2024年4月份的敦煌年會,除了討論伺服器的升級,與會者們還重點關注了IDP下一步該怎麼走。
文欣認為未來IDP在上傳文書的時候,應該對文獻的出土地做更詳細的標記,「最重要的就是要儘量展現文書的『全貌』,這不單是指文書正、背面的圖版,而且還要有文書出土的地點、遺址的時代,以及文書在其出土地和其他文書、文物之間的關係。」文欣對南方週末記者說,這些資訊構成了一件文書的「語境」,「簡單的一張照片,是無法復原這些『語境』的。IDP提供了某些文書出土地的資訊,但是這些資訊對於西域文書『語境』的重建,還不完全足夠。」
另外引起學者興趣的,是IDP未來的檢索功能。到目前為止,IDP基本上還只是一個圖版的資料庫,但圖片已經不能滿足學者們的需求,很多人在期待文書的OCR(光學字元識別,將圖像中的文本轉化為可讀取的文本)與檢索。榮新江是檢索功能的熱情支持者,他認為現在的IDP網站不是真正的數位化,「我所理解的數位化是要真正能檢索,而檢索功能現在是可以做到的。」
檢索的前提,是要認出文書上的字。敦煌文書大部分是佛經文獻,榮新江認為這部分並沒有OCR的必要,「像最近的《法華經》的專案,他們用OCR做《法華經》的文字識別,我覺得這在學術上沒有太大的意義,因為《法華經》的文字我們都有,和敦煌本差異很小,何不用現有的本子做底本,稍微改幾個字呢?」
而對於學術研究意義更為重大的世俗文書來說,「敦煌俗字很多,格式也不規整,又很潦草,OCR機器是拿它沒有辦法的。」劉波說。
既然OCR機器識別不了世俗文書,那麼只能靠學者們的「火眼金睛」,於是這一百多年來敦煌學學者的研究就顯得尤為重要。榮新江對南方週末記者說,幾乎所有重要的敦煌文書,經過這100年的研究,都已經有了錄文、論文,只不過散在各種書、期刊裏面,「IDP的人找不到這些,必須得跟我們敦煌學研究者合作。我覺得這一步我們中國學者一定要作出貢獻來。」
劉波雖然同意榮新江的願景,但在他看來,這條路也是困難重重。首先是版權問題,敦煌學者人數眾多,如何將他們的錄文與研究收集於網路並公佈,版權問題必然紛繁複雜,「就算解決了法律問題,還有一個技術問題,敦煌大量的俗字、異體字,或者生造字,這些東西很難輸入電腦。」劉波說。而這還只是漢字內部的問題,更不用提其他多種西域文字的文書了。
事實上,敦煌研究院自己開發的一個資料庫「敦煌遺書資料庫」已經有了加載的錄文,「但目前也只有一千多號的文字資料,與7萬號的敦煌文獻相距甚遠。」榮新江說,他對數字化敦煌的前景比劉波更加樂觀,「學者們合力,就可以做出一個真正的數位化的敦煌文本,這樣也可以吸引學術界外的人。否則敦煌文書是按編號走的,和內容沒關係,前一個號是佛經,下一個號可能就是《論語》,再下一個號又是《史記》,沒有檢索的話,不搞敦煌的人哪里去找?所以你要有一個數位化敦煌,大家都可以用,不光搞敦煌研究的人可以用,外面的人也可以用。
(王華震/文)
中華大地