古籍整理校勘入門 蔣門馬

一、從事古籍整理校勘者的條件或資格

任何人都可以從事古籍整理校勘,衹要懷著對古書的敬畏之心,眞心想把一本書整理到自己完全滿意爲止。

這一條件,其實要求極高,很不容易做到。首先是對所要整理校勘的古書懷有敬畏之心,戰戰兢兢,如臨深淵,如履薄冰,唯恐自己的一毫不愼,導致原文有一字譌誤,以致自誤誤人;因此寧可保留原文的錯誤,亦極不願意自己在此外增添一箇可能的錯誤。其次是自己的學識水平境界,會在整理校勘過程中不斷提昇,對滿意度的要求亦會隨之而提高。整理出來的書,質量好不好,自己最清楚。自己是這本書的第一讀者。如果連自己都不滿意,怎麼敢公開與其他讀者分享?

衹要尊重古人,眞心想整理好一部古書,沒有任何古籍整理校勘的相關知識,都可以通過不斷學習來提高自己的學識水平,這是完全不成問題的。任何人都是從沒有經驗到經驗豐富,這是一箇自然過程。古籍整理校勘的知識經驗,可以由別人傳授,可以從書中自學,亦可以自己摸索。天底下最困難的事,幾乎不可能的事,都是由無知無畏的有心人做成功的。

二、確定整理校勘一本書

一箇人的一生中,往往會閱讀大量的圖書,但眞正讓自己百讀不厭、受益無窮的,亦就極少數的幾本書。對於這樣的精讀書,如果沒有令自己滿意的書本,是一件令人十分遺憾的事。因此親自動手整理校勘這樣的一本書,是勢在必行的一件事。可以說,整理校勘古書的初衷,是對現有各種版本的不滿意,就是爲了方便自己的學習和研究。整理校勘的過程,亦就是自己學習和研究的過程。

作爲自己整理校勘的第一本書,一定要發自內心的,而且沒有任何功利之心。如果不是爲了自己而整理校勘古籍,對於有經驗的人來說,或許不成問題;但對於一箇沒有經驗的人來說,恐怕不是一件樂此不疲的好事。人生不如意事,已經常十居八九,我們又何苦要選擇做自己不喜歡的事來折磨自己呢?更何況做事的目的不同,過程就會有差異,結果亦自然大相徑庭。

如果是工作需要,至少亦要選擇自己感興趣的典籍,相關知識又比較熟悉的;否則對中醫一竅不通卻去整理中醫典籍,對道教文化一無所知卻去整理道教典籍,這樣整理出來的書籍,是自欺欺人。

三、查閱書目,蒐集各種版本

確定了自己要整理的書後,第一件要做的事,就是要查閱各種書目文獻,蒐集這本書的各種版本,明確各種版本的源流情況。

古書最初當然是作者手寫的,然後是他人的傳鈔,最後是刻印;在傳鈔刻印過程中,難免會出現譌脫衍倒等差錯,甚至被竄改,這樣就有可能漸漸失眞,甚至變得面目全非。「修辭立其誠」,文辭本是爲了達意,但文字有差錯,意義就會「差之毫釐,謬以千里」,因此蒐集古書流傳的各種版本,梳理它們之間是否有源流關係,就顯得極爲重要。書中的藏書印、敘跋、版式、刊刻時間地點人員等等,都要細細考察。在校對過程中,亦會發現這些版本之間有源流關係。一般情況下,版本年代越早的,就越是接近原貌。各種版本的價值不盡相同,因此可以確定主校本和參校本,剔除沒有價值的版本(或僅作參考)。主校本,必須全書通校,逐字細細校對,一絲不苟。參校本則不必通校,僅於有疑處查覈卽可,亦可因此避免不必要的異文校勘記。

當然,關於該書撰寫的年代、作者的生平等情況,亦應該進行資料的收集和考證。前人的相關論述,當然要參考,但必須追溯來源出處,覈實考證,避免人云亦云。

四、整理校勘

接下來要做的,就是按照自己的眼光和感覺,挑選一箇版本開始閱讀,目的在於自己的理解和體悟,享受優游閒暇的閱讀過程。不要忘了,這可是自己整理校勘這本書的最終目的!這是整理校勘古籍的第一步,亦是最後一步,一定要慢慢享受,反覆閱讀體會。這一過程,看似浪費校勘時間,其實卻是校勘質量的最重要保證。因爲對文本的熟悉,和對文義的深刻理解,可以使得此後的校勘非常順暢。如果急於求成,急功近利,初心一變,校勘質量問題就隱伏其中。莊子說「美成在久」,一本書的整理時間與流傳時間,應該是成正比的。如果可能,最好依樣畫葫蘆地鈔寫一遍,這樣就會對傳統漢字、異體字等有非常深刻的印象。這是古籍校勘的準備工作。

閱讀過程中,遇到有疑問的字句,就要覈對其他版本,看看是否有錯誤。在這種對比校勘中,慢慢地就會分別版本的優劣。然後挑出一箇內容最齊全、文字譌誤最少的版本作爲底本,開始正式的校對。底本的確定,是古籍校勘最首要的任務,至關重要,直接決定校勘質量的優劣。

接著依照底本録入文字,加標點但不分段(最好有分段的標記,以便以後全部查找-替換)。這時注意力集中在正確録入文字上,句讀標點分段留待以後慢慢推敲確定。爲便於校對,隱藏標點符號或標點側邊放置,把文本編排成與原刻本完全一致的版式,相當於古代的景刻或覆刻,使得頁頁對應,行行對應,確保每頁文字沒有衍脫(增加或遺漏)。這一排版方式,使得録入文字與底本原書的校對非常方便。然後把書稿打印出來,與底本原書逐字校對。先閱讀一遍,看看有沒有明顯的文字錯誤,再與底本比較覈對三遍,把異文記録在書稿上,然後在計算機上改正,再打印出來校對底本。這一過程,至少進行三遍,務必確保書稿電子文本與底本完全一致。然後再拿書稿,與其他版本進行反覆校對,記録異文,校勘記中說明:底本某字,某校本作某字。所謂校對,就是把校本的文字,與底本的文字,逐一比較,然後把不同之處標記在底本上,把異文摘鈔出來,客觀地記録異文,而不去分別正誤優劣。校對的最大問題,可能是漏校。明明兩箇版本文字不同,但自己就是沒看出來。而漏校的文字,往往就是這箇版本的校勘價值所在。因此反覆校對是勢所必然的事。

文字録入及標點,現在當然都可以由AI來完成,OCR(文字識別),自動標點。亦可直接在電腦屏幕上校對,雙顯示屏或大寬顯示屏是最佳選擇。建議初學者,開始時自己手工録入,加標點。如果再有AI可利用,就把兩個結果作對比,可以用word或者wps的文檔對比功能:審閱-對比。人工與AI的對比,能夠最大程度地看清自己和AI的優缺點,取長補短。在電腦顯示屏上校對,與在紙上校對,體驗有很大差異。紙上校對,每一次校對,都是有客觀記錄,可以覈查,當然要注意這些資料不能丟掉。但是在電腦上操作,很有可能就沒有注意保留記録,這樣後期發現此前的操作未盡恰當時,需要參考、糾正或恢復,就幾乎不可能,所以保留不同的版本就顯得非常重要。最終結果是要印刷出來,所以在定稿後,還是一定要打印出來校讀。

待所有的校對完成之後,接下來要做的,就是對所有的異文進行考證,然後校改底本文字,校勘記中說明:某字,底本作某字,據某校本改。決定是否要更改底本文字的依據,不在利用文字音韻訓詁等小學知識來判斷異文的正誤優劣,從而作出取捨,這樣容易導致以箇人臆見竄改原文,而是要細心地去體會不同版本之間的差異,探求經典原文到底是怎樣的。對底本文字的更改,一定要非常愼重小心。對於自己不懂的文字語句,一定要勤查字書及其他各種參考資料,有疑惑時尤其應當多利用各種數據庫檢索相關詞句,不以箇人懷疑或臆測更改原文,以免後人譏嘲自己爲妄改古書的淺人。顏之推謂:「觀天下書未遍,不得妄下雌黃」,正是對誤校的忠告。

古人說:「校書如掃落葉,旋掃旋生」,這是因爲隨著自己的經驗和學識不斷提高,發現此前有漏校和誤校,因此不得不重新進行校勘。不是有誰規定要校對多少遍數,而是自己想要這麼做,以確保校勘質量。到底需要校勘多久,才能讓自己放心滿意,有時連自己心裏都沒有底。

校對完畢,校改定稿後,打印出來,反覆閱讀。自己是書稿的第一讀者,一定得細細閱讀,不斷修訂完善。還得放置幾箇月或半年後,再重新閱讀,否則會因爲熟視無睹而留下遺憾。

如果不能自始至終地保守自己的初心,這一過程就會變得枯燥乏味,更因遇到各種困難而心浮氣躁,身體亦會容易疲累,校勘質量問題就此產生。當一件事情逐漸變得痛苦不堪的時候,就該停止前進,放鬆休閒一段時間,待心境狀態恢復時再繼續。老子說「愼終如始,則無敗事」,可以細細品味。

五、傳統漢字的識讀和録入

文字録入,主要涉及傳統漢字的計算機漢字處理。

漢字的書寫有各種形態,因此形成異體字,包括古字、俗字、譌字等等,有的甚至連字典中亦沒有。古籍整理,原則上是保留異體字(避諱字一般改回原字),但實際操作時往往把異體字更改爲通行字或正體字(以不影響文義爲前提條件),因爲計算機字體中或許根本沒有這箇字,新造字旣麻煩,更不利於全文檢索,而且大多數讀者未必認識。對於傳統漢字的準確識讀及録入,可能是古籍整理中最大的困難。《康熙字典·辨似》、顏元孫《干祿字書》可以先學習。在閱讀過程中,書中的漢字,衹要與已知的漢字有一點一畫的差異,如攴支、鼔鼓、苟茍、汜氾、底厎、穀榖、采釆,有時視而不見, 有時誤以爲是某字,漏校就此產生;如果不敢確定是何字,建議先查《康熙字典》或《異體字字典》。如對字形有疑惑,可以查《說文解字》和《隸辨》。(相關資料下載

從小使用簡化漢字的人,從事古籍整理校勘的第一步,就是要能識讀傳統漢字,同時能夠録入傳統漢字。繁體字,是與簡化字相對而言的。如果繁體字與簡化字是一一對應關係,那就不成問題,但事實情況並非如此,尤其是有些簡化字本身就是傳統漢字,如儿兒、听聽、极極、医醫等,兩者意義完全不同。建議先學習繁體字與簡化字的對應關係,然後學習其中的差異,這是入門的必修課程。可惜這些資料都不完全,還得自己在實際校勘過程中慢慢學習。

傳統漢字的録入,固然可以使用拼音輸入法,轉出設置改爲繁體字,但遇到自己不認識的字,還得另想辦法。筆畫輸入法、手寫筆亦是一種輔助輸入法,還可以用構形檢字法。會使用形碼輸入法,如五筆字形(分86版和98版)、倉頡碼之類,就會得心應手。學習新的輸入法,雖然麻煩且費時,但「工欲善其事,必先利其器」,「磨刀不誤砍柴工」,對於從事古籍整理的人是值得的。現代計算機字體中已有近十萬箇Unicode編碼漢字,對於此外的漢字,或者使用圖片字,或者自造字體。凡計算機漢字處理相關問題,可以參閱白雲深處人家網站中關於計算機漢字處理的網頁(http://www.homeinmists.com/indexComputing.htm)。

六、文本的編輯排版

用Word或wps録入文本的時候,就可以進行簡單的排版:設置頁面大小,調整頁面視圖及顯示比例,設置正文的樣式(字號、字體、段落),爲各箇章節名稱設置各級標題樣式,插入分節符,使不同節有不同的頁眉頁腳,待全書完成,根據已設置的標題爲全書自動編製目録、插入頁眉。爲區分經文和注文,需要設置不同的段落樣式。對於需要特殊設置的文字,亦可以設置字符樣式,方便將來製作索引。設置樣式的最大優點在於,衹要更改樣式,則已應用該樣式的文字全部隨之而更改,而且便於將來導入到專業的排版軟件中,亦便於後期製作全文檢索數據庫。當然不設置樣式亦不成問題,衹要各級標題、正文、注釋等各有相應的設置或特殊標記,後期處理亦很方便,因爲計算機程序最擅長處理的就是有規律的文本(查找-替換,使用正則表達式)。

如果希望最終的書本完全符合自己心意,就必須親自排版。Word或wps能夠勝任一般文檔的排版(wps對超大字符集漢字支持不夠友好),但對於古籍整理校勘類圖書,最好還是使用專業的排版軟件,如方正書版或Adobe Indesign。方正書版是所想卽所得,與網頁設計一樣,採用標記語言,用命令的方式進行文本的設置。Adobe Indesign,與Word一樣,是所見卽所得,有眾多的設置。如果想隨心所欲地編輯文本,正則表達式(regular expression)是一定要學會的;當然使用文本編輯器,如EmEditor或EditPlus,處理起來可能更爲便捷。把文檔儲存爲txt文本時,一定要確保編碼爲UTF-8或者unicode,否則可能是廢物一堆(超大字符集漢字全部作廢)。

計算機的字體有成千上萬,但想找到一款令自己滿意的字體,尤其是古色古香的舊字形字體,實在是一種奢望。每一款字體都有缺陷,或者字數太少,或者字形有誤差而不合要求,亦實在是因爲漢字太過複雜的緣故,懂計算機字體設計的人大多不懂文字學,懂文字學的人不懂字體設計,而且漢字數太多,設計一款完美字體實在太費時。一般情況下,現有字體足敷應用,否則就衹能自己動手了。

文檔定稿後,導出爲pdf格式,注意選擇嵌入字體的選項(如印刷質量,或PDF/A-1b:2005,不要選擇默認的標準設置,亦沒有必要文字轉曲),送交印刷廠製版印刷。用紙、裝訂、墨粉等,都必須關注。一本書要以完美的形式呈現在自己眼前,眞不是一件輕而易舉的事,每一箇細節都需要精心細緻地去完成。

七、數據丟失的預防和急救

使用計算機時,所有的數據(文本、圖像、各種資料)都不要直接存放在桌面上、我的文檔或系統盤(C盤),應把數據存放在系統盤之外的磁盤分區中。爲方便使用,可以將文件或文件夾發送到桌面快捷方式,同時養成數據備份的習慣。爲防止意外,經常備份重要數據(如書稿)尤爲重要,因爲由於主客觀的原因而導致數據損壞或丟失是經常發生的事。備份的數據盡可能不刪除,因爲誰亦想不到什麼時候還會被再利用,卽使在十年之後。

一旦發生意外,數據損壞或丟失、災難性的硬盤損毀,就可以起用備份的文件。如果數據被誤刪除,可以先去回收站查找。凡數據被刪除、磁盤被格式化、磁盤中數據全部空白、分區(盤符)從計算機中消失,都是可以搶救回來的。如果願意自學,可以使用DiskGenius這款軟件進行數據恢復,完全可以自救。

蔣門馬 2015.01.07初稿 2019.04.04定稿。2023.09.01修訂。


部件檢索:拆分或合併漢字部件,支持Unicode 15,能檢索198806個漢字(包括相應字體)。F.G.Wang先生授權發佈。
Unicode15 中日韓CJK統一字符:全部漢字及符號 2022年10月27日
Unicode15 統一碼漢字:簡體.繁體.異體字.粵語.拼音.英語釋義 2022年10月27日
四角號碼檢字:74014字。2022年10月06日整理製作
漢語大字典第二版【異體字關聯檢索+釋義】 逍遙子整理 2021年8月15日整理製作
異體字字典:根據WFG先生的教育部異體字索引字典.mdx整理,2022.10.21整理製作,2023.01.25更新
說文解字:文本+圖像。2015年6月23日整理製作。2017年11月12日更新。2023年01月13日更新
桂馥.說文解字義證:文本檢索+圖像。2023年01月13日整理製作。
朱駿聲.說文通訓定聲:文本檢索+圖像。2023年01月13日整理製作。
經籍䉵詁:清阮元主編。文本+圖像。2014年7月6日整理製作。2017年11月6日更新。2023.01.30更新
康熙字典:文本+康熙五十五年武英殿刻本彩圖版。2017年12月整理製作
壽星天文曆V5.10:福建莆田第十中學許劍偉製作:
中國歷史紀年表:2022年09月16日整理製作
干支紀年檢索:2023年04月16-22日整理製作
籍合學院:中華書局古籍整理培訓平臺。

白雲深處人家 Home in Mists
Digital Archive of Traditional Chinese Taoism (Daoism)
No Rights Reserved. All free of charge. 版權不保留,免費共享
千古蓬頭赤腳,一生伏氣餐霞。笑指武夷山下,白雲深處吾家。——白玉蟾自贊
松篁鬱鬱冬猶秀,桃李紛紛春漸迷。識破邯鄲塵世夢,白雲深處可幽棲。——陳摶