計算機漢字處理
2024年12月09日更新
白雲深處人家網站公告
十八大報告:文化,是民族的血脈,是人民的精神家園。
十九大報告:文化是一個國家、一個民族的靈魂。文化興,國運興;文化強,民族強。沒有高度的文化自信,沒有文化的繁榮興盛,就沒有中華民族偉大復興。
習總書記:文化自信是一個國家、一個民族發展中最基本、最深沉、最持久的力量。 優秀傳統文化,是一個國家一個民族傳承和發展的根本;如果丟掉了,就割斷了精神命脈。 中華優秀傳統文化是中華民族的文化根脈,其蘊含的思想觀念、人文精神、道德規範,不僅是我們中國人思想和精神的內核,對解決人類問題也有重要價值。 中華優秀傳統文化已經成爲中華民族的基因,植根在中國人內心,潛移默化影響著中國人的思想方式和行爲方式。
中共中央辦公廳 國務院辦公廳 印發《關於實施中華優秀傳統文化傳承發展工程的意見》2017-01-25
中華文化源遠流長、燦爛輝煌。在5000多年文明發展中孕育的中華優秀傳統文化,積澱著中華民族最深沉的精神追求,代表著中華民族獨特的精神標識,是中華民族生生不息、發展壯大的豐厚滋養,是中國特色社會主義植根的文化沃土,是當代中國發展的突出優勢,對延續和發展中華文明、促進人類文明進步,發揮著重要作用。 隨著我國經濟社會深刻變革、對外開放日益擴大、互聯網技術和新媒體快速發展,各種思想文化交流交融交鋒更加頻繁,迫切需要深化對中華優秀傳統文化重要性的認識,進一步增强文化自覺和文化自信;迫切需要深入挖掘中華優秀傳統文化價值內涵,進一步激發中華優秀傳統文化的生機與活力;迫切需要加强政策支持,著力構建中華優秀傳統文化傳承發展體系。實施中華優秀傳統文化傳承發展工程,是建設社會主義文化强國的重大戰略任務,對于傳承中華文脉、全面提昇人民群眾文化素養、維護國家文化安全、增强國家文化軟實力、推進國家治理體系和治理能力現代化,具有重要意義。
中共中央辦公廳 國務院辦公廳 印發《關於推進新時代古籍工作的意見》2022-04-11
做好古籍工作,把祖國寶貴的文化遺產保護好、傳承好、發展好,對賡續中華文脈、弘揚民族精神、增強國家文化軟實力、建設社會主義文化強國具有重要意義。
通用規範漢字表 8105字: 2013年6月5日
古籍印刷通用字規範字形表 14250字:2021年
古籍印刷通用字規範字形表 檢索:2021年11月29日整理製作
Unicode 中日韓CJK統一字符:全部漢字及符號 2024年12月09日
Unicode 統一碼漢字檢索:簡體.繁體.異體字.粵語.拼音.英語釋義 2024年12月09日
籍合學院:中華書局古籍整理培訓平臺。
四角號碼檢字:74014字。2022年10月06日整理製作
漢語大字典第二版【異體字關聯檢索+釋義】 逍遙子整理 2021年8月15日整理製作
異體字字典:根據WFG先生的教育部異體字索引字典.mdx整理,2022.10.21整理製作,2023.01.25更新
部件檢索:拆分或合併漢字部件,支持Unicode 15.1,能檢索199266個漢字(包括相應字體)、異體字關聯檢索。F.G.Wang先生授權發佈。
古籍整理校勘入門: 蔣門馬 2023.07.17發佈
一、漢字編碼字符集、字體
1. GB-2312字符集:收入漢字6763箇,符號715箇,總計7478箇字符,這是大陸普遍使用的簡體字符集(包括了沒有簡體與繁體之分的傳統傳承漢字,如金木水火土人民在大小等等,有4000多箇。真正由傳統傳承漢字簡化而來的簡體漢字約2235箇)。楷體-gb2312、仿宋-gb2312、華文行楷等市面上絕大多數字體支持顯示這箇字符集。需要注意的是,市面上有一些所謂的繁體字體,采用GB-2312字符集簡體字的編碼,用字體顯示爲繁體字,而不是直接用GBK字符集中繁體字的編碼,錯誤百出。
2. BIG-5字符集:收入13060箇漢字(傳統傳承漢字,包括相對於簡化漢字而言的繁體字),808箇符號,總計13868箇字符,目前普遍使用於臺灣、香港等地區。臺灣教育部標準宋體楷體等港臺字體都支持這箇字符集的顯示。
3. GBK字符集:又稱大字符集(GB=GuóBiāo國標,K=擴展),包含以上兩種字符集漢字,收入21003箇漢字,882箇符號,共計21885箇字符,包括了中日韓(CJK)統一漢字20925箇、擴展A集(CJKExt-A)中的漢字52箇。Windows95\98簡體中文版就帶有這箇GBK.txt文件。宋體、隸書、黑體、幼圓、華文中宋、華文細黑、華文楷體、標楷體(DFKai-SB)、Arial Unicode MS、MingLiU、PMingLiU等字體支持顯示這箇字符集。微軟拼音輸入法2003、全拼、紫光拼音、極點中文、龍鳳五筆等輸入法,能夠錄入如鎔炁夬喆嚞姤贇龑昳堃慜等GBK簡繁體漢字。
4. GB18030字符集:包含GBK字符集、CJKExt-A全部6582箇漢字,共計27533箇漢字。宋體-18030、方正楷體(FZKai-Z03)、書同文楷體(MSSong)、宋體(ht_cjk+)、香港華康標準宋體(DFSongStd)、華康香港標準楷體、CERG Chinese Font、韓國NewGulim、NewBatang,以及微軟Windows Vista操作系統提供的宋黑楷仿宋等字體亦支持這箇字符集的顯示。Windows98支持這箇字符集,以下的字符集則不支持。
5. ISO/IEC10646/Unicode字符集:這是全球可以共用的編碼字符集,兩者相互兼融,涵蓋了世界上主要語文的字符,其中包括簡繁體漢字,計有:CJK統一漢字20925箇,CJK Ext-A 6582箇,Ext-B 42711箇,共計70244箇漢字。方正楷體超大字符集(簡體版FZKaiS-Extended(SIP)或繁體版FZKaiT-Extended(SIP))、SimSun-ExtB(宋體)、MingLiU-ExtB(細明體)能顯示全部Ext-B漢字。至今尚無單獨一款字體能夠顯示全部70244箇漢字,但可用手寫輸入法逍遙筆、海峰五筆、新概念五筆、倉頡輸入法世紀版,以及東里五筆98全字版等輸入法錄入。
Unicode字符集仍在不斷更新中,詳見字庫概況。
6. 亂碼的問題:BIG-5(大五碼,繁體中文)與GB-2312(國標碼,簡體中文),是兩種完全不同的編碼系統,互不兼容,相同的字符在不同編碼的操作系統中便產生亂碼。凡亂碼文本文檔,可用BabelPad解決:啟動BabelPad,打開亂碼txt文檔,在encoding處選擇您認爲可能的編碼(或不需要這個步驟),正常閱讀,然後另存爲Unicode編碼的文本,或UTF-8編碼的文本。爲避免亂碼問題的發生,在保存文件時,尤其是TXT文本,建議把編碼更改爲UTF-8或Unicode,而不是默認的ANSI。文本文字簡繁體編碼間的轉換,可以用BabelPad、cnbook、TextPro之類的轉碼軟件來解決。在網頁中,可點擊右鍵→編碼→繁體中文或簡體中文以解決。若是程序,WindowsXP操作系統,可用Microsoft AppLocale Utility解決。各種字體雖分大五碼(繁體)或國標碼(簡體),但並不妨礙在簡體或繁體操作系統中安裝與顯示。
7. 辦公軟件安裝建議:在安裝MicrosoftOffice等辦公軟件的過程中,如果“典型安裝”,就會有很多遺漏,如字體不全,功能不全。建議:完全安裝(或自定義安裝),但可選擇相關的程序,如只安裝其中常用的幾個組件。
二、漢字輸入法
相關下載
1. 繁體字的輸入:凡是能夠錄入GBK字符集漢字的輸入法,自然都能夠錄入繁體字。如果只想錄入繁體字,可以在輸入法設置中修改。右鍵點擊屏幕右下角的語言欄→設置→微軟拼音輸入法2003→屬性→字符集→繁體中文。選擇大字符集,則簡體和繁體漢字都能夠輸入。其他輸入法,亦可以用這箇方法修改設置。有一些輸入法,還有打簡體字輸出繁體字的設置。但要注意一點,輸入法提供的繁體字,有時並不是想要的漢字,如想錄入“云、后”字(子曰詩云、皇后),輸入法提供的卻是“雲、後”字(彩雲、後來),反之亦然,需要自己掌握。文本文字的簡體與繁體之間的轉換,可以用TextPro、cnbook或Convertz之類的軟件。Microsoft Office文檔,可以用軟件自帶的漢字簡繁體轉換功能,建議更改默認設置:2003→工具→語言→中文簡繁體轉換→詞彙:轉換時包括詞彙(把前面的√去掉);2007及以上:審閱→簡繁轉換→使用港澳臺地區的異體字(建議保留√)、轉換常用詞彙(把前面的√去掉)。簡繁轉換後,錯誤或多或少仍然存在,仍需要人工檢視。
按照國際標準編排的繁→簡對照清單,包含字的標準來源及性質分類
簡繁轉換別字表 李小狼製作
易混淆的繁簡體字對照表
繁體字與簡體字之爭
一些漢字標準、字體/字型、內碼、輸入法資料的整理
2. 如果超出了輸入法所支持的字符集,此字符集外的漢字就不能用這種輸入法錄入計算機,請更換另一種相應的輸入法。在此特別推薦使用手寫輸入法逍遙筆,能輸入70000多漢字。安裝後即可用鼠標書寫,使用非常方便,是最理想和完美的輔助輸入法。
3. 字體顯示:一箇已編輯好的文檔,在另一臺計算上,如果沒有相應字體的支持,就可能會用別的字體顯示,效果當然不一樣,但仍可能保留原來的字體名。如果操作系統或應用軟件不支持該字符集,尤其是GBK字符集以外的漢字,則顯示爲黑框、方框、空白、問號(一箇或兩箇),在網頁上亦存在同樣的情況。在word2003中,在沒有安裝相應字體的計算機上亦能完全顯示與打印的方法是:另存爲→(保存按鈕的左邊)工具→保存選項→保存→將字體嵌入文檔→僅嵌入文檔中使用的字符;或者用Adobe Acrobat等軟件把文本導出爲pdf文檔,但仍要嵌入相應字體纔行,否則在沒安裝相應字體的計算機上亦不能顯示,即顯示爲空白。如果字體不能被嵌入文檔中,可以更改字體的設置,詳見下。
4. 如果已知一箇字符的Unicode內碼,就可以在Word2003中直接鍵入其內碼,再按下鍵盤中的[Alt+X]組合鍵,就能呈現該字符。若再按下[Alt+X]組合鍵,又可呈現其Unicode內碼。因此亦可用此法在Word2003中查出任何一箇字符的Unicode內碼。
5. 漢文博士:(http://hanbox.cnblogs.com/)、(http://hanzisearcher.cnblogs.com/)其中有兩個功能可以利用:一是部首檢字法,知道這個字的部首,就能找到這個字;一是構形檢字法,列出這個字的主要部件,就能找到這個字。BabelPad亦有按部首檢字的功能。
6. 支持 Unicode15.1 全部漢字,能檢索199266個漢字(包括相應字體)、異體字關聯檢索:f.g.wang先生製作的部件檢字法:部件檢索。
三、難字的處理方法
1. 字符集裏的漢字:對於字符集裏原有的漢字,如果沒有合適的輸入法可供錄入,可以先輸入這箇漢字的部首或同部首的漢字,然後插入符號,找到所要的漢字。或者:開始→程序→附件→系統工具→字符映射表→勾上“高級查看”→分組→按偏旁部首分類的表意文字。注意字體,衹有相應的字體纔能顯示。找到所要的字後,再點“選擇”和“複製”,粘貼到Word。
2. 字符集外的漢字:對於字符集裏沒有的漢字,除了造字之外(開始→程序→附件→TrueType造字程序。建議把後綴名tte直接改成ttf,然後再用字體編輯軟件修改字體設置。不推薦這麼做。可以直接用字體編輯軟件製作自造字),還可以將這些漢字全部做成圖片,插入正文中,調整至與周圍文字相稱,可以不受計算機字符集的限制,在別的計算機上亦能完全顯示。
3. 圖片字簡易製作法:顯示屏上的任何內容,按鍵盤上的[PrintScreen]鍵,粘貼到畫圖板上(開始→程序→附件),編輯成所需要的字或圖形,將這箇圖片字直接剪切粘貼到正文中——這種嵌入圖片的方法不推薦。建議使用SnagIt或HyperSnap之類的屏幕抓圖軟件,以BMP或PNG格式存儲圖片,然後在Word中插入這箇圖片字,右鍵點擊圖片,用“設置圖片格式→大小”進行調節,再調整上下位置:格式→字體→字符間距→位置→降低。
4. 凡直接可以由部首或幾箇字合成的文字,在Word中可以用字符加圈框(切換域代碼)、字符縮放、改變行距(設爲固定值)、調整字符大小及間距等方法,製作成所需要的文字。能用別的畫圖軟件製作圖片字,效果更好些。在Word中,大概衹能如此。若是專業的排版軟件,如Adobe InDesign,文字轉曲後,可隨意改變形狀。
1. 漢字字符集(字庫)概況
Unicode漢字及符號
[1D300-1D356]: Tai Xuan Jing Symbols 太玄經符號:87
[4DC0-4DFF] : Yijing Hexagram Symbols 易經六十四卦符號:64
[2F00-2FD5] : Kangxi Radicals 康熙字典部首:214
[3300-33FF] : CJK Compatibility (256 characters) 兼容字符: 256
[3000-303F] : CJK Symbols and Punctuation (64 characters) 符號標點: 64
[FE30-FE4F] : CJK Compatibility Forms (32 characters) 兼容符號: 32
[2E80-2EFF] : CJK Radicals Supplement (115 characters) 部首擴展: 115
[31C0-31EF] : CJK Strokes (36 characters) 筆劃: 36
[F900-FAFF] : CJK Compatibility Ideographs (472 characters) 兼容表意文字:472箇漢字
[2F800-2FA1F]: CJK Compatibility Ideographs Supplement (542 characters) 兼容表意文字補充: 542箇漢字
[4E00-9FFF] : CJK Unified Ideographs (20992 characters) CJK基本表意文字:20992箇漢字 Unicode 1.01
[3400-4DBF] : CJK Unified Ideographs Extension A ( 6592 characters) 擴展A CJK Ext-A: 6592箇漢字 Unicode 3.0
[20000-2A6DF]: CJK Unified Ideographs Extension B (42720 characters) 擴展B CJK Ext-B:42720箇漢字 Unicode 3.1
[2A700-2B73F]: CJK Unified Ideographs Extension C ( 4153 characters) 擴展C CJK Ext-C: 4153箇漢字 Unicode 5.2
[2B740-2B81F]: CJK Unified Ideographs Extension D ( 222 characters) 擴展D CJK Ext-D: 222箇漢字 Unicode 6.0
[2B820-2CEAF]: CJK Unified Ideographs Extension E ( 5762 characters) 擴展E CJK Ext-E: 5762箇漢字 Unicode 8.0
[2CEB0-2EBEF]: CJK Unified Ideographs Extension F ( 7473 characters) 擴展F CJK Ext-F: 7473箇漢字 Unicode 10
[30000-3134A]: CJK Unified Ideographs Extension G ( 4939 characters) 擴展G CJK Ext-G: 4939箇漢字 Unicode 13
[31350-323AF]: CJK Unified Ideographs Extension H ( 4192 characters) 擴展H CJK Ext-H: 4192箇漢字 Unicode 15.1
[2EBF0-2EE5F]: CJK Unified Ideographs Extension I ( 622 characters) 擴展I CJK Ext-I: 622箇漢字 Unicode 16
中日韓CJK統一字符 合計98583箇字符。
支持顯示Unicode 15全部漢字的字體:
Windows系統宋體升級包:支持Unicode 15,能顯示擴展H 4192箇漢字。
部件檢索:支持Unicode15.1 全部漢字,能檢索199266個漢字、異體字關聯檢索(包括相應字體),f.g.wang先生製作的部件檢字法。
天珩全字庫4.1版,支持Unicode 15.1:http://cheonhyeong.com/index.html
vivoSans 字體:支持近9萬漢字,支持到CJK_Ext-F的字集:https://h5.vivo.com.cn/pcvivo/OS5-font/vivo%20Sans.zip
SimsunExtG.ttf:支持 CJK_Ext-G H I 漢字的字體 ,9753 箇漢字。Windows 11 Insider Preview Build 27723字體。
Unicode 字符集 網上查詢:http://www.babelstone.co.uk/Unicode/babelmap.html
The Unicode Standard Archived Code Charts:http://www.unicode.org/Public/
Unicode 13 全部94352漢字pdf下載:
支持Unicode 13 全部漢字的SimSun-ExtB V5.03XYB字體:
在原字體基礎上,增補中日韓(CJK)統一表意文字擴展E.F.G(Unicode 13)全部字符。
CJK新增13字:U+9FF0~U+9FFC:Urgently needed
CJK-A新增10字:U+4DB6~U+4DBF:resulting from disunifications
CJK-B新增7字:U+2A6D7~U+2A6DD
CJK-G新增4939字:U+30000~U+3134A
Unicode 12 全部中日韓CJK統一字符文本編碼下載
BabelMap:A free Unicode character map tool for Windows
http://www.babelstone.co.uk/Software/BabelMap.html
BabelPad:A free Unicode text editor for Windows
http://www.babelstone.co.uk/Software/BabelPad.html
BabelStone Fonts:http://www.babelstone.co.uk/Fonts/
Unicode7.0字符excel表
2. 大陸字體
01. 华文彩云、华文琥珀、华文隶书、华文新魏、华文行楷 6763
02. KaiTi楷体_gb2312、FangSong仿宋_gb2312 6763
03. 方正舒体 9690 方正姚体 9826
04. SimSun宋体、NSimSun新宋体、SimHei黑体、LiSu隶书、YouYuan幼圆 21003
05. STKaiti华文楷体、STFangsong华文仿宋、STSong华文宋体、STXihei华文细黑、STZhongsong华文中宋 21003
(以上字體 MS Office XP\2003 簡體版自帶)
06. FZNew XiuLi-Z11 方正新秀麗(舊字形) 15290
方正書宋、楷體、仿宋、黑體-GBK 21003 (包含在四通利方轉碼軟件內)
07. 北師大說文小篆(bnucdp.ttf)、北師大說文重文 11100箇
此兩款字體包含在“漢字構形資料庫”中。字體編碼爲BIG-5。
小篆和甲骨文專用輸入法 說文小篆PDF文本
08. 宋体-18030、新宋体-18030 21003+ 6582 = 27533
09. MS Song 書同文楷體 21003+ 6582 = 27533 (即FZKai-Z03方正楷體簡體版)
ht_cjk+ 華天宋體 21003+ 6582 = 27533(包含在四部叢刊軟件中)
10. FZKai-Z03 方正楷體 21003+ 6582 = 27533
此外還自造了近5000箇在古籍中較常使用的漢字(能顯示八卦六十四卦符號,非Unicode)。
包含於《文淵閣四庫全書全文檢索電子版》2.0中。下載簡體中文版的是大陸標準楷體的寫法,下載繁體中文版的是台灣教育部楷體的寫法,同時還有日本和韓國的楷體寫法。四箇字體都是相同的文件名、字體名,除非更改字體名稱,否則沒有辦法兩箇同時安裝。
11. Simsun(Founder Extended) 宋体-方正超大字符集 21003+6582+36862=64395
MS Office XP\2003簡體版自帶。Windows2000超大字符集支持包“Surrogate更新”
方正宋體S-超大字符集(SIP) V2.0 27533 + 42711 = 70244
原版的FZSongS.TTF,FZSongS(SIP).TTF
方正宋體-Ubuntu_GB18030-2005:
FZST_GB18030-2005(090811).TTF,FZST_GB18030-2005(SIP)_090812.TTF
12. 方正楷體超大字符集
http://tw.subscriptionv3.skqs.com/skqs/download/
採用最新ISO/IEC 10646:2003 Unicode 5.0國際標準編碼大字庫,包含70244箇CJK漢字,外加Unicode CJK EXT-C漢字12592箇,總計82787箇漢字,包含於《文淵閣四庫全書電子版》3.0版中。簡體版FZKaiS-Extended、FZKaiS-Extended(SIP), 繁體版FZKaiT-Extended、FZKaiT-Extended(SIP),兩者字形不同,文件名及字體名亦不同,可同時安裝使用。
13. 籍合網:中華書局宋體字庫及古聯輸入法:12萬漢字!Unicode10全部漢字,自造36000字。
字庫:http://www.ancientbooks.cn/helpcore?font
輸入法:http://www.ancientbooks.cn/helpcore?input
14. Sun-ExtA, Sun-ExtB Unifonts 6.0
UniFonts5.4版包含近10萬標準字符,其中中日韓越通用中文字符75814箇:CJK 20924字,CJK-Ext-A 6582字,CJK-Ext-B 42711字,CJK-Ext-C 4219字,CJK相容擴展542字,CJK部首擴展116字,CJK康熙部首214字,CJK筆劃36字,CJK相容474字。能顯示《易經》符號、《太玄經》符號等一些特殊符號。配套的海峰五筆輸入法9.5版。
15. UniSongGBK1.01 宋體-全漢字集 71564 (采采卷耳制作)
可顯示Unicode5.0全部漢字,注音符號擴展,易經太玄經符號等
16. 特制simsun(2008.12.18更新)和mingliu5.06字庫 制作者
是在Windows Vista自帶的simsun.ttc和mingliu.ttc字庫基礎上改造的:刪除了simsun自帶的難看的漢字點陣字庫,換上了Windows XP的simsun的點陣字庫,並添加了多套漢字點陣字庫,同時補充了所欠缺的CJK EXT A區的6852漢字的點陣數據,支持GB18030字符集27533字。添加了mingliu字庫所缺乏的多套漢字點陣字庫,支持Big5字符集以及其它漢字共24000多字。除了添加漢字點陣字庫外,也添加了幾套小點陣的ASCII點陣字庫,使得在6pt-21pt(基于96dpi顯示)時,均能以點陣方式顯示漢字,提高了漢字顯示的質量。ASCII字符甚至能顯示更小的點陣。所有點陣字庫均進行了手工調整,修改了原點陣字庫的一些錯誤。simsun和mingliu字庫各自可同時支持GBK代碼頁(936)和BIG5代碼頁(950),可直接顯示兩岸三地的中文文檔和網頁,無需切換到其它字庫。simsun和mingliu字庫中的曲綫字庫同原有的曲綫字庫保持兼容,所以可用來直接取代Windows 2000/XP/2003/Vista自帶的simsun和mingliu字庫。
系統字體的刪除與安裝:Windows XP系統,直接把C:\WINDOWS\Fonts文件夾中的宋體文件拖到另一處(同時按住Shift鍵),再把要安裝的宋體拖入其中,重新啟動電腦即可。在Windows 7以上系統中,①首先安裝新的宋體:在「提示已安裝, 是否希望替換」時選擇「是」,這樣會在C:/Windows/Fonts/下生成一個simsun_0.ttc 的字體文件。②運行regedit,定位到HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows NT/CurrentVersion/Fonts, 分別將「SimSun & NSimSun (TrueType)」和「宋体 & 新宋体 (TrueType)」數值從「simsun.ttc」修改為「simsun_0.ttc」。③註銷後重新登錄即可。系統字體mingliu.ttc的安裝亦同例。
17. 多種字體下載:http://ftp.isu.edu.tw/pub/Windows/Chinese/fontntool/ttffonts/
其他字體下載:http://beu.sakura.ne.jp/fontz/
18. 漢語音標、英語國際音標、音樂符號字體
漢語方言國際音標及輸入法 http://www.eastling.org/resource.htm
漢語拼音字母字體。
19. WindowsVista字體四種 (GB-18030, 宋體、楷體、仿宋體、黑體)
20. WindowsVista SimSun-ExtB 宋體ExtB 采采卷耳修正版SimsunB(CCJE)
21. 康熙字典體等 舊字形字體 厲向晨Digidea Lee製作http://typeland.com/typeface/
22. Windows 7 SimSun 宋體 支持 CJK_Ext-C、CJK_Ext-D的字集
23. Windows 8 SimSun 宋體 支持 CJK_Ext-C、CJK_Ext-D的字集
24. 華秀月明 明朝體 舊字形 http://code.google.com/p/ifont/downloads/list
25. 籍合網:中華書局宋體字庫及古聯輸入法:
字庫:http://www.ancientbooks.cn/helpcore?font
輸入法:http://www.ancientbooks.cn/helpcore?input
26. 京華老宋體:38627箇漢字。https://weibo.com/1760571162/OkqVEulhz
3. 臺灣字體
Big5中文編碼表:http://moztw.org/docs/big5/
01. 教育部標準楷書、宋體、隸書等 13063
http://www.edu.tw/
02. DFKai-SB (kaiu.ttf) 標楷體 21003
03. cwTeX TrueType 13346(舊字形) 字體有錯誤
http://cle.linux.org.tw/fonts/cwttf/cwttf-v1.0.tar.gz
http://cle.linux.org.tw/fonts/cwttf/?C=S;O=A
http://edt1023.sayya.org/fonts/tex/cwttf/
04. MingLiU、PMingLiU 臺灣細明體 (Ming Light Unicode)
MingLi v1.00最早的細明體 version 2.00版 17260 version 3.00版 20923 version 3.21版 20923
05. 新細明體更新套件 MingLiU.ttc 5.03 版 + MingLiUB.ttc 1.05 版 27533 + 42711 = 70244
06. 漢字構形資料庫:http://cdp.sinica.edu.tw/index.html
漢字構形資料庫2.7版 120M 收錄古今漢字165653個,其中楷書字形91510個。收錄《漢語大字典》異體字表12208組。收錄《說文解字詁林》的小篆及重文共11100個。收錄《金文編》中的22729個金文。 收錄《楚系簡帛文字編》(增訂本)中的37614個楚系簡帛文字。 收錄《殷墟甲骨刻辭類纂》中的2700個甲骨文。http://cdp.sinica.edu.tw/hanzi/cdphanzi.htm
漢字構形資料庫2.63版 106M,2010年7月8日開放,收錄古今漢字142325個;其中楷書字形87974個,小篆及重文11100個,金文21413個,楚系簡帛文字19138個,甲骨文2700個。另收《漢語大字典》異體字表12208組。
2007年9月20日開放的漢字構形資料庫2.5版,83.3M,收錄古今漢字112533箇;其中楷書字形62366箇,小篆及重文11100箇,金文及重文20069箇,楚系簡帛文字及重文16801箇,甲骨文及重文2197箇;另收《漢語大字典》異體字表12208組。可使用解決亂碼的軟件Microsoft AppLocale Utility以安裝,亦可以解壓後使用其中的字體文件。
07. 全字庫楷體宋體_98.1 內含:TW-Kai, TW-Kai-Ext-B, TW-Kai-Plus
http://open.cosa.org.tw/COSA/Fonts/
10. WindowsVista 臺灣及香港的細明體(GB-18030) mingliu 27533
11. WindowsVista 臺灣及香港的細明體 Ext-B mingliub 42711
12. 說文標篆體 說文小篆字庫 http://www.cl.fcu.edu.tw/
http://140.134.4.2/~cl/sw/index.html
13. Windows 7 MingLiu 細明體
14. 華康MingLiuB 7.001 支持 CJK_Ext-C、CJK_Ext-D的字集
4. 香港字體
01. AR PL Mingti2L Big5 明體 13070
02. AR PL KaitiM Big5 楷體 13070
03. DFSongStd 華康標準宋體 21003 + 6582 + 1640 = 29173
04. 楷體四種 宋體三種 20923 + 6582 = 27505
05. CERG Chinese Font 21003+ 6582 = 27533
06. 香港增補字符集Hong Kong Supplementary Character Set-2001 (HKSCS-2001)
Ming(for ISO10646)ExtB 香港明體超集
http://www.microsoft.com/hk/hkscs/chinese/default.aspx
07. 華康“金蝶2006 H.K. Edition”7CD專業版完整版
http://lib.verycd.com/2005/12/19/0000080456.html
08. WindowsVista 臺灣及香港的細明體(GB-18030) mingliu 27533
09. WindowsVista 臺灣及香港的細明體 Ext-B mingliub 42711
10. 香港的舊字形楷體:https://www.microsoft.com/zh-hk/download/details.aspx?id=10109
5. 日本字體
01. MS Gothic、MS Pgothic、MS UI Gothic 黑體 12218
02. MS Mincho、MS Pmincho 明朝體 12218(以上字體MS Office 2003 自帶)
03. QuiMi-mincho 癸羊明朝體 6696(舊字形)
http://www.asahi-net.or.jp/~sd5a-ucd/freefonts/
http://ftp.vector.co.jp/36/75/114/QuiMi-2004-0509.zip
http://ftp.vector.co.jp/36/75/114/XANO-mincho-2004-0509.zip
http://ftp.vector.co.jp/36/75/114/QANO-mincho-2004-0509.zip
http://www.asahi-net.or.jp/~sd5a-ucd/freefonts/Kandata/Kandata-2004-0509.tgz
http://www.asahi-net.or.jp/~sd5a-ucd/freefonts/Oradano-Mincho/Oradano2005-1112.zip
04. WindowsVista meiryo 10775+615=11390
WindowsVista msgothic 12218
WindowsVista msmincho 12218
05. 日本今昔文字鏡:
http://www.mojikyo.org/
07. Kozuka Gothic Mincho Pr6N 小塚黑體、明朝體 12723 (Adobe InDesign CS6軟件自帶)
字體來源於Adobe Font Folio 11 (Win):Opentype 字體
08. 自由字體:http://wiki.fdiary.net/font/?freefont
免費字體:http://wiki.fdiary.net/font/?FreeButNotFreeFont
10. 花園明朝體 hanazono 107,518字 (CJK Ext.B、C、D、E、F) 2017年09月04日版
http://fonts.jp/hanazono/
http://iij.dl.osdn.jp/hanazono-font/68253/hanazono-20170904.zip
http://iij.dl.osdn.jp/hanazono-font/64385/hanazono-20160201.zip
11. 花園明朝體Daofu修訂版 支持 CJK_Ext-C、CJK_Ext-D的字集
12. meiryo 6.06
13. msmincho_msgothic 5.04
14. IPAmj明朝Ver.006.01,Mincho明朝體,總字符數65536,2019年5月,CJK+EXT-ABCDEF
http://mojikiban.ipa.go.jp/1300.html
15. http://glyphwiki.org/wiki/GlyphWiki
17. 漢字字體:http://fonts.jp
18. 漢字構型檢索: CHISE IDS:http://www.chise.org/ids-find
19. 全漢字:http://glyphwiki.org/wiki/Group:%E5%85%A8%E6%BC%A2%E5%AD%97
20. 漢字數據庫項目:http://kanji-database.sourceforge.net/index.html
21. 字雲:https://kamichikoichi.github.io/jigmo/
6. 韓國字體
01. Batang、BatangChe 明朝體 7481
02. Gungsuh、GungsuhChe 窮鼠體 7481(宮書)
03. Dotum、DotumChe 黑體 7481
04. Gulim、GulimChe 標準圓體 7481 (以上字體:MS Office 2003 自帶)
05. New Gulim 新圓體 21003 + 6582 = 27533(新字形)
06. New Batang 明朝體 21003 + 6582 = 27533 以及old hangul
07. WindowsVista batang 7481 韓國字體
08. WindowsVista gulim 7481 韓國字體
09. malgun Gothic 6.15
10. http://db.itkc.or.kr/ime/inputassist.htm
7. 越南字體 含 CJK Ext-A 及 Ext-B 漢字, 由越學院提供
詳情http://www.viethoc.org/article.php
下載http://jaist.dl.sourceforge.net/sourceforge/vietunicode/hannomH.zip
下載http://jaist.dl.sourceforge.net/sourceforge/vietunicode/hannom.zip
8. 其他漢字字體
01. Arial Unicode MS 黑體 20925, 50377箇字符(多國文字,MS Office 2003 自帶)
02. Bitstream Cyberbit 20936, 29934箇字符
ftp://ftp.netscape.com/pub/communicator/extras/fonts/windows/Cyberbit.ZIP
03. 微軟雅黑體 msyh 20923+6582=27505, 29126箇字符 (MS Office 2007 自帶)
04. 微軟正黑體 msjh 20923+6582=27505, 28969箇字符 (MS Office 2007 自帶)
05. 楷體 細明體 中黑體 20923+6582=27505, 43725箇字符,Unicode 多國文字
06. code2000,6249+670=6919, 34801箇字符,Unicode多國文字
07. Unicode Symbols 各種符號,包括麻將、排九、易經、太玄經、音樂等各種符號
http://users.teilar.gr/~g1951d/
08. 字體下載 (注意更新↓)
簡體字體:http://www.wazu.jp/gallery/Fonts_ChineseSimplified.html
繁體字體:http://www.wazu.jp/gallery/Fonts_ChineseTraditional.html
各國字體:http://www.wazu.jp/index.html
備注:字體雖分簡體與繁體,但並不妨礙在簡體或繁體操作系統中安裝與顯示。
09. 文鼎細上海宋.中楷體 AR PL UMing.UKai http://freedesktop.org/wiki/Software/CJKUnifonts/Download
10. Symbola,符號字體,Unicode Fonts for Ancient Scripts:http://users.teilar.gr/~g1951d/
11. 雲林黑體 H-YunLin 舊字形 GB18030
12. 十九款舊字形等字體
13. 舊字形等字體二十三種
14. 其他漢字舊字形字體多種
15. 再加幾種舊字形字體
16. Adobe與Google共同推出開源中日韓字體 思源黑體.思源宋體
16. Adobe與Google共同推出開源中日韓字體 思源宋體,下載指南
17. I.Ming ( I.明體/一點明體/一點明朝體)
https://github.com/ichitenfont/I.Ming
18、天珩全字庫:http://cheonhyeong.com/index.html
9. MacOSX 操作系統字體
01. lihei_Pro 華康麗黑,繁體,22581箇字符。
Windows下使用的華康麗黑,17678 箇漢字
02. lisong_Pro 華康麗宋,繁體,17678, 22581箇字符
03. stfangsong 華文仿宋,簡體,32493箇字符
04. stheiti 華文黑體,簡體, 32493箇字符
05. stkaiti 華文楷體,簡體, 32493 箇字符
06. stsong 華文宋體,簡體,32493箇字符
07. stxihei 華文細黑,簡體,32493箇字符
備注:Macosx的中文字體不能直接在Windows下使用。
用FontForge打開上面的字體後,直接生成,則可以在Windows下使用。
08. 經轉換後可以在Windows下使用的以上七種字體
09. CrossFont、TransType:在MacOS和Windows平臺之間轉換字體格式
四、漢字輸入法下載
01. 微軟拼音輸入法:
02. 海峰五筆輸入法:可錄入7萬多箇漢字,免費軟件
03. 甲骨文小篆專用輸入法
04. 手寫輸入法逍遙筆 6.5版:可錄入7萬多箇漢字
05. 倉頡輸入法:http://www.chinesecj.com
06. RIME 輸入法引擎 跨平臺的輸入法算法框架:http://rime.im/download/
Rime 是一種開源中文輸入法,其擴展性較強,內建多種輸入方案,但不易於普通用戶上手。Rime的基礎架構十分精良,一套算法支持了拼音、雙拼、註音、五筆、倉頡等所有音碼和形碼輸入法,遠比基於碼表的各種「輸入法生成器」優秀許多。Rime默認提供了兩個拼音輸入法「朙月拼音」和「地球拼音」,兩者都可以輸入準確的繁體和簡體,而且「地球拼音」還支持聲調輸入。Rime還支持了許多種方言拼音,如吳語、粵語,甚至中古漢語。Rime還是跨平台的!Rime針對Windows、Linux、Mac三大平台提供了不同的發行版,核心算法不變,還能和系統完美融合,真乃絕妙。佛振還給Rime的發行版起了好聽的名字,Windows發行版叫做「小狼毫」,Mac發行版叫做「鼠鬚管」,Linux發行版叫做「中州韻」。
07. 東里五筆98全字版,東里書齋分享:http://www.donglishuzhai.net/index.html
08. 華宇拼音輸入法6.9版:http://www.unispim.com/
09. 極點五筆拼音6.5版:http://www.freewb.org/
10. 極點五筆7.2便攜版,支持Unicode漢字至Ext-F。2015年10月11日修訂最終版
11. 四角號碼27585字
17、四角號碼檢字:74014字。2022年10月06日整理製作
12. 部件檢索:支持Unicode15.1 全部漢字,能檢索199266個漢字(包括相應字體)、異體字關聯檢索,f.g.wang先生製作的部件檢索:WordFinder.htm
13. 籍合網:中華書局宋體字庫及古聯輸入法:12萬漢字!Unicode10全部漢字,自造36000字。
字庫:http://www.ancientbooks.cn/helpcore?font
輸入法:http://www.ancientbooks.cn/helpcore?input
14.五筆98-U++輸入法:支持Unicode13漢字100414個,配套字體SimSun-ExtB V5.03 XYB。
15.SimSun-ExtB V5.03 XYB(XYB-學研版) :增補中日韓(CJK)統一表意文字擴展E.F.G(Unicode 13)全部字符。
16. 黃狗五筆超大字符集版,五筆字型86版(V4.5),可以輸入Unicode 15中文字符約98060個。相關介紹。
17、漢文博士:支持生僻古難字檢索的開放式免費漢語詞典,部首檢字法,構形檢字法,支持Unicode15:
http://hanbox.cnblogs.com/、http://hanzisearcher.cnblogs.com/
五、字體製作、修改、安裝、改名等
01. 字體安裝:開始→設置→控制面板→字體→文件→安裝新字體,
在文件夾中找到字體文件,勾上“複製到Fonts文件夾”→確定。或者:
02. C:\Windows\Fonts→文件→安裝新字體,在文件夾中找到字體文件,勾上“複製到Fonts文件夾”→確定。
若不勾上“複製到Fonts文件夾”選項,此法安裝的字體文件不在C:\Windows\Fonts文件夾。
安裝後,存放字體的文件夾及字體文件不能改變位置,
否則得先把C:\Windows\fonts文件夾中的快捷方式刪除,然後再重新安裝字體。或者:
03. 直接把要安裝的字體複制到:C:\Windows\Fonts文件夾。
若要把C:\Windows\Fonts文件夾中的字體複制或刪除,請用菜單命令,點鼠標右鍵的方式可能行不通。
另外可用菜單命令中的“查看→詳細信息”以查看字體文檔名及字體名。
對於不能用別的方法刪除及安裝的字體,尤其是系統字體:
在Windows XP系統中,直接把C:\Windows\Fonts文件夾中的宋體文件拖到另一處(同時按住Shift鍵),把要安裝的宋體simsun.ttc拖入其中,重新啟動電腦即可。
在Windows 7以上系統中,
①首先安裝新的宋體simsun.ttc:替換已安裝字體,這樣會在C:/Windows/Fonts/下生成一個simsun_0.ttc 的字體文件。
②運行regedit,定位到HKEY_LOCAL_MACHINE/SOFTWARE/Microsoft/Windows NT/CurrentVersion/Fonts,
分別將「SimSun & NSimSun (TrueType)」和「宋体 & 新宋体 (TrueType)」數值從「simsun.ttc」修改為「simsun_0.ttc」。
③註銷後重新登錄即可。系統字體mingliu.ttc的安裝亦同例。
04. 字體改名:用 Font Creator 可以修改字體名稱:tools→autonaming。
若要用漢字名稱,要把漢字以Unicode內碼表示。表示方法:\XXXX\XXXXX(X爲0~F編碼)。
如 华文楷体:\534E\6587\6977\4F53;華文楷體:\83EF \6587 \6977 \9AD4。
Font Creator 6 以後的版本,字體改名可以直接輸入漢字,不必再輸入內碼了。
05. 漢字內碼:在Word2003中錄入漢字,然後按〔Alt+X〕組合鍵,即可呈現該字的Unicode內碼。
或者選定這箇漢字如“華”,菜單命令:插入→符號,就能看到“字符代碼 83EF,來自Unicode”。
當然可以用BabelMap查看字體中字符的內碼,或者查看全部Unicode漢字中提供的相關文檔。
06. 更改字體設置:有的字體不能夠被嵌入到文件中或被打印,就需要更改它的設置。
用Font Creator7.0以上版本打開字體文件,菜單欄:Font(字體)→Font Properties(字體屬性)→Legal(法律)→
Embedding Licensing Rights(嵌入許可授權)→Installable(no embedding restrictions. 可安裝.無嵌入限制)。
用Font Creator7.0之前版本打開字體文件,Format→Settings→header→Font header flags→edit, 把reserved前面的√去掉。
在General→font embedding - Licensing rights→edit, 把Reserved及Restricted License embedding前面的√去掉。
修改字體時,最好把 tools→options→fonts→recalc average chac width前面的√去掉。
07. High-Logic FontCreator 英文版。非常好用:https://www.high-logic.com/
TTC字體文件爲數種TTF字體打包文件,可用Font Creator,tools→extract from TTC 分解爲單箇的TTF字體文件 。
08. FontForge 字體制造、修改、合併軟件:http://fontforge.sourceforge.net/
FontForge軟件默認語言爲英文,可以修改爲中文,具體方法是:
解壓縮後,找到fontforge.bat,右鍵,編輯,將 set LANG=C.UTF-8 改爲 set LANG=zh_CN.UTF-8,保存,
然後雙擊 fontforge.bat 運行。第一次運行可能要等待很久。
FontForge的Windows版:fontforge-cygwin_2016_05_26
FontForge for Windows 2010.05.18 安裝程序
09. 如何知道一種字體所支持的漢字字數?
用 BabelMap 可以查看字體相關信息:http://www.babelstone.co.uk/Software/BabelMap.html
運行BabelMap,菜單欄:Fonts——Add Fonts from Disk, 找到要查看的字體,就可以看到軟件中間位置的Single Font 方框中出現了相應的字體名稱。然後Fonts——Font Analysis Utility, 就可以查看到字體的相關信息了。Font Information的最下面一行,就是全部漢字數量。
六、相關資料下載
00. Clear type Tuning 簡體中文綠色版:
超清晰顯示WindowsXP字體,液晶顯示器專用。我的電腦→屬性→外觀→使用下列方式使屏幕字體的邊緣平滑→清晰。
Windows7以上版本自帶,桌面右鍵:個性化→(左下角)顯示→調整ClearType文本。
一種保護眼睛的好方法:
桌面→右鍵→屬性→外觀→高級→項目選擇(窗口)、顏色1(L)選擇(其它),改爲:
色調:85,飽和度:123,亮度:205→添加到自定義顏色→在自定義顏色選定點確定→確定
這樣所有的文檔都是非常柔和的豆沙綠色,這個色調是眼科專家配置的,長時間使用會很有效的緩解眼睛疲勞,保護眼睛。
01. 實用漢字轉拼音4.8綠色版 江志鍵先生製作
02. 漢語大字典、故訓匯纂、中文大辭典之全部字頭檢索,漢語大詞典2.0版補丁
03. BabelPad 文本處理程序(Unicode)簡繁及編碼轉換等
04. Word2003長篇文檔排版技巧
05. Word排版藝術(The Art of Word) 臺灣侯捷著
06. Microsoft Applocale WinXP下最佳轉內碼工具,免除程序亂碼
07. TextPro 6.5 文本處理程序 支持Unicode 簡繁及編碼轉換等(附cnbook、ConvertZ等)
http://www.fmddlmyy.cn/download/cnbook.zip
08. ZDT (Zhongwen(Chinese) Development Tool) for foreign students to learn Chinese
Chinese Language Learner ZDT 0.7.0 (for Windows) 41.8MB
09. Chinese Symbol Design Translation V3.97
Creates high quality anti-aliasing symbols. 創建字符的特效。將英文譯成中文。
Translate English words to Chinese writing symbols (Kanji). And other functions!
http://www.thechinesesymbol.com/
10. TechSmith SnagIt 8.0 屏幕圖像捕捉軟件英文版
11. http://www.zdfans.com/
http://www.dayanzai.me/
https://www.nocmd.com/
12. 鳩摩搜索:https://www.jiumodiary.com/
13. 免費資源網路社群:https://free.com.tw/
14. bookget 數字圖書館下載利器:https://github.com/deweizhu/bookget
七、相關網站及網頁
00. 漢字 字源網:http://www.chineseetymology.org/
01. 香港中文大學網站:
http://www.cse.cuhk.edu.hk/~irg/irg/CJK/CJK.htm
03. 微軟的網站:
http://www.microsoft.com/en/us/default.aspx
http://www.microsoft.com/zh/cn/default.aspx
http://www.microsoft.com/zh/tw/default.aspx
http://www.microsoft.com/taiwan/download/CHTdownload.htm
04. 統一碼Unicode網站:
http://www.unicode.org/charts/
http://www.unicode.org/charts/unihan.html
05. 支持全部Unicode的字符映射表BabelMap
http://www.babelstone.co.uk/Software/BabelMap.html
06. 支持全部Unicode的文本編輯器BabelPad
http://www.babelstone.co.uk/Software/BabelPad.html
07. 一些漢字標準、字體/字型、內碼、輸入法資料的整理
08. 龍語瀚堂典籍數據庫:http://edu.dragoninfo.cn/index.aspx
09. 開放康熙字典:http://kangxi.adcs.org.tw/kangxizidian/
10. 異體字字典 正式第五版:http://140.111.1.40/main.htm
異體字字典 正式第六版:http://dict.variants.moe.edu.tw/
11. 中華博物 文字庫 書法字典:http://images.gg-art.com/dictionary/index.php
12. 語文綜合檢索系統:http://www.nlcsearch.moe.gov.tw/EDMS/admin/dict3/
13. 說文解字綜合檢索系統 文本的全方位檢索+20種圖像查閱 白雲深處人家整理製作
http://www.homeinmists.com/shuowen/index.html
14. 漢文博士:http://hanbox.cnblogs.com/
15. 書法空間——永不落幕的書法博物館:http://www.9610.com/
17. 在線字典:http://www.uname.cn/Tools/tools_1.asp
18. 粵語審音配詞字庫:http://humanum.arts.cuhk.edu.hk/Lexis/lexi-can/
19. 佛學辭典在線版:http://www.fodian.net/zxcd/default.asp
20. 文獻處理實驗室:http://www.sinica.edu.tw/~cdp/
21. 中國古籍全錄:http://guji.artx.cn
22. 漢典網上檢索:http://www.zdic.net/
23. 漢文庫典:http://www.hanculture.com/dic/index.php
24. 字海(中華字海):http://yedict.com/
26. 中文字元資料頁:http://input.foruto.com/ccc/
27. 韻典網,綜合韻書查詢網站:http://ytenx.org/
30. 小學堂文字學資料庫:http://xiaoxue.iis.sinica.edu.tw/
漢字古今字資料庫:http://xiaoxue.iis.sinica.edu.tw/ccdb
漢字古今音資料庫:http://xiaoxue.iis.sinica.edu.tw/ccr
小學堂甲骨文資料庫:http://xiaoxue.iis.sinica.edu.tw/jiaguwen
小學堂金文資料庫:http://xiaoxue.iis.sinica.edu.tw/jinwen
小學堂楚系簡帛文字資料庫:http://xiaoxue.iis.sinica.edu.tw/chuwenzi
小學堂小篆資料庫:http://xiaoxue.iis.sinica.edu.tw/xiaozhuan
小學堂異體字表資料庫:http://xiaoxue.iis.sinica.edu.tw/variants
小學堂上古音資料庫:http://xiaoxue.iis.sinica.edu.tw/shangguyin
小學堂中古音資料庫:http://xiaoxue.iis.sinica.edu.tw/zhongguyin
小學堂官話資料庫:http://xiaoxue.iis.sinica.edu.tw/guanhua
小學堂晉語資料庫:http://xiaoxue.iis.sinica.edu.tw/jinyu
小學堂吳語資料庫:http://xiaoxue.iis.sinica.edu.tw/wuyu
小學堂徽語資料庫:http://xiaoxue.iis.sinica.edu.tw/huiyu
小學堂贛語資料庫:http://xiaoxue.iis.sinica.edu.tw/ganyu
小學堂湘語資料庫:http://xiaoxue.iis.sinica.edu.tw/xiangyu
小學堂閩語資料庫:http://xiaoxue.iis.sinica.edu.tw/minyu
小學堂粵語資料庫:http://xiaoxue.iis.sinica.edu.tw/yueyu
小學堂平話資料庫:http://xiaoxue.iis.sinica.edu.tw/pinghua
小學堂客語資料庫:http://xiaoxue.iis.sinica.edu.tw/keyu
小學堂其他土話資料庫:http://xiaoxue.iis.sinica.edu.tw/otherdialects
甲骨文合集材料來源表資料庫:http://xiaoxue.iis.sinica.edu.tw/obm
吳守禮台語注音字型:http://xiaoxue.iis.sinica.edu.tw/download/WSL_TPS_Font.htm
吳守禮台語注音輸入法:http://xiaoxue.iis.sinica.edu.tw/download/WSL_TPS_IME.htm
小學堂增益集:http://xiaoxue.iis.sinica.edu.tw/download/Xiaoxue_Addin.htm
31. 漢語方言發音字典:http://cn.voicedic.com/
32. 日本國立公文書館:http://www.digital.archives.go.jp/
33. 全文搜索工具下載:http://docfetcher.sourceforge.net/
先在Search Scope內右鍵添加要搜索的文件夾,創建索引(Create Index)。
34. java下載:http://java.com/zh_CN/download/manual.jsp
35. 新浪微盤:http://vdisk.weibo.com/
36. CBETA電子佛典集成 漢文大藏經:http://tripitaka.cbeta.org/
37. 日本早稻田大學圖書館:http://www.wul.waseda.ac.jp/kotenseki/search.php
38. Free Books: The Internet Archive:http://archive.org/details/texts
40. Open Access Library 中外文學術期刊免費獲取:http://www.oalib.com/
41. 搜韻 音韻相關,四庫全書等影印古籍在線閱讀下載:http://sou-yun.com/index.aspx
42. PDF文獻搜索引擎:http://www.sopdf.com/
43. 華藝線上圖書館:http://www.airitilibrary.com/Home/Index
44. 諸子百家中國哲學書電子化計劃:http://ctext.org/zh
45. 書格:有品格的數字古籍圖書館:http://shuge.org/
46. 書法字典:http://www.shufazidian.com/
49. 國際電腦漢字及異體字知識庫:http://chardb.iis.sinica.edu.tw/
51. 國學大師:http://www.guoxuedashi.net/
54. 東里書齋_免費古籍在綫閱讀: http://www.donglishuzhai.net/index.html
55. 維基文庫:https://zh.wikisource.org/wiki/Wikisource:%E9%A6%96%E9%A1%B5
56. 林語堂當代漢英詞典網上版:http://humanum.arts.cuhk.edu.hk/Lexis/Lindict/
57. 漢リポ Kanseki Repository:Electronic texts for researchers from researchers.
https://www.kanripo.org/
58. 中古音韻字書查詢系統 顧國林:http://www.guguolin.com
59. 各種中文資源網站鏈接
60. 中文大辭典網上檢索:http://ap6.pccu.edu.tw/Dictionary/index.asp
61. 殆知閣:古代文獻在線檢索:http://122.200.75.13/
62. 籍合網:中華文史工具書數據庫:http://www.ancientbooks.cn/home
63. E書聯盟:http://www.book118.com
64. 漢字全息資源應用系統:http://qxk.bnu.edu.cn
65. 引得市 古文字工具書索引:http://www.mebag.com/index/
66. FreeMdict:https://freemdict.com/
67. 國際敦煌項目:http://idp.nlc.cn/
68. 登樓古籍全文檢索:https://www.denglou.org/
69. 漢籍全文資料庫:http://hanchi.ihp.sinica.edu.tw/ihp/hanji.htm
70. 學衡古籍資料庫:http://www.xueheng.net/dz.html
71. 漢字拼音在線轉換:https://www.qqxiuzi.cn/zh/pinyin/
72. 北京書同文古籍手寫漢字OCR識別系統,點字成金:https://dzcj.unihan.com.cn/Account/Login
備注:OCR結果文本中顯示爲空白的是自造字,可用四庫全書的楷體顯示。
可用BabelPad的字頻統計得到全部自造字,然後用TextPro6.5的自定義批量替換爲通行字。
73. 北師大的古詩文斷句:https://seg.shenshen.wiki/
74. 龍泉寺的古籍自動標點:http://gj.cool/gjcool/index
74. Z- Library,俄羅斯免費圖書館:https://z-lib.org/
75. 中國大百科全書:https://poe.zgbk.com/
76. 字統網:漢字源、形、音、義、碼:https://zi.tools/
77. 籍合網:古籍整理與數字化綜合服務平臺:http://www.ancientbooks.cn/
78. 古音小鏡:歷史語言學材料和工具:http://www.kaom.net/index.php
79. 東方學デジタル圖書館:http://kanji.zinbun.kyoto-u.ac.jp/db-machine/toho/html/top.html
80. 臺灣博碩論文知識加值系統:https://ndltd.ncl.edu.tw/
81. 維基共享資源:https://commons.wikimedia.org/wiki/Commons:Library_back_up_project
82. The Journal of Asian Studies 開放下載:https://buff.ly/3GZ8p2k
83. 安娜的檔案:https://zh.annas-archive.org/
84.全球漢籍影像開放集成系統:https://guji.wenxianxue.cn/index
85.中國古典文獻資源導航系統:https://www.wenxianxue.cn/
86.看典古籍:https://www.kandianguji.com/about_kdgj
圖書館及博物館推薦:
- 哈佛大學圖書館
- 日本宮內廳書陵部
- 日本內閣文庫
- 京都大學圖書館
- 世界數字圖書館
- 互聯網檔案館
- 日本國立國會圖書館
- 法國國家圖書館
- 不列顛哥倫比亞大學圖書館
- 美國國會圖書館
- 普林斯頓大學東亞圖書館
- 臺北故宮博物院圖書文獻
- 京都大學人文科學研究所
- 牛津大學博德利圖書館
- 慶應義塾圖書館
- 香港中文大學圖書館
- 早稻田大學圖書館
- 關西大學圖書館
- 伯克利圖書館
- 國文學研究資料館
- 東京大學附屬圖書館
- 國家哲學社會科學文獻中心
- 中國國家圖書館
- 德國柏林國立圖書館
- 奎章閣-古典文獻資源導航
- 北京故宮博物院
- 臺北故宮博物院
- 大都會博物館
- 克利夫蘭藝術博物館
- 弗瑞爾·賽克勒美術館
- e 國寶
- 普林斯頓大學博物館
- 臺灣華文電子書庫
八、文本編輯和排版
文本編輯,就是無格式的.txt文本內容的編輯,最重要的技術就是使用“正則表達式”(regular expressions 規則表達式)。
只要文本有規律可循,就可以利用“正則表達式”,實現對文本的查找和替換,極其方便。
正則表達式全集手冊:http://tool.oschina.net/uploads/apidocs/jquery/regexp.html
揭開正則表達式的神秘面紗:http://www.regexlab.com/zh/regref.htm
有兩本書最值得推薦學習:精通正則表達式、正則指引。
余晟《正則指引》:http://pan.baidu.com/s/1nuqjp81
正則表達式的知識大全網站:http://www.regexlib.com
正則表達式相關知識點的詳細講解,各種語言實現細節參考列表:http://www.regular-expressions.info/
文本編輯軟件很多,特別推薦:
TextPro6.5,中文文本編輯的利器,簡繁體轉換,自定義批量替換。
EmEditor,Windows下最佳文本編輯軟件,完美支持中文,極速打開大文件:https://www.emeditor.com/
正則表達式語法:http://www.emeditor.org/zh-cn/howto_search_search_regexp_syntax.html
另外兩種工具,特別推薦:
一是本地電腦上的文件,文件名極速搜索工具 Everything:https://www.voidtools.com/zh-cn/
一是本地電腦上的文件,內容全文搜索工具 AnyTXT Searcher:https://anytxt.net/
圖書、報刊、雜志的專業排版軟件:
方正書版,所想即所得,需要記憶命令,易學易用。
Adobe InDesign,所見即所得,几乎能隨心所欲,因爲功能非常多,需要花時間熟習。
https://helpx.adobe.com/cn/creative-cloud/kb/creative-cloud-apps-download.html
相關教程:
https://pan.baidu.com/s/1pLKxbf1
https://helpx.adobe.com/tw/indesign/topics.html
https://www.cnprint.org/bbs/thread/74/351922/
InDesign導出爲pdf時,注意不得使用Adobe PDF默認設置的標準,否則會因爲缺少特定字體而在另一臺電腦上不能顯示和打印出來。必須更改默認設置:開始→設備和打印機,右鍵點擊Adobe PDF,設置爲默認打印機;右鍵點擊Adobe PDF→打印首選項→默認設置,在▼處選擇:印刷質量(或PDF/A-1b:2005,不要選擇默認的標準設置)。
InDesign導出爲PDF時,保存→標準→無;包含→勾選【書籤】和【超鏈接】,轉換出來的PDF帶有書籤和超鏈接功能。
CPC中文印刷社區:http://www.cnprint.org/bbs/index.php
備忘:中文相關的正則表達式
漢字:\p{Han}:支持到CJK EXT-F,未包涵G H I 區、中文標點、易經、太玄經、麻將牌符號等
漢字中間的空格:(?<=[\u4E00-\u9FFF])\s+(?=[\u4E00-\u9FFF]):替換成空白卽可刪除。
中文字符:[\u4E00-\u9FFF],或[\x{4E00}-\x{9FFF}],或[\u{4E00}-\u{9FFF}]:CJK 基本表意漢字 20992字
[\u3400-\u4DBF],[\x{3400}-\x{4DBF}]:CJK擴展A CJK Ext-A: 6592
[\u20000-\u2A6DF],[\x{20000}-\x{2A6DF}]:CJK擴展B CJK Ext-B:42720
[\u2A700-\u2B73F],[\x{2A700}-\x{2B73F}]:CJK擴展C CJK Ext-C: 4153
[\u2B740-\u2B81F],[\x{2B740}-\x{2B81F}]:CJK擴展D CJK Ext-D: 222
[\u2B820-\u2CEAF],[\x{2B820}-\x{2CEAF}]:CJK擴展E CJK Ext-E: 5762
[\u2CEB0-\u2EBEF],[\x{2CEB0}-\x{2EBEF}]:CJK擴展F CJK Ext-F: 7473
[\u30000-\u3134A],[\x{30000}-\x{3134A}]:CJK擴展G CJK Ext-G: 4939
[\u31350-\u323AF],[\x{31350}-\x{323AF}]:CJK擴展H CJK Ext-H: 4192
[\u2EBF0-\u2EE5F] ,[\x{2EBF0}-\x{2EE5F}]:CJK擴展I CJK Ext-I:622
[\u1D300-\u1D356],[\x{1D300}-\x{1D356}]:太玄經符號:87
[\u4DC0-\u4DFF],[\x{4DC0}-\x{4DFF}]:易經六十四卦符號:64
[\u2F00-\u2FD5],[\x{2F00}-\x{2FD5}]:康熙字典部首:214
[\u3300-\u33FF],[\x{3300}-\x{33FF}]:兼容字符: 256
[\u3000-\u303F],[\x{3000}-\x{303F}]:符號標點: 64
[\uFE30-\uFE4F],[\x{FE30}-\x{FE4F}]:CJK兼容符號: 32
[\u2E80-\u2EFF],[\x{2E80}-\x{2EFF}]:CJK部首擴展: 115
[\u31C0-\u31EF],[\x{31C0}-\x{31EF}]:CJK筆劃: 36
[\uF900-\uFAFF],[\x{F900}-\x{FAFF}]:CJK兼容表意文字:472
[\u2F800-\u2FA1F],[\x{2F800}-\x{2FA1F}]:CJK兼容表意文字補充: 542
標點符號:[:punct:],[\p{P}\p{S}]
\w:[A-Za-z0-9_]。\W=[^A-Za-z0-9_]。
豎排標點符號10:[\uFE10-\uFE1F] =︐ ︑ ︒ ︓ ︔ ︕ ︖ ︗ ︘ ︙
半角標點12:[\uFF61-\uFFEE]=「 」 、 。 , ? ! ; ・ │○ ■
結構位置符號12:[\u2FF0-\u2FFB]=⿱ ⿰ ⿳ ⿲ ⿴ ⿵ ⿶ ⿷ ⿸ ⿹ ⿺ ⿻
參看:Unicode15 中文字符。
九、Word相關技巧
Microsoft Office2003 綠色精簡便攜版,兼容2007、2010版、WPS
Word2003長篇文檔排版技巧
Word排版藝術(The Art of Word) 臺灣侯捷著
Word排版之道(第2版) 宋翔 電子工業出版社2012
Microsoft Office 論壇:http://bbs.pcbeta.com/forum-518-1.html
Microsoft Word 大家論壇:http://club.topsage.com/forum-288-1.html
Word - ExcelHome 技術論壇:http://club.excelhome.net/forum-23-1.html
01. 給漢字標注拼音
Microsoft Office XP或2003 的Word就有這箇功能。選定要注音的文字,用:格式→中文版式→拼音指南,Word就會在所選文字的上方自動標注拼音。如果出現的是注音符號而不是拼音符號,先選定這些文字,檢查:工具→語言→設置語言,確定是“中文(中國)”而不是“中文(臺灣)”。但Word能夠自動標注拼音的漢字大約兩萬箇,此外漢字的拼音,就只能在所選文字的“格式→中文版式→拼音指南→拼音文字”處用鍵盤錄入了;拼音若有錯誤,亦可以在此處手工更正。可以把“拼音文字”處的拼音,用[Ctrl+C]組合鍵複製,再用[Ctrl+V]組合鍵粘貼到Word中。反之亦可以用這種方法把Word中的拼音複製到“拼音文字”處。可惜Word一次最多只能標注30箇漢字。中文輸入法的狀態欄一般都有一箇鍵盤符號,用右鍵點擊,選擇“拼音字母”,就可以錄入那些帶有聲調的字母;點左鍵取消或開啟。
若要給整篇Word文檔標注拼音,有兩個現成的工具:
一、漢字拼音在線轉換:https://www.qqxiuzi.cn/zh/pinyin/
把轉換的結果複製到word中,再進行編輯處理。但一次只能轉換2000字(標點符號在內)。
二、使用 實用漢字轉拼音4.8綠色版。
轉換結束後,文件→結果導出爲MsWord格式。這時就可以進行拼音的字符格式設置。
那麼如何批量修改拼音的字體、字號、與文字的間距?
先選中一個字(建議第一個漢字),用Word的“拼音指南”進行設置。結果滿意後,全選→右鍵→切換域代碼,這樣所有的拼音格式設置就全部顯示爲代碼。用查找替換的方式,把拼音格式代碼更改爲第一字的設置,然後再右鍵→切換域代碼,恢復正常。成功。
在InDesign中,按 Ctrl+D 導入Word文檔,注意勾選“顯示導入選項”,然後在段落樣式中,對拼音進行統一設置。
若要在InDesign中修改拼音,當然可以右鍵→拼音,推薦使用“極速拼音插件”免費版:http://www.inwun.com/
漢語拼音字母字體。
CJK 41158 個漢字的拼音。
02. 在Word中如何實現豎排句讀號右側放置?
在Word中豎排古籍時,實現句讀號(句號)放置在文字的右側,但又不占正文字符空間。
查找需要被替換的標點符號。
替換爲:【】高級:字體(中文字體,西文字體):ArialPun,高級-字符位置提升3磅。全部替換。
注意:替換爲【】內的字符,先輸入030A(句號。其他標點亦同樣),再按ALT+X組合鍵,出來的結果肉眼看不見,沒關係。全部替換後就可以看到結果了。上升3磅,感覺比較合適。
用此處提供的豎排標點側邊放置字體,按使用說明操作,就能實現標點符號的側邊放置。
還有如何處理帶圓圈的數字,相關字體,見上壓縮包內。
03. 在Word中如何刪除尾注的橫線或豎線?
在Word中,爲文檔插入尾注後,就會出現橫線或豎線,非常難看,在頁面視圖中無法刪除。刪除方法如下:
在Word2003中,切換到:視圖-普通,視圖-腳注。就能看到:尾注-所有尾注。點擊倒三角形(下拉菜單),就能看到:尾注分隔符、尾注連續分隔符,選中出現的橫線,即可刪除。切換到視圖-頁面。完成。
在Word2010中,視圖標簽選擇文檔視圖項中的草稿,再點擊引用標簽中腳註項下的顯示備註。這個時候可以看到WORD2010界面分成上下兩個窗口,下面窗口中顯示的就是尾註的內容。尾註下拉列表框中選擇尾註分隔符,就會在備註窗口中顯示尾註的那條橫線,就可以刪除該橫線了,亦可以刪除尾註延續分割符和尾註延續標記。
04. 在Word中如何爲腳注或尾注的引用編號數字加方括號?
1. 尾注引用編號加方括號的操作:查找:^e(樣式-尾注引用)。替換:[^&]。全部替換。
2. 腳注引用編號加方括號的操作:查找:^f(樣式-腳注引用)。替換:[^&]。全部替換。
05. 在Word中如何實現單引號與雙引號的互換?
大陸使用引號的習慣是用雙引號,其中另有引語,則用單引號,而港臺的習慣正好相反。
港臺的習慣是:正文內之引文,用單引號「」;若引文內別有引文,則使用雙引號『』。
1. 查找,高級,使用通配符:“(*)”。替換:「\1」。全部替換。
2. 查找,高級,使用通配符:‘(*)’。替換:『\1』。全部替換。成功。
如果要求的是“”與‘’的互換,使用查找替換功能,Word就會把左引號全部替換成右引號。因此要告訴Word,我要的是左引號,就在前面加一個冒號。爲與別的冒號區別以便刪除,就在前面再加一個符號,繼續如下:
3. 查找,高級,使用通配符:「(*)」。替換:*:‘\1’。全部替換。
4. 查找,高級,使用通配符:『(*)』。替換:*:“\1”。全部替換。
5. 查找,高級,不使用通配符:*:。替換:(不輸入任何內容)。全部替換。成功。
06. 在Word中如何調整下劃線與正文字符的間距?
1. 最好待文檔完成後再操作。
2. 在操作之前,應該爲字符下劃線不想連在一起的,加一個空格(字符緊縮)或別的符號,如|。
方法如下:
1. 查找:(一個空格,格式-字體-字符間距-緊縮-磅值)。替換:|(文檔中別的地方沒使用過的半角符號)。全部替換。
2. 查找:^?(下劃線。高級-特殊字符-任意字符)。替換:《^&》(特殊字符-查找內容)。全部替換。
3. 查找:》《(不限定格式)。替換:(不輸入任何內容)。全部替換。即刪除查找的內容。
說明:用書名號,是權宜之計。如果文中有書名號,就用別的符號。用書名號,就可以把原文是波浪線的文字,改爲書名號。反向操作,把書名號內文字改爲波浪線:查找:使用通配符,在書名號中間插入特殊符號-零個或多字符。替換:(波浪線)。全部替換。再用查找替換命令刪除書名號即可。
4. 查找:^p《。替換:^p(特殊字符-段落標記)。全部替換。即刪除了段首的空格。
5. 查找:《。替換:(一個空格)。全部替換。即爲帶下劃線的字符之前添加了一個帶下劃線的空格。
6. 查找:》。替換:(一個空格)。全部替換。即爲帶下劃線的字符之後添加了一個帶下劃線的空格。
說明:一定要在帶下劃線字符前後各添加一個帶下劃線的空格,否則字符分兩處行,空格之前或之後的字符會恢復原狀。
7. 查找:(一個空格,下劃線 )。替換:(字體顏色-白色,Arial Unicode MS,字符緊縮8磅)。全部替換。
8. 查找:|。替換:( 字體顏色-白色,Arial Unicode MS,字符緊縮2磅)。全部替換。
07. 在Word2003中如何定置工具欄按鈕?
打開Word,然後關閉文檔,這樣就只有Word程序,而沒有開啟任何一個文檔。這個時候,點擊三角形的工具欄選項,就可以隨意添加或刪除按鈕了。
08. 如何在Word中批量轉換文件格式?
打開Word,然後:文件→新建→本機上的模版→其他文檔→轉換嚮導,接下來可按提示操作。
html,xml,rtf,純文本,outlook通訊薄等,與Word之間,實現文檔及模版的批量轉換。
09. 在Word分欄的最後一頁,如何平衡各欄的長度?
很簡單,在分欄的末尾:插入→分隔符→分節符類型→連續,確定。
10. 如何爲Word分欄添加頁碼?
視圖→頁眉和頁腳,定位到起始頁的頁眉或頁腳,在需要設置頁碼的位置,連續按兩次「Ctrl+F9」組合鍵,得到兩對大括號「{{}}」。輸入字符,最終形式爲:左欄:{={page}*2-1},右欄:{={page}*2}。如果要顯示爲:第x頁,那就:左欄:第{={page}*2-1}頁,右欄:第{={page}*2}頁。再分別選中「{={page}*2-1}」和「{={page}*2}」,鼠標右鍵選擇「更新域」。
11. 一次性保存Word文檔中所有圖片的方法:
方法一:Word文件另存爲網頁(*.htm;*.html)。Word文檔中的圖片全都被保存在與html文件同名文件夾中,按出現的先後次序命名。
方法二:Word文檔必須是*.docx格式,否則必須把*.doc格式轉換爲*.docx格式。然後把後綴名docx重命名爲zip。解壓縮,Word文檔中的所有圖片就在word\media文件夾中,按出現的先後次序命名。
12. 如何把Word自動編號轉換爲普通文本?
1. 打開Word2003,工具→宏→宏→宏名稱(NumberToText)→創建
打開Word2007,視圖→宏→查看宏→宏名稱(NumberToText)→創建
2. 在彈出的Visual Basic編輯器窗口,把下面這段代碼複制下來:
ActiveDocument.Content.ListFormat.ConvertNumbersToText
粘貼到編輯器窗口內容“End Sub”前面,得到:
Sub NumberToText()
NumberToText Macro
宏在 2015-10-3 由 nirvana 創建
ActiveDocument.Content.ListFormat.ConvertNumbersToText
End Sub
3. 將宏保存到Normal模板,然后關閉VBA窗口並返回Word。
4. 打開Word2003文檔,工具→宏→宏→NumberToText→運行。
Word2007文檔,視圖→宏→查看宏→NumberToText→運行。
13. Word轉PDF帶有書籤和超鏈接功能
Word文檔,Office按鈕(左上角)→另存爲▶(鼠標停留在該處,或點擊▶)→Adobe PDF,選項→創建符合PDF/A-1a:2005規範的文件;創建書籤→將Word標題轉換爲書籤,轉換出來的PDF帶有書籤和超鏈接功能,而且嵌入了字體。前提條件是,Word文檔必須設置了標題。
14. 如何在word2007文檔中,插入另一個word文檔?
菜單欄→插入→對象▼,點擊▼→文件中的文字。成功。
15. word2007及以上版本,可以比較兩個word文檔
審閱→比較。
16. word如何自動添加頁眉?
菜單欄→插入→文檔部件→域→StyleRef→標題。前提條件是,Word文檔必須設置了標題。
17. word的雙引號前後混亂,如何批量調整?
1. 乾脆把前後雙引號全部替換爲一個符號,譬如◆。
2. 查找-替換,使用通配符:◆([!◆]*)◆
替換爲:△:“\1△。”)△
備注:「△:」「△。」「)△」這三個內容,是故意添加上去的,是讓word判斷前後引號的標記。
3. 全部替換。查看結果是否成功調整了前後雙引號。如果成功,就把故意添加的符號刪除。
4. 查找:△:替換爲空白,全部替換。
5 查找:△。替換爲空白,全部替換。
6. 查找:)△替換爲空白,全部替換。
成功。word的正文和腳注,似乎當分兩次處理。單引號亦可以同樣處理。
18. Word和Excel中查找替換通配符使用方法詳解:Word-exp
白雲深處人家 Home in Mists
Digital Archive of Traditional Chinese Taoism (Daoism)
No Rights Reserved. All free of charge. 版權不保留. 免費共享
Copyright © 2017 www.homeinmists.com 浙ICP备17049091号-1
千古蓬頭跣足,一生伏氣餐霞。笑指武夷山下,白雲深處吾家。——白玉蟾
松篁鬱鬱冬猶秀,桃李紛紛春漸迷。識破邯鄲塵世夢,白雲深處可幽棲。——陳摶