Unicode UCS-2 码表

165 views
Skip to first unread message

wanghx

unread,
Nov 29, 2009, 8:42:31 PM11/29/09
to Salon Friends, lihlii-g
以及一个用来产生这个码表的 perl 脚本。


相关参考:

UnicodeImageMaker - Mouser - Software - DonationCoder.com

    image maker freeware graphic text ascii art unicode

Unicode 编码表到GB2312编码表映射表 - wyingquan的专栏 - CSDN博客

    gb2312 映射 码表 unicode

生 成Unicode汉字表的程序 - wyingquan的专栏 - CSDN博客

    汉字 字表 gb2312 转换 unicode

字 体编辑用中日韩汉字Unicode编码表 - 编著:中韩翻译网 金圣镇

    CJK 汉字 码表 unicode

Unicode 码部首笔画查询表 - 先利其器 - 国学数典论坛 - Powered by Discuz!

    部首 笔画 查询 字表 unicode

按 部首+筆劃的Unicode 搜索表(页 1) - 中文信息处理 - 北大中文论坛 www.pkucn.com 致力于做中国最好的中文学术论坛! - Powered by Discuz! Archiver

    部首 笔画 unicode

Unicode 中文排序 - chenlb 的学习笔迹 - JavaEye技术网站

    中文 排序 超大 字集 unicode

LGJ Notes | Unicode 中文部首起始碼位

    font chinese fontforge 部首 unicode

Arial Unicode MS - Wikipedia, the free encyclopedia

    arial font typography i18n unicode

汉 字编码对照表(gbk-unicode-区位码)xls下载--yuanke

    gbk 区位码 对照表 unicode

List of Unicode characters - Wikipedia, the free encyclopedia

    list character 字表 unicode

http://www.unicode.org/versions/Unicode4.0.0/ch11.pdf

    cjk east asian scripts language character unicode

http://unicode.org/charts/PDF/U2FF0.pdf

    ideographic description characters 汉字 组字 造字 unicode

Unicode - 维基百科,自由的百科全书

    unicode

[分 享] 全部UNICODE汉字笔画编码与五笔编码表 - 中文信息处理 - 北大中文论坛 www.pkucn.com 致力于做中国最好的中文学术论坛! - Powered by Discuz!

    汉字 笔画 编码 五笔 海峰 UNICODE

詳 全文_建立UNICODE漢字異體字表與異體字辭典相關研究

    异体字 unicode

Unicode 汉字对照表 - ZJDA07的日志

    delphi unicode


http://blog.bs2.to/post/EdwardLee/5112
Unicode 中文部首起始碼位
2006/04/06,18:57 :: 點閱次數 (8395)
在 製作字型的時候,如果已經有原字型,那麼想要造新字的最好辦法就是從原字型裡頭的其他的字,取出它們的部份部首、偏旁來組合成另外一個新字。這樣,在字的 一致性上會維持原來的風格。


想必有使用過 Fontforge 這個字型編輯器的朋友都知道,他目前無法由純文字的形式來找字型裡頭的 各個字,必需知道某個字的實際 Unicode 碼位,或者是他的字序,才能方便的找到所需要的字,這在字數繁多的中文字就很頭疼了。尤其,如果這個字怎麼寫不完全清楚的話,那麼只能像查字典一樣的,由 部首來下手找起。

幸好,Unicode 的中文字排列,雖然有其他延伸後來補上的部份,但大致上各部份都能依我們中文字典的部首排列的方式來置放,使得我們在找字的時候會比較方便些。

通常由原字型已存在的字,把其中的部首、偏旁、筆畫拆下來,另組合成新字,這在自由字型是最常見,也是最方便的造字方法。因為自由字型的授權允許我 們合法的這樣修改,而這樣組合也最能符合原字型的整體風格。如果是自行去畫個新字,那麼在大字的時候,可能會覺得看起來很一致,但在一般的螢幕、紙本印刷 品中,和其它原字一字排開下就會發覺不協調情形,這在目前的報章雜誌的造字,相信大家都曾察覺到新造的字常會顯得突兀的經驗。

這裡整理了一下在 Unicode 中,中文各部首的起始碼位,這樣想要造新字的時候,想找看看是否有可以利用的其他原字的部首、偏旁,就可以很快的由 Fontforge 的 Goto 功能(或按鍵 Ctrl-Shift->)來輸入這些碼位(請在碼位前加個 u),很快就能找到所需要的字,這就像我們依部首在查字典一樣。

Unicode 中文部首起始碼位表


部首 KangXi CJKExtA CJKHan CJKExtB

U+2F00 U+3400 U+4E00 U+20000
U+2F01 U+3404 U+4E28 U+20061
U+2F02 NA U+4E36 U+2007C
丿 U+2F03 U+3405 U+4E3F U+20086
乙乚 U+2F04 U+3407 U+4E59 U+200CF
U+2F05 U+3427 U+4E85 U+2010C
U+2F06 U+3429 U+4E8C U+2011E
U+2F07 U+342A U+4EA0 U+20141
U+2F08 U+3430 U+4EBA U+201A3
U+2F09 U+34AB U+513F U+20476
U+2F0A U+34B0 U+5165 U+204DB
U+2F0B U+34B5 U+516B U+20500
U+2F0C U+34BA U+5182 U+2053C
U+2F0D U+34CD U+5196 U+20573
U+2F0E U+34C5 U+51AB U+205AC
U+2F0F U+34D8 U+51E0 U+20627
U+2F10 U+34D9 U+51F5 U+20674
刀刂 U+2F11 U+34DA U+5200 U+206A3
U+2F12 U+3513 U+529B U+20832
U+2F13 U+3528 U+52F9 U+208CC
U+2F14 U+352B U+5315 U+2090E
U+2F15 U+352F U+531A U+2092C
U+2F16 U+3537 U+5338 U+2096E
U+2F17 U+3539 U+5341 U+2097B
U+2F18 U+353D U+535C U+209D2
卩㔾 U+2F19 U+353E U+5369 U+20A0D
U+2F1A U+3542 U+5382 U+20A2C
U+2F1B U+3555 U+53B6 U+20AD3
U+2F1C U+355A U+53C8 U+20B1A
U+2F1D U+3563 U+53E3 U+20B99
U+2F1E U+361D U+56D7 U+211A0
U+2F1F U+3626 U+571F U+2123C
U+2F20 U+3683 U+58EB U+2151B
U+2F21 U+3685 U+5902 U+21552
U+2F22 U+3686 U+590A U+2155E
U+2F23 U+3688 U+5915 U+21584
U+2F24 U+368E U+5927 U+215D2
U+2F25 U+36A2 U+5973 U+216A6
U+2F26 U+373D U+5B50 U+2193C
U+2F27 U+3749 U+5B80 U+219B9
U+2F28 U+3773 U+5BF8 U+21B1D
U+2F29 U+3778 U+5C0F U+21B54
尢尣 U+2F2A U+377C U+5C22 U+21BC1
U+2F2B U+378B U+5C38 U+21C23
U+2F2C U+37A2 U+5C6E U+21CFE
U+2F2D U+37A4 U+5C71 U+21D2D
巛川 U+2F2E U+3829 U+5DDB U+21FE6
U+2F2F U+382A U+5DE5 U+22011
U+2F30 U+382F U+5DF1 U+22034
U+2F31 U+3832 U+5DFE U+22052
U+2F32 NA U+5E72 U+22189
U+2F33 U+386B U+5E7A U+221AF
广 U+2F34 U+386F U+5E7F U+221D7
U+2F35 U+389F U+5EF4 U+22317
U+2F36 U+38A1 U+5EFE U+2232C
U+2F37 U+38A4 U+5F0B U+2237A
U+2F38 U+38A7 U+5F13 U+22397
彐彑 U+2F39 U+38C7 U+5F50 U+2244F
U+2F3A U+38C9 U+5F61 U+22480
U+2F3B U+38D4 U+5F73 U+224BC
心忄 U+2F3C U+38FA U+5FC3 U+225A9
U+2F3D U+39AE U+6208 U+2298C
U+2F3E U+39BE U+6236 U+22A24
手扌 U+2F3F U+39C3 U+624B U+22A65
U+2F40 U+3A7A U+652F U+22EB5
攴攵 U+2F41 U+3A7F U+6534 U+22EEB
U+2F42 U+3AAF U+6587 U+23041
U+2F43 U+3AB2 U+6597 U+2306C
U+2F44 U+3ABC U+65A4 U+23091
U+2F45 U+3AC3 U+65B9 U+230D7
U+2F46 NA U+65E0 U+2312D
U+2F47 U+3AD0 U+65E5 U+2313B
U+2F48 U+3B30 U+66F0 U+23321
U+2F49 U+3B33 U+6708 U+2335D
U+2F4A U+3B41 U+6728 U+233B3
U+2F4B U+3C1D U+6B20 U+23880
U+2F4C U+3C4F U+6B62 U+23942
歹歺 U+2F4D U+3C59 U+6B79 U+239B5
U+2F4E U+3C7C U+6BB3 U+23A82
U+2F4F NA U+6BCB U+23AEC
U+2F50 U+3C8B U+6BD4 U+23B02
U+2F51 U+3C8C U+6BDB U+23B1B
U+2F52 U+3CB3 U+6C0F U+23C45
U+2F53 U+3CB4 U+6C14 U+23C55
水氵 U+2F54 U+3CB8 U+6C34 U+23C71
火灬 U+2F55 U+3DA1 U+706B U+24182
爪爫 U+2F56 U+3E12 U+722A U+244EF
U+2F57 U+3E16 U+7236 U+2454E
U+2F58 U+3E1A U+723B U+2455C
U+2F59 U+3E1B U+723F U+2456A
U+2F5A U+3E1D U+7247 U+245A8
U+2F5B U+3E26 U+7259 U+24605
牛牜 U+2F5C U+3E28 U+725B U+24614
犬犭 U+2F5D U+3E5C U+72AC U+2471A
U+2F5E NA U+7384 U+248E5
玉王⺩ U+2F5F U+3EA8 U+7389 U+248E9
U+2F60 U+3F09 U+74DC U+24AEA
U+2F61 U+3F17 U+74E6 U+24B26
U+2F62 U+3F4D U+7518 U+24BBA
U+2F63 U+3F52 U+751F U+24BD3
U+2F64 NA U+7528 U+24C03
U+2F65 U+3F55 U+7530 U+24C12
疋⺪ U+2F66 U+3F70 U+758B U+24D13
U+2F67 U+3F71 U+7592 U+24D25
U+2F68 NA U+7676 U+24F25
U+2F69 U+3FDD U+767D U+24F3D
U+2F6A U+3FEA U+76AE U+24FC6
U+2F6B U+3FFB U+76BF U+2503F
目⺲ U+2F6C U+400E U+76EE U+250E4
U+2F6D U+4086 U+77DB U+2535D
U+2F6E U+408F U+77E2 U+253A6
U+2F6F U+4096 U+77F3 U+25415
示礻 U+2F70 U+40FC U+793A U+25605
U+2F71 NA U+79B8 U+2573B
U+2F72 U+4126 U+79BE U+2574C
U+2F73 U+4191 U+7A74 U+25922
U+2F74 U+41C2 U+7ACB U+25A55
竹⺮ U+2F75 U+41D6 U+7AF9 U+25AD7
U+2F76 U+427A U+7C73 U+25E25
糸糹 U+2F77 U+42B5 U+7CF8 U+25F85
U+2F78 U+4342 U+7F36 U+26222
网罒罓 U+2F79 U+434F U+7F51 U+2626A
U+2F7A U+4367 U+7F8A U+2634B
U+2F7B U+437E U+7FBD U+263F2
U+2F7C U+439B U+8001 U+264B1
U+2F7D U+439F U+800C U+264CE
U+2F7E U+43A2 U+8012 U+264E4
U+2F7F U+43B2 U+8033 U+2652E
U+2F80 U+43CB U+807F U+26612
肉⺼ U+2F81 U+43CC U+8089 U+26629
U+2F82 U+4450 U+81E3 U+268DD
U+2F83 NA U+81EA U+268F9
U+2F84 U+4452 U+81F3 U+26933
U+2F85 U+4454 U+81FC U+26951
U+2F86 U+4459 U+820C U+269C6
U+2F87 U+445D U+821B U+269EE
U+2F88 U+4460 U+821F U+26A07
U+2F89 NA U+826E U+26ACB
U+2F8A U+448A U+8272 U+26AD3
艸艹 U+2F8B U+4491 U+8278 U+26AF3
U+2F8C U+4588 U+864D U+2719B
U+2F8D U+459D U+866B U+2721D
U+2F8E U+460F U+8840 U+275A7
U+2F8F U+4615 U+884C U+275DD
衣衤 U+2F90 U+461A U+8863 U+27607
U+2F91 U+4672 U+897E U+277E0
U+2F92 U+4677 U+898B U+27806
U+2F93 U+4697 U+89D2 U+278B2
U+2F94 U+46AE U+8A00 U+2795B
U+2F95 U+472A U+8C37 U+27BAB
U+2F96 U+4733 U+8C46 U+27BDA
U+2F97 U+4745 U+8C55 U+27C26
U+2F98 U+4756 U+8C78 U+27CA0
U+2F99 U+4767 U+8C9D U+27D24
U+2F9A U+4791 U+8D64 U+27E58
U+2F9B U+4796 U+8D70 U+27E86
U+2F9C U+47D3 U+8DB3 U+27FB7
U+2F9D U+4832 U+8EAB U+2820F
U+2F9E U+4842 U+8ECA U+282A0
U+2F9F U+4883 U+8F9B U+2840B
U+2FA0 U+4885 U+8FB0 U+28443
辵⻌⻍⻎ U+2FA1 U+488A U+8FB5 U+2844D
邑⻏ U+2FA2 U+48B3 U+9091 U+28668
U+2FA3 U+48E5 U+9149 U+287F1
U+2FA4 NA U+91C6 U+2890F
U+2FA5 U+491A U+91CC U+28922
U+2FA6 U+491B U+91D1 U+2893D
長镸 U+2FA7 U+4987 U+9577 U+28C57
U+2FA8 U+498C U+9580 U+28CC7
阜阝 U+2FA9 U+49B9 U+961C U+28E0F
U+2FAA NA U+96B6 U+28F76
U+2FAB U+49F1 U+96B9 U+28F85
U+2FAC U+4A0B U+96E8 U+29076
U+2FAD U+4A3C U+9751 U+291D5
U+2FAE U+4A3D U+975E U+291E6
U+2FAF U+4A42 U+9762 U+29203
U+2FB0 U+4A50 U+9769 U+2925B
U+2FB1 U+4AF8 U+97CB U+29392
U+2FB2 U+4A9E U+97ED U+29401
U+2FB3 U+4AA6 U+97F3 U+29417
U+2FB4 U+4AB1 U+9801 U+2944B
U+2FB5 U+4AF8 U+98A8 U+29598
U+2FB6 U+4B20 U+98DB U+29671
U+2FB7 U+4B22 U+98DF U+2967F
U+2FB8 U+4B6B U+9996 U+29810
U+2FB9 U+4B6F U+9999 U+2983A
U+2FBA U+4B74 U+99AC U+29867
U+2FBB U+4BC6 U+9AA8 U+29A11
U+2FBC U+4BE7 U+9AD8 U+29ABF
U+2FBD U+4BED U+9ADF U+29AF4
U+2FBE U+4C17 U+9B25 U+29C0A
U+2FBF NA U+9B2F U+29C20
U+2FC0 U+4C19 U+9B32 U+29C2B
U+2FC1 U+4C1F U+9B3C U+29C79
U+2FC2 U+4C32 U+9B5A U+29D4B
U+2FC3 U+4CA5 U+9CE5 U+29F8F
U+2FC4 U+4D1A U+9E75 U+2A256
鹿 U+2FC5 U+4D1F U+9E7F U+2A28B
U+2FC6 U+4D2C U+9EA5 U+2A2FC
U+2FC7 U+4D47 U+9EBB U+2A391
U+2FC8 U+4D4A U+9EC3 U+2A3B3
U+2FC9 U+4D51 U+9ECD U+2A3ED
U+2FCA U+4D5D U+9ED1 U+2A417
U+2FCB NA U+9EF9 U+2A4CB
U+2FCC U+4D76 U+9EFD U+2A4D1
U+2FCD U+4D7A U+9F0E U+2A502
U+2FCE U+4D7D U+9F13 U+2A50B
U+2FCF U+4D82 U+9F20 U+2A538
U+2FD0 U+4D8A U+9F3B U+2A590
U+2FD1 U+4D92 U+9F4A U+2A5C4
U+2FD2 U+4D94 U+9F52 U+2A5D4
U+2FD3 U+4DAC U+9F8D U+2A691
U+2FD4 U+4DAF U+9F9C U+2A6A6
U+2FD5 U+4DB3 U+9FA0 U+2A6CA

註一:KangXi(U+2F00-U+2FD5) 指康熙部首實際的 code point。
註二:CJKExtA(U+3400-U+4DFF) 指 CJK Unified Ideographs Extension A。
註三:CJKHan(U+4E00-U+9FFF) 指 CJK Unified Ideographs。
註四:CJKExtB(U+20000-U+2A6DF) 指 CJK Unified Ideographs Extension B。

如果由於字型的關係,如果你的瀏覽器無法正確顯示表中的部首的話,這裡有 PDF 格式可供查閱:

http://edt1023.sayya.org/fonts/kangxi-ucs.pdf

我不是漢學專家,有些部首可能會弄錯,尤其是 CJK Extension B 的那些怪字。但應該只會差幾個碼位,對於想依部首找字的用途不會有很大的影響。但如果有更正確的資訊,那當然是歡迎大家提出來把他修正,以方便其他朋友在 其他用途上的利用。

當然,我們在取出某個字的部首或筆畫的時候,盡可能不做大幅度的縮放,因為這會使得筆畫變細或變粗,這樣會和原字的筆畫粗細不一致。所以,究竟該從 哪一個字取出它的筆畫出來組合新字,可能就需要各位造字的朋友多費點心思去找適當的字了。


【修正】 Wed May 17 00:37:01 CST 2006
fontforge 的 goto 功能,亦可以使用純文字的方式找字,但目前似無法直接輸入中文,可以使用 copy&paste 的方式來輸入中文,就可以馬上到達這個字的位置。但超過 Unicode BMP 的字,例如 CJK Ext B 的字還是無法正常運作。

# Posted by EdwardLee :: 字型:: 迴響 (5) :: 靜態連結網址 :: 引用 (1)
 unichart

jserv 利用 Cairo,寫了一個小工具,他可以印出某字型中,某個碼位範圍的圖檔(png, ps, pdf 皆可),滿有趣的:
http://blog.linux.org.tw/~jserv/archives/001607.html

我上面的那個表格,其實不是刻出來的,是由 Ruby 寫的一個小工具所輸出的,包括,編譯成 PDF 的那個 LaTeX 文稿,也是 Ruby 所寫,所輸出的,並不是直接寫 HTML/TeX。:D

不過,jserv 的方式,無疑的留下了很大的想像空間,利用 Cairo,可能可以做更細節的處理,值得深究。

Posted by: LGJ at 2006/04/07, 18:46

你這張表做的很棒耶~是全自製嗎?有無其他參考網頁,我想以後看能不能讓我的網站能夠查到部首,所以這表對我可能會有幫助。

Posted by: ileadu at 2006/04/28, 09:58

是的,這個表格完全是自製的,所參考的只是 Unicode 所公佈的碼位對應,自行去查表、對應的。

http://www.unicode.org/

Posted by: LGJ at 2006/04/28, 12:18
 Unicode 中文部首起始碼位

我安裝了第五代倉頡輸入法世紀版
http://www.chinesecj.com/newsoftware/index3.php?Type=1
它支持七萬簡繁漢字,內碼 Unicode4.0、BIG5、GB18030、GBK、GB

所以看到大部份的部首字。可是,
「辵」之後的三個部首字就看不到了。

PDF裡的都能看到。

請問你是用什麼 FONT?

此 FONT 可安裝到WINDOWS XP上嗎?

另外,你可以把其他變體的部首字的 UNICODE 碼也列出來嗎?
(如「衣」後的「衤」)

謝謝

Posted by: th at 2006/08/17, 09:11
 Re: 字型

請使用 HAN NOM 字型,可以參考一下這個討論串:
http://cle.linux.org.tw/forum/viewtopic.php?t=908

那些所謂的『變體』部首,是在 CJKHan 那個部份,從那個起始碼位就可以查得到。

Posted by: LGJ at 2006/08/17, 19:12




unicode_table.7z

wanghx

unread,
Nov 30, 2009, 12:00:09 AM11/30/09
to Salon Friends, lihlii-g
产生的文件是 UTF8 编码的。
Reply all
Reply to author
Forward
0 new messages