1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
| Unicode常见语言编码范围
(1)u0000-uFFFF:包含世界上所有语言字符,俗称“万国码”。
(2)u0000-u007F:基本拉丁字符,包含常见数字、字母。(阿拉伯数字:u0030—u0039;大写字母:u0041—u005A;小写字母:u0061—u007A)
(3)u0000-u01FF:包含英语/荷兰语/西班牙语/意大利语/葡萄牙语/丹麦语/德语/芬兰语/挪威语/瑞典语/法语/土耳其语。(同语系)。
(4)u4E00-u9FD5:中文
(5)uAC00-uD7AF:韩文
(6)u3040-u31FF:日文
(7)u0E00-u0E7F:泰文
(8)u0400-u052F:俄语
(9)u0600-u06FF:阿拉伯语
(10)u0900-u097F:印度语
对于不是从u0000开始的unicode编码字库,因为是“截取”的一部分编码,写指令时需要减去起始编码,得到的值才是正确的字符编码。
(1)韩语
uAC00-uD7AF韩语:显示“uAC8B”编码字符
AC8B-AC00=008B
Tx:5A A5 05 82 1000 008B
(2)阿拉伯语
u0600-u06FF阿拉伯语:显示“u0626”编码字符
0626-0600=0026
Tx:5A A5 05 82 1010 0026
(3)印度语
u0900-u097F印度语:显示“u092D”编码字符
092D-0900=002D
Tx:5A A505 82 1020 002D
|