linyawen

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

http://www.cnblogs.com/jfyes/archive/2009/09/24/1573638.html

  GBK 中文编码: (* GBK是GB2312的扩展,是向上兼容的,因此GB2312中的汉字的编码与GBK中汉字的相同。 
GBK中每个汉字仍然包含两个字节, 第一个字节的范围是0x81-0xFE(即129-254),第二个字节的范围是0x40-0xFE
(即64-254)。GBK中有码位23940个, 包含汉字21003个。
--------------------------------------
GBK/1: 0xA1A0~0xA9EF(部分) GB2312非汉字符号
GBK/2: 0xB0A0~0xF7FE(部分) GB2312汉字
上面两个是GB2312的扩展,是向上兼容的;
--------------------------------------------------------------
GBK/3: 0x8140~0xA0FE(部分) 扩充汉字 包括繁体 ---->上一篇博客已发表 
GBK/4: 0xAA40~0xFEA0(部分) 扩充汉字 包括繁体
GBK/5: 0xA840~0xA995(部分) 扩充非汉字



procedure Tfm_Words.Button5Click(Sender: TObject);
var
  A, B: Cardinal;
  I, J: Integer;
  sHex: 
string;
  s1: WideString;
  ss: 
string;
begin
//
GBK/5: 0xA840~0xA995(部分) 扩充非汉字
  ss :
= #13#10+
        
'                GBK/5: $A840~$A996(部分) 扩充非汉字                '#13#10+
        
'                                           jfyes 2008-07-07'#13#10#13#10;

  
for  I:=  $A8 to $A9 do
  
begin

     
for J := $40 to $96 do
     
begin

       sHex :
= Format('$%.2x%.2x', [I, J]);
       A :
= SysUtils.StrToIntDef(sHex, 0);
       
       
if J = $40 then
         ss :
= ss+ 'code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F ';


       
if J in [$40, $50,$60, $70, $80,$90, $A0, $B0, $C0, $D0, $E0, $F0] then
         ss :
= ss + #13#10 + sHex+ #32;

       
if J <> $7F then
         ss :
= ss + Char(I) + Char(J) + #32
       
else ss := ss + #32#32#32


     
end;
     ss :
= ss + #13#10#13#10;
  
end;
self.memo1.lines.add(ss, True);
end;  

执行结果如下:
------------------------------------------------------------------------------
                GBK/5: $A840~$A996(部分) 扩充非汉字                
                              
code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 
$A840 ˊ ˋ ˙ – ― ‥ ‵ ℅ ℉ ↖ ↗ ↘ ↙ ∕ ∟ ∣ 
$A850 ≒ ≦ ≧ ⊿ ═ ║ ╒ ╓ ╔ ╕ ╖ ╗ ╘ ╙ ╚ ╛ 
$A860 ╜ ╝ ╞ ╟ ╠ ╡ ╢ ╣ ╤ ╥ ╦ ╧ ╨ ╩ ╪ ╫ 
$A870 ╬ ╭ ╮ ╯ ╰ ╱ ╲ ╳ ▁ ▂ ▃ ▄ ▅ ▆ ▇    
$A880 █ ▉ ▊ ▋ ▌ ▍ ▎ ▏ ▓ ▔ ▕ ▼ ▽ ◢ ◣ ◤ 
$A890 ◥ ☉ ⊕ 〒 〝 〞  

code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F 
$A940 〡 〢 〣 〤 〥 〦 〧 〨 〩 ㊣ ㎎ ㎏ ㎜ ㎝ ㎞ ㎡ 
$A950 ㏄ ㏎ ㏑ ㏒ ㏕ ︰ ¬ ¦  ℡ ㈱  ‐    
$A960 ー ゛ ゜ ヽ ヾ 〆 ゝ ゞ ﹉ ﹊ ﹋ ﹌ ﹍ ﹎ ﹏ ﹐ 
$A970 ﹑ ﹒ ﹔ ﹕ ﹖ ﹗ ﹙ ﹚ ﹛ ﹜ ﹝ ﹞ ﹟ ﹠ ﹡    
$A980 ﹢ ﹣ ﹤ ﹥ ﹦ ﹨ ﹩ ﹪ ﹫        
$A990       〇 



procedure Tfm_Words.Button4Click(Sender: TObject);
var
  A, B: Cardinal;
  I, J: Integer;
  sHex: 
string;
  s1: WideString;
  ss: 
string;
begin   //GBK/4: 0xAA40~0xFEA0(部分) 扩充汉字 包括繁体
  ss :
= #13#10+
        
'                GBK/4: $AA40~$FEA0(部分) 扩充汉字全表                '#13#10+
        
'                                           jfyes 2008-07-07'#13#10#13#10;

  
for  I:=  $AA to $FE do
  
begin

     
for J := $40 to $A0 do
     
begin

       sHex :
= Format('$%.2x%.2x', [I, J]);
       A :
= SysUtils.StrToIntDef(sHex, 0);
       
       
if J = $40 then
         ss :
= ss+ 'code  +0 +1 +2 +3 +4 +5 +6 +7 +8 +9 +A +B +C +D +E +F ';


       
if J in [$40, $50,$60, $70, $80,$90, $A0, $B0, $C0, $D0, $E0, $F0] then
         ss :
= ss + #13#10 + sHex+ #32;

       
if J <> $7F then
         ss :
= ss + Char(I) + Char(J) + #32
       
else ss := ss + #32#32#32


     
end;
     ss :
= ss + #13#10#13#10;
  
end;

self.memo1.lines.add(ss, True);
end;
执行结果如下:
------------------------------------------------------------

                GBK/4: $AA40~$FEA0(部分) 扩充汉字全表  

posted on 2011-09-30 02:49  linyawen  阅读(1959)  评论(0编辑  收藏  举报