您有新信

 
补充中文函式
#1
ray
发信站: 狮子吼站 (Lion , 信区: BudaTech)
有一事要补充一下,辨识一个档案的第N个byte 是否为
中文,不需要从第一个字元开始,只要从换行码 #13#10
後的第一个字开始就可以了!

研发部
Sun Dec 28 11:46:38 1997
回覆 | 转寄 | 返回

Re: 补充中文函式
#2
Heaven
发信站: 狮子吼站 (Lion , 信区: BudaTech)
==> 於 ray (huiray@Lion) 文中述及:
: 有一事要补充一下,辨识一个档案的第N个byte 是否为
: 中文,不需要从第一个字元开始,只要从换行码 #13#10
: 後的第一个字开始就可以了!

  是的. 因为後学写的都是从头找到尾, 故没提到这点.
  再提供一点, 我常在程式中将 #13 忽略不管, 只处理 #10
  , 这样就可以一并处理 unix 的档案了. :)

  heaven
Tue Dec 30 16:17:32 1997
回覆 | 转寄 | 返回

Re: 补充中文函式
#3
大 师
发信站: 狮子吼站 (Lion , 信区: BudaTech)
==> 於 Heaven (Heavenchow@Lion) 文中述及:
: ==> 於 ray (huiray@Lion) 文中述及:
: : 有一事要补充一下,辨识一个档案的第N个byte 是否为
: : 中文,不需要从第一个字元开始,只要从换行码 #13#10
: : 後的第一个字开始就可以了!
:   是的. 因为後学写的都是从头找到尾, 故没提到这点.
:   再提供一点, 我常在程式中将 #13 忽略不管, 只处理 #10
:   , 这样就可以一并处理 unix 的档案了. :)
:   heaven


   辨识一个档案的第N个字元是否为中文字,亦不需要从换行开始,
   只要判断:
 1)该byte是否为big-5之第1 byte?
   若是====>则此byte为big-5之第1 byte
   若不是==>
       读取前一byte是否为big-5之第1 byte?
       若是====> 则第1 项所找到之byte为big-5之第2 byte。
       若不是==> 则第1 项所找到之byte为ASCII Code
Wed Dec 31 23:31:07 1997
回覆 | 转寄 | 返回

□ 台大狮子吼佛学专站  http://buddhaspace.org