看板: BudaTech ◎ 佛典电子化讨论 板主: HeavenChow |
阅读文章: 第 1116/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
发信人: wiskey@Lion (大 师), 信区: BudaTech 标 题: Re: 补充中文函式 发信站: 狮子吼站 (Wed Dec 31 23:31:07 1997) 转信站: Lion ==> 於 Heaven (Heavenchow@Lion) 文中述及: : ==> 於 ray (huiray@Lion) 文中述及: : : 有一事要补充一下,辨识一个档案的第N个byte 是否为 : : 中文,不需要从第一个字元开始,只要从换行码 #13#10 : : 後的第一个字开始就可以了! : 是的. 因为後学写的都是从头找到尾, 故没提到这点. : 再提供一点, 我常在程式中将 #13 忽略不管, 只处理 #10 : , 这样就可以一并处理 unix 的档案了. :) : heaven 辨识一个档案的第N个字元是否为中文字,亦不需要从换行开始, 只要判断: 1)该byte是否为big-5之第1 byte? 若是====>则此byte为big-5之第1 byte 若不是==> 读取前一byte是否为big-5之第1 byte? 若是====> 则第1 项所找到之byte为big-5之第2 byte。 若不是==> 则第1 项所找到之byte为ASCII Code -- Ξ Origin: 狮子吼站 <cbs.ntu.edu.tw> [FROM: 168.95.4.17] |
阅读文章: 第 1116/2032 篇 | 上篇 | 下篇 | 回覆 | 转寄 | 转贴 | m H d | 返回 |
□ 台大狮子吼佛学专站 http://buddhaspace.org |