2008-02-06から1日間の記事一覧

日本語におけるレガシーなエンコーディングでのミニマムなサブセット

などというものを考え始めています。とりあえず有力な候補としてはEUC-JPの場合には以下。 ASCII: 0x00-0x7F JIS X 0208: 第1バイト 0xA1-0xFE 第2バイト 0xA1-0xFEいろいろ考え合わせた上で半角カナとか機種依存文字とか水準の高い漢字とか非文字とかはいっ…