2005年08月06日

◆ 機種依存文字

 前日分では書き落としたが、機種依存文字の問題もある。 ──

 Windows には、機種依存文字がかなりある。丸数字などだ。これらは、世間でもそこそこ使われている。
 機種依存文字は、同じコードポイントで、JIS X0213 とは異なる文字が使われている。同じコードポイントで別の文字が共存することになるから、当然、混乱が起こるだろう。

 この件は、南堂私案では問題が起こらないが、JIS X0213 は問題が生じる。
 Microsoft がどうするかというと、やはり、独自の文字規格を定めるわけには行かないから、JIS X0213 を採用するのだろう。……当然、混乱が起こるだろう。

 ※
 どうしてこうなったか? 新JIS規格委員会が、メンツにこだわるあまり、南堂私案を無視するから、世間は大迷惑をこうむる。世間が「あいつはトンデモだ」と非難しているせいで、そのツケを自分たち自身が払うわけだ。

 昔々、「狼が来た」と叫ぶ少年を「トンデモだ」と見なしていた人々は、みんな狼に食い殺されてしまいました。

 ──────

 さらに補足。
 機種依存文字はまったく駄目になったのではなくて、丸数字やローマ数字は大丈夫だ。ABCなどの丸数字と、UVWなどのローマ数字・大文字は、Windows に関する限り、現在の文字をそのまま使える。 などの省略文字も、同様に、現在の文字をそのまま使える。
《 以上の文字は、機種依存文字であるから、Windows でしか正常に表示されない。Mac では文字化けする。》

 というわけで、丸数字とローマ数字は、現時点では「機種依存文字」とされていて、利用が制約されるが、これからは、かなりおおっぴらに利用できることになる。

 ただし、注意。ローマ数字は、13区のローマ数字のみだ。他のローマ数字・小文字は、駄目である。

 ──
 ※
 実は、ABCなどの丸数字と、UVWなどのローマ数字・大文字と、省略文字は、「訂正すべし」と私(など)が指摘したのを受けて、初期の新JIS規格の案(草案)から、あとで変更されたものである。(一部は従来の文字がそのまま据え置かれ、一部は空白のコードポイントとなった。いずれにせよ、初期の草案では別の漢字を割り当てられていたのが、正式案では変更された。) 
 というわけで、改定されたあとの正式案では、文字化けの危険は起こらなくなった。
 一方、ローマ数字・小文字は、私の指摘を無視している。草案と同じで、あえて違う文字を置くようにしている。というわけで、ローマ数字・小文字については、文字化けが起こる。「草〓」(くさなぎ)の二字めも同様だ。(「鹿」の下に「米」という文字に文字化けする。)他にもたくさんの機種依存文字がある。これらも同様であり、文字化けをする。
 これらの文字は、私の指摘を受け入れておけば、何も問題は起こらなかったのに、あえて文字化けを起こす仕様にしているわけだ。「それは仕様です」というわけ。(どこかで聞いた言葉ですね。)そのせいで、あちこちでトラブル続出する設定を、意図的に取り込むするわけだ。

 ──

 ※
 ついでに、余談。現状における文字化けの話。
 上記では「〓」という記号で「なぎ」を意図している(表示はしていない)。なぜかというと、他の面で問題があるからだ。
 たとえば、このブログでは、高いコードポイントの機種依存文字を入力すると、その文字以降の文字がすべて文字化けしてしまうからだ。上記の例では、くさなぎ云々の語句がすべて、ひどく文字化けする。(ブログが unix 系の文字コードを使っているせい。)
 前にこのブログでも、文字化けが発生したことがあるが、その場合もたぶん、機種依存文字を使ったせいだろう。
 というわけで、「今すぐ使ってもあまり問題のない機種依存文字」は、丸数字とローマ数字・大文字ぐらいに限られるようだ。
posted by 管理人 at 16:21| Comment(0) | TrackBack(0) |  文字規格 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ