2007年03月12日

◆ 外字領域の拡張


 前項では、「シフトJISの拡張」という案を示した。これについての話題。
 Windows では外字領域として 1880字のコードポイントを占めている。
 では、この領域を、どうするべきか? 使うべきか使わないべきか。

 ( ※ 文字コード専門家向けの細かな話。一般向けではありません。) ──

 シフトJISを拡張した場合、今まで外字領域にあった 1880字のコードポイントが問題だ。そのまま外字領域として残すと、拡張シフトJISでは コードポイントが使えなくなるので、拡張シフトJISの領域が 1880字分だけ小さくなってしまう。これではがもったいない。(外字領域の分が無駄になってしまう。使えない領域があることになる。)
 かといって、これを廃止してしまうと、今まで外字を使っていた人が不便になる。(上位互換性がなくなる。外字を使っていた企業ユーザーの反発が怖い。)
 この両者(外字領域を残すか否か)は、あちらが立てばこちらが立たず、という関係だ。二者択一である。では、どうすればいいか? 
 
 私は、次のように提案する。

 ──

 提案:
  • どちらにするかは、各人に任せる。
    換言すれば、各人がどちらでも取れるようにする。
  • 基本的には、外字領域をそっくりそのまま残す。
    従って、従来の外字ユーザーは、そのまま使える。
  • ただし、初期設定では、外字領域はJISの文字(難読漢字)で埋められている。
    これらの難読漢字は、日常的な使用はなされない字だが、とにかく、指定済み。
  • 通常のユーザーは、初期設定に従って、JISの難読文字を使う。
  • 一部のユーザーは、初期設定を変更して、自分の外字ファイルで指定し直す。
  • 外字領域の文字は、フォント切替が可能である。各フォントごとに字形が異なる。
    したがって、「MS明朝では難読漢字、特殊フォントでは指定された外字」というふうに切り替えることが可能になる。
  • 特定分野の学界や業界では、外字領域を丸ごと変更することで、特殊文字を使える。
    たとえば、漫画用に「あ」に濁点を付けたような文字を含む文字セットを使う。
  • これらの文字は、「文字化け」の危険はある。あらかじめそう理解した上で使う。
    文字化けがいやならば、 unicode を使うか、フォント指定で使うか、どちらかだ。
  • つまり、文字化けのリスクを自分自身で負うことで、使うことにする。
  • ただし、一般的に素人が使うときには、IMEワープロやエディタが警告すればよい。
    「その文字は文字化けの危険があります」と。これでミスの恐れはなくなる。

 ──

 現実には、普通の人には関係ないはずだ。特別な文字のことであり、実用上では目にすることはほとんどないだろう。
 また、実際に使う場合には、PDF のようにフォント指定で使うはずだから、文字化けの問題が起こることはまずないはずだ。(PDFを作成するときには、ソフトが自動的にフォントを埋め込んでくれるから、普通の人は特にあれこれと意識することなく、ちゃんと利用できる。)

 結局、「わずかな文字化けの危険を理解しながらも、多様な文字を使うか」あるいは「わずかな文字化けの危険があるせいで、1880字の文字をまったく使わないか」という、二者択一。
 「あつものに懲りてなますを吹く」という臆病な態度を取るかどうか、という問題。
 なお、実を言うと、現状だって、1880字については、文字化けの可能性はある。ただし、実際には、問題にはならない。外字は誰だって私的に使うだけだからだ。そんなことは誰だって知っている。「外字が文字化けした」を騒ぐ人はいない。今後もそれと同様にすればいいだけだ。
 つまり、普通の人は、「外字や難読漢字なんかどうせ使わないから関係ない」と思っていればいい。

( ※ 南堂私案では、この領域は「第五水準」として指定されている。そこには余り使われない漢字が収まる。そのことは既述。本項では、第五水準をユーザー外字に丸ごと置き換え可能、という形で、ユーザー外字をそのまま残せる方針を示している。その理由は、上位互換性を完璧にするため。)
posted by 管理人 at 22:45 | Comment(0) |  文字規格 | 更新情報をチェックする
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ