前項では、「シフトJISの拡張」という案を示した。これについての話題。
Windows では外字領域として 1880字のコードポイントを占めている。
では、この領域を、どうするべきか? 使うべきか使わないべきか。
( ※ 文字コード専門家向けの細かな話。一般向けではありません。) ──
シフトJISを拡張した場合、今まで外字領域にあった 1880字のコードポイントが問題だ。そのまま外字領域として残すと、拡張シフトJISでは コードポイントが使えなくなるので、拡張シフトJISの領域が 1880字分だけ小さくなってしまう。これではがもったいない。(外字領域の分が無駄になってしまう。使えない領域があることになる。)
かといって、これを廃止してしまうと、今まで外字を使っていた人が不便になる。(上位互換性がなくなる。外字を使っていた企業ユーザーの反発が怖い。)
この両者(外字領域を残すか否か)は、あちらが立てばこちらが立たず、という関係だ。二者択一である。では、どうすればいいか?
私は、次のように提案する。
──
提案:
- どちらにするかは、各人に任せる。
換言すれば、各人がどちらでも取れるようにする。 - 基本的には、外字領域をそっくりそのまま残す。
従って、従来の外字ユーザーは、そのまま使える。 - ただし、初期設定では、外字領域はJISの文字(難読漢字)で埋められている。
これらの難読漢字は、日常的な使用はなされない字だが、とにかく、指定済み。 - 通常のユーザーは、初期設定に従って、JISの難読文字を使う。
- 一部のユーザーは、初期設定を変更して、自分の外字ファイルで指定し直す。
- 外字領域の文字は、フォント切替が可能である。各フォントごとに字形が異なる。
したがって、「MS明朝では難読漢字、特殊フォントでは指定された外字」というふうに切り替えることが可能になる。 - 特定分野の学界や業界では、外字領域を丸ごと変更することで、特殊文字を使える。
たとえば、漫画用に「あ」に濁点を付けたような文字を含む文字セットを使う。 - これらの文字は、「文字化け」の危険はある。あらかじめそう理解した上で使う。
文字化けがいやならば、 unicode を使うか、フォント指定で使うか、どちらかだ。 - つまり、文字化けのリスクを自分自身で負うことで、使うことにする。
- ただし、一般的に素人が使うときには、IMEワープロやエディタが警告すればよい。
「その文字は文字化けの危険があります」と。これでミスの恐れはなくなる。
──
現実には、普通の人には関係ないはずだ。特別な文字のことであり、実用上では目にすることはほとんどないだろう。
また、実際に使う場合には、PDF のようにフォント指定で使うはずだから、文字化けの問題が起こることはまずないはずだ。(PDFを作成するときには、ソフトが自動的にフォントを埋め込んでくれるから、普通の人は特にあれこれと意識することなく、ちゃんと利用できる。)
結局、「わずかな文字化けの危険を理解しながらも、多様な文字を使うか」あるいは「わずかな文字化けの危険があるせいで、1880字の文字をまったく使わないか」という、二者択一。
「あつものに懲りてなますを吹く」という臆病な態度を取るかどうか、という問題。
なお、実を言うと、現状だって、1880字については、文字化けの可能性はある。ただし、実際には、問題にはならない。外字は誰だって私的に使うだけだからだ。そんなことは誰だって知っている。「外字が文字化けした」を騒ぐ人はいない。今後もそれと同様にすればいいだけだ。
つまり、普通の人は、「外字や難読漢字なんかどうせ使わないから関係ない」と思っていればいい。
( ※ 南堂私案では、この領域は「第五水準」として指定されている。そこには余り使われない漢字が収まる。そのことは既述。本項では、第五水準をユーザー外字に丸ごと置き換え可能、という形で、ユーザー外字をそのまま残せる方針を示している。その理由は、上位互換性を完璧にするため。)