2004JISでは、字形の変更がなされたが、一部に例外がある。
その例外とは何か? ──
厳密に確定できるほど明確な調査ではないのだが、たぶん、次の (1)(2) がそうだと思える。 《 下記の 10行程度は、説明を書き改めました。 》
(1) XP の unicode (補助漢字 + 中国規格)にもともとあったもの[の略字]。
正字がもともと unicode に入っていたので、字形の変更をするわけには行かないもの。(もし字形の変更をすると、正字が二つできてダブってしまうので。)
(a)略字が簡易慣用字体でないもの。国語審議会では容認されないので、略字が残るのは妥当でないもの。正字は、JIS97 では「包摂」とされたが、JIS2000 と JIS2004 では「包摂」とされないもの。 (29字)
唖 焔 鴎 噛 侠 躯 鹸 麹 屡 繍 蒋 醤 蝉 掻 騨
箪 掴 填 顛 祷 涜 嚢 溌 醗 頬 麺 莱 蝋 攅
(b)略字が簡易慣用字体であるもの。国語審議会でも簡易慣用字体として容認されたもの。正字は、JIS97 と JIS2000 では「包摂」とされたが、JIS2004 では「包摂」とされないもの。(9字)
倶 剥 呑 嘘 妍 屏 并 痩 繋
(2) Vista の 2004JIS で追加されたもの。略字は俗字。(1字)
叱
──
以上では、略字で文字を表示しているが、それに対応する正字が表示可能である。
(1) は、XP の unicode でも対応する正字がある。
(2) は、XP の unicode では対応する正字がないが、Vista の 2004JIS では対応する正字がある。
──
略字に対応する正字については、別途、変換表を用意した。
→ 変換表
残る1字である「叱」の正字は、単独で出力すればいいだろう。
「手書き文字入力」や「部首入力」で正字を探してもいい。
コードポイントなら16進コードの 9873 である。
──
※ 本項の記述は、確認されたわけではないので、もしかしたら間違っているかもしれない。検証してくださる人がいれば、ご連絡下さい。(下記のコメント欄。)
2007年01月23日
過去ログ
* 分類の変更
* 変換表の追加
(修正の時点は、このコメントのタイムスタンプの時点です。 ↓ )
(1)
上記の39字が、2004JIS のフォントでも略字のままだ、ということは容易に確認できる。Vista のフォントで上記の 39字を表現して、略字のままであることを確認すればいい。(実は、XANO明朝というフォントで、確認済み。)
(2)
2004JIS のフォントでも略字のままであるのが、上記の39字だけであるかは、未確認。39字のほかに、略字のままの文字があるかもしれない。(ただし、たぶん、ないはずだ。)(厳密にチェックするには、83JISの略字 299字+2字について、一つ一つチェックすればよい。……ただし、労多くして益少なし。)
(3)
結局、本項から、何がわかるか? 次のことだ。
2004JISでは、たいていの文字が「字形の変更」を受けて、略字から正字になったのだが、例外がある。その例外は、次の二つ。
・ もともと正字が unicode にあった。
(もし略字を変更すると、重複して、やばい。)
・ 略字が簡易慣用字であるので、字形の変更をしなくてよい。
(正字は別のコードポイントで追加すればよい。)
この二つは独立する。重複が9字。前者だけが29字。後者だけが1字。
なお、この二つの場合だけを例外として、他のすべてについては「字形の変更」をする、というのが、今回の 2004JIS だ。……そして、そういうことを提案したのが、まさしく私なのである。
(他の文字コード関係者は、「略字の維持」または「正字の追加」のどちらかであって、「字形の変更」を主張したのは、私だけであった。どちらかと言えば、「正字の追加」が圧倒的に優勢であった。)
http://www.horagai.com/www/moji/int/tajima.htm
Unicodeには中国規格から入っていました。
『(b)X208 で「包摂」とされないもの。』ではないでしょう。『JIS X 0208:1997, JIS X 0213:2000では包摂とされていたが、JIS X 0213:2004では包摂とされないもの』じゃないんですか。
おっしゃるとおりですので、該当箇所を修正し、さらに情報不足の点を書き加えて、前後の記述を大幅に書き直しました。
タイムスタンプは下記。 ↓
タイムスタンプは下記。 ↓