2007年01月23日

◆ 字形の変更の例外

2004JISでは、字形の変更がなされたが、一部に例外がある。
その例外とは何か? ──

 厳密に確定できるほど明確な調査ではないのだが、たぶん、次の (1)(2) がそうだと思える。 《 下記の 10行程度は、説明を書き改めました。 》

(1) XP の unicode (補助漢字 + 中国規格)にもともとあったもの[の略字]。

 正字がもともと unicode に入っていたので、字形の変更をするわけには行かないもの。(もし字形の変更をすると、正字が二つできてダブってしまうので。)

  (a)略字が簡易慣用字体でないもの。国語審議会では容認されないので、略字が残るのは妥当でないもの。正字は、JIS97 では「包摂」とされたが、JIS2000 と JIS2004 では「包摂」とされないもの。 (29字)

唖 焔 鴎 噛 侠 躯 鹸 麹 屡 繍 蒋 醤 蝉 掻 騨

箪 掴 填 顛 祷 涜 嚢 溌 醗 頬 麺 莱 蝋 攅


  (b)略字が簡易慣用字体であるもの。国語審議会でも簡易慣用字体として容認されたもの。正字は、JIS97 と JIS2000 では「包摂」とされたが、JIS2004 では「包摂」とされないもの。(9字)

倶 剥 呑 嘘 妍 屏 并 痩 繋

(2) Vista の 2004JIS で追加されたもの。略字は俗字。(1字)

 
 
 ──

 以上では、略字で文字を表示しているが、それに対応する正字が表示可能である。
 (1) は、XP の unicode でも対応する正字がある。
 (2) は、XP の unicode では対応する正字がないが、Vista の 2004JIS では対応する正字がある。

 ──

 略字に対応する正字については、別途、変換表を用意した。
   → 変換表
 
 残る1字である「叱」の正字は、単独で出力すればいいだろう。
 「手書き文字入力」や「部首入力」で正字を探してもいい。
 コードポイントなら16進コードの 9873 である。

 ──

 ※ 本項の記述は、確認されたわけではないので、もしかしたら間違っているかもしれない。検証してくださる人がいれば、ご連絡下さい。(下記のコメント欄。)
posted by 管理人 at 18:21| Comment(6) |  文字規格 | 更新情報をチェックする
この記事へのコメント
一部修正しました。
* 分類の変更
* 変換表の追加

 (修正の時点は、このコメントのタイムスタンプの時点です。 ↓ )
Posted by 管理人 at 2007年01月23日 22:41
管理人の補足。

 (1)
 上記の39字が、2004JIS のフォントでも略字のままだ、ということは容易に確認できる。Vista のフォントで上記の 39字を表現して、略字のままであることを確認すればいい。(実は、XANO明朝というフォントで、確認済み。)

 (2)
 2004JIS のフォントでも略字のままであるのが、上記の39字だけであるかは、未確認。39字のほかに、略字のままの文字があるかもしれない。(ただし、たぶん、ないはずだ。)(厳密にチェックするには、83JISの略字 299字+2字について、一つ一つチェックすればよい。……ただし、労多くして益少なし。)

 (3)
 結局、本項から、何がわかるか? 次のことだ。
 2004JISでは、たいていの文字が「字形の変更」を受けて、略字から正字になったのだが、例外がある。その例外は、次の二つ。

  ・ もともと正字が unicode にあった。
   (もし略字を変更すると、重複して、やばい。)
  ・ 略字が簡易慣用字であるので、字形の変更をしなくてよい。
   (正字は別のコードポイントで追加すればよい。)

 この二つは独立する。重複が9字。前者だけが29字。後者だけが1字。

 なお、この二つの場合だけを例外として、他のすべてについては「字形の変更」をする、というのが、今回の 2004JIS だ。……そして、そういうことを提案したのが、まさしく私なのである。
(他の文字コード関係者は、「略字の維持」または「正字の追加」のどちらかであって、「字形の変更」を主張したのは、私だけであった。どちらかと言えば、「正字の追加」が圧倒的に優勢であった。)
Posted by 管理人 at 2007年01月23日 23:52
(a)のうち、蝉騨箪の3字は補助漢字に入っていません。略字大好きの野村氏が断固拒絶したそうです。
http://www.horagai.com/www/moji/int/tajima.htm
Unicodeには中国規格から入っていました。

『(b)X208 で「包摂」とされないもの。』ではないでしょう。『JIS X 0208:1997, JIS X 0213:2000では包摂とされていたが、JIS X 0213:2004では包摂とされないもの』じゃないんですか。
Posted by 通行人 at 2007年02月04日 00:58
訂正「蝉騨箪の3字」→「蝉騨箪相当の康煕字典体3字」
Posted by 通行人 at 2007年02月04日 01:06
情報をありがとうございました。
おっしゃるとおりですので、該当箇所を修正し、さらに情報不足の点を書き加えて、前後の記述を大幅に書き直しました。
タイムスタンプは下記。  ↓
Posted by 管理人 at 2007年02月04日 10:27
記述が不正確だったので、再度、書き直しました。
 タイムスタンプは下記。  ↓
Posted by 管理人 at 2007年02月04日 10:46
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ