読売の夕刊記事(29日)から。
“マイクロソフト社は、来年発売の次期パソコン用基本ソフト(OS)「ウィンドウズ・ビスタ」で使用する日本語の漢字約150字の形を変えることを決めた。新しいJIS漢字の字形を反映させたためで、今の「ウィンドウズXP」で使われている「葛」「辻」「飴」「蝕」「逗」などは基本的に表示・印刷できなくなる。”
http://www.yomiuri.co.jp/net/news/20050729nt0a.htm ──
さらに itmedia の記事も。
http://www.itmedia.co.jp/news/articles/0507/29/news049.html
──
関連情報 2004年2月の「JIS漢字コード表の改正」
(1) 報道記事
http://pcweb.mycom.co.jp/news/2004/02/23/008.html
(2) 経済産業省の発表
http://www.meti.go.jp/kohosys/press/0004964/
(3) 同・人名漢字
http://www.meti.go.jp/press/20041221008/20041221008.html
(4) まとめ・字形画像
http://www.eonet.ne.jp/~kotobukispace/ddt/jisx0213/02132004.html
──
ここに至るまでの過程(裏事情)は
→ 文字講堂
http://hp.vector.co.jp/authors/VA011700/moji/code00.htm
2005年07月30日
この記事へのトラックバック
過去ログ

http://release.nikkei.co.jp/detail.cfm?relID=106685&lindID=1
http://enterprise.watch.impress.co.jp/cda/software/2005/07/29/5848.html
http://www.microsoft.com/japan/presspass/detail.aspx?newsid=2353
読売新聞(朝刊・解説面 2005-07-30 )に、続報がある。
・ JIS の改定案(2004)年では、168字の改定。
しかし今回のMS方針では、148字のみの改定。
差の20字はそのまま。字形差の少ないものらしい。詳細は不明。
・ 168字の改定の、具体的な字形差は、記事にある。
紙面上の画像で示している。(文字にはならない。)
Unicode 3.x 以上の仕様を実装していて
JIS第四水準漢字までを表示できるのだから、
いまさら字形の変更をするよりも、第三、
第四に新たな文字を追加してもらったほうが、
よかったと思います。
それがだめなら第一第二水準の字形を変更して
略字は第三、第四に移動するというのでもいいし。
すでに「蓮」の点2つの字はコードポイントが
あるわけで、いまさら「辻」だけは1文字しか
認めないというのはどうかと思います。
(もちろん全ての異体字を認めろというのではなく、
一度出したものを引っ込めるな、という意味で。)
だいいち「ウチは代々点がひとつだ」という辻さんは
どうなってしまうのでしょう。
(31日の日付。予告すると、8月1日も。)
まったく論理的に誤りがない記憶力抜群である頭の良いクルクルパーにつきあうのもほとほと莫迦莫迦しくなってきました。
もちろん、略字よりも正字の方が正しい字であることは間違いありませんし、JISコードにせよ正しい方向に行くのであれば歓迎できることだとは思います。
これからの問題として以下が現れてくるものと思われます。
(1)略字を正字にすることで略字を使わなければならない場合にどうするか
(2)旧環境への対応は可能か
(3)すべての正字が使えるのか(あるいはすべての略字が使えるのか)
私個人としては(1)については略字タグを使うことで旧環境においても略字として表示・検索が可能であるところまでは持っていけると思います。
また、(2)についてもシステムのリプレイスでなんとかなるものと思われますし、情報システムへのコンセンサスとして旧システムではこの字は出ないんだなというものが得られればそれでよいものとは思います。
あと、結局行き着くのが(3)かとは思いますが、すぐこれが実現できれば別に何の問題もありませんが、現実をみて現状の正字への置き換えがあるとすればこれで正解でしょう。
結局、現状の少ない文字集合を整理するしか日本語を守ることができないという現状を技術者が共有するところが原点と気づかされるところです。
TRON計画がスーパー301条の影響で停止してこれから進めなかった歴史など、結局はソフトウェア開発として自らの生計を守らざるを得ない現状や、新しいアプリを作るにしても競争の原理で作るならばまた新たな混乱を生じかねない現状も極めて残念でしかありません。
文字鏡を使おうと、まだ文字が足りないという現状や、正しさを守る難しさを痛感する次第ですし、今回の対応も現状としての妥当点を持っていると理解しました。
私個人としては、本当に古典の文字をシステムに入れるには外字なりビットマップによる文字に頼らざるを得ないものと思うなかで、現状として正しい文字が出るところまで持っていったという判断を理解した次第です。
ただ私も人様の名刺などを印刷する仕事をしたこともあり、現状において文字が足りない、ということだけはお伝えしたい限りです。先生がおっしゃるように正しさを守りたいお気持ちは汲みますが、何度も申し上げている通り、これは正しさの一部でしかありません。全部の文字が出る環境を作った訳ではないことだけはご理解頂かなければ、先生の文中にてあります通り、相当数の略字体への置換をEコマースサイト、住所録、名簿録、ひいては論文のヘッダーなどに対して行わなければならないおそれもあることだけは、別に新しい文字コードに正字を入れた場合となんら変わりがないことだけはお伝えします。
逆に言うと、業務として行う場合については、どのように大変であろうと対応いたしますので、仕事を増やさないでください。略字タグをつけた場合も、略字タグに対応した検索ソフトでないと検索できません。このアプリを作ったり、買ったりする必要があり、従来のシステムではこれらのアプリが動作するのか現時点では不明であり、なおかつ略字タグを検索ダイアログに入れた時点でシステムが止まるかもしれないのです。面倒だから、という理由はお考えにならなくてもよろしいかと存じます。仕事ならやります。何億桁でも計算します。以上です。
これでは私が正しい日本文化を守らないようにしか思われないこととは思う中ですが、逆に文字コードを増やすなり、Unicodeを使うなり文字鏡を使うなりすればよいだけの話です。GoogleだってUnicodeの文字セットで表示されるのですから、別に交換不可能な符号とは思いません。また、今回の決定で正しい日本語が守られることがないことは再三申し上げますが文字数が足りませんから無理です。
だから、無用の混乱を減らしてください、といっているのです。
根本的解決ではありません。
小さい箇所だけ正しくなろうと、古文がVistaからすべて入力できるようになるわけでもなんでもないのです。
私だって、すべての古文が計算機に入れば非常に各界のご研究がお進みになられることは夢想する次第ですが、現状の新たな文字セットでは文字数が足りませんから、これでは端っこをいじくっただけであることだけは忘れないでください。
もちろん、すべての文字を扱うには、大きな文字集合を備えた規格を採用するしかありません。現時点では、TRONコードが最善でしょう。この規格もちゃんとできています。(Windowsでは使えませんが。)
文字コードの分野では、さまざまな努力が何十年もなされています。TRONコードにも、多大な労力が注がれました。国からも十億円の費用が拠出されました。その甲斐はあったようです。この規格は、確か、中国でも(部分的に)使われる、というような話を聞いた覚えもある。(うろ覚え。)
一方、今回の改正は、あくまで「シフトJIS」という範囲内のことです。この範囲内で、おおまかに言って、「誤字を正す」という方針が取られただけです。これがあって、初めて、「シフトJISの文字数をいくらか増やす」ということが可能になりました。
シフトJISをやめて、新たな文字集合を取れば、多くの文字集合を扱えます。ただし、その場合、文字コードが変更されるので、従来の文書では、互換性が取れなくなります。たとえば、unicode ですら、普通のテキストファイルでは扱えません。( unicode テキストという特殊なファイルになる。)
文字集合の多さと、文字コードの互換性との、二者択一の状況があります。その範囲内で、「できる限り両立させよう」というのが、今回の新JISです。
このことは、OSのバージョンアップにも似ているでしょう。MS-DOSないし16bit OSの規格にとらわれている限りは、進歩は望めない。だからといって、従来との互換性をなくしてしまうわけにも行かない。そこで、「互換性を保ったまま、最大限に機能を拡張する」という試みがなされ、同時に、「互換性のないまったく新しい規格も設定する」というふうになる。……どちらを選ぶかは、ユーザ次第です。
どうも先生の記述を拝させていただくにあたり正字でないと日本文化が守れないように受け止められます。これでは日本人が使用した文字ではなく、過去の日本人が以前使った文字でないと日本文化が守れないように受け止められます。私としてはいずれも日本文化であると思っております。現在日本で使われている言葉にしても、昔の意味から変わったり正反対になる場合はいくらでもあり、言葉も生き物であれば漢字も生き物ではないでしょうか。実際に生活された御先祖様方がその実生活でお使いになられた略字です。これは日本文化です。
また、漢字を計算機上でやりとりする以前から略字は使われてきました。計算機より正字を無視する傾向を決定づけているとは思えませんが、ただ正字が使えないということですのでそのように受け止められるのも正当な理由かと思います。
私としては、字体が異なるのだから別の文字コードに追加すればいいじゃないかという意見です。なければ増やすことで、特に計算機が正字を無視する傾向を助長している訳ではないことは言えると思っております。
あと、字体が増えることで旧環境で文字が見えなくなることについてですが、昔でも第2水準漢字が見えないという環境もあったし、現在においてもそうは漢字は計算機内で使えない現状もあります。
文字鏡にせよ14万字ありますが、JISコードとなると1万字程度です。現状、計算機上で漢字の文書をすべて登録すること字体が困難である現状からすれば、現状は現状として受け入れることで対応すれば良いのではないかと思われてなりません。
仮に、今回の対応で正字が正しく打てるようになるテキストはあるかもしれません。が、逆にこれまでの略字が正しくテキストとして打てなくなる局面が発生することになります。
この流れもまた、日本文化の1つとして未来に受け継いでいくものの1つになると思っております。
どんなOSにもいえることですが、コンセントを抜けばハードディスクが飛んだり、1回ファイルを保存しただけでアンドゥが出来なくなったり、操作方法は各OS各バージョンまちまちであって、いわば現状のOSはおもちゃの延長線上です。ハッカーの余暇の道具でIT革命を起こしている。ここを正しくするという発想も私も持ち合わせておりません。先生が仰られるように正しい方向に持っていくことが出来るのであれば、それは幸いでしょう。
最後に、現状世界のOSに載っているUnicode用フォントにある略字も変更していく必要も生じます。ひいては、携帯電話やPOS端末、オンライン端末、DVDプレーヤなどの情報家電にあるような漢字ROMとして載っているものについてもファームのアップデートなどが要求される面もあるかもしれません。
そこまで注力しても、他の多くの正しい文字が打てない文字セットをどうしていじらないといけないのかは私の中では不思議なものを感じているのですが、いかがなものでしょうか?
しかし、紆余曲折の末に、最終的には、主流派とトンデモとの立場が逆転しました。いわば、「天動説」から「地動説」に変わるように。
これが文字コードの問題の歴史です。とても一言では説明しきれないので、本サイト(Openブログ)のあちこちを読むほか、「文字講堂」の文献を一つ一つ読んだりすると、歴史的な経緯がわかるでしょう。一つだけ読んで簡単に読んで済ませたいなら、「略字侃侃諤諤」のページが読みやすいのでお勧めです。
一般的な概説は、「ほら貝」のサイトに詳しい基礎情報があります。とはいえ、この分野に足を突っ込むと、とんでもない泥沼になりますから、素人はあまり足を踏み入れない方がいいとも言えます。
なお、足を踏み入れても、何かが変わるわけではありません。規格はすでに決定済みですから。意見を言いたいのであれば、6年前に言うべきでした。
> 略字タグをつけた場合も、略字タグに対応した検索ソフトでないと検索できません。
異体字問題って、外国語にも昔からありますよね。
アクサン付文字のソーティングや、検索での問題などです。
(悪用例:http://japan.internet.com/webtech/20050209/12.html )
テキスト(キャラクタ?)ではなくなってしまって根本的解決ではありませんが、
htmlで文字に色をつけるみたいに、xmlみたいな形で文字の追加情報として異体字を特定する方法が主流になってもいいと思います。
もちろん今存在しない文字の新規追加は無理ですけど。
http://www.soumu.go.jp/kokusai/pdf/data_hyojyun_050322_07.pdf
なお、私の見解は、前に示したことがあります。文字講堂の次の箇所。
http://hp.vector.co.jp/authors/VA011700/moji/codeitai.htm
の、 §4−9 の 《 提案 》