2005年07月30日

◆ PC略字の廃止

 読売の夕刊記事(29日)から。
 “マイクロソフト社は、来年発売の次期パソコン用基本ソフト(OS)「ウィンドウズ・ビスタ」で使用する日本語の漢字約150字の形を変えることを決めた。新しいJIS漢字の字形を反映させたためで、今の「ウィンドウズXP」で使われている「葛」「辻」「飴」「蝕」「逗」などは基本的に表示・印刷できなくなる。”
http://www.yomiuri.co.jp/net/news/20050729nt0a.htm ──

さらに itmedia の記事も。
http://www.itmedia.co.jp/news/articles/0507/29/news049.html

 ──

 関連情報 2004年2月の「JIS漢字コード表の改正」
 
 (1) 報道記事
 http://pcweb.mycom.co.jp/news/2004/02/23/008.html
 
 (2) 経済産業省の発表
http://www.meti.go.jp/kohosys/press/0004964/

 (3) 同・人名漢字
http://www.meti.go.jp/press/20041221008/20041221008.html

 (4) まとめ・字形画像
http://www.eonet.ne.jp/~kotobukispace/ddt/jisx0213/02132004.html

 ── 

 ここに至るまでの過程(裏事情)は
 → 文字講堂
http://hp.vector.co.jp/authors/VA011700/moji/code00.htm
posted by 管理人 at 00:04| Comment(13) | TrackBack(0) |  文字規格 | 更新情報をチェックする
この記事へのコメント

 読売新聞(朝刊・解説面 2005-07-30 )に、続報がある。
  ・ JIS の改定案(2004)年では、168字の改定。
   しかし今回のMS方針では、148字のみの改定。
   差の20字はそのまま。字形差の少ないものらしい。詳細は不明。
  ・ 168字の改定の、具体的な字形差は、記事にある。
   紙面上の画像で示している。(文字にはならない。)
Posted by 管理人 at 2005年07月30日 13:36
Windows VISTA にしても Mac OS X にしても
Unicode 3.x 以上の仕様を実装していて
JIS第四水準漢字までを表示できるのだから、
いまさら字形の変更をするよりも、第三、
第四に新たな文字を追加してもらったほうが、
よかったと思います。
それがだめなら第一第二水準の字形を変更して
略字は第三、第四に移動するというのでもいいし。

すでに「蓮」の点2つの字はコードポイントが
あるわけで、いまさら「辻」だけは1文字しか
認めないというのはどうかと思います。
(もちろん全ての異体字を認めろというのではなく、
一度出したものを引っ込めるな、という意味で。)

だいいち「ウチは代々点がひとつだ」という辻さんは
どうなってしまうのでしょう。
Posted by 山猫 at 2005年07月30日 18:21
この問題については、「小泉の波立ち」をご覧ください。
(31日の日付。予告すると、8月1日も。)
Posted by 管理人 at 2005年07月30日 19:40
実際に使われている字ではなくて、国策で決められた字を使いなさいとは、まあそんなものなのでしょうか。日本は民主主義ですし、まあ、デモでもストでも起こせばいいんでしょうけどね。どうせトップダウンでもいいや、ってなるのかな。
まったく論理的に誤りがない記憶力抜群である頭の良いクルクルパーにつきあうのもほとほと莫迦莫迦しくなってきました。
Posted by 通りすがり at 2005年10月02日 01:34
誤解ばりばりの文章を書いてしまったようで申し訳ない限りです。私は理系の人間ですが、確かにすべての異字体が使えればよいとは思うのですが、現状で行おうとするとアプリを新たに作って新たな文字コードを使わざるを得ないとは思います。
もちろん、略字よりも正字の方が正しい字であることは間違いありませんし、JISコードにせよ正しい方向に行くのであれば歓迎できることだとは思います。
これからの問題として以下が現れてくるものと思われます。
(1)略字を正字にすることで略字を使わなければならない場合にどうするか
(2)旧環境への対応は可能か
(3)すべての正字が使えるのか(あるいはすべての略字が使えるのか)

私個人としては(1)については略字タグを使うことで旧環境においても略字として表示・検索が可能であるところまでは持っていけると思います。
また、(2)についてもシステムのリプレイスでなんとかなるものと思われますし、情報システムへのコンセンサスとして旧システムではこの字は出ないんだなというものが得られればそれでよいものとは思います。
あと、結局行き着くのが(3)かとは思いますが、すぐこれが実現できれば別に何の問題もありませんが、現実をみて現状の正字への置き換えがあるとすればこれで正解でしょう。

結局、現状の少ない文字集合を整理するしか日本語を守ることができないという現状を技術者が共有するところが原点と気づかされるところです。
TRON計画がスーパー301条の影響で停止してこれから進めなかった歴史など、結局はソフトウェア開発として自らの生計を守らざるを得ない現状や、新しいアプリを作るにしても競争の原理で作るならばまた新たな混乱を生じかねない現状も極めて残念でしかありません。
文字鏡を使おうと、まだ文字が足りないという現状や、正しさを守る難しさを痛感する次第ですし、今回の対応も現状としての妥当点を持っていると理解しました。
私個人としては、本当に古典の文字をシステムに入れるには外字なりビットマップによる文字に頼らざるを得ないものと思うなかで、現状として正しい文字が出るところまで持っていったという判断を理解した次第です。

ただ私も人様の名刺などを印刷する仕事をしたこともあり、現状において文字が足りない、ということだけはお伝えしたい限りです。先生がおっしゃるように正しさを守りたいお気持ちは汲みますが、何度も申し上げている通り、これは正しさの一部でしかありません。全部の文字が出る環境を作った訳ではないことだけはご理解頂かなければ、先生の文中にてあります通り、相当数の略字体への置換をEコマースサイト、住所録、名簿録、ひいては論文のヘッダーなどに対して行わなければならないおそれもあることだけは、別に新しい文字コードに正字を入れた場合となんら変わりがないことだけはお伝えします。
逆に言うと、業務として行う場合については、どのように大変であろうと対応いたしますので、仕事を増やさないでください。略字タグをつけた場合も、略字タグに対応した検索ソフトでないと検索できません。このアプリを作ったり、買ったりする必要があり、従来のシステムではこれらのアプリが動作するのか現時点では不明であり、なおかつ略字タグを検索ダイアログに入れた時点でシステムが止まるかもしれないのです。面倒だから、という理由はお考えにならなくてもよろしいかと存じます。仕事ならやります。何億桁でも計算します。以上です。
Posted by 通りすがり at 2005年10月02日 03:44
繰り返しますが、略字と正字を異なった文字コードにすると検索できなくなるというのは対応がなければ、というだけであり、現状においても各社死を覚悟して「あいまい検索」や「似た漢字を組み合わせた漢字を検索する機能」などを開発してきました。システムと紙に書いた文字とでは考え方が異なるということだけはお伝えしたいものであります。今回のように変更される文字数が少ないのであればアプリとしての対応はまだましなものであると理解しております。逆に同じ文字コードで文字が変わる方が途方もないことに思いますがいかがでしょうか。
これでは私が正しい日本文化を守らないようにしか思われないこととは思う中ですが、逆に文字コードを増やすなり、Unicodeを使うなり文字鏡を使うなりすればよいだけの話です。GoogleだってUnicodeの文字セットで表示されるのですから、別に交換不可能な符号とは思いません。また、今回の決定で正しい日本語が守られることがないことは再三申し上げますが文字数が足りませんから無理です。

だから、無用の混乱を減らしてください、といっているのです。
根本的解決ではありません。
小さい箇所だけ正しくなろうと、古文がVistaからすべて入力できるようになるわけでもなんでもないのです。
私だって、すべての古文が計算機に入れば非常に各界のご研究がお進みになられることは夢想する次第ですが、現状の新たな文字セットでは文字数が足りませんから、これでは端っこをいじくっただけであることだけは忘れないでください。
Posted by 通りすがり at 2005年10月02日 03:57
ご指摘の件は、文字コードの分野では、すでに何度も議論されてきたことです。
 もちろん、すべての文字を扱うには、大きな文字集合を備えた規格を採用するしかありません。現時点では、TRONコードが最善でしょう。この規格もちゃんとできています。(Windowsでは使えませんが。)
 文字コードの分野では、さまざまな努力が何十年もなされています。TRONコードにも、多大な労力が注がれました。国からも十億円の費用が拠出されました。その甲斐はあったようです。この規格は、確か、中国でも(部分的に)使われる、というような話を聞いた覚えもある。(うろ覚え。)

 一方、今回の改正は、あくまで「シフトJIS」という範囲内のことです。この範囲内で、おおまかに言って、「誤字を正す」という方針が取られただけです。これがあって、初めて、「シフトJISの文字数をいくらか増やす」ということが可能になりました。

 シフトJISをやめて、新たな文字集合を取れば、多くの文字集合を扱えます。ただし、その場合、文字コードが変更されるので、従来の文書では、互換性が取れなくなります。たとえば、unicode ですら、普通のテキストファイルでは扱えません。( unicode テキストという特殊なファイルになる。)
 文字集合の多さと、文字コードの互換性との、二者択一の状況があります。その範囲内で、「できる限り両立させよう」というのが、今回の新JISです。

 このことは、OSのバージョンアップにも似ているでしょう。MS-DOSないし16bit OSの規格にとらわれている限りは、進歩は望めない。だからといって、従来との互換性をなくしてしまうわけにも行かない。そこで、「互換性を保ったまま、最大限に機能を拡張する」という試みがなされ、同時に、「互換性のないまったく新しい規格も設定する」というふうになる。……どちらを選ぶかは、ユーザ次第です。
Posted by 管理人 at 2005年10月02日 09:34
私の誤解なのか知れませんが、仰られるように略字、正字という概念があるとはいえ、これは日本で流通した漢字であることには変わりないと思っております。これもまた、日本文化の1つと考えております。

どうも先生の記述を拝させていただくにあたり正字でないと日本文化が守れないように受け止められます。これでは日本人が使用した文字ではなく、過去の日本人が以前使った文字でないと日本文化が守れないように受け止められます。私としてはいずれも日本文化であると思っております。現在日本で使われている言葉にしても、昔の意味から変わったり正反対になる場合はいくらでもあり、言葉も生き物であれば漢字も生き物ではないでしょうか。実際に生活された御先祖様方がその実生活でお使いになられた略字です。これは日本文化です。

また、漢字を計算機上でやりとりする以前から略字は使われてきました。計算機より正字を無視する傾向を決定づけているとは思えませんが、ただ正字が使えないということですのでそのように受け止められるのも正当な理由かと思います。

私としては、字体が異なるのだから別の文字コードに追加すればいいじゃないかという意見です。なければ増やすことで、特に計算機が正字を無視する傾向を助長している訳ではないことは言えると思っております。

あと、字体が増えることで旧環境で文字が見えなくなることについてですが、昔でも第2水準漢字が見えないという環境もあったし、現在においてもそうは漢字は計算機内で使えない現状もあります。
文字鏡にせよ14万字ありますが、JISコードとなると1万字程度です。現状、計算機上で漢字の文書をすべて登録すること字体が困難である現状からすれば、現状は現状として受け入れることで対応すれば良いのではないかと思われてなりません。
仮に、今回の対応で正字が正しく打てるようになるテキストはあるかもしれません。が、逆にこれまでの略字が正しくテキストとして打てなくなる局面が発生することになります。
この流れもまた、日本文化の1つとして未来に受け継いでいくものの1つになると思っております。

どんなOSにもいえることですが、コンセントを抜けばハードディスクが飛んだり、1回ファイルを保存しただけでアンドゥが出来なくなったり、操作方法は各OS各バージョンまちまちであって、いわば現状のOSはおもちゃの延長線上です。ハッカーの余暇の道具でIT革命を起こしている。ここを正しくするという発想も私も持ち合わせておりません。先生が仰られるように正しい方向に持っていくことが出来るのであれば、それは幸いでしょう。

最後に、現状世界のOSに載っているUnicode用フォントにある略字も変更していく必要も生じます。ひいては、携帯電話やPOS端末、オンライン端末、DVDプレーヤなどの情報家電にあるような漢字ROMとして載っているものについてもファームのアップデートなどが要求される面もあるかもしれません。
そこまで注力しても、他の多くの正しい文字が打てない文字セットをどうしていじらないといけないのかは私の中では不思議なものを感じているのですが、いかがなものでしょうか?
Posted by 通りすがり at 2005年10月02日 11:00
通りすがりさんの意見は、まさしく主流派の意見です。珍しい意見ではありません。むしろ、文字コード関係者の誰もがそういうふうに考えていました。そうではない意見を出す私は、「トンデモ」と呼ばれてきました。
 しかし、紆余曲折の末に、最終的には、主流派とトンデモとの立場が逆転しました。いわば、「天動説」から「地動説」に変わるように。

 これが文字コードの問題の歴史です。とても一言では説明しきれないので、本サイト(Openブログ)のあちこちを読むほか、「文字講堂」の文献を一つ一つ読んだりすると、歴史的な経緯がわかるでしょう。一つだけ読んで簡単に読んで済ませたいなら、「略字侃侃諤諤」のページが読みやすいのでお勧めです。
 一般的な概説は、「ほら貝」のサイトに詳しい基礎情報があります。とはいえ、この分野に足を突っ込むと、とんでもない泥沼になりますから、素人はあまり足を踏み入れない方がいいとも言えます。

 なお、足を踏み入れても、何かが変わるわけではありません。規格はすでに決定済みですから。意見を言いたいのであれば、6年前に言うべきでした。
Posted by 管理人 at 2005年10月02日 12:41
横入り失礼します。
> 略字タグをつけた場合も、略字タグに対応した検索ソフトでないと検索できません。
異体字問題って、外国語にも昔からありますよね。
アクサン付文字のソーティングや、検索での問題などです。
(悪用例:http://japan.internet.com/webtech/20050209/12.html

テキスト(キャラクタ?)ではなくなってしまって根本的解決ではありませんが、
htmlで文字に色をつけるみたいに、xmlみたいな形で文字の追加情報として異体字を特定する方法が主流になってもいいと思います。
もちろん今存在しない文字の新規追加は無理ですけど。
Posted by itochan at 2005年10月03日 13:05
自治体内のみでの使用となるのかもしれませんが、とりあえず。
http://www.soumu.go.jp/kokusai/pdf/data_hyojyun_050322_07.pdf
Posted by かえで(yfi) at 2005年10月04日 00:49
情報(政府の方針)、ありがとうございます。

なお、私の見解は、前に示したことがあります。文字講堂の次の箇所。
http://hp.vector.co.jp/authors/VA011700/moji/codeitai.htm
の、 §4−9 の 《 提案 》
Posted by 管理人 at 2005年10月04日 14:08
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ