2005年08月22日

◆ シフトJISで

 今回の文字規格の変更では、文字コード自体は維持された。すなわち、シフトJISである。一方、これを変更する、という案もあった。 ──

 シフトJISというのは、本来的に、限界のある規格である。どういじっても、十分な文字数は収められない。そこで、全面改革を主張する人もいた。「シフトJISを廃止せよ」という方針のもとで、別の新規格を主張するわけだ。たとえば、次のように。

  ・ unicode (固定長)
  ・ unicode (可変長・サロゲートペア)
  ・ iso 2022 拡張
  ・ CIDフォント
  ・ TRON規格
  ・ 異体字タグつきの長いバイトを使う新規格

 あれやこれやだ。で、これらに共通する難点がある。それは、こうだ。
 「従来のパソコンでは使えないので、パソコンを買い換える必要がある。買い換えない場合には、文字が消失する」

 たとえば、unicode がある。これは、現段階でこそかなり普及しているが、互換性は十分でない。Windows95では使えない。ワープロ専用機でも駄目だ。携帯やPDAでも、使えないものが多いだろう。
 他も同様だ。文字鏡方式(フォント切り替え)なら、かろうじて半分セーフだが、他の規格は、OSが対応していないので、新たなOSを搭載したパソコンに買い換える必要がある。さもないと、文字がまったく見えない。

 一方、シフトJISならば、従来の環境を維持できる。たとえば、Windows95のパソコンでも、前項に示した無料フォントを使えば、大丈夫。年末に発売されるはずの年賀状ソフトのフォントを使ってもいい。さらに言えば、何もしなくても、たいして問題はない。文字がまったく消失するということはない。(字形の変更がされた部分については、だが。それ以外の「區鳥」は、事情が別だが。)……つまり、何もしなくても、単に現状維持となるだけだ。悪くなるわけではない。

 シフトJISは共通基盤となっている。この共通基盤を維持することが、言語の共通性を維持するために、とても大事なのだ。「特定のアプリがあれば」とか、「特定のOSがあれば」という発想では、共通基盤が維持されなくなる。

 ひところは、「unicode が採用されれば、unicode が全面的に普及するだろう」などと見なされたこともある。だが、現実には、シフトJISの方が圧倒的に優勢だ。このOpen ブログを初め、ほとんどのサイトでは、シフトJIS(または符号化方式がちょっと違うだけの他方式: unix系)が使われている。UTF-8 のサイトは、非常に少ない。
 では、なぜ、そうなったのか? なぜ、高機能な unicode が普及せず、低機能のシフトJISが、いつまでも維持されるのか? 簡単だ。シフトJISでも、まったく困らないからだ。普通の文字はすべてシフトJISで済む。例外的な特殊な文字も、シフトJISという共通基盤を用いて、その上でHTMLのマークアップを使えば、unicode の文字でさえ使える。とすれば、文字コードに、UTF-8 という特殊なものを使う必要はないからだ。また、そんなものを使えば、ファイルサイズが長くなるなどのデメリットがある。メリットよりも、デメリットの方が大きい。

 言語においては、最も大切なのは、「共通基盤」であり、「高機能性」なんかではないのだ。そして、そういう思想があるからこそ、人々は同じ共通基盤の上で、異なる機器を使いながら、相互にコミュニケーションができるわけだ。
 言語の最大の機能は、コミュニケーションである。「文字はデータ処理のためにある」とブログで書いている人もいたが、だったら、その人は、自分の意見をブログで書いたとき、「自分は何をしているのか」と考えた方がいい。自分のやっていることを自分でも理解できない人々が、言語の機能を忘れながら、無自覚に言語を使うのだ。(たいていは、変な日本語で。)

 ・・・・・・・・・・・・・・・・・・

 【 追記 】
 「UTF-8 を使っているサイトは非常に少ない」と書いたが、例外的に、UTF-8 を使っている大手のサイトがある。google だ。2004年の春に、文字コードを変更して、原則として UTF-8 になった。
 で、どうなったか? 私の旧型パソコン(Windows98)は、対応できなかった。google に接続するたびに、異常を起こした。たいていは、マシンがビジー状態になってストップするだけであり、再起動すれば直った。しかし、あるときついに、ビジー状態のあげく、CPUが過熱して、パソコンが壊れてしまった。
 つまり、UTF-8 という文字コードを採用したせいで、パソコンが壊れてしまったわけだ。同じ被害にあった人は、たくさんいる、と思う。MSのバグやウィルスのバグよりももっと恐ろしいのが、文字コードの規格変更だ。やっていること自体は、別に法律違反ではない(法律を書き換えるのと同じだから)のだが、現実が規格に対応できないので、パソコンが破壊されるわけだ。
 世の中には旧型のパソコンを使っている人がいる以上、そういう人のことを忘れるべきではない。それが「共通基盤を維持する」ということの意味だ。「自分さえ文字が使えればいい」という発想では駄目なのだ。(字体ならば、自分だけが勝手な変更をしてもいいが、文字規格そのものをあれこれといじるべきではないのだ。)

 【 追記2 】
 上記では UTF-8 のエラーを報告したが、これは Windows98 というOSに原因があった可能性が高い。というのは、MS-IE で異常が起こっただけでなく、秀丸でも異常が起こったからだ。
 秀丸があるときバージョンアップして、 UTF-8 に対応するようになった。そこで私はさっそく秀丸で UTF-8 のファイルを開いたのだが、秀丸がビジー状態になった(画面上で無反応になった)。
 この異常を秀丸の作者に報告したところ、まさしくそうなることを確認した。常にそうなるわけではなくて、私の提供したファイル(かなり大サイズのファイル)ではそうなったわけだ。
 この時点で、秀丸は、単に UTF-8 に対応しただけである。その対応法は、秀丸が細かな文字コード制御ソフトを作成したはずがないから、Windows98 のOSに依存したものであっただろう。ライブラリか何かを使ったはずだ。で、そこで不具合が起こって、ビジー状態になったわけだ。……これは、秀丸のせいというよりは、Windows98 のせいだと思える。
 ま、責任が誰があるかは、どうでもいい。いずれにせよ、基本システムを大がかりに変更するようなことをやると、初期にはいろいろとトラブルが起こるわけだ。というわけで、前述の通り、「文字規格そのものをあれこれといじるべきではないのだ」という結論になる。
posted by 管理人 at 01:38| Comment(8) | TrackBack(0) |  文字規格 | 更新情報をチェックする
この記事へのコメント
注意書き。
 このサイトは、掲示板機能がありますが、南堂の悪口を書くためのゴミ掲示板ではありません。
 批判するのは構いませんが、正当な批判をするのであれば、自分の氏名あるいは身元などをある程度は明らかにした上で、自分のブログまたはホームページにお書き下さい。その上で、Nando ブログの該当箇所に、「ここを見てくれ」というリンクを記すといいでしょう。
 なお、意味のある内容もなしに、単に罵詈雑言だけを書きたい場合は、落書き専用の巨大掲示板があるので、そこにお書き下さい。
Posted by 管理人 at 2005年08月22日 21:36
>今回の文字規格の変更では、文字コード自体は維持された。すなわち、シフトJISである。一方、これを変更する、という案もあった。

と書かれているのですが、これはいったい「いつ」の話なんでしょう? 少なくともJIS X 0213の2004年改正においては、文字コードの変更をおこなうという案はありませんでしたが?
Posted by 安岡孝一 at 2005年08月28日 00:26
直接の回答は、「ほら貝」のページに記述がありますから参照してください。unicode (固定長)や iso 2022 拡張が提案されたのは非常に古い時代だし、サロゲートペアもかなり古い。TRONも非常に古い。文字コードの歴史では、さまざまな提案が古くからなされています。
 なお、誤解されると困るのですが、私が記しているのは、JIS規格委員会の議論ではありません。つまり、「実施するか否か」の議論ではなくて、方式の技術的な案のことです。「議論」ではなく、「案の提示」です。
 ついでに言えば、JISの規格委員会は、JISだけを議論するのであり、unicode やTRON やCIDの規格について議論することはありません。これらについて「いつ議論したか」を問うても、無意味です。
 また、私がこれまで記したことのほとんどすべては、2000年末までのことです。以後の2004JIS の制定過程自体については、ほとんど言及していません。2000JIS の問題点を指摘するのが主眼であり、ほとんどは 2000JIS の関連で語られるだけです。また、私が何らかの作業をなしたのも、2000年末までです。以後については何ら関与していません。
( ※ 以上は文字講堂の文献を見れば、すぐわかることなんですが。)
Posted by 管理人 at 2005年08月28日 06:23
次の疑問にお答えします。( → 出所は検索すればわかる。)
  ── 以下、引用 ──
この「2004 JISをめぐる混乱」を書いた南堂久史とかいう人物は、JIS X 0213:2004の審議に参加してないばかりか、JIS X 0213:2004の委員会議事録http://www.jsa.or.jp/domestic/instac/committe/JCS/ すら読んでいないように思われます。このような人物が、どうしてJIS X 0213:2004に関して「当事者ヅラ」するのか、非常に疑問だったりします。
  ── 以上、引用 ──

 この疑問を書いた人は、たぶん、2000JISの制定過程について、何も知らないのでしょう。そこで、「南堂は2004JISに関して何ら関与していない」と批判しているわけです。根本的な勘違い。

 そこで、はっきりと解説しておきます。(文字講堂を見ればわかることですが、初心者向けの解説。)
 南堂がやったことは、2004JIS を構築することではなくて、2004JIS の基盤を整えたことです。すなわち、2000JISをつぶしたことです。
 ここでは、2004JIS の細かな規則などは、細かなことなので、関与していません。大事なのは、「正字を原則とする、字形の変更」という大枠です。このことは、2000JIS がつぶれたあと、2000年末に決まりました。

 こうして基盤が整えられたあとで、2004JIS が構築されていったのです。それは 2004JIS委員会の仕事です。一方、南堂がやったのは、大枠の基盤を構築することです。それは、「略字の支配」という 2000JIS の大枠を破壊することです。

 2000JIS の大枠を破壊することは、JIS という権力に真っ向から反対することです。このとき、権力に対して、(ほら貝との)たった二人だけで立ち向かったわけです。
 ところが、上記の批判者は、「南堂は、JIS の委員ではない。権力に属していない」と批判しています。何を勘違いしているんだか。
 南堂は、権力と対抗したのであって、権力の一部であったわけではありません。JISの味方だったわけではなく、JISの敵だったのです。JISを構築しようとしたのではなく、誤ったJISを破壊しようとしたのです。
 「権力の一部であるような顔をするな」とのことですが、冗談ではない。私は「権力の一部」であるような顔をしたことはありません。逆に、権力の敵として、権力と対抗したのです。そして、権力の無謀な略字支配を、破壊したのです。
 
 上記の批判者は、「略字支配」を狙う、略字主義派の人です。そのせいで、あちこちに書き込みをして、南堂の悪口を言っています。しかし、批判をするのはいいが、事実とは逆のことを書くのは、やめてもらいたいものですね。

 比喩的に言えば、こうです。
 「民主党の岡田は、自民党の党員でもないくせに、自民党の批判をしている。しかし、自民党の党員名簿のどこにも、岡田の名前なんかないぞ。けしからん。自民党の当事者ヅラをしている岡田をやっつけろ。権力に歯向かうやつを弾圧しろ!」

 ──

 そもそも、私は最初にこう書いたはずです。
 「JISの委員会が責任を果たさないから、かわりに、私が書く」
 私は、JISの委員会がやるべきこと(説明責任を果たすこと)を、肩代わりしてやってあげているのです。外部から助太刀しているのです。
 なのに、内部の人間が、批判する。「肩代わりするなんて、けしからん。内部の人間でもないくせに」と。
 これでは、本末転倒でしょう。自分たちがサボっているから、かわりに他人がやったのに、それを批判するなんて。
 比喩。
 火事になった。消防署員が来たが、消防署員は火事が怖くて、何もできない。そこで、南堂という変人が、わが身の危険も顧みず、消火した。すると、消防署員が、こう非難した。
 「消防署員でもないくせに、消火するなんて、けしからん。おまけに、消火の経緯を説明するなんて、ますますけしからん。消防署員でもないくせに、消防署員の当事者ヅラをするなんて、けしからん! 生意気な南堂をやっつけろ!」
 
 男はつらいよ。葛飾柴又。

 ──

 ※ ついでに、イヤミ。
 JIS 委員の人は、「JIS 委員は立派だ」と思っているようですが、とんでもない勘違いでしょう。

  ・ 「字形の変更」について説明責任を果たさない。
  ・ 「字形の変更」だけをやるのに、4年もかかった。
  ・ 重要な文字(漢和字典にある文字)が大幅に欠落している。
  ・ 誤字にすぎない人名漢字をやたらと採択した。
  ・ 使用禁止である2バイト欧文特殊文字を採用した。

 2004JISは、こういうふうに、欠陥だらけの規格です。私が JIS 委員だったら、こんな欠陥規格は採用せず、まともな「南堂私案」(漢和字典に依拠した規格)を採用します。そうすれば、漢和字典にある由緒ある文字が使えたはずです。
 「JIS 委員は立派だ」ということはなく、その正反対でしょう。私をそういう連中といっしょにしないでほしいものです。
 「南堂は JIS委員だ」と称することは、「南堂は無能かつ無責任だ」と称するのと同じであり、侮辱です。
Posted by 管理人 at 2005年09月02日 01:14
そもそもJISの委員は文字講堂というwebの存在を知っているのでしょうか?
Posted by 赤井邦道 at 2005年09月02日 19:24
そもそも、細かいサイトを別とすれば、文字コードのサイトは「ほら貝」と「文字講堂」しか、ないんです。Yahoo などのサイトで調べても、この二つが主要です。文字講堂を知らなければ、他には何も知らなかった、ということになります。
( ※ ただし、そういう無知な人も、いくらかいました。「これが問題だ」と騒ぐが、その解答はとっくに判明していることに気づかない。単にわめきたてる人々。何も知らないで、無知をさらけ出す。)
 ──
 それは別として。・・・・
 JISの委員(特に名を上げません)には、略字派ではない中立派の学者もいました。その人は、世間の情報を広く集めて、リンクの形で情報提供していました。そこにはもちろん、文字講堂の名称もあります。
 この委員とは、何度もメールをやりとりしていました。意見とは別に、事実調査の点で、文字コードにはいろいろと面倒な調査が必要なので、そこでは、正字派も略字派も関係なく、事実関係の調査をします。
 で、事実関係の調査に当たっては、基礎資料が必要となりますが、基礎資料は、文字講堂だけにあるものが多いんです。どんな漢字が不足しているかとか、正字と略字の違いは何かとか、そういう情報は、文字講堂の「資料」編に、たくさんあります。それなしには、正確な情報を得られません。
 例として、国技審議会の失敗があります。国語審議会は、「略字」を採集するときに、約千字だけを調査したために、9割ほどの略字を見るだけで、残りの1割の略字を見失っていました。大失態。みっともない。恥さらし。
 そこで、「残りの1割は文字講堂にあるぞ。ちゃんと調べてから報告しろ」と指摘してあげました。2004JISの委員会は、それほど無知ではないので、基礎資料ぐらいはちゃんと調べたでしょう。

 資料とは、具体的には、何か? それは、文字講堂の「資料」のところをご覧ください。膨大な資料があります。JIS委員会が世間に公開した基礎資料より、ずっと膨大です。
( ※ JIS委員会の基礎資料は、他人からもらったものが多くて、自前のものはほとんどないので、JIS委員会の権限で公開することができないんです。一方、私の基礎資料は、私が作成したものだから、私が公開できます。)
Posted by 管理人 at 2005年09月02日 20:11
補足します。
 なぜ私だけが基礎資料を大量に公開できたか? それは、コンピュータで調査したからです。
 私以外の人は、誰もが手作業で一つ一つ、漢字を調べていきました。「これがどうした、あれがどうした」というふうに。ものすごい時間をかけて、ごくわずかな成果を提出しました。
 しかし、私だけは、コンピュータを使って調査しました。「さまざまな資料と漢字とのデータを照合し、一定の条件に当てはまるものを抽出する」という操作です。
 これは、言葉で言えば簡単ですが、実際には、ものすごい量のプログラムを作成する必要があります。で、そういうふうに、大量のプログラムを自力で作成する能力が、JISの委員にはなかった。私だけが、「文字コードの知識」と「プログラムの能力」の双方を備えていた。だから、私だけが、大量の基礎資料を提供できたのです。
 例。「国語辞典には、JISの文字で表示できない漢字がある。その漢字を、抽出して、JISのコードを使わないで表現して、一覧表の形にまとめる」
 こういうことは、普通の人には、まずできません。実際、コンピュータで資料を作成して公開したのは、私だけです。
( ※ ごく小規模の一覧表を除く。)
Posted by 管理人 at 2005年09月02日 22:03
< 南堂の役割 >
 南堂の役割について、補足しておこう。

 上記の略字派(JIS委員)の言い分では、こうなる。
 「字形の変更を決めたのは、2004JISの委員会である。しかし南堂は、この委員会において、字形の変更を提案したことはない」
 これは、明白な間違いである。世間に嘘八百を垂れ流すのは、やめてもらいたいものだ。
 
 この主張の後半(南堂は云々)は正しい。ただし、前半がまったく異なる。事実は、次のことだ。
 「字形の変更を決めたのは、 2004JISの委員会ではなくて、工業技術院である。その時期は、2000年末である。」
 「工業技術院がまず、字形の変更を決めた。そのあと、この方針に沿って、 2004JISの委員会が発足した。ここでは、委員長を初めとする主要な人員の大半は、字形の変更という方針に合致することを前提として、選任された。(ただし少数派としての略字派を含む。)」

 つまり、南堂が「字形の変更」を提案したあと、それが文字コードの関係者の間で広く「有力な案」と認識されるようになった。そのあとで、工業技術院が、国語審議会の方針に反する 2000JIS を廃棄し、国語審議会の方針に合致する案(字形の変更)を選定した。その後に、この案(字形の変更)を受けて、 2004JISの委員会が発足した。

 この案(字形の変更)を実質的に決定したのは、2004JISの委員会ではなくて、工業技術院である。2004JISの委員会は、すでに決まっている方針を、形式的に再決定して、細部の詰めをやっただけだ。字形の変更そのものは、2004JISの委員会よりも、前に決まっていたのである。ゆえに、
 「字形の変更を決めたのは、2004JISの委員会であり、南堂はそこには参加していないから、字形の変更には関与していない」
 という主張は、誤認である。字形の変更を決めたのは、2004JISの委員会ではなく、工業技術院であるからだ。
 そして、私の影響力は、工業技術院に及んだのであって、2004JISの委員会に及んだのではない。(2004JISの委員会が発足した時点では、字形の変更はすでに決定済みだった。)

 詳しい経緯は、下記を参照。特に、【 5 】 の箇所。
http://hp.vector.co.jp/authors/VA011700/moji/codekwra.htm
 具体的な報道資料も、そこに記してある。

 【 注釈 】
 工業技術院は、政府の一部門である。JISの規格委員会は、政府の一部門ではなくて、ただの外郭団体にすぎない。誰が選ばれるかは、政府が決める。方針の大枠も、重要な件については、政府が決める。JISの規格委員なんてのは、ただの下っ端の事務作業員にすぎない。
 なのに、JISの委員が、「2004JISの委員がすべてを決めた」と主張することは、「他人の決めたことを、おれが決めたと主張すること」である。──こういうのこそ「当事者**」という。(下品な言葉なので伏せ字)
 
 【 解説 】
 なお、参考資料として、次の文書がある。
http://www.jsa.or.jp/domestic/instac/h13reports/JCSmain_Web.pdf
 これを読むと、「何もかもJISの委員会が決定した」と受け止められるように書いてある箇所もある。
 しかし、そうか? 2000末の時点では、JISの委員会は、「略字の支配する」という2000JIS の方針を決定したばかりである。その舌の根も乾かないうちに、今度は「正字の支配する」という新しいJISについて、「それも自分たちで決めたんです」と主張する。「節操がない」とは、このことだ。

 【 補注 】
 以上では、「南堂の役割」について、説明した。ここでは、「工業技術院に影響を及ぼした」というふうに説明している。ただし、これを否定する立場もあるだろう。それならそれで、その立場を取ってもいい。その場合は、次のようになる。
 「文字コードの関係者は、誰もが、字形の変更に反対していた。字形の変更を唱えた者は、一人もいなかった。ところが、工業技術院の役人が、勝手な思いつきで、JISの方針をひっくり返して、字形の変更という方針を押しつけた。専門家の決定を、ただのど素人が、勝手な思いつきで、全部ひっくり返して、私的な方針を押しつけた。つまり、官僚による独裁である。これはまったく間違ったやり方であるが、どういうわけか、これが世間の事情に合致した。字形の変更は、国語審議会にも歓迎されたし、文芸関係者にも歓迎された。……つまり、ただのど素人の発想が正しく、文字コードの関係者はそろいもそろって無能ぞろいだった。自分では字形の変更を打ち出せる関係者は一人もいなくて、政府のど素人の役人ただ一人に、完敗した。」
 これはつまり、「文字コードの関係者は馬鹿ぞろいだった」という主張である。そういう主張を、取りたければ、取ってもいいだろう。「南堂憎けりゃ、袈裟まで憎い」という形で、「文字コード関係者の全員を馬鹿ぞろいだと批判する」というわけだ。あまりにも支離滅裂なので、私としては信じがたいが、そういうことを主張したい人は、勝手に主張すればいいだろう。
( ※ 現実には、そうではなくて、政府には「南堂説」を理解するだけの知恵があった、ということ。)
( ※ ついでだが、「字形の変更という方法が、無から湧いたのだ。その発想が、いっせいに、多くの人の頭に生じた」と主張する人もいる。ごく風変わりなアイデアが、あるとき急に同時発生した、という主張だ。……こういう非科学的な主張には、付き合いきれない。いちいち否定する気にもなれない。勝手にどうぞ、と言うだけだ。)
Posted by 管理人 at 2005年09月06日 13:25
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ