2005年09月10日

◆言葉・自然・アトム

 文字規格の余談。言葉と自然と鉄腕アトムで、三題噺。
 → 小泉の波立ち (9月11日の箇所)
http://www005.upp.so-net.ne.jp/greentree/koizumi/99p_news.htm#09
posted by 管理人 at 22:10| Comment(8) | TrackBack(0) |  文字規格 | 更新情報をチェックする
この記事へのコメント
こんにちは。

そういえば下記URLで自民党比例区(千葉2区)で
「山中 ※子」と表示されますが、こういうのも文字規格の弊害のようなものでしょうか。(使用ブラウザは最新版のFireFox とIE6です。)
http://headlines.yahoo.co.jp/specialfeature/election2005/list/hirei/05.html
Posted by タナカアキラ at 2005年09月11日 23:05
http://www2.asahi.com/senkyo2005/carta/A12002003.html
http://www.google.co.jp/search?q=%E5%B1%B1%E4%B8%AD%E7%87%81%E5%AD%90
 「山中 【[火華]】子」さんでよろしいでしょうか。
 JIS:953A SJIS:FB59 区点:11726 数値文字参照:燁
 Unicode:U+71C1 NEC外字:0xEDFA IBM外字:0xFB59
 コメント欄には本来の文字を記述できるのですが(私はIMEの文字パレットで漢字を拾いました)、プレビューすると文字化けしますね…これは困りました。

 WindowsXP・Firefox・Google検索の組み合わせであれば正しく検索でき、また検索結果は「UTF-8(Unicode)」や「Shift_JIS」などの文字コードで表現されているようです…が、ここで通らないとなると、そう安易には使えない文字と言うことになりますね。

 その他環境によって表示が崩れる場合もあるようで、この点については「ほら貝」に詳細が記されているようです。
http://www.horagai.com/www/moji/2000a.htm
 また、該当漢字と「文字化け」を組み合わせて検索しますと、色々と不都合の状況を見ることができるかと思われます。

 せめて新聞社・報道関係のシステムだけでも、扱う文字コードをUTF-8(Unicode)へと変更していただきたいところです。
 もっとも、他の問題が出るかもしれない点は怖いのですが…。
Posted by かえで(yfi) at 2005年09月12日 04:10
あっ、プレビューだけがダメで、実際の表示は上手くいく場合もありそうですね(手元の環境では「#x71C1;」が正しく表示されています)。
 「数値文字参照:」の後に実際に書いた文字は、「#x 71C1;」(先のコメントでは、xと7の間にスペースを挟んでいません)です。

 数値文字参照の表示具合に関しては、
http://www.securehtml.jp/utf-8/reference.html
あたりが綺麗にまとめてあるように思います。
Posted by かえで(yfi) at 2005年09月12日 04:41
かえでさんのご説明、ありがとうございます。

 (1)
 該当の文字は「火 + 華」ですが、これは通常、機種依存文字と呼ばれます。
 特にこの機種依存文字は、Windows でしか使えない文字です。Mac などでは文字化けします。また、Unix 系の EUC ではまずいとになるようです。
 本ブログも、基本システムは EUC という文字コードであるらしく、同様のトラブルが起こります。
  → http://openblog.seesaa.net/article/5668777.html の最後

 (2)
 UTF-8 なら、どうか? UTF-8 のページは、ケータイやPDAで見ることができない場合が多いので、お勧めしません。
 最近になって知ったのですが、ブログをケータイで見る人は、とても多いようです。ブログにケータイで書き込む人もたくさんいます。UTF-8 にするメリットは、ほとんどありません。
 「UTF-8 ならば大丈夫」というのは、「UTF-8 にすれば問題が生じない」という意味ではなくて、「UTF-8 を読み取れないユーザーをすべて拒否する」という形で、ユーザーを制限しているからです。ある小さな問題を避けるために、大きな領域を丸ごと削除しているので、その小さな問題が起こらなくなっているように見えるだけです。実際には、「大きな領域が丸ごと削除される」という大問題が生じています。
 さらに言えば、「 UTF-8 のページが正しく表示されない」というトラブルが起こることもあります。たとえば、次のページ。
http://www-ise2.ise.eng.osaka-u.ac.jp/~iwanaga/miscellany/symbol.html

 単に unicode の文字を使うだけなら、UTF-8 を使わず、番号表示(数値文字参照)をすればいいのです。これで問題がないことは、かえでさんの教示してくれたページに記してあるとおり。また、大丈夫であることは、上記の「火華」の実例が正しく表示されていることでわかります。
 問題は、正しい番号を知ること。それには、別項を参照。(9月12日)

 (3)
 新フォントによる字形の変更のあとは、どうなるか? 
 実は、機種依存文字は、同じく Windows 同士ですら文字化けします。新フォントと急フォントで、互換性ありません。(他の一般の文字は互換性があるが。)
 これは、JIS X0213 に固有のトラブルです。このトラブルは、「コードポイントの交換」というトラブルです。
 こういう「コードポイントの交換」は駄目だ、ということはわかっていたのに、あえて馬鹿なことをやったのが、JIS X0213 です。2000版で決定し、2004版でも修正されません。
 なお、南堂私案ならば、このトラブルは生じないはずでした。
 多くの人は、「辻」さんの点が増えたり減ったりすることには大騒ぎなのに、機種依存文字の人では「文字がまったくかわってしまう」という点については、ほとんど考慮しません。この問題は、先に扱ったとおり。

 →2005年08月06日「種依存文字」
 http://openblog.seesaa.net/article/5668777.html
Posted by 管理人 at 2005年09月12日 12:20
(2)で提示頂いたページについてですが、記述者の方により修正して頂ける可能性がありそうでしたので、念のためお知らせさせて頂きました。

 どういったことが原因でUTF-8のページが文字化けするのかという点について興味を持っています…復旧後に、文字化けの理由についても言及いただけることを期待しています>記述者様。
Posted by かえで(yfi) at 2005年09月13日 12:30
上記のエラーページですが、たぶん、1行目の「DOCTYPE」の宣言ミスです。
1行目を削除すると、Firefox でも正常に表示されます。Firefox はソースを馬鹿正直に解釈するせいで、ユーザーのエラーを補正しないことがしばしばあります。
Posted by 管理人 at 2005年09月13日 16:00
utf-8 の文字化けページですが、この url を以下のサイトでチェックしてみると何が原因か説明してもらえます。

http://openlab.ring.gr.jp/k16/htmllint/htmllint.html
Posted by 渡部 at 2005年09月14日 16:44
かえでさま、渡部さま、管理人さま コメント有難うございます。

タナカアキラです。

最初の書き込みのすぐ後に該当ページの管理サイトに質問しました。で、回答がつい先ほど届きましたので、報告します。メール全文をそのままコピーします。

↓ここから_________________________


Yahoo!ニュースカスタマーサービスです。
ご利用くださいまして、ありがとうございます。

お客様からお問い合わせの件について回答いたします。

該当者の名前に関してですが、ページ下方にも記載されておりますように、
「※=火ヘンに華」でございます。

お手数ですが、再度ご確認ください。

これからもYahoo! JAPANをよろしくお願いします。

**********************************
Yahoo!ニュースカスタマーサービス担当[435]
Yahoo!ニュースヘルプページ
http://help.yahoo.co.jp/help/jp/news/
「Yahoo!知揃袋」もご活用ください
http://knowledge.yahoo.co.jp/
**********************************

元のメッセージ:
------------------------
ご利用のサービス:ニュース
お問い合わせのURL:http://headlines.yahoo.co.jp/specialfeature/election2005/list/hirei/05.html

お問い合わせいただいた内容:
Yahoo!ニュース - 特集 2005年衆院選トップ 比例区南関東ブロック の表において、一人目の名前が文字化けしています。私のパソコンはWINDOWS-XP、ブラウザはIE6とFireFox(最新版)、で確認しましたが、両方とも名前が「※子」をなってしまいます。この文字化けの原因を教えてください。
_________________________


自民党
○ 1 山中 ※子 千葉2区   元

_________________________

↑ここまで_________________________

…じつはみなさんの書き込みの内容が非常に詳しかったので、「ここはひとつ、ヤフーからちゃんと返事が来てから、それと合わせてコメントしよう」と思っていたのですが…ええと、メールの質問の仕方が悪かったのかしら。結局、みなさんのコメントで機種依存文字のことを知ることが出来たのですがw
勉強になりました。有難うございます。
Posted by タナカアキラ at 2005年09月20日 01:31
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]


この記事へのトラックバック
  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ