たいした話題ではないのだが、「ネット検索力の訓練」のつもりで、情報を探してみた。(ネット検索の話題である。)
清華大学の双子姉妹が超優秀だ、という話がある。
→ 「優秀すぎる」双子が話題 中国主席ら輩出大学
では、その名前は? ちょっと検索すると、次のページにたどり着く。
→ 清華大学の優秀な双子の女子学生が人気_中国網_日本語
馬冬書カさんは2011年の清華大学の特等奨学金の給費生で、……双子の妹、馬冬書怩ウんは……おやおや。半角カタカナなどが現れて、文字化けしている。
ここで文字コードの血が騒ぐ。原文ではどのような文字になっていたか?
まず、念のために、上記のページの文字コードを調べると、UTF-8 である。原理的には文字化けが起こるはずがない。となると、原稿を各段階で、何らかのエラー(文字化け)が起こったのだろう。執筆者のミスですね。
ともあれ、元ネタを探す。
中国語の記事を探すときは? .tw を付ければ、台湾のサイトが検索される。.cn を付ければ、中国のサイトが検索される。ざっと試したが、うまく行かない。(この方法はお手軽すぎた。)
そこで、「 Google honkong 」を検索してから、Google の香港サイトへ飛ぶ。( Google の中国語版を知りたいときには、ここを使う。これは覚えておこう。)( Google にするわけは、中国語を読めなくても、アイコンふうの文字の位置だけで,操作がわかるからだ。)
そこで「馬冬 清華大」を入力すると、ただちに結果が得られる。
→ 馬冬 清華大 - Google 搜尋
結果のページに飛べば、ここだ。
→ 中國 - 新聞頻道 - 新浪網
そこで「馬冬」を検索すれば、次の二種類の単語が見つかる。
・ 馬冬含
・ 馬冬マ
いずれもJISの文字であるあることに注意。つまり、もともと文字化けのしようがないのだ。先のサイトで文字化けが起こっていたのは、執筆者の手違いが原因だろう。
さて。この姉妹の名前の読み方は、どうか?
先の「人民網 日本語版」で「清華大学」をサイト内検索すると、次の結果が得られる。
昨年の清華大学の特等奨学金給費生のトップは馬冬カンさん、3位が双子の妹の馬冬シンさんだった。 ...馬さん姉妹はつまり、「カン」さん、「シン」さんだ。
こうして、二人の女性の名前はわかった。
文字は 「馬冬含」「馬冬マ」だ。読み方は、「カン」「シン」だ。
なお、姓と名は、すぐ上の「馬さん」という言葉から、「馬」が姓であるとわかる。(「馬冬」が姓なのではない。)したがって名前は「冬カン」「冬シン」だ。
「馬」の読み方は、たぶん「マー」だろう。
[ 付記 ]
なお、「冬」の文字は、日本語と中国語で字体が少し違うが、それは正字と新字の違い。あるいは、ただの字体差。文字としては、同じ文字と見なしていい。 unicode では、両者は同じ文字と見なされ、同じコードポイントを与えられている。使う言語によって、フォントのセットが異なるだけだ。
