2025年02月03日

◆ デジタル庁とマイナンバー .1

 デジタル庁は国民管理に、氏名よりマイナンバーを使うべきだ。

 ──

 政府はマイナンバーを使うことで、国民を 12桁の番号で管理しようとする。これで行政事務が大幅に能率アップする。それが政府の基本方針であるはずだ。
 ところが、これに真っ向から反対するのが、デジタル庁である。国民をマイナンバーで管理するかわりに、特別な専用の漢字システムを用いた氏名で管理するべきだ、という方針を立てた。

Feloの回答
 デジタル庁が構築している漢字システムは、主に「行政事務標準文字」と呼ばれる文字セットを中心に展開されています。このシステムは、地方公共団体で使用される基幹業務システムの文字の標準化を目的としており、特に「外字」と呼ばれる特殊な文字の管理や運用に関する課題を解決するために設計されています。
 
外字の統一:
 これまで地方公共団体ごとに異なる外字が使用されていたため、システム間でのデータ連携に問題が生じていました。デジタル庁は、これらの外字を整理し、標準化することで、文字の一貫性を保つことを目指しています
 具体的には、約6万字が文字情報基盤(MJ)から派生し、さらに約1万字が追加されています。

 デジタル庁が狙ったのは、地方公共団体における各種システムの統合だ。それぞれの地方公共団体が別々のシステムを使っているので、非効率だ。どの公共団体も同一の統一システムを使えばいい。だから、そういうシステムを開発したい。
 しかし、それぞれの地方公共団体は、独自の外字システムを使っており、別々の異体字を用いている。それらをすべて記載すると、7万字になってしまう。
 しかるに、 unicode の文字コードの上限は 6.5万字だ。そのうち、多くの外国文字が unicode に入るので、漢字数の上限は約20,902文字である。これ以上の漢字数を扱うには、サロゲートペアという特殊な文字を使う必要がある。(文字を制御文字とすることで、2文字を1字として扱う。)
 unicode で扱える漢字の上限は(普通の方法では)2万字ほどしかないので、別の方法が求められた。それは Adobe の OpenType というフォントだ。これならば、番号のすべてを日本語の漢字専用に配置することができる。かくて 16ビット(6.5万)の信号のすべてに漢字を配置することで、(2万字でなく) 6.5万字の漢字を扱えるようになった。……これが、現在のほとんどの地方公共団体で導入されている漢字システムだ。
 しかし、である。その方式は、おのおののシステムで異なるフォントを用いる。だから、同じ番号を割り振っても、別の文字になることがある。これでは統一性が取れない。
 そこでデジタル庁は、次の方針を立てた。
 「すべてのシステムの漢字を収録するには、6.5万字の OpenType では不可能だ。そこで、新たに独自の専用システムを、デジタル庁が開発する。そこでは7万字の漢字を収録できるので、あちこちの地方公共団体で導入されている漢字システムの漢字をすべて収録できる。重複なしに、統一的に」

 すべての文字を統一的に収録できるのだから、これで問題は解決する、とデジタル庁は考えた。しかし、そこで使われるシステムは、あまりにも特殊な独自システムであり、およそ一般的に使われるものではないようだ。
 AIに質問してみたが、その方式はいまだに公開されていない。どうも、フォント切り替えで済むような単純なものではなく、かといって(既存の)サロゲートペアを使うものでもなく、デジタル庁の独自の専用システムであるらしい。

Perplexity の回答
 デジタル庁は、行政事務標準文字と呼ばれる約7万字の文字セットを構築しています。この文字セットは、一般的なシステムで実装可能なフォントファイルの上限である約6.5万字を超えているため、特別な対応が必要となりました。
 基本フォントファイルと予備文字ファイルに分けて管理します。
 基本フォントファイルと予備文字ファイルの切り替えについて、具体的な切り替え方法は明確に示されていません。
 基本フォントファイルには約4万字が含まれ、予備文字ファイルには使用頻度の低い約2万字が含まれる予定です。
 
 新しい標準を採用するアプリケーションは、基本フォントファイルと予備文字ファイルの両方を管理する必要があります。 これにより、開発者は新たなフォント管理機能を実装する必要があります。

 切り替えは単純なフォント名の変更や文字コードの変更ではなく、より複雑なシステムレベルでの管理が必要であると推測されます。具体的には:
  ・ アプリケーションが必要に応じて適切なフォントファイル(基本または予備)を選択し、使用する仕組みが実装される可能性が高いです。
  ・ IVSの対応を考慮すると、文字コードだけでなく、文字の表示方法も含めた総合的な管理システムが必要になると考えられます。

 どうやら、メチャクチャに複雑なシステムを必要とするようだ。スタンドアローンのパソコン上で独立して使えるようなものではなくて、ホストコンピュータと通信するクライアント上でホストコンピュータの端末として使うようなシステムかもしれない。ホストとの通信を絶った状態では、漢字がまともに表示されることもない、というふうになりかねない。

 これは、ただの unicode のフォントや、OpenType のフォントとは、全然違う。 unicode のフォントなら、フォントファイルをインストールするだけでいい。それだけで、2万字の漢字をごく簡単に使える。
 また、IPAmj明朝 というフォントがあり、これは「異体字セレクタ」(IVS)という機能を使うことで、同一の文字コードで複数の異体字を管理できる。この方式で 5.8万字(その多くは異体字である)を扱えるようになっている。


 mjfont.jpg
出典:IPA



 つまり、従来の方式を扱うだけでも、かなり多数の文字を扱える。
  ・ 2万字(unicode 標準)
  ・ 6.5万字( OpenType )
  ・ 5.8万字(異体字セレクタ併用)

 これだけの文字を使えるのだ。なのに、ほんの少しの文字を追加するために、システム全体を大がかりな独自システムにしてしまっている。
 これでは「行政事務の簡略化・能率化」という本来の目的が達成しにくくなる。本末転倒と言える。

 ──

 より根源的な問題がある。こうだ。
 「国民のデータを管理するためには、マイナンバーの 12桁の数字を使えばいい。文字で管理する必要はない。ゆえに、文字システムを使う必要はもともとないし、文字システムを共通化する必要すらもない」
 これで済むはずなのだ。本来ならば、マイナンバーだけで済むはずなのだ。

 とはいえ、文字システムをまったく使わないというのも無理だろう。だから、現実的な解決策は、こうだ。
 「文字システムは、基本的な漢字だけを扱えればいい。そこから逸脱する分は、既存の文字の範囲内で扱うだけでいい」


 基本的な漢字とは? 次のような基準の例が考えられる。(どれでもいい。)
  ・ JIS第一水準・第二水準
  ・ unicode の CJK統合漢字 (2万字ほど)
  ・ IPAmj明朝(5.8万字)
  ・ OpenType(6.5万字)


 こうして基本的な漢字の範囲を決める。その後、ここから逸脱する分については、次のように扱う。
  ・ 異体字セレクタにより、異体字として扱う。
  ・ 正式文字はカタカナとして、参照で画像の文字を添付する。

 後者の方式は、外字の概念に似ているが、外字とは違う。あくまで「画像を参考として添付する」だけだ。(電子的に登録された)文字の本体はカタカナとする。(カタカナのかわりに類似の文字で代用してもいい。)

 私としては、 IPAmj明朝を使うことをお薦めする。(異体字セレクタの方式。)
 なお、IPAmj明朝を使用できるシステムについて調べると、おおむね 2014年以後の OS やアプリで使えるようだ。これよりも古い機械は、現状ではほとんど残っていないはずだ。だから、現状ではどの機械でも IPAmj明朝を使用できると言える。もちろん、スマホでも使える。

 一方、デジタル庁で使う特殊システムでは、その漢字はシステムの外では使えない。そのデータはまったくの孤立したシステム内のデータとなる。要するに、互換性が取れない。
 互換性のないデータを使うのだから、効率の低下たるや、惨憺たる状態となりそうだ。

 「マイナンバーを使って、統一された番号データで、行政を効率化する」
 というのとは、正反対の方針を取るのが、デジタル庁だ。
 「ホストコンピュータと接続された独自システムの端末でのみ使える。そこで得たデータは、外部とは互換性が取れないので、外部とのデータのやりとりがまったく不可能である」
 という孤立したシステムを使うので、行政の効率化が著しく低下する。

 「独自システムの使用をやめて、マイナンバーと IPAmj明朝で統一し、逸脱分は画像で対応せよ」
 というのが、私の提案だ。
 
  ※ そもそも、特殊な異体字は一切認めない、というふうにするのも手だ。特殊な異体字のほとんどは、ただの書き間違えが固定化されたものにすぎない。そんなものは、役所の職権で是正・訂正してしまえばいいのだ。……私としてはそれが推奨だ。
  ※ 戸籍名は標準漢字だけに限定して、現実の生活では自己流でいくらでも勝手な書体の文字を使えばいい、というのが、私の立場だ。
  ※ デジタル庁には、「個人の趣味に役所が振り回されているんじゃねーよ」と批判したい。

 
 
posted by 管理人 at 22:12 | Comment(4) | 一般(雑学)6 | 更新情報をチェックする
この記事へのコメント
デジタル庁がそんなことをしているとは知りませんでした。国文学の分野のことは全く分かりませんが、わたくしの印象では些細で末節なことを知っちることが重要視されているのではないかと思います。そんな人たちのために貴重な人的、知的資源が無駄に使われているような気がします。そんなことは国文学の学界に任せておけばよいのです。できないならそれでよいのです。
 管理人さんの言われていることに賛成します。
Posted by ひまなので at 2025年02月04日 10:30
 国文学で使われる漢字数は、2万字以下。
 公的なシステムで使われる多様な漢字のほとんどは、戸籍専用で、手書きの異体字。本文中で「特殊な異体字のほとんどは、ただの書き間違えが固定化されたものにすぎない」と記したとおり。
Posted by 管理人 at 2025年02月04日 17:53
「戸籍名は標準漢字だけに限定して、現実の生活では自己流でいくらでも勝手な書体の文字を使えばいい

大賛成です。

私も、親がつけて名前に異体字が含まれており、銀行や病院の登録で結構面倒なことになっています。
異体字から常用漢字に改名しようと思ったこともあるのですが、異体字から常用漢字への変更は家庭裁判所の許可が必要とのことで、面倒でやっていません。
法律が行政の効率化を妨げています。
Posted by こんとん at 2025年02月04日 18:51
> ※ そもそも、特殊な異体字は一切認めない、というふうにするのも手だ。特殊な異体字のほとんどは、ただの書き間違えが固定化されたものにすぎない。そんなものは、役所の職権で是正・訂正してしまえばいいのだ。……私としてはそれが推奨だ。

⇒ 今年5月の改正戸籍法の施行で、

・戸籍に氏名の読み仮名が記載されます。
・施行にあわせて、市区町村が住民票の読み仮名を基に登録予定の読み仮名を全住民に通知します。
・施行から1年以内に届出がなければ、通知に記された読み仮名が登録されます。
(Google AI要約)

なので、これとあわせて、現状の異体字はぜんぶ、筆者提案のIPAmj明朝(5.8万字)に含まれる字に置き換えて、対象者全員にその候補字をあわせて通知するようにしておけばよかったのです(異議がなければそれで決まってしまうので好都合)。これは本来、千載一遇のチャンスですから絶対にやるべきでした。ですが、今からでは法整備や準備が間に合わないってことになるんでしょうね。
Posted by かわっこだっこ at 2025年02月05日 02:57
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

  ※ コメントが掲載されるまで、時間がかかることがあります。

過去ログ