さらに考察する。デジタル庁の難点を指摘する。
──
デジタル庁と政府の矛盾
すでに述べた話をまとめると、こうなる。
「政府はマイナンバーのシステムで、標準的な文字を用いる 1.3万字のシステムを構築した。一方で、デジタル庁は多数の異体字を扱う 7万字のシステムを新たに開発中である。こうして互換性のない独自システムを構築するようになった」
一方で、政府は次の方針を立てている。

このことは、下記でも説明されている。
戸籍のコンピューター化は、戸籍の改製により正しい文字で登録し戸籍の正確性を向上させる目的もあるため、コンピューターに登録される氏や名の文字は、法務省で統一して定められている「正字」「俗字」に限られます。
従来の戸籍で簡略化して記載されていたり、書き癖や漢和字典に載っていない文字、現在は使えない文字や誤字が使われている場合は、法務省の定めた対応する「正字」で登録されています。
( → 氏名の文字が変更されている場合があります/宇佐市 )
つまり、政府は「漢字は 1.3万字の範囲に収める」という方針を立てている。にもかかわらず、デジタル庁は「7万字のシステムを独自開発する」という方針を立てたわけだ。デジタル庁の方針は、政府の方針に反しており、まったくの無駄仕事だと言える。
どうしてこうなったのか?
デジタル庁の方針
ではどうして、デジタル庁は政府の方針に反する奇妙な方針を取ったのか? それは、デジタル庁の由来を考えるとわかる。
デジタル庁に課された役割はこうだった。
「日本全体の公的業務をデジタル化・統一する」
特に、次のことだ。
「各地の地方自治体でバラバラに構築されたシステム(アプリを含む)を統一して、全国で共通のシステム(アプリを含む)を用いる」
ここで、次の方針を立てた。
「既存の地方自治体のシステムを遺漏なく扱えるようにする。つまり、上位互換になるようにする」
ところが、「6.5万字の OpenType をフォント切り替えで使う」という方式では、現状のシステムが使えない。それぞれのシステムは別々のフォントを使うからだ。フォントを切り替えるという方式では共通したシステムを使えない。これではまずい。そこでデジタル庁が取ったのが「7万字をすべて含む独自システム」というものだった。
このことを理解するには、「レガシー」という概念を用いるといい。旧来のレガシーの財産をすべて引き継ごうとするから、さまざまなレガシーを吸収して、システムが巨大化する。そのせいで、無駄なゴミもたくさん紛れ込むようになる。
比喩的に言えば、Windows Me だ。当時のWindows 9x 系は、古臭い MS-DOS のシステムを引き継いでおり、640KBの制限があった。そのせいでシステムの動作が非常に不安定だった。(メモリ不足。)
こんなポンコツなシステムはさっさと捨ててしまえばよかったのだが、従来のアプリとの互換性にこだわったせいで、なかなか次世代のシステム(NT系)に移行できなかった。
レガシーを引き継ぐことを重視したせいで、とんでもないポンコツなシステム( Windows Me )を使うハメになったのだ。
デジタル庁の独自システムは、そういうものである。
従来の自治体のシステム
従来の自治体のシステムは、どんなものだったか? こうだ。
「6.5万字の OpenType を使って、戸籍に基づいた個人識別をするシステム」
ここでは「戸籍は正字にする」という政府の基本方針は無視されている。かわりに「正字ではない戸籍の文字(特殊な異体字)を、コンピュータに入れて使う」という方針が取られている。いかにも奇妙な方針に思えるが、そういう方針が取られていたのだ。
Feloの回答
日本の戸籍における氏名の文字表記については、法務省が定めた「正字」と「俗字」に基づく統一が求められていますが、実際には多くの自治体で特殊な異体字が登録されているのが現状です。
法務省は戸籍に記載される氏名の文字を「正字」と「俗字」に限定する方針を持っています。
しかし、実際には多くの自治体が戸籍システムにおいて、異体字や外字を使用していることが問題視されています。法務省が整理した「戸籍統一文字」は約5万5000種類に及び、これは常用漢字の2136文字に比べて非常に多い数字です。この中には、異体字が含まれており、特に人名に使われる漢字のバリエーションが豊富であるため、戸籍通りの漢字を表示するために外字を利用するケースが多く見られます。
外字の使用は、データの互換性や表示の問題を引き起こすことがあります。異体字が含まれるデータを他のシステムに移行する際、同じ外字が登録されていないと正しく表示できないため、教職員や自治体の職員にとっては大きな負担となります。このため、一部の自治体では外字の廃止に向けた取り組みが進められています。
自治体のシステムでは、戸籍の情報が基盤となり、個人の識別が行われます。戸籍に基づく情報は、マイナンバー制度と連携しており、個人の識別には戸籍の正字が使用されることが多いです。これにより、戸籍の情報とマイナンバーが一貫して管理され、個人の識別が円滑に行われるようになっています。したがって、自治体のシステムで個人を識別する際には、戸籍の文字(正字)とマイナンバー制度で使用される正字の文字が両方とも重要な役割を果たしています。戸籍の情報が基盤となり、正字に基づく文字が使用されることで、個人の識別が行われています。
Perplexityの回答
自治体のシステムにおける個人の識別には、戸籍の文字と正字の両方が使用されていますが、実際の運用は複雑で統一されていません。
自治体のシステムでは戸籍の文字と正字の両方が使用されており、完全に統一された方法はありません。自治体ごとに異なる運用が行われている現状があり、今後さらなる標準化が求められています。
マイナンバーの文字(正字)が用いられることもあるが、自治体の独自のシステムによって戸籍の文字が使われることもあるようだ。現状では混在していると言える。
これが、現状(従来)の自治体のシステムだ。
デジタル庁の逆行
自治体は、マイナンバーの正字のシステム(1.3万字)を使うかわりに、戸籍(6.5万字)のシステムをあちこちでバラバラに使う。その全体を吸収しようとしたデジタル庁は、独自のシステムを構築することにした。レガシーをすべて引き継ごうとした。そのせいで、歪んだシステムができてしまった。
では、どうすればよかったのか? それは、シリーズの最初に述べた通りだ。つまり、国民を 12桁の数字であるマイナンバーで管理すればいいのだ。マイナンバーを主体として、それに添える形で漢字を付け足せばいい。これで簡単に済むはずだ。
一方、あちこちの自治体のシステムは、そうなっていない。どうなっているか? こうだ。
「マイナンバーのかわりに、氏名で識別する。その氏名は、戸籍の漢字に従う。その漢字は、OpenType を用いれば、すべてコンピュータできちんと処理できる」
これはこれでよかった。実際、その方式で片付いた。ここまでは、何も問題なかったのである。
ところが、そこへデジタル庁が手を出した。
「あらゆる自治体をすべてまとめてやる。おれの手で」
というふうに手を出した。しかし、6.5万字のファイルは、それぞれが別々に用いている限りは何も問題なかったが、全部をまとえて用いようとすると、あふれてしまう。大問題だ。
「ならばすべてを呑み込む上位互換のシステムを構築する」
というのがデジタル庁の方針だった。しかし、そのせいで、独自のシステムを構築することになったので、肝心の互換性が大幅に低下してしまったのだ。
つまり、「互換性を大幅に高めよう」という目標を持ったせいで、「互換性が大幅に低下してしまう」という結果になったわけだ。これを「本末転倒」という。
自分が何をやろうとしているか、まったく理解できていない、と言える。愚の骨頂である。
互換性の低下
デジタル庁は、自治体間での互換性を取ることばかりに熱中した。そのせいで、独自システムを構築した。しかるに、そうすると、その独自システムが、他のアプリ全体との互換性をなくしてしまうのだ。
実際、そこで使われる文字コードは、まったく独自の文字コードになるから、他のアプリとの互換性がない。
- ・ 役所で公的文書を作成しようとするときに、「独自システムにある氏名を、コピーして、ワードに貼りつける」というふうにすると、文字化けしてしまう。
・ 個人がマイナポータルで、「独自システムにある氏名を表示する」というふうにすると、(独自アプリをインストールすることで)氏名を表示することまではできそうだ。しかし、「その氏名を、コピーして、ワードに貼りつける」というふうにすると、文字化けしてしまう。
こういうふうに、互換性の低下が起こる。非常に利便性が低下する。
( ※ ちなみに、IPAmj明朝 では、異体字セレクタが使えない場合には、異体字部分が消えることで、正字になるだけだ。文字情報が消えるわけではない。利便性の問題はない。)
デジタル庁の問題
デジタル庁は失敗した。では、その本質は何か? こうだ。
「マイナンバーのない時代のシステム(氏名に頼らざるを得ないシステム)を維持しようとしたせいで、マイナンバーを基本にしてデータ管理をするという新時代の方針を採用できなかった」
自治体が構築したシステムは、もともとマイナンバーがない時代のシステムだった。それは文字に依存したシステムとして構築された。それをたくさんまとめて拡張したのが、デジタル庁の独自システムだった。
しかし、そこで使われるデータは、マイナンバーを基本としたデータだった。かくて、マイナンバーがないことを前提としたシステムの上に、マイナンバーがあることを前提としたデータを構築する、という矛盾が生じた。
むしろ、マイナンバーがあることを前提として、単純明快な 1.3万字の管理システムを構築すればよかったのだ。最初に述べたように、マイナンバーを基本とするシステムを構築すればよかったのだ。
なのに、デジタル庁はそうしなかった。そのせいで、「7万字を扱う」という能力を獲得したが、その7万字はまったくの無駄となる運命にある。(使うべきではないのだ。政府方針で。)
一方で、「他のアプリや外部情報との互換性をなくす」という致命的な難点が生じることになった。
対策
では、対策はどうすればいいか? 簡単だ。こうだ。
「デジタル庁の開発した独自システムは、使わないですべてお蔵入りにすればいい。廃棄してしまえばいい。ただの1回も使わないで、ゴミ捨て場に捨ててしまえばいい」
かわりに、どうするか? こうだ。
「1.3万字を扱う標準システムだけを使えばいい。要するに、文字については何もしなくていい。デジタル庁は単に、行政用のさまざまなアプリを開発するだけでいい」
これで済む。文字の扱いについては、「何もしない」というのが正解なのである。
昔の人も下記のように言っている。この言葉をデジタル庁に贈りたい。

明治生まれの私の母の名前はいわゆる変体仮名でしたが、戸籍では正字で登録されていました。本人はそんなものと言っていて、自分の名刺だけはその変体仮名を使ていました。担当役人の裁量でどんな字でも登録していたところもあったのでしょうが、それを全部取り入れる発想が間違っています。
一部の文系人間はITはどんなに複雑なことも受け入れられるものだと思っています。今まで受け入れっれなかったこんな字でも使えるぞ、「やっと今までの研究が役に立つ時代が来た」というわけです。
デジタル庁が取り込むと決めた対象は、異体字じゃなくて、地方自治体のシステム全体です。IT技術者の発想ですね。彼らには国文の知識なんかありません。
全くの余談ですがパスポートに使う名前の英文表記に納得できません。例えば「づ」はzuでdzuはダメ見たいです。島津藩は今のローマ字が制定される前からdzuを使っていたのに。外人が日本国籍を取得した時は事情が違うような気がします。本文に関係なくてすみません。