「⾏」と「行」は違う文字!? 思わぬ文字化けを生む康熙部首とは

みなさんは「⾏」と「行」の違いがわかりますか？

見た目には全く同じように見えるこれらの文字、Unicodeでは

「⾏」が U+2F8F
「行」が U+884C

と、全く違う文字なのです。

康熙部首ってなに？
対応していないフォントが…

康熙部首ってなに？

この記事のタイトルの二つの同じ漢字、実は一つ目の「⾏」は”康熙部首(康熙部首)” という文字で漢字ではないのです。

康熙部首は、18世紀に完成した中国の漢字辞典、康熙字典に記載されている214個の部首です。
この214個の部首はUnicodeでも漢字とは全く別の文字として分離されているのです。

以下に全214個の康熙部首を記載してみます。

⼀⼁⼂⼃⼄⼅⼆⼇⼈⼉⼊⼋⼌⼍⼎⼏⼐⼑⼒⼓⼔⼕⼖⼗⼘⼙⼚⼛⼜⼝⼞⼟⼠⼡⼢⼣⼤⼥⼦⼧⼨⼩⼪⼫⼬⼭⼮⼯⼰⼱⼲⼳⼴⼵⼶⼷⼸⼹⼺⼻⼼⼽⼾⼿⽀⽁⽂⽃⽄⽅⽆⽇⽈⽉⽊⽋⽌⽍⽎⽏⽐⽑⽒⽓⽔⽕⽖⽗⽘⽙⽚⽛⽜⽝⽞⽟⽠⽡⽢⽣⽤⽥⽦⽧⽨⽩⽪⽫⽬⽭⽮⽯⽰⽱⽲⽳⽴⽵⽶⽷⽸⽹⽺⽻⽼⽽⽾⽿⾀⾁⾂⾃⾄⾅⾆⾇⾈⾉⾊⾋⾌⾍⾎⾏⾐⾑⾒⾓⾔⾕⾖⾗⾘⾙⾚⾛⾜⾝⾞⾟⾠⾡⾢⾣⾤⾥⾦⾧⾨⾩⾪⾫⾬⾭⾮⾯⾰⾱⾲⾳⾴⾵⾶⾷⾸⾹⾺⾻⾼⾽⾾⾿⿀⿁⿂⿃⿄⿅⿆⿇⿈⿉⿊⿋⿌⿍⿎⿏⿐⿑⿒⿓⿔⿕

これだけを見ると、漢字と全く見分けがつかないことがわかります。

しかし、見た目が全く同じならこれが混じっても特に問題ないような気がしますが、実はそうでもないのです…

対応していないフォントが…

見た目には漢字と同じなのに、中身は全く違う文字である康熙部首。

全く違う文字である以上、実は対応していないフォントがそこそこあるのです。

例えば、「家族で⾧野県に⾏きました。」という文章もフォントによっては

「家族で〿野県に〿きました。」

というような表示になってしまいます。(対応していないフォントを取り上げるのは憚られたので、今回は対応しているフォントを使用しているため擬似的に再現しました)

しかし、わざわざ康熙部首を混入させるようなことがなければ大丈夫ではないのか…と思いたいところですが、実は厄介なことに簡単に意識せずに混入させてしまうことがあるのです。

例えば業務の中でPDF文書から文字列をコピーして入力することがあるかと思いますが、PDFに出力される時になぜか通常の漢字が康熙部首に置き換わってしまうことがあるのです。

このように気づかないうちに混入してしまう康熙部首。
対応しているフォントを使用したり、通常の漢字に置き換える処理を組み込むなどして、思わぬ文字化けを未然に防ぎましょう。