秀丸の漢字

動機

Unicode に[秀丸] 𮂼 (U+2E0BC)という漢字があることを知って、この文字がなぜ追加されたのか知りたかった。

glyphwiki.org

分かったこと

この漢字は由来不明である事がわかった

調べた方法

  1. Unicode code charts で対象の漢字の codepoint を入力*1
  2. Script の pdf のリンクが表示されるので、pdf 内を codepoint で検索する
  3. JMJ-059986 という番号が書いてあった*2ので、そちらで検索
  4. 日本ソースのCJK統合漢字拡張F2候補・その4 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ がヒットした。住基統一文字のコードを書いてくれていたので、文字情報基盤検索システムJ+B73C を検索
  5. 文字情報基盤検索システム で漢字辞典には載っていない文字ということが分かった。
  6. MJ059986 で検索すると https://moji.or.jp/wp-content/mojikiban/2015/03/MJShrinkMapGuideV1.0.pdf がヒットし、意味や用法が不明なことがわかった。

後から思えば 文字情報基盤検索システム で最初からMJ文字の番号で検索しても良かった。

なぜMJ-059986がMJ文字集合に入っているのかは気になるところだけど、調べ方がさっぱり検討つかないため終わりにした。

感想

今回たまたま意味や用法が不明な文字としてピックアップされていたから分かったものの、そうでなければ判断は難しいなーと思った。あと漢字でない場合はこの方法が取れないため、Unicodeの文字一般に対して「この文字がどういう経緯で入ったか」を調べる方法があるといいのになぁと思った。一応その方法も調べてみたがけっこう大変(要約すると、proposalと議事録から頑張って辿る)だったのでまた別の機会に書くことにする

*1:漢字の場合は Unihan Database Lookup でも良さそう。

*2:これは拠り所となる規格を示しているようだ。日本の場合は頭にJがつくため、これはMJ文字集合由来の文字ということになる。参考: MJ文字図形名とUCS符号位置との対応 | 一般社団法人 文字情報技術促進協議会