キーワード設定の現場から(10)

小平

 「月見里」さんという方がおられる。さて何と読むか?答えは「やまなし」さん。山がないから月見ができるという洒落のような名前。実在の方である。「小鳥遊」さんで「たかなし」さんというのもある。これは鷹がいないから小さな鳥も遊ぶという意味だそうだ。
 固有名詞という世界は、他と違うことをもって尊しとする風潮があるのだろう、なかなかユニークなものが多い。
 さて文芸家協会という団体がある。今まではコンピュータとは無縁を決め込んでいるような団体だったが、最近のコンピュータ・ブームを無視できなくなったのか、昨年暮れあたりから突然JIS漢字コードを批判し始めた。「漢字文化を守るために」などと大上段にシンポジウムなどを開催している。
 漢字の問題に注目が集まるのは大いに結構なことだが、無限集合とまでいわれている漢字の世界を無原則にコード化するわけにもいかないだろう。私としては漢字コードの充実も大切だが、漢字を公的に使用したりコンピュータで使用する場面では若干の制限や秩序立てがあったほうが良いと思っている。
 現在通常使用されているJISの文字セットは第1水準、第2水準の約6000字。通常の使用で必要な字をこの狭い範囲に納めるというのは至難の課題だ。現在のJIS文字セットには問題も多いが全体的には良くできている。通常の文章の範囲ではほとんど問題は発生しない。外字問題が出てくるのはおもに人名・地名の場合が多い。
 人名はJIS外字によく出会う。名前の方は人名用漢字という制限があるので今後はJIS外字が比較的少なくなってくると思われるが、姓のほうは代々引き継がれるものだから問題が大きい。法務省が戸籍事務の改正でこのあたりの改革を行おうとしたらしいがどうやら腰砕けらしい。
 地名に関しては日本の行政地名はすべて表せるというから、これはすごい。でもお隣、中国の地名となると俄然弱くなる。いわゆる簡体字が出ないのは当然としても、通常の字体の地名でもJISの外字というケースが多い。
 中国の人名・地名で誰でも知っている有名な外字を取り上げよう。「小平」の‘’と「深」の‘’がJIS外字である。
 「深」はJIS制定時は誰も知らない小さな村だったのだろうから‘’がないのは納得がいくが、‘’はなぜJIS外字なのか?この質問を関係者にしたことがある。答えは「当時小平は失脚中でした」。ことの真偽は不明だが漢字コード選択の舞台裏を見るようで面白い。
 さてここでの問題はJIS外字を含んだ検索語をどうするかだ。「そんなの簡単!作字をすればよい」といってはいけない。いくら作字をしてもユーザーがその字を入力できなければ検索はできない。
 検索ソフトが勝手にユーザーの日本語かな漢字変換の辞書を変更したりするのは行き過ぎだろうし混乱のもとだ。だからJIS外字の入った検索語は検索不能となるのだ。
 しかたがないので読みでの検索か外字部分だけ読みで開いた表記文字列で検索してもらうしかない。中国の人名地名ですべてカタカナという表記はそう違和感がないが、日本人の人名などだと少々気が引ける。
 こんな時には、JISの文字数を少しは増やしてもらいたいな、と「コンピュータ漢字制限論者」である私も思ったりはする。

『情報管理』Vol.40 No.12 Mar.1998 より転載


キーワード設定の現場から  目次 ←前回 次回→

BACKNewsletterのTopに戻る
Homeトップページに戻る