キーワード設定の現場から(19)

縦横ジグザグ(その2)

 前回のテーマは日本人は文字を縦に書くのか横に書くのかだった。現代の日本では印刷物においてはほとんどのものが縦書きなのに、日本人が手でメモやノートをとる場合は不思議なことに横書きが圧倒的だ。
 さて電子出版物の世界では横書き表示が普通だ。したがって縦書きで出版されている紙の書籍を横書きの電子出版物にするケースは非常に多い。
 縦書きを横書きに直した時に発生する問題に数字表記の変更がある。日本で使われる数字の表記法ふたつ、漢数字とアラビア数字の使い分けはなかなか難しい。
 縦書きでは漢数字での表記が普通である。漢数字の表記にもいろいろある。「1,234,567円」を伝統的な表記にしたがって書けば、「百二十三万四千五百六十七円」となる。これではあまりに冗長になるので「一二三万四五六七円」などとも書く。この表記法では本来、漢数字にはなかった「0(ゼロ)」も用意されていてたとえば「600円」は「六〇〇円」と書くことができる。アラビア数字風漢数字表記といったところだ。
 でもアラビア数字風であってもこういった表記を横書きにすると居心地が悪い。悪いどころか「11」などは「一一」となり長い横棒が一本ころがっているような有り様だ。やはり横書きの表示では漢数字をアラビア数字に置き換えたい。
 とはいうものの漢数字をアラビア数字に置き換えるのもなかなか難しい。自動的に置き換えられるだろうと考える向きもあろうかと思うが、どっこいそう簡単ではない。
 1冊の本を数えるときは「1部」だが、全体のなかの特定の部分を指すときは「一部」と漢数字になる。「一郎」を「1郎」としたら怒られてしまう。数字の置き換えでは意味上の判断を要求されるわけだ。
 横書きの数字表記の原則は「数の意味があるものをアラビア数字、固有名詞や熟語・成句は漢数字で」となっているが、同時に慣用によって漢数字とするかアラビア数字とするかを決めるというルールもある。数ではあるが「六歌仙」を「6歌仙」とやったら笑われてしまうだろうし、逆に「G7」を「G七」とは縦書きでも書かない。
 使われかたが揺れている場合がある。たとえば「第二次世界大戦」なのか「第2次世界大戦」なのかという話になると書籍によってさまざまである。「三六協定」「第三世界」「五全総」「週休二日」この辺りはみなボーダーの語だろう。
 したがって漢数字をアラビア数字に置き換えるには人間のチェック作業が必須となる。数字の多い出版物ではたいへんな作業である。
 さて検索の世界でも縦書きと横書きにともなってこの数字の表記が問題となる。
 本文を縦書きで表示する電子辞書でも検索語の入力ダイアログはなぜか横書きである。そこに検索語を入力するユーザーは、アラビア数字を使うのだろうかそれとも漢数字を使うのであろうか?
 ということで数字を和洋両用に書ける語を検索キーワードにとると表記をアラビア数字にするか漢数字にするか悩んでしまう。ユーザーの負担を減らすために和洋両様に書ける場合はふたつのキーワードを設定することになる。おまけに数字の混じった語では読みの問題も発生する。「2000年問題」は「ニセンネンモンダイ」が読みだが、「2000ネンモンダイ」という簡単入力もありうるだろう。
 正直なところ数字が入ったキーワードにはなるべく出会いたくないものだ。

『情報管理』Vol.41 No.9 Dec. 1998 より転載


キーワード設定の現場から  目次 ←前回 次回→

BACKNewsletterのTopに戻る
Homeトップページに戻る