“次世代辞書”に思うこと

2012.04.01

ディジタルアシスト  永田 健児

 前回のキーパーソンズ・メッセージが2009年の5月号、その時のタイトルが「おかげさまで8年になります」(会社設立のことです)だったので、この間に会社設立10周年を迎えることとなりました。お世話になっている各企業の皆様にこの場をお借りして感謝の意を表させていただきます(JEPA会員社の比率が高いんです)。
 その、前回のキーパーソンズ・メッセージの締めくくりは、JEITA(社団法人電子情報技術産業協会)とのリエゾンによる国際標準の辞書交換フォーマット提案の話題でした。この作業も昨年無事完了し、「IEC 62605 ed1.0 : Multimedia systems and equipment - Multimedia e-publishing and e-books - Interchange format for e-dictionaries」という国際標準規約となりました。ここでひと息つきたいところですが、その国際規約のベースにもなった、本家本元(?)の“LeXML”(*)の仕様書が、もう5年も更新できていません。今年こそはきちんと改定します。
(*)弊社で策定した辞書・事典類に特化したXMLフォーマットです。おかげさまで多くの出版社様に採用いただき、各種電子辞書・検索サービス・辞書アプリに提供されています。
 さて、標題の件。
 ここ数年、今度こそはと期待できそうな「電子書籍元年」が到来し、電子書籍を取り巻く環境も今までになかった大きな変化が生じています。ここしばらくは話題もリソースも(そして予算も)“電子書籍”にもっていかれるんだろうなあ、と思いつつ、この時期だからこそ“次世代辞書”について考えてみようと思う今日この頃です。
 考えていることをいくつか挙げてみます。
(1) 「電子書籍元年」はいずれ「電子書籍第一次黄金期」になっていく筈ですが、デジタル辞書の使われ方も、そしておそらく内容(語釈や立項基準)も、電子書籍の影響を大いに受けて変化していくと思われます。今まで、デジタル辞書は“ユーザーが検索語を入力して検索”というのが基本的な使い方でしたが、これから電子書籍端末上では“本文の気になる単語をなぞって検索”という使い方が増えてくるでしょう。分かち認識などアプリ側に対応をお願いする事項も多いのですが、交ぜ書き・カナ表記等の表記の揺れや活用形の問題など辞書コンテンツ側でも検討すべきことは多々あると思います。
 書籍文中の言葉をダイレクトに検索される、という辞書引きスタイルでは、固有名詞、専門語、略語、俗語、方言、といった、現在の辞書ではちょっと弱い見出し語へのニーズが高まるものと思われます。 また、あくまで“読書中の補助的なレファレンス”になりますので、語釈・用例・コラムの詳しさやボリュームよりも、シンプルさが要求されるものと思います。
(2) ちょっと前まで「検索キーワードの正規化」について、なんとなく作り手と使い手の間で“お約束”があったと思うのですが、――「音引きは無視」とか「全角/半角は同一視」とか、作り手は意図的に処理し、使い手は経験的に体得していた、検索上のルールです―― 最近なかなか通用しなくなってきているなあ、と。スマホ向け辞書アプリに顕著だと感じています。欧米の辞書に比べて日本の辞書は特にこの辺りは複雑なので、この機会に問題点を整理して行きたいと考えています。
(3) 文字コードと外字の問題……避けて通れませんね。
 まだいろいろあるのですが、以上のようなことを、「次世代辞書研究委員会」改め「レファレンス委員会」で皆さんと意見交換して行きたいと考えています。ご興味のある方は是非ともご参加を。