デジタル辞書XMLの国際標準

2021.10.01

ディジタルアシスト  永田 健児

 本年8月30日にデジタル辞書XMLフォーマットの国際標準「IEC 62605」がEdition 3.0 にアップデートされました。

IEC 62605:2021
Multimedia systems and equipment - Multimedia e-publishing and e-books - Interchange format for e-dictionaries
https://webstore.iec.ch/publication/65663

 IEC(国際電気標準会議)のTC 100/TA 10という部会が、フォーマットの策定・提案を担当しています。JEPAレファレンス委員会からも若干名が作業に参加し、特に辞書の構成要素に関連するXML記述内容については、ほぼ主導する形で仕様策定に協力してきました。

 この「IEC 62605」はデジュール標準と位置付けられるもので、IECのような公的機関で明文化され公開された手続きによって作成されたものです。IECのほか、ITU(国際電気通信連合)やISO(国際標準化機構)がこれにあたります。もうひとつ、デファクト標準というものがあり、これは法的根拠はないものの国際市場で採用されているものです。W3Cやユニコードなど、フォーラム/コンソーシアムで標準化されたものも、ここに含まれます。

 さて、デジタル辞書の交換フォーマットですが、電子辞書やCD-ROM辞書で既にまとまった市場が存在し、デジタル化された辞書コンテンツも多いことから、日本からの提案となりました。仕様の設計やメンテナンスなど、提案国の裁量権限が強くなるため、ここは日本で押さえておきましょう、という事情もあったようです。

 ゼロから仕様設計するのも大変なので、IECのTC 100/TA 10からJEPAレファレンス委員会(当時は次世代辞書研究委員会という名称でした)に相談があったのが2008年。日本には既に「LeXML」という仕様があって、それなりの実績がありますよ、ということで、この「LeXML」をベースに仕様を整理して、翌2009年に原案を提出しました。

 「LeXML」は私が代表を務める株式会社ディジタルアシストが2001年に策定・公開した、辞書・事典類に特化したXML仕様です。「IEC 62605」プロジェクトがスタートした時点で、国語・漢字・古語・外国語等の語学辞典から地名・人名等を含む事典まで300タイトル超のXML化実績(2021年現在は521タイトル)と、各種電子辞書・辞書アプリ・オンライン辞書での採用実績がありました。多種多様な辞書事典の特徴・構造や各種デジタルシステムへのデータ供与の問題を、事前に“実績”の形で整理でき、仕様検討期間を大幅に短縮できたのは幸いでした。

 各国からの質問・コメントへの回答と、国際投票を経て、2011年に「IEC 62605:2011」(Edition.1)が無事成立しました。同年にはJEPAでも、TC100/TA10マネージャー植村八潮氏、同プロジェクトリーダー齋鹿尚史氏を迎えて、「辞書フォーマット国際標準提案について」というセミナーを開催しています。

 その後も日本国内のデジタル辞書は、(市場規模はおいといて)普及と機能強化が進み、また出版社における編集のデジタル化も影響して、「LeXML」は随時、改訂・改良を行ってきました。「IEC 62605」も、Edition.2(2016年)からは「LeXML」と完全に同期させることとなり、改訂が進んでいます。

IEC 62605:2011            LeXML v.2.0βベース
IEC 62605:2016            LeXML v.3.0と同期。主に学習辞典まわりの対応を強化
IEC 62605:2021            LeXML v.3.1と同期。オンラインサービスやアプリの表示形式多様化に対応。用例、ラベル分類等を強化、数式・漢文記述も。

 標準化は、互換性・インタフェースの整合性確保、生産効率の向上、製品の品質保証等を目的とするものですが、近年はアクセシビリティや環境配慮等の重要性も高まってきています。辞書コンテンツ側も、教育現場でのデジタルデバイスの普及、音声入力(検索)や音声合成(自動読み上げ)、ナビゲーションやパーソナライズ等のUI進化、一層の編集工程のデジタル化、等々、様々な状況変化が進んでいます。辞書コンテンツを「より便利に」「より有効に」ユーザに提示するため、辞書コンテンツを「より低コストで」「より安定的に」出版社やメーカー・ソフトハウスが制作できるように、「IEC 62605」(と「LeXML」)はその一助となるべく、今後も進化していきます。