JIS X 4177-7 (文書スキーマ定義言語(DSDL)—第7部:文字レパートリ記述言語(CREPDL))改正原案作成委員会

第3 種専門委員会

JIS X 4177-7 (文書スキーマ定義言語(DSDL)—第7部:文字レパートリ記述言語(CREPDL))改正原案作成委員会

<2021年度委員会活動報告>

 委員長 村田 真(慶應義塾大学政策・メディア研究科)

1. 経緯

JIS X 4177:2009を制定し,今回の改正に至った経緯を説明する。

1) 2009年規格の制定経緯
2009年度規格は,Character Repertoire Description Language (CREPDL:文字レパートリ記述言語)を規定しており,ISO/IEC 19757-7:2009を基に制定された。
グローバルな電子化情報交換の普及に伴い,国際符号化文字集合(UCS)にある文字すべてを無制限に使うのではなく,使える文字符号と文字符号列を明示し,制限することが必要となっている(実装負担の軽減)。近年,UCSのAnnex Aに記載されているサブレパートリが増加しているのも,こうした制限が必要なことを示している。漢字を扱う日本では,制限の必要性はとくに高い。
こうした必要性を受けて,使える文字符号の制限を記述するための言語CREPDLが開発され,2009年度規格の対応国際規格ISO/IEC 19757-7:2009として制定された。

2) 今回の改定の経緯
文字符号の集合だけではなく,文字符号の列の集合を記述できることが望ましい。特に,どの漢字の後にどの漢字異体字シーケンス(IVS)を許容するかを正確に記述することは,IVSが普及しつつあるいま,ますます重要になってきている。欧州でも,どの基底文字の後にどの結合文字を許容するかは重要である。
文字符号の列の集合を記述できるようにCREPDLを拡張したのがISO/IEC 19757-7:2020である。今回の改正は,この原規格改訂を受けたものである。

2. 作業内容
2.1 主な改正点

  •  箇条5に,文字符号の集合だけではなく,文字符号の列の集合を扱うことを加え,大幅に拡充する。
  •  箇条6“表記法”において, 文字符号を検査するのか,それとも文字符号の列を検査するのかを指定する属性を追加する。また,改正前の版との混同を避けるため,CREPDLスキーマの名前空間の名称を変更する。
  •  箇条7“意味”において,レジストリとしてUnicode漢字字形データベース(Unicode Ideographic Variation Database)を導入する。
  •  附属書Bに,文字符号の列の集合を記述した例を追加する。
  •  新たに附属書Cを設け,主な改正点を列挙する。
 

2.2 作業中問題となった点

附属書JAにどのようなCREPDLスキーマを盛り込むかが議論になった。

JIS X 0212:2020には日本文字関連部分集合用図形文字の組が示されており,それらをどう組み合わせるかも示されている。これらに基づくCREPDLスキーマを導入することには直ちに合意された。日本文字関連部分集合用図形文字の組に正規化Dを適用して得られる文字レパートリをCREPDLスキーマを導入することも問題なく合意された。

一方,Adobe-Japan1フォントで表示可能な符号位置からなる文字レパートリを附属書JAに含めるという案もあった。しかし,これについては反対があり見送ることになった。この規格はCREPDL言語を規定するものであって文字レパートリを規定するものではないので,慎重な議論が必要となる文字レパートリはたとえ附属書であっても含めないのが妥当である。

3. その他

今後は,普及のための活動が重要になってくる。オープンソース実装はすでに存在している。当面もっとも期待される用途は,EPUBアクセシビリティへの応用である。