SC 2 専門委員会 (符号化文字集合)

第1 種専門委員会

SC 2 専門委員会(符号化文字集合/Coded Character Sets)

<2023年度委員会活動報告>

 委員長 田代 秀一(開志専門職大学)

1. スコープ

SC2 専門委員会は,符号化文字集合の国際標準化を担当する国際組織 ISO/IEC JTC1/SC 2(以降 SC 2)に対応する日本国内の組織である.そのスコープは,符号化文字集合,および,その並べ順を含む情報交換上必要な表現形式など(ただし,音声と画像の符号化を除く)である.「文字」を扱うあらゆる情報機器から参照される基盤的な規格を担当しており,また,「文字」を扱うことから,技術だけでなく,文化や言語の側面も含め,調和のとれた形で規格化議論を進めることが不可欠である.

「符号化文字集合」は,文字に番号(符号あるいはコードと呼ばれる)をつけたものの集合のことである.情報システムはこの番号を用いて文字の記録・伝達・処理などを行う.多数の国で独自の国内規格が定められてきた歴史を経,現在は世界中で使われている文字を一つの表に収めた国際符号化文字集合ISO/IEC 10646(国際符号化文字集合,以後10646規格という)が主に用いられている.10646規格は,約3万文字が収録された初版の発行(1993年)以来年間約5,000文字のペースで文字の追加が行われており,2020年発行の第6版は約14万文字が収録されている.現在その追補2を準備中である.SC 2ではこの規格と,ISO/IEC 14651(国際文字列の並べ替えと比較)の2つの規格の開発を継続して進めている.

日本は1997年より一貫してSC 2の国際議長及びコミッティマネージャを務めるなど,この分野での高いプレゼンスを確保・維持している.

10646規格は,SC 2とユニコード・コンソーシアムとで協調して開発しており,同コンソーシアムから発行されるUnicode Standardと同期した内容となっている.

2. 参加国

Pメンバー23ヶ国
Oメンバー27ヶ国
幹事国:日本
議長:武智秀(NHK財団).
エディタ引き受け状況:鈴木俊哉(広島大学),TR2375 (*1)のコエディタ

(*1)TR2375(Information technology - Registered escape sequences and coded character).過去に登録されたエスケープシーケンスの記録を残すための文書.

3. トピックス

3.1. 「水平拡張」提案の承認

2023年度のSC2総会(6月19,23日於カナダ)では,約3万文字に対する「水平拡張」の日本案が承認され,10646規格追補版2への掲載が確実となる大きな成果を収めることができた.

ISO/IEC 10646の文字コード表のうち,漢字に関する部分には,一つの文字コードに対して複数の字形が例示される場合がある.これは,漢字文化圏の各国・地域で用いられる漢字の代表的字形に微妙な差があるためである.ある文字コードに対して例字する字形を追加することを「水平拡張」と称している.

日本の戸籍などでの正確な人名表記に必要とされる約6万種の漢字のISO/IEC 10646の文字への対応付は完了している.しかし,日本で用いられる字形の全てはコード表に例示されていなかった.この不足分36,422文字へ例示字形を追加するのが今回の「水平拡張」提案であった.

下図は,同規格の文字コード表の中の,“3560”という文字コードの部分を一例として示したものである.現状は,このコードに,中国,台湾の例示字形(それぞれGHZ-64096.09,T3-3F78)のみが掲載されているが(図の矢印の左側),今回の提案により,日本の例示字形(JMJ-000316)が追加されることになる.





日本で用いる約6万の文字の例示字形がコード表に漏れなく掲載されることにより,人名などの正確な表記を目的とするシステムの実装などに今後活用されることが期待される.


 

3.2. 中国の国内規格問題の解決

同総会では,中国が,未だ国際規格となっていない漢字に対し,国内規格として独自の文字コードを割り当てる準備を進めている問題が議論された.

独自の国内規格ができてしまうと,同一の文字コードに対応する文字が国によって異なるものになる恐れがある.これはデータ連携や電子文書の自由な流通を阻害し,経済活動や文化交流に深刻な影響をもたらす恐れがある.この問題が各国から指摘された.

米国から,中国が必要としている約700文字を緊急に国際規格へ収容する案の寄書が出され,日本もそれを支持する寄書を提出した.総会において,中国は独自の国内規格の作成を中止することに合意し,問題は解決した.


 

3.3. SC 2標準化プロセスの見直し

2023年11月,米国よりSC 2の標準化プロセスの改善を訴える寄書(“Proposal to maintain UCS repertoire via a maintenance agency”)が提出された.主要国・地域の一般の人々が日常用いる文字の国際規格化の完了が近づいている中,近年規格へ追加される文字は人名や地名などで用いられる文字,歴史的文字,少数民族文字など専門性の高い文字や,SNSなどで用いられる絵文字などが増えている.こういった文字の規格化を効率的に進めるためには新たな体制が必要であると指摘した上で,その解決策としてISO/IEC Directives, Part 1,Annex Gに規定された“Maintenance Agency(メンテナンス機関)”の活用を検討するべきだという提案がなされた.

日本はこの考えに基本的に賛成するものの,中立公平な意思決定プロセスを確保することが重要であり,そのために議論を尽くすべきであることを主張した寄書を提出した.

4. 日本対応/方針

基本的承認を得た水平拡張案について,出版へ向けた投票処理などを円滑に進めてゆくとともに,規格の活用を図る.

少数民族文字,歴史的文字,人名用漢字などのように,文化,国家,民族などに深く根ざす文字,また,絵文字などビジネスや現代文化を反映した文字などの規格化が増え,今後の議論にはますます多岐に渡る専門家が必要とる上,国家・地域や文化圏,学界,産業界など,利害関係者も多岐にわたる.このような環境で,効率的かつ中立・公正な規格化を進めることは非常に困難であるが,長期にわたって国際議長及びコミッティマネージャを務めるなどSC 2へ貢献してきた日本がイニシャティブをとることが期待されており,それにこたえてゆく.

2025年のSC 2総会は日本で開催する予定であり,そこで納得できる結論が出るよう,準備を進める.