SC 32 専門委員会 (データ管理及び交換)

第1 種専門委員会

SC 32 専門委員会(データ管理及び交換/Data Management and Interchange)

委員長 土田正士(東京都立大学)

1. スコープ

 SC 32 は,情報システムのローカル及び分散環境でのデータ管理のための標準開発,また個々の分野のデータ管理機能を協調させる技術を提供することをス コープとする.現在,開放型電子データ交換を扱う「e ビジネス」,メタデータの管理と交換を扱う「メタデータ」,関係データベース言語 SQL 及びグラフ問合せ言語 GQL を扱う「データベース言語」,「データ利用」について作業グループを設置し標準開発を進めている.

2. 参加国

P メンバー 18 ヶ国,O メンバー 20 ヶ国,総会及び WG 中間会議の参加国 12 か国(オーストラリア,カナダ,中国,ドイツ,オランダ,デンマーク,韓国, 日本,スウェーデン,イタリア,英国,米国) 議長(Jim Melton,米国),セクレタリ(Bill Ash,米国)

3.トピックス

3.1 メタデータ

a) WG 2 の中心的な規格である ISO/IEC 11179 シリーズの改版作業が進行中。
b) WG2 の新たな PJ として,ISO/IEC 5394 Criteria for concept systems が開始.
c) WG2 にて ISO/IEC 6523 シリーズ(Structure for the identification of organizations and organization)の改版 PJ が開始.

3.2 データベース言語 SQL

a) 次期 SQL2022 の新パート 16 (ISO/IEC 9075- 16: Property Graph Queries(SQL/PGQ)では,隣接ノード取得の高速性を特徴とし,グラフ表現のデ ータ形式に対して問い合わせを行うことでデータ間の関連性を導くなど,経路探索や中心性解析などのグラフ解析 ( ソーシャルグラフ分析等 ) の Property Graph 機能が提供される.これら機能は,頂点情報を保持する表(Vertex table),辺情報を保持する表(Edge table)によりグラフ構造にマッピングし,グラフ表現のデータ形式に対するグラフ問合せ(GRAPH_TABLE 機能,グラフパターン正規表現)で実現する.このパート 16 を含めて 2022 年中 の国際規格化を目指す.
b) データベース言語 GQL(ISO/IEC 39075)は,SQL でのグラフ問合せのためのパート 16(SQL/PGQ) とは別にグラフ問合せ機能を開発している. SQL/PGQ に対して GQL で固有にサポートする機能(グラフ操作のための DML,グラフスキーマでの制約定義など)があるものの,共有できる機能(グ ラフパターン指定での集合操作,グラフパターン一致)については共通化することで開発が進められている.
c) ガイダンス IS の 19075 シリーズについては,SQL でサポートされる OLAP 機能,即ち OLAP 操作,ウィンドウ関数,統計関数の概要及びユースケースを概観する目的でパート 9(ISO/IEC 19075-9, Online analytic processing (OLAP) capabilities), 及びリレーショナルモデルからの拡張部分を SQL モデルとして詳解するパート 10(ISO/IEC 19075- 10, SQL model)を新たに開発する.
d)SQL 統計解析関数の主に検定に関する拡張の議論に加えて,ビッグデータ及び AI に関連したデータ分析が実践され始めており,それらのニーズに対応するために SQL 及び GQL で関数ライブラリを規定する 29075 シリーズ(Information technology -- Function libraries for advanced analytics in data management)について議論された.ただ, ISO TC69/WG12 ( Application of statistical methods - Big data analytics)など先行して関数ライブラリを開発する規格などあり SC42/WG2 ( Big data ) , SC42/WG5 ( Computational approaches and computational characteristics of AI systems)とも共同して,先ずは PWI として開発を行い,改めて NWI 投票を実施する.

3.3 データ利活用(Data Usage)

a) Advisory Group 9 で検討されていた Data Usage が SC 32 に移管され、2020 年 10 月に担当 WG として WG6(コンビナー:Oppenrmann Ian、登録 エキスパート約 50 名。主要参加国は、豪、英、加、 米、日本)が設置された。
b) 二本の標準を規格化中。 1) ISO/IEC 5207 – Terminology and use cases, Project editor: Teresa Anderson (AU)。 背景は、データの共有と使用が、多くの JTC 1 標準に関連しており、既存の標準間で異なる方法で記述されている。より広範なデータ共有を促進し、データ共有の価値を明らかにするために、標準化された用語と調和されたユースケースが市場で必要とされている。本規格では、データの使用に関する用語を定義し、関連する使用例について説明す ることによって、他の規格の開発や、多様な利害関係者間のコミュニケーションの支援に使用することが期待される。
2) ISO/IEC 5212 – Guidance for data usage, Project editor: Alexandra Harrington (AU)。背景は、デジタル変革とデジタル経済のメリットを実現するために、多くの組織が大量の高品質データにアクセスする必要がある。データ使用の決定がどのような根拠に基づいて承認されているかを判断することは困難であり、プライバシー、セキュリティ、品質、価値などの問題はすべて考慮すべき事項である。データ利用に関する意思決定のためのガイダンスは、しばしばアドホックであり、 適切なコンテキストを整理されていないため、本規格の目的は、組織がデータ利用に関する意思決定プロセスを発展させるのに役立つ、一貫した一連の考察とガイダンスを提供することである。
c) WG6 は設置してから2週間毎に遠隔会合を実施し、意見交換とアイディアの抽出のため、いくつかのワークショップも同時に実施されている。

4. 日本対応/方針

4.1 メタデータ

a) WG2 では,毎月開催される Zoom 会議に参加し, 作業中の開発の状況を把握する. 特に ISO/IEC 11179シリーズの第4版への改定とISO/IEC 6523 シリーズの改版について注視する.

4.2 データベース言語 SQL

a) SQL2022 及び GQL では仕様の整合性を確保しつつ,データの関係性に着目するグラフ問合せが開発項目として議論されている.Property Graph 機能 を提供しているベンダも多く,活用事例が増えつつあり,SQL と併存することでグラフ DBMS の市場も立ち上がることが期待されている背景がある.既に Property Graph 機能を提供しているベンダも多く , Cypher9(Neo4J) , PGQL(Oracle) , GSQL(TigerGraph) , Gcore(Linked Data Benchmark Council(LDBC) Query Language task force)他からエキスパートが参加している. Neo4J は米国だけでなく,他のベンダからも多数のエキスパートが参加している.データ分析への期待が高まっており,意思決定に役立てるために迅速に意味付ける技術としてグラフ関連システムに期待が集まっており,留意しながら開発を進めたい.

4.3 データ利活用(Data Usage)

a) 日本は AG9 での議論も積極的に参加し、WG6 の設置時に「Contract Guidelines on Utilization of AI and Data: Data Section」という寄書を提出
b) 第 5 回 WG6 会合にて、経産省の羽深宏樹氏より 上記寄書の背景及び日本の取組についてプレゼンされ、強い関心と評価を得ていた。

5. その他

a) 国際規格開発賞 1 件(WG 2 小委員会 岡部雅夫氏[東北工業大学])の受賞があった(2021 年 1 月).