SC 32 専門委員会 (データび交換)

第1 種専門委員会

SC 32 専門委員会(データ管理及び交換/Data Management and Interchange)

<2021年度委員会活動報告>

委員長 土田 正士(東京都立大学)

1. スコープ

 SC 32は,情報システムのローカル及び分散環境でのデータ管理のための標準開発,また個々の分野のデータ管理機能を協調させる技術を提供することをスコープとする.現在,開放型電子データ交換を扱う「eビジネス」,メタデータの管理と交換を扱う「メタデータ」,関係データベース言語SQL及びグラフ問合せ言語GQLを扱う「データベース言語」,「データ利用」について作業グループを設置し標準開発を進めている.

2. 参加国

 Pメンバー 18ヶ国,Oメンバー 20ヶ国,総会及びWG中間会議の参加国14か国(オーストラリア,カナダ,中国,ドイツ,オランダ,デンマーク,韓国,日本,スウェーデン,イタリア,インド,ルクセンブルク,英国,米国)
議長(Karl Schendel,米国),セクレタリ(Bill Ash,米国)

3.トピックス

3.1 メタデータ

a) WG 2の中心的な規格であるISO/IEC 11179シリーズの第4版の改版作業において概ねCDフェイズが終え、DIS投票に向けての準備に着手した.

b) ISO/IEC 11179シリーズの改版が大詰めを迎えたため,参照している他の規格の改版作業が開始.

c) WG2にてISO/IEC 6523シリーズ(Structure for the identification of organizations and organization)の改版についてWDベースでの議論を継続.

3.2 データベース言語 SQL

a) SQL2023の新パート 16 (ISO/IEC 9075-16: Property Graph Queries(SQL/PGQ)では,グラフ表現のデータ形式に対して問い合わせを行うことでデータ間の関連性を導くなど,経路探索や中心性解析などのグラフ解析(ソーシャルグラフ分析等)のProperty Graph機能が提供される.これら機能は,頂点情報を保持する表(Vertex table),辺情報を保持する表(Edge table)によりグラフ構造にマッピングし,グラフ表現のデータ形式に対するグラフ問合せ(GRAPH_TABLE 機能,グラフパターン正規表現)で実現する.このパート16を含めて,9075シリーズのすべてのパートがDIS投票に付される.

b) データベース言語GQL(ISO/IEC 39075)では,SQLでのグラフ問合せのためのパート16(SQL/PGQ)とは別にグラフ問合せ機能を開発している.米国を中心にProperty Graph機能を提供しているベンダも多く,活用事例が増えつつあり,SQL と併存することでグラフDBMS の市場も立ち上がることが期待されている.会議には,Neo4J,Oracle,TigerGraph,DataStax,RedisLabs, Linked Data Benchmark Council(LDBC)他からエキスパートが参加している.パート16(SQL/PGQ)と共有できる機能(グラフパターン指定での集合操作,グラフパターン一致)については開発の目途が立ち,今後はGQLで固有にサポートする機能(グラフ操作のためのDML,グラフスキーマでの制約定義など)の開発に注力する.

c) ガイダンスISの19075シリーズについては,リレーショナルモデルからの拡張部分をSQLモデルとして詳解するパート10(ISO/IEC 19075-10, SQL model)のCD投票を行う.

d) SQL統計解析関数の主に検定に関する拡張の議論に加えて,ビッグデータ及びAIに関連したデータ分析が実践され始めており,それらのニーズに対応するためにSQL及びGQLで関数ライブラリを規定する29075シリーズ(Information technology -- Function libraries for advanced analytics in data management)については,継続的に検討を続け,改めてNP投票を行う.

3.3 データ利活用(Data Usage)

 2020年10月発足したWG6は豪主導で2本の規格を策定中(a. ISO/IEC 5207 – Terminology and use cases, Project editor: Teresa Anderson (AU); b. ISO/IEC 5212 – Guidance for data usage, Project editor: Alexandra Harrington (AU)).
 WG6に登録したエキスパートが約70名で、アクティブに活動しているのは10名前後である.COVID19の影響とWG運用の不慣れより、2本の規格とも進捗が予定より9か月遅延している.
当初静観していた中国のエキスパート達が、積極的にコメントとアドバイスの提供に転じて運営側に助け舟を渡している.

4. 日本対応/方針

4.1 メタデータ

 WG2では,毎月開催されるZoom会議に参加し,作業中の開発の状況を把握する. ISO/IEC 11179シリーズの改版が大詰めを迎えている為,この規格を参照している他の規格の改定とISO/IEC 6523シリーズの改版について注視する.

4.2 データベース言語 SQL

 9075シリーズのすべてのパートがDIS投票に付され,SQLでのグラフ問合せのためのパート16(SQL/PGQ)と並行して開発しているデータベース言語GQLで共有できる機能についても目途が立ち,今後はデータベース言語GQLのCDコメント解消に注力することとなる.また,既にProperty Graph機能を提供しているベンダも多く,Neo4J,Oracle,TigerGraph,DataStax,RedisLabs, Linked Data Benchmark Council(LDBC)他からエキスパートが参加している.例えば,商用製品は米国を中心に,AgensGraph, Amazon Neptune, ArangoDB, MS CosmosDB, DataStax Enterprise Graph, HANA Graph, IBM Db2 Graph, JanusGraph, Neo4j, Oracle Server and PGX, RedisGraph, Sparksee, Stardog, TigerGraphがあり,データ分析への期待が高まっており,意思決定に役立てるために迅速に意味付ける技術としてグラフ関連システムに期待が集まっている.グラフDBについては,特に海外の産業界での適用が着々と進んでいる.国内での適用事例は少ないが,今後は適用が進むことが期待される.

4.3 データ利活用(Data Usage)

規格の検討状況と進捗の把握に留まっている.

5. その他

 特になし.