SC 32 専門委員会 (データ管理及び交換)

第1 種専門委員会

SC 32 専門委員会(データ管理及び交換/Data Management and Interchange)

<2024年度委員会活動報告>

委員長 土田 正士(東京都立大学)

1. スコープ

 SC 32は,情報システムのローカル及び分散環境でのデータ管理のための標準開発,また個々の分野のデータ管理機能を協調させる技術を提供することをスコープとする.現在,開放型電子データ交換を扱う「eビジネス」,メタデータの管理と交換を扱う「メタデータ」,関係データベース言語SQL及びグラフ問合せ言語GQLを扱う「データベース言語」,「データ利用」について作業グループを設置し標準開発を進めている.

2. 参加国

Pメンバー 18ヶ国,Oメンバー 24ヶ国,総会への参加国12か国(オーストラリア, カナダ, 中国, デンマーク, ドイツ, インド, イタリア, 日本, 韓国, オランダ, スウェーデン, アメリカ)
議長(Karl Schendel,米国),セクレタリ(Bill Ash,米国)

3.トピックス

3.1 データベース言語

a) ISO/IEC 9075シリーズ(SQL:2023)及びISO/IEC 39075(GQL: Graph Query Language)が発行されたので,訂正票の開発に着手した.また,両シリーズの次期版については,いずれも次回SC32総会(2025年6月)までに作業文書を開発する.WG3のエディタ会議で出版プロセスでの懸案事項を議論し,今後の共同作業に向けて課題を整理した結果,規格文書が大規模なXMLで開発されており,すべての規格文書に主エディタ,副エディタを配して,相互にXML文書の品質を保証する体制としている.


b) ISO/IEC PWI 29075(Function Libraries for advanced analytics in data management)は,ISO/IEC 9075シリーズ(SQL)及びISO/IEC 39075(GQL)で共通するデータ分析機能を関数ライブラリとして順次開発する狙いであるので,複数パート構成とする.それぞれ,第1部のフレームワーク,第2部のStatistical functionsからなる作業文書が示され議論の結果,NP提案を行う.


c) ISO/IEC 19075-10(SQL Model)のすべてのDISコメントが解消されたことを確認し,ISO/CSに最終文書を送付した.


d) 「データ利用」に関する新たな潮流として,生成AI(Generative AI)をビジネスシステムに活用する実践事例が最近の顕著な動向として急激に増加している.この生成AIの活用では,大規模言語モデル(LLM)が重要な役割を果たす.それら多くのLLMは一般的に公開されている情報に基づいて学習されたものである.しかし,LLMをビジネスシステムに適用するために,ビジネス用途のためにアクセス制御されたデータベースに格納されている情報でLLMを補強する必要があり,これをRAG(Retrieval-Augmented Generation)と呼ぶ.データ管理分野では商用及びOSSのISO/IEC 9075(SQL)シリーズに準拠するSQL処理系に限らず,ISO/IEC 39075(GQL)に準拠するグラフDB処理系でもRAGをサポートし始めており,ビジネスシステムでのRAGサポートが最重要な開発課題である.特に,主要なビジネスシステムの中核としてデータ管理基盤の活用が進んでいるSQL処理系に対して,RAGサポートは主要なシステム要件として取り上げられ始めている.例えばSQLでは他のデータモデル(オブジェクト指向,XML,JSON,多次元配列,プロパティグラフなど)を取り込んできたのと同様に,RAGを商用及びOSSのSQL処理系でサポートする動きが出ている.ビジネスシステムでのRAGサポートが最重要な開発課題であることが認識された.
 

3.2 データ利活用(Data Usage)

a)  2020年10月発足したWG6は,豪主導で2本の規格(a. ISO/IEC 5207 – Terminology and use cases, Project editor: Teresa Anderson (AU); b. ISO/IEC 5212 – Guidance for data usage, Project editor: Alexandra Harrington (AU))を策定し,最終文書は2024年4月に国際標準として発行された.WG6に登録したエキスパートが大幅に増えて約110名で,アクティブに活動しているのは豪州,カナダ,中国など約15名前後であった.


b)  2024年9月から2025年3月まで計7回のWGリモート会合(トータルで68回のWGリモート会合)を行い,PWI 24927 on Framework for organization data usage evaluationについて,議論が交わされた.

4. 日本対応/方針

4.1 データベース言語

 市場動向を受けて,次期版ISO/IEC 9075(SQL)シリーズ及びISO/IEC 39075(GQL)でのRAGサポートについて議論が行われた.標準化については,ISO/IEC SC 42/WG 2 : Dataで規定する用語定義の継承,ベクトルデータ型の定義,ベクトル近傍検索の概念などが懸案事項と認識された.現時点ではRAGを取り巻く技術動向の進展が早く,活用方法が安定化する時期も読めないので,SQL及びGQLの次期版への反映方法(9075/39075での既存パートに機能追加あるいは新パートで対応,29075でのベクトル近傍検索の関数ライブラリ化など)については合意されていない.RAGを取り巻く技術動向の進展が早く標準仕様を策定できる時期も決め難い状況であるが,益々生成AIへの期待が高まっており,ビジネスデータ間の関係性を深く探りビジネスの意思決定に役立てるために文脈や意味理解を支援する技術としてRAGサポートに期待が集まっている.国内外の産業界での適用が着々と進んでいるので,今後とも適用動向に注視したい.

4.2 データ利活用(Data Usage)

 2024年度は設立当初で計画された両文書が発行され,新しい標準化アイテムを模索する年なので,専門委員会に都度進捗を報告し,動向を見極めていた.