データスペースとはなにか?をまずざくっとしたいい加減な言い方から入っていきたいと思います。
データスペースとは、複数の組織の間で、データ共有やデータ流通を行ったり、データガバナンスの考え方を実現するための何らかのメカニズムで、そのメカニズムには、デジタル技術を含むことはもちろん、ただ、それだけれなく、法制度とかビジネス、コンセプトやビジョンなども含んだもので、いわゆる技術的・組織的・社会的なプラットフォームとして実現されるものです。
もともとは、2005年にGoogleの研究者によって提唱され(ACM SIGMODの論文[1]があります)、2020年頃からヨーロッパのデータ流通・共有の複数のイニシアチブ(今後ここでもいろいろご紹介します)により、再提案・推進されているものです。アカデミア側からみると、欧州ではFranfaufer研究機構のBoris Otto教授が近年の推進における、学術的・基盤的中核となっており、データスペースの父のような存在になっています(データスペースに関する代表的な書籍[2])。
そして、「データスペース」と呼ばれる、または自ら標榜するプラットフォームは、概ね以下の特徴を複数備えています。
1.データの分散型管理(連邦型アーキテクチャ)
データをどこかに集めるのではなく、各自が出したデータをゆるやかにつなげていく技術構造をとります。
データ保有者がデータ制御権を持つ「データ主権」を尊重する。ただ、この「データ主権」という言葉も、コンテキストによっては、いろいろな意味で使われます。
2.相互運用性(Interoperability)
データのサイロを開放し、異なるシステムや組織間でデータが円滑に連携・利用できることを目指します。これを分散管理と組み合わせれば、オープンまたは標準化されたAPIを用いた連携によって連邦型データプラットフォームアーキテクチャを構成します。
3.信頼・契約ベース(トラスト)
参加するステイクホールダー(多くの場合、データ提供者やデータ受領者)が相互に信頼できる環境を構築し、ガバナンスルールに従ってデータのフローや利用(Usage)を制御します。欧州などでは、個人情報については、GDPRを満たことが厳格に求められます。これによって、オープンデータだけでなく、許諾や契約が必要な有償データも含めて流通させることができます。
参考文献
[1] Franklin, M., Halevy, A., and Maier, D.: “From databases to dataspaces.” ACM SIGMOD Record, 34(4), 2005, pp. 27–33.
https://doi.org/10.1145/1107499.1107502
越塚登(2025年9月11日)