JSON-statの評価

ここではJSON-statと他の統計データモデルを比較して、JSON-statの特徴を説明します。ベースとする資料はJSON-statの考案者であるX. Badosa氏の国連での講演ですので、多少手前味噌なところがあるかも知れませんが、筆者はかなり妥当なものだと考えています。

表1 統計データモデルの比較評価

表1でブルーの背景部分はBadosa氏の国連講演(http://www.slideshare.net/badosa/jsonstat)内の記述の要約です。黄色の背景部分は筆者が追加したものです。

SDMX(Statistical Data and Metadata Exchange)は国際機関(BIS,ECB,Eurostat,IMF,OECD,World Bank and the UN)が中心となって標準化した統計データを記述するデータモデルで、SDMX-MLはそのXML版です。これは主に国と国際機関の間のデータ交換に使われています。

SDMX-MLは多次元統計データ一般を記述できますが、統計専門機関が使う詳細な統計概念を記述できるようにしているため複雑です。また、XMLを使っているため、データ量が膨大になる欠点があります。

3列目のUN Data APIなどの国際機関・国については、Badosa氏は多くの実例をあげて、そのいずれもがその組織固有のデータ概念を使っており一般性がないことを指摘しています。

従って、現状ではJSON-statがベストであるというのがBadosa氏の主張です。ここまでは筆者も異論がありません。ただ取り上げられた例が少し足りないように思われました。そこで追加したのが右端の2列です。

e-Statは総務省が国勢調査など日本の主要統計を提供しているポータルサイトの名前です。そこの統計データ提供APIは、Badosa氏が一般性がないとしたアメリカ労働省などのものと同じ政府機関のAPIの一つですが、e-StatのAPIには総務省固有のデータ概念は含まれていず、十分一般性があります。しかし、同じ情報を送るのに必要なデータ量は、JSON-statに比べて、数段多い(Not Light)です。

e-Statのデータ概念はJSON-statによく似ています。JSON-statには定義されていないメタデータ概念を追加できる拡張機能(extension)があります。そこで、e-Statについては、データ提供に追加でJSON-statのフォーマットも採用し、そのextensionを活用して足りない概念を補うというのが望ましい方策なのではないかと考えています。

そうすればe-Stat利用者はJSON-stat向けの多くのツールを活用できるようになります。また、日本のextensionの活用方法を公開すれば、今後統計APIを整備しようとするであろう発展途上国の人々にとって有益な情報となるのではないかと思います。

最後の列は当サイトでも取り上げている統計Linked Dataの国際標準QB(正式名称:The RDF Data Cube Vocabulary)です。これもJSON-statに劣らない一般性を備えています。名前空間の利用などLinked Dataの長所を備えており、JSON-statより優れている面も持っています。このLinked DataとJSON-statとの比較については別稿の「Linked Data と JSON-stat」で取り上げます。

最後に表1に筆者が追加した2行について説明しておきます。「意味の扱い」は名前空間の利用の有無を念頭においています。統計では、市町村合併や商品分類変更などにより、同じ名前でも直接データを比較できないものが多いです。この行は、この問題を正しく扱えるかどうかを表しています。この問題も別稿の「Linked Data と JSON-stat」で取り上げます。

「使われている」の行は、国や国際機関で正式に使われているかどうかを表しています。〇はJSON-statとSDMX-MLで、これらは多くの国や国際機関で使われています。△は国際機関や国の独自仕様で、少なくとも1ヵ国または1つの機関で正式なものとして使われています。?はQBで、国際標準になっていますが、正式にこれを採用した国や国際機関はまだないのではないかと思います。

About 佐藤 英人

東京国際大学名誉教授。 若い頃、経済企画庁(現内閣府、経済産業省)の統計課、国民所得部で統計の実務を経験。 その後、大学で統計データベース、知識ベース、オブジェクト指向等の研究・教育に従事。 著書:統計データベースの設計と開発 - データモデルと知識ベースの応用(オーム社)、オブジェクト指向が分かる本(オーム社)など。

コメントを残す

Name and email are required. Your email address will not be published.

キャプチャ * Time limit is exhausted. Please reload CAPTCHA.