2012 09 06_sot_m_osm

29
OpenStreetMapのデータとコミュニティ活動について Tomomichi Hayakawa (@Tom_G3X) OpenStreetMap Foundation Japan Center for Green Computing, Nagoya Institute of Technology Yuma Imi, Takayuki Ito Department of Computer Science, Nagoya Institute of Technology

Upload: tom-hayakawa

Post on 31-May-2015

523 views

Category:

Technology


0 download

TRANSCRIPT

Page 1: 2012 09 06_sot_m_osm

OpenStreetMapのデータとコミュニティ活動について

Tomomichi Hayakawa (@Tom_G3X) OpenStreetMap Foundation Japan

Center for Green Computing, Nagoya Institute of Technology

Yuma Imi, Takayuki Ito Department of Computer Science, Nagoya Institute of Technology

Page 2: 2012 09 06_sot_m_osm

OpenStreetMap

自己紹介

•  OpenStreetMap Tokai •  OpenStreetMap Foundation Japan •  名古屋工業大学グリーンコンピューティング研究所 •  Malaika System – CEO

•  FLOSSな活動 –  OpenStreetMap東海

•  - http://groups.google.co.jp/group/OSM-Tokai

–  XOOPS Cube Project 〜 XOOPS Cube 東海 –  FLOSS桜山 〜 DS-Tokai

•  名古屋のメタ・コミュニティ

•  Twitter @Tom_G3X •  うえこみ春日井小牧

–  地域情報サイト運営- http://www.kasugai-komaki.jp/

•  その前は・・・株式会社ザクロ – 取締役 とか・・・・

早川 知道(はやかわ ともみち)Tomomichi Hayakawa

Page 3: 2012 09 06_sot_m_osm

今回使用したデータについて

日本のコミュニティ活動の調査 – 日本の履歴データ

•  全球データより日本を抽出 (planet.openstreetmap.org) •  2007.11.7 ~ 2012.04.30の期間 •  PostGISで拡張したPostgreSQLへ (データベースで約500GB 程度) •  加えて、藤澤さんのデータも

–  http://wiki.openstreetmap.org/wiki/User:Techstrom/JapanData

日本と他地域との比較調査 – 各地域のデータ(77地域)

•  世界のデータ(Node, Way, Relation, User) –  http://odbl.de/ より取得

•  2012.4.30 現在

日本のデータについて調べてみました

Page 4: 2012 09 06_sot_m_osm

日本のOpenStreetMap 履歴データ

Page 5: 2012 09 06_sot_m_osm

OpenStreetMap の日本のデータ

OpenStreetMap Japan の歴史 (2007.11 – 2012.7)

0

10,000,000

20,000,000

30,000,000

40,000,000

50,000,000

60,000,000

70,000,000

80,000,000

90,000,000

2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月

Object relation

way

node

2008.3 - 国土数値情報(鉄道) インポート開始

2010.4 ‒ 国土数値情報(森林) インポート

2010.4 ‒ 2011.10 国土数値情報(河川) インポート

2008.4 ‒ 国土数値情報(行政区域) インポート

2008.3 ‒ 2010.4 国土数値情報(空港) インポート

2009.11 ‒ 2010.2 国土数値情報(海岸線) インポート 2010.12 ‒

Bing衛星写真 提供開始

2010.3.31 国土計画局オルソ空中写真提供終了

2011. 9.23-10.3 coastline 入れ替え作業 Yahoo/Alpsデータ

2011.4 ‒ 2011.9 国土数値情報(公共施設) インポート

2012.4.1 ODbLライセンス切り替え 2010.12.24 OpenStreetMap Foudation Japan 設立

2011.3.6 Yahoo/Alpsデータの提供発表

2011.3 国土数値情報(発電所) インポート

2011.4.1 Yahoo/Alps道路データ インポート開始

3.11

9   14   12   30  62   73   80  

94  109  121  

155  171  206  218  

237  

312  346  

374  413  

472  499  

542  544  558  567  578  584  592  606  645  671  

698  743  766  

802  825  854  

1,179  1,238  1,272  1,298  

1,338  1,364  1,391  

1,440  1,468  

1,514  1,543  1,590  

1,842  

1,965  1,994  

2,162  

user  

Page 6: 2012 09 06_sot_m_osm

OpenStreetMap の日本のデータ

Source Tag (All ObjectsèNode, Way, Relation)

リソースの割合を調査、sourceタグの数を集計してみたが・・・・、

Nodeにタグがあったりで、正確な比率が出せなかった orz

PGS, 37,660 , 0.05% NRPB of MLIT Japan(オルソ), 80,873 ,

0.10%

MLIT(国土数値情報/森林など),

292,056 , 0.35%

KSJ2(国土数値情報), 25,007,061 , 30.36%

Bing, 494,767 , 0.60%

Yahoo/Alps, 3,970,862 , 4.82%

Sourceタグなし, 52,482,876 , 63.72%

PGS

NRPB of MLIT Japan(オルソ)

MLIT(国土数値情報/森林など)

KSJ2(国土数値情報)

Bing

Yahoo/Alps

Sourceタグなし

2012.04.30 現在

Page 7: 2012 09 06_sot_m_osm

OpenStreetMap の日本のデータ

Highway = * (道路タグの値) (2007.11 – 2012.4)

0    

500,000    

1,000,000    

1,500,000    

2,000,000    

2,500,000    

3,000,000    

3,500,000    

4,000,000    

4,500,000    

2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月

steps cycleway road living_street track path footway pedestrian service residential unclassified tertiary secondary primary trunk motorway

3.11

2011.4.1 Yahoo/Alps道路データ インポート開始

Page 8: 2012 09 06_sot_m_osm

Tag別 (Highway以外のタグ) (2007.11 – 2012.4)

0    

100,000    

200,000    

300,000    

400,000    

500,000    

600,000    

700,000    

800,000    

2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月

landuse=

natural=

power=

leisure=

shop=

waterway=

railway=

3.11

2008.3 - 国土数値情報(鉄道) インポート開始

2010.4 ‒ 国土数値情報(森林) インポート

2010.4 ‒ 2011.10 国土数値情報(河川) インポート

2011. 9.23-10.3 coastline 入れ替え作業 Yahoo/Alpsデータ

2011.3 国土数値情報(発電所) インポート

2009.11 ‒ 2010.2 国土数値情報(海岸線) インポート

Page 9: 2012 09 06_sot_m_osm

Shop=* Leisure=* (2007.11 – 2012.4)

淡々と増えている

0    

2,000    

4,000    

6,000    

8,000    

10,000    

12,000    

14,000    

16,000    

2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月

shop=

leisure=

3.11

Page 10: 2012 09 06_sot_m_osm

Tagの数 (Wayの数と比較) (2007.11 – 2012.7)

0  

1,000,000  

2,000,000  

3,000,000  

4,000,000  

5,000,000  

6,000,000  

7,000,000  

8,000,000  

9,000,000  

2008年1月 2008年7月 2009年1月 2009年7月 2010年1月 2010年7月 2011年1月 2011年7月 2012年1月 2012年7月

way

通常のタグ

※但し、 以下のタグは除外している Source =* , Node =* Created_by =* Yh:* =* KSJ2:* = *

2010.4 ‒ 2011.10 国土数値情報(河川) インポート

2011.4.1 Yahoo/Alps道路データ インポート開始

Page 11: 2012 09 06_sot_m_osm

実は、当初、環境が整ってなくて、 Gripで集計してた事は、内緒です。

気が付いたら、

iMac3台を2週間くらい回してた orz

今は、ちゃんとDBに入ってます。

Page 12: 2012 09 06_sot_m_osm

日本と他地域のデータを比較し、興味深い結果が出ましたので

紹介します。

Page 13: 2012 09 06_sot_m_osm

OpenStretMapの品質

オブジェクトの数の指標

•  OSM Merit –  http://odbl.de にて定義

–  Node,Way,Relationの複数の要素を一元化した指標

OSM Merit = Node + 5*Way + 20*Relation

•  OSM Merit 密度 –  1000km2 あたりのOSM Merit

–  他地域との比較に利用 OSM Merit密度 = (OSM Merit * 1000) / 面積 (km2)

•  マッパー1人当たりのOSM Merit –  マッパー1人当たりのOSM Merit(オブジェクト数) –  他地域との比較に利用

マッパー1人当たりのOSM Merit = OSM Merit / マッパー数

OSM Merit (オブジェクトの数の指標)

Page 14: 2012 09 06_sot_m_osm

データ分析

OSM Merit 密度 (上位20地域)

11,289,000

1,990,387

646,354

540,552

527,690

506,001

490,827

441,267

437,450

421,356

361,974

306,936

280,999

258,064

253,014

248,482

233,776

160,385

122,655

118,683

124,471

0 200,000 400,000 600,000 800,000 1,000,000 1,200,000 1,400,000 1,600,000 1,800,000 2,000,000

monaco

netherlands

france

czech_republic

luxembourg

belgium

germany

gaza

slovakia

switzerland

austria

denmark

japan

europe

great_britain

italy

canary_islands

bahrain

israel_and_palestine

slovenia

japan 20110309

OSM Merit / 1000km2

Region

OSM Merit密度 = 1000km2あたりのOSM Merit(データ数) ・日本は13番目  ・まだ日本のコミュニティは小さいのだが、 OSM先進地域に迫るOSM Merit(データ数)

・日本は、ヨーロッパ平均と同程度 ・3.11直前から、約一年でデータ数が約2倍に  ・日本でOSMが普及過程にあった事  ・3.11にクライシスマッピングが行われた  ・4/1よりYahoo!/Alpsデータのインポートが始まった

OSM Merit密度 (単位面積当たりのオブジェクト数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ

Page 15: 2012 09 06_sot_m_osm

データ分析

マッパー1人あたりの人口 (OSM Merit上位20地域)

339

3,311

4,684

2,842

786

2,947

1,732

13,355

4,094

1,596

1,873

2,365

64,814

4,003

4,653

6,253

2,348

11,631

12,402

2,274

149,133

0 20000 40000 60000 80000 100000 120000 140000 160000

monaco

netherlands

france

czech_republic

luxembourg

belgium

germany

gaza

slovakia

switzerland

austria

denmark

japan

europe

great_britain

italy

canary_islands

bahrain

israel_and_palestine

slovenia

japan 20110309

Population / Mapper

Region

= 人口/マッパー数 ・日本は飛びぬけて多い ・OSM先進国と比べて、  飛びぬけてOSM普及率が低い! ・3.11直前は、さらにその倍以上低かった!

日本は普及率が低い!(マッパー人口比) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ

Page 16: 2012 09 06_sot_m_osm

データ分析

マッパー1人あたりの面積 (OSM Merit上位20地域)

マッパー1人あたりのカバー面積が広すぎる! 22

8,196

41,129

21,969

4,047

8,631

7,565

3,243

36,703

8,643

19,122

18,479

192,282

34,624

18,180

32,437

8,475

7,900

29,126

23,011 442,430

0 50000 100000 150000 200000 250000 300000 350000 400000 450000

monaco

netherlands

france

czech_republic

luxembourg

belgium

germany

gaza

slovakia

switzerland

austria

denmark

japan

europe

great_britain

italy

canary_islands

bahrain

israel_and_palestine

slovenia

japan 20110309

Area (1000km2)/Mapper 

Region

= 面積(km2)/マッパー数 これも、日本は飛びぬけて広い OSM先進国と比べて、 マッパーあたりのカバー面積が飛びぬけて広い! 3.11直前は、さらに倍以上広かった!

Page 17: 2012 09 06_sot_m_osm

•  データの密度は、ヨーロッパ並み

  だけど

•  マッパー人口比、ヨーロッパの10倍以上

•  マッパー面積比、ヨーロッパの5倍以上

èマッパー少なすぎ

  それで

•  マッパー1人当たりのデータ量は・・・・・・・

つまり、日本は、・・・・・

Page 18: 2012 09 06_sot_m_osm

データ分析

マッパー1人あたりのOSM Merit (OSM Merit上位20地域)

251

16,312

26,584

11,875

2,136

4,367

3,713

1,431

16,056

3,642

6,922

5,672

54,031

8,935

4,600

8,060

1,981

1,267

3,572

2,731

55,070

0 10,000 20,000 30,000 40,000 50,000 60,000

monaco

netherlands

france

czech_republic

luxembourg

belgium

germany

gaza

slovakia

switzerland

austria

denmark

japan

europe

great_britain

italy

canary_islands

bahrain

israel_and_palestine

slovenia

japan 20110309

OSM Merit / Mapper

Region

マッパー1人あたりのOSM Merit = OSM Merit/マッパー数 ・日本は、マッパー1人あたりのOMS Meritが極めて多い。 ・少数のマッパーで多くのデータを維持管理している状況  ・ボランタリーなプロジェクトでは将来の持続に不安があるかも

いい意味でも、悪い意味でも、日本の特徴

1人あたりのデータ数が極端に多い!EUの6倍! 77地域(2012.04.30現在) と 2011.3.9の日本のデータ

Page 19: 2012 09 06_sot_m_osm

OpenStretMapの品質

汎用情報データベースのデータ数の指標

–  OSMの仕様上、多様な情報を入力する場合それぞれWayを分断する必要がある。

Node-Way比 = Node/Way

–  Node-Way比が高い •  Wayのデータ数(情報量)が少ない

–  Node-Way比が低い •  Wayのデータ数(情報量)が多い

–  但し、あくまで簡易な指標 –  試験的にやってみた

Node-Way比 (Wayのデータ数(情報量)の指標)

Page 20: 2012 09 06_sot_m_osm

データ分析

Node-Way x OSM Merit by Region & Japan

Node-Way比と OSM Merit密度(オブジェクト) 77地域(2012.04.30現在) と 2007.11〜2012.3の日本の履歴データ

0.0

5.0

10.0

15.0

20.0

25.0

30.0

35.0

40.0

45.0

0 100,000 200,000 300,000 400,000 500,000 600,000 700,000

Node/Way

OSM Merit密度 (オブジェクト)

Gaza Bahrain

Luxembourg

France Germany Belgium

Monaco Netherlands

3.11

2011.4.1 Yahoo/Alps道路データ インポート開始

2009 ‒ 2010 国土数値情報 インポート

・Node-Way比が高い時期  ・国土数値情報インポートの時期と一致する

・Node-Way比の急激な下降  ・Yahoo/Alps道路データのインポート開始時期と一致

 ・Yahoo/Alps道路データはNode-Way比が低いデータ  情報量が多いデータといえる

・他地域に比べ、まだ高い  ・不要なデータ、重複データ、冗長なデータなどが多いかも

・シンプルなマッピングも大事かも

Page 21: 2012 09 06_sot_m_osm
Page 22: 2012 09 06_sot_m_osm

まとめ

調査して分かった事

•  日本のデータ数は、約1年間で2倍以上増加 –  OSM先進地域に近づきつつある

•  日本は、マッパー1人当りの編集量が極めて多い –  持続可能なコミュニティとして不安がある

•  日本のデータ品質は、OSM先進地域のレベルに至っていない

•  Yahoo/Alps道路データは、比較的情報量が多いデータ

•  持続可能なコミュニティの為には、 –  更なる普及活動が必要

•  データ品質向上の為に、 –  重複・冗長・不要データなどの整理

Page 23: 2012 09 06_sot_m_osm

背景

研究の目的

•  OpenStreetMapèボランタリーなコミュニティ活動

– 社会への貢献を果たしている

•  「コミュニティ活動」と「成果物の品質」

– è相関関係にある

•  OpenStreetMapの品質が向上すれば

– 更に多様な社会への貢献が可能に

•  「コミュニティ活動」と「成果物の品質」の研究成果

– OSMコミュニティへフィードバック

Page 24: 2012 09 06_sot_m_osm

OpenStretMap の品質- Information Quarity of OpenStreetMap -

Page 25: 2012 09 06_sot_m_osm

OpenStretMap  DB

OpenStreetMap の品質

OpenStretMapの2つの可能性

•  汎用情報データベース的な側面 –  Tag ( key : Value)

–  地物の様々な情報(タグ情報)

地理情報DB と 汎用情報DB の側面がある

Objects (Node, Way, Relation)

+ Tag

•  地理情報データベース的な側面 –  緯度、経度 (Latitude , Longitude)

–  位置、外観、形状

Page 26: 2012 09 06_sot_m_osm

OpenStretMapの品質

OSMの品質(精度&データ数)

地理情報 (Object) 汎用情報 (Tag)

精度

位置精度 (形状精度) (緯度・経度・高度)

タグ精度 (正確な情報である事)

繋がり精度 (交差・接続)

時間精度 (最新の情報である事)

データ数 オブジェクトの数 (より多くのオブジェクト)

タグの数 (より多くのタグ情報)

Page 27: 2012 09 06_sot_m_osm

データ分析

Node-Way x OSM Merit by Region

Node-Way比(情報量)と OSM Merit密度(データ数) 77地域(2012.04.30現在) と 2011.3.9の日本のデータ

0.0

5.0

10.0

15.0

20.0

25.0

30.0

35.0

40.0

45.0

0 100,000 200,000 300,000 400,000 500,000 600,000 700,000

Node/Way

OSM Merit密度 (データの数)

Japan

Gaza Bahrain

Luxembourg

France Germany Belgium

Japan 2011.3.9

Monaco Netherlands

Page 28: 2012 09 06_sot_m_osm

データ分析

Node-Way x OSM Merit (Japan 2007.11.7 – 2012.4.30)

日本の履歴データ (2007.11.7-2012.4.30)

0.00

5.00

10.00

15.00

20.00

25.00

30.00

35.00

40.00

45.00

50.00

0 50000 100000 150000 200000 250000 300000

Node

/W

ay

OSM Merit密度 (データの数)

Node/Way

Page 29: 2012 09 06_sot_m_osm

まとめ

今後の課題

•  品質の指標の明確化

– 品質指標を多様化し、多角的な調査

•  ユーザーの活動と品質の関係

– より狭い地域での比較/調査

•  コミュニティ活動とインセンティブについて