時間となりましたので、「第9回東京都オープンデータ・ラウンドテーブル」を開催いたします。
本日の司会進行を務めますデジタルサービス局データ利活用担当課長の大迫です。どうぞよろしくお願いいたします。
本日の次第でございます。
始めに「東京都のオープンデータの取組状況」について説明いたします。
続いて、「提案者からのプレゼンテーション」では、オープンデータへのご提案を3者様から頂きます。最後に、オープンデータ利活用促進に向けてのディスカッションを行う予定です。
なお、事業者様のご提案資料及び全体の議事は、後日、東京都オープンデータカタログサイトに掲載予定でございます。
本日の参加者をご紹介いたします。
ご提案者として
・Weather(ウェザー) Data(データ) Science(サイエンス)合同会社 加藤 芳樹(かとう よしき)さま
・WeatherDataScience合同会社 加藤史葉(かとう ふみよ)さま
にも本日ご出席いただいております。
・株式会社アーバンエックステクノロジーズ 福冨 義章(ふくとみ よしあき)さま
・HollowByte(ホロウバイト)合同会社 米田 将(よねだ しょう)さま
本日はどうぞよろしくお願いいたします。
オブザーバーとして、
・デジタル庁 データユニット長 山田 政幸(やまだ まさゆき)さま
・デジタル庁 デジタル社会共通機能グループ データプロダクトマネージャー 丸田 之人(まるた ゆきと)さま
・一般財団法人GovTech東京 テクノロジー本部 データ利活用グループ 畔上 健太(あぜがみ けんた)さま
にご出席いただいております。
また、東京都からは、デジタルサービス局データ利活用担当部長の池田(いけだ)、そしてデジタルサービス局戦略部デジタル改革担当課長の佐塚(さつか)、そして私、大迫が出席してございます。どうぞよろしくお願いいたします。
その他、都各局職員及び区市町村職員の方々にもオンラインで御参加いただいております。本日はどうぞよろしくお願いいたします。
発表者の方はご発言の際に、事務局からご案内いたします。現地参加のみなさまにおいては発言の際カメラのみオンとしてください。事務局のマイクを使います。オンラインの方に置かれましては、発言の際以外はマイクをミュートとしていただき、画面操作を行わないようお願いいたします。また区市町村職員の皆様におかれましてはご質問がございましたら原則Teamsのチャット機能よりご投稿をお願いいたします。
ご案内が長くなりましたが、開催に先立ちまして、デジタルサービス局 データ利活用担当部長の池田より開会のご挨拶を申し上げます。
池田部長、よろしくお願いいたします。
東京都デジタルサービス局 データ利活用担当部長の池田です。日頃よりオープンデータの推進はじめ、都のデジタルサービス関連施策にご協力いただきまして、誠にありがとうございます。
私ども、オープンデータの推進に当たっては一つのサイクルを大事にしております。まずは、都と区市町村の保有する数多くのデータの中から、優先順位をつけてオープンデータ化するため、2020年度からオープンデータ・ラウンドテーブルを開催しいろいろな事業者様と意見交換をしながら、オープンデータ化を進めております。
また、昨年度からは、より気軽にオープンデータに関する意見交換を促進する取組として、Slack上での「東京都オープンデータコミュニティ」を立ち上げました。
これらの取組で民間の皆様方のニーズをしっかりと聞き取り、データの所管部署と調整し、オープンデータ化を進めているところでございます。
また、オープンデータにして終わりではなく、実際にデータを使ってもらうことが重要だと考えておりますので、2021年度から「都知事杯オープンデータ・ハッカソン」を開催しています。
これらのサイクルを回しておりますが、本日のオープンデータ・ラウンドテーブルについては、9回目の開催となります。
これまでのラウンドテーブルでは、駅のエレベーターの点検情報や、都指定の史跡データ、浸水予想区域図等のデータ公開要望をいただき、新たにオープンデータカタログサイトで公開してきました。
本日の意見交換を踏まえ、オープンデータの取組をさらに深めていきたいと考えております。どうぞよろしくお願いいたします。
池田部長、ありがとうございました。
つづいて、オープンデータの取組状況について私からご説明いたします。
東京都では、区市町村などの行政機関や、様々な関係者と連携してオール東京で、オープンデータの取組を進めています。
2021年2月に初の「東京都オープンデータ・ラウンドテーブル」を開催し、民間事業者をはじめデータ利活用される皆さまからオープンデータへのご提案を頂き、我々行政職員とディスカッションしながら、新たなオープンデータの公開や改善を実現してまいりました。
また、昨年度2023年にはオープンデータを利用される方々と、日常的かつ活発にコミュニケーションを行う場として、「東京都オープンデータコミュニティ」を立上げました。
これらオープンデータのニーズを把握し、優先順位をつけてデータ公開を進めておりまして、「東京都オープンデータカタログサイト」では現在約70,000件の都及び区市町村のデータを掲載しております。あわせてAPI形式による公開も行っております。
そして、これらのオープンデータを活用して新たなサービスを生み出していく取組が「都知事杯オープンデータ・ハッカソン」となっております。
このように各事業の成果を連鎖させ、循環させていくことで、オール東京でのオープンデータの取組をさらに促進していきたいと考えております。
具体的にいくつかの事業をご紹介させていただきます。
まずは「東京都オープンデータ・ラウンドテーブル」についてです。
民間事業者の方や学術研究機関の方から、オープンデータの課題や幅広いニーズを聴取し、意見交換を行い、関係部署と調整のうえ、オープンデータ化につなげています。
先ほど挨拶の中にもありましたが、今回、第9回目の開催となります。
次に、「東京都オープンデータコミュニティ」についてです。
オープンデータ利用者同士のコミュニケーションや、利用者と都の繋がりを活性化させることを目的として、2023年5月に立ち上げました。
どなたでも無料で参加ができ、現在会員数は500名を越えました。会社員、公務員、学生など、多くの方に参加いただいております。
会員同士の情報共有や意見交換、又はサービス開発メンバーの募集といった「交流」。自らが行ったサービス開発など、オープンデータの利活用事例の「発信」。有識者による講演等の「イベント」への参加。オープンデータ利活用に関する問い合わせや、データ要望などを行える「質問・提案」を行えます。
今週末2/7(金)には、今年度第4回目のイベントも実施予定となっております。
次に、「都知事杯オープンデータ・ハッカソン」についてです。
都では、都や区市町村のオープンデータを活用し、行政課題の解決に向けたデジタルサービスの開発を競うイベント「都知事杯オープンデータ・ハッカソン」を開催しており、今回で4回目を迎えました。応募者数も年々増加しており、今年度は925名の方にご応募いただきました。
今年度においては、参加者による自由な提案に加え、都及び区市町村が抱える行政課題を提示し、参加者からサービスをご提案いただく取組を行いました。
2024年度受賞作品をいくつかご紹介いたします。
昨年10月のFinal Stageの結果、三鷹市様の行政課題への提案である「リアルタイム高解像度 熱中症リスクダッシュボード」が都知事杯・オーディエンス賞のW受賞の栄誉に輝きました。
オープンデータ「公共施設一覧」を用いて、3D都市モデルを用いた高解像度熱中症リスクマップを開発し、社会実装に向けてさらにブラッシュアップしているところです。
次に、部門賞を受賞した3作品について、資料をご覧ください。
今年度はこれまでのサービス開発部門、アイデア提案部門のほか、新たにデータを分かりやすく見える化するビジュアライズ部門を新設しております。
続きまして、審査員特別賞を受賞した4作品です。資料をご覧ください。
最後に、2024年8月時点において実装されたサービスの例になります。
「行政からの支援が必要なときに、必要な支援にアクセスするためのシミュレーター」や、「産後うつなど育児中の孤立をLINE上の対話でケアし、地域でのサポートに手軽につながるサービス」、「海外からの旅行者や在住者など、外国人向けに安心して公衆トイレを利用してもらうための検索アプリ」などがあります。
都民に役立つサービスを様々提案いただき、都が開発支援を行いながら、各チームによる社会実装まで行っていただいています。
こうした様々な取組を通じ、オープンデータの公開を一層進め、都政のQOSを継続的に向上させていきたいと考えております。
東京都のオープンデータの取組状況の報告は以上です。
ここまで事務局から堅苦しい説明が続きましたが、東京都ではオープンフラットの取組を進めておりまして、ここからは皆様を「さん」付けで、お呼びしていきたいと思いますので、ご了解いただけますと幸いです。
それではデジタル庁の丸田さんから、最近のデジタル庁の状況、データ関連のお話を伺えればと思います。丸田さんお願いいたします。
デジタル庁のオープンデータ関連の最新情報についてご紹介します。
公共データ利用規約についてと、現在、「政府等保有データのAI学習データへの変換に係
る調査研究」という事業の2点です。
まず1点目、公共データ利用規約(PDL)です。オープンデータ基本指針を2024年7月に更新しております。その中で、「国が持つデータは原則オープンデータとして公開しましょう。地方公共団体においても同様に対応することが望ましい。」と書かれています。
公共データ利用規約については、「国については原則適用してください。地方公共団体においても同様に対応することが望ましい。」という記載をしております。これに基づいて、地方公共団体においても、「公共データ利用規約を適用してくださいね」ということがこれから我々の予定している動きとなります。
公共データ利用規約、通称PDL (Public Data License)ですが、これは、ウェブサイトやオープンデータの提供ページの利用規約です。これまでは「政府標準利用規約」やCCBY(クリエイティブ・コモンズ)をお使いの自治体がほとんどで、ウェブサイトについては二次利用禁止の自治体がかなり多いかと思います。これを全部オープンデータにしていこう、という動きになります。
基本的にはCCBY4.0と互換性を持っているため今までのオープンデータと大きく変わることはないかと考えています。我々としてはできればウェブサイト全体にPDLを適用いただき、「ウェブサイト全てがオープンデータ」という形にしていただきたいと考えています。ただ、なかなかそれが難しい場合には、オープンデータの提供ページのみの適用というのも可能になっています。
今後自治体向けにPDLの適用を依頼していきますが、2月下旬に自治体向けにオンラインにて説明会を実施予定です。ぜひ、オープンデータの担当者とウェブサイトの担当者にご出席いただきたいと思います。近日中に説明会の案内を発出予定です。
PDLのメリットは、今まで二次利用禁止としている場合には、そのデータを使いたい住民は自治体に許可を得るため問い合わせる必要がありましたが、その手間がなくなること。住民にとっても自治体にとっても手間が減り、データを利活用しやすくなります。
2つ目としては、「政府等保有データのAI学習データへの変換に係る調査研究」についてご紹介します。昨今、生成AIの進化が著しく、また、生成AIの学習データとしてオープンデータがかなり使われているということもあり、質の高い、鮮度の高いデータをAIに学習させるために何をすべきか、ということを調査研究しているところです。
3月末に報告書が出来上がり、年度明けに公表されるかと思います。
以上、デジタル庁のオープンデータに係る取組のご紹介でした。
丸田さん、ありがとうございました。
引き続き、いろいろご意見頂戴できればと思いますので、よろしくお願いいたします
それでは次第の3「提案者からのプレゼンテーション」に進んでまいります。
Weather Data Science合同会社 加藤芳樹さん、お願いいたします。
それでは、発表を始めます。
Weather Data Science合同会社の加藤芳樹と申します。
私の専門が気象ですので、気象データに関する要望と、気象と関係性の高い再生エネルギーの発電量の要望、この2つについてお話ししたい。
その前に、気象データアナリストについてもお話しさせていただく。
まずは自己紹介をさせていただきます。Weather Data Science合同会社は、気象予報士&気象データアナリストの夫婦ユニットです。経歴としては、ウェザーニューズという気象会社で現場の気象予報業務を長くやっておりまして、いわゆるテレビで見る天気予報ではなくて、BtoB、例えばエアライン向けに、飛行機を飛ばすために必要な気象予測情報を提供するサービスをやっておりました。その後エアラインに転職したり、エネルギーベンチャーに転職したりということを経て、2018年にリスキリングとしてデータサイエンスを学びました。その後気象に強いデータサイエンティストというポジションを取って事業を行っている。具体的には、気象に関係するビジネスをしている企業や気象に関して困りごとのある企業に対して、気象データを活用した分析をしたり、AIの開発をしたりしています。
具体的な事例としては、コインランドリーの事業者と一緒に行ったプロジェクトで、テレビでも取り上げていただいたものがある。気象条件によって変化する需要、例えば来客数が増減する、稼働率が変化するといった需要の予測をして、ダイナミックプライシングをすることで需要を変化させて機会損失を減らすことを目指すプロジェクトで、気象データを使って需要予測をするAIを開発しました。基本的にはこのような形で、気象データを活用したソリューションを開発している。
もう一つ、気象データアナリストに関係することをお話ししたい。様々なメディアにも取り上げられていただいている。気象データアナリストとは、近年気象庁を中心として人材育成に取り組んでいる比較的新しい職種です。どんな職種なのかと言いますと、気象庁が持っている莫大な気象データをビジネスや社会課題の解決に活用してほしいということで、気象の専門的なデータを使って、企業の持つデータとか、社会課題に関係するデータを掛け合わせた分析を行い、課題の解決や新しいビジネスを創出する、そういった役割を担える人材です。
例えば、コンビニの商品やレストランの来客数、物流の荷物の量などは気象の影響を受けて変動します。気象予測データを活用して事前に商品需要や荷物量を予想することで、それに応じた発注をかけたり、人員を調整したりすることができます。こうしてビジネスに貢献す
ることが期待されています。
こうした気象データアナリストのような人材がなぜ必要なのかというと、実は気象データは企業の中でなかなか使われておらず、1割に満たない企業しか使っていないことがわかっています。一方で自社のビジネスが気象の影響を受けていると自覚する企業は約7割もあるが、気象データの使い方がわからないことや、気象データを扱える人材がいないことがネックになって、気象データが活用されていないことがわかっている。
様々なビジネスパーソンと話すと、結構皆さん、いろんなビジネスが気象の影響を受けることは分かっていて、意思決定においても気象のデータを使っていくのは重要だよね、という認識を持っている人は非常に多い。そういうことからも、気象データを活用してビジネスで活躍する気象データアナリストの人材育成が大事だという認識です。
我々は気象庁と一緒に2020年頃から気象データアナリストの制度設計や人材育成カリキュラムの設計を行い、現在は気象データアナリストの育成講座で講師も務めています。制度が開始してまだ3年ほどなので、気象データアナリストの人数はまだ少ないですが、今後増えていくと思います。おそらくオープンデータを使う機会も増えていくと思います。
まずはぜひ、そういった存在があるということを知ってもらえればと思い紹介させていただきました。
さて本題の、オープンデータへの要望です。オープンデータコミュニティに去年参加したのですが、参加した動機が3つありまして、3つ目が先ほど話した気象データアナリストの活躍の場になるのではないかということ。1つ目は気象庁以外の気象データを探すこと、2つ目として、東京都臨海部の風力発電施設のデータを手に入れたいことなどがありました。
普段、気象庁のHP上の無料公開のデータを主に使っており、また気象庁の有償データを使うこともあります。ただ、それだけでは足りない場合もあり、他のデータを探していたことがあります。そうしたところ、東京都の高潮防災総合情報システムのページにたどり着き、「水門に気象観測データがあるのか」ということをその時初めて知りました。リアルタイムではなく過去のデータの蓄積がないかを調べていたら、東京都オープンデータカタログサイトに行き着いたというところです。
ここで実際にある水門の気象観測データを見てみますと、ヘッダ付きのCSVになっていて、Pythonなどに使いやすい・いいものを見つけた、と最初は思いました。しかし過去の蓄積が1年分しかなく、もっと過去のデータが利用できず残念な思いをしました。ウェザーニューズに勤めていた経験も踏まえて申し上げますと、過去の気象状況を調べたいときに直近1年分だけで足りることはあまりないかと思います。少なくとも5年、できれば10年分のデータがあると利用価値が非常に高くなります。
近年、AIの技術を使ったサービス開発も増えていますが、AIに学習させるデータにしても、例えば気象のデータが1年分だと、1回の周期しかないので、学習データとして物足りない
ということになります。そのため、できれば10年ぐらいのデータの公開をしていただけると理想的です。
次に臨海部の風力発電施設のデータです。我々は太陽光発電や風力発電などの発電量を予測する技術開発を行っています。再生可能エネルギーはただ増やすだけではなくて、使う段階になると、明日の発電量を今日の10時までに予測して計画を立てる必要があります。しかも30分間単位で予測して計画を立てる必要があります。計画はあくまで予測なので外れる場合もありますが、予測誤差に対して事業者にはペナルティが課せられる制度になっています。厳密にはもう少し複雑だが、簡単に言うとそういう仕組みになっている。そのために、精度の良い発電量予測のニーズがあります。
こちらは、私たちが過去に行ったプロジェクトの成果を示していて、それなりに自然エネルギーの大きく変動する発電量を予測できているかなと思います。この開発事例は、我々のクライアント企業が所有するデータで作った技術なので、我々が勝手に別のことに転用できません。そこで私たちも自ら技術開発をしたいのですが発電量データがなかなか入手できないという問題があります。
私たちのクライアント企業、それも結構大きな企業担当者からも「発電量の予測技術開発もしたいが、データがない。どうしたらいいか」という相談を受けることがありました。発電量データを入手できない問題で苦しんでいる企業は割と多いのではないかと思います。
そこでぜひデータ公開を検討していただきたいのが、かつて東京の臨海部にあった「東京風ぐるま」と、江東区の、若洲公園の風力発電施設。これらの過去の発電量を公開してほしいと思います。すでにご検討がいただいていることは伺っており、ぜひ再生可能エネルギーの普及と安定的な利用のために、データを公開していただければと思います。
もし今回データ公開がかなわなかったとしても、こういうスペックのデータがあると有効に活用できますよ、という仕様を下に示しています。
簡単に言いますと、データの時間解像度は30分間隔、30分の積算の発電量であることが必須です。30分単位で発電量予測をする必要があるからです。また過去数年分以上の蓄積が必要で、一年だと物足りないです。さらに発電設備のスペックの情報、例えばどのメーカーの設備がどれくらい発電できる設備なのか、設備の特徴などが必要です。もし今後、再生可能エネルギーの発電設備を新規に設置して公的機関にてデータを取得する機会がありましたら、是非参考にしていただければと思います。
以上で、私からの発表とさせていただきます。
加藤さん、ありがとうございました。気象データや再エネ発電量データをオープンデータ化する価値と活用方法についてご紹介いただきました。
具体的には高潮情報と風力発電のデータについてご要望をいただきました。
まずは各局職員及び区市町村職員の皆さん、他ご出席のみなさんから、ご質問事項やご意見があればいただきたいと思っています。デジタルサービス局の佐塚さん、お願いします。
よろしくお願いいたします。
高潮防災総合情報システムの情報をカタログサイトで発見したとのことでした。率直に言って、カタログサイトは使いやすかったですか。
そのときは多分すぐに見つかりました。ただ、もう一度探そうとしたとき、うまく見つかりませんでした。検索キーワードとして「気象」や「水門」と入れても出てこない、「観測」と入れたら出てきました。
私も実は、「気象」や「水門」で探しましたが出てこなかったので、どうやって見つけられたのか興味がありました。
オープンデータカタログサイトには、「気象」のタグはないのですが、「環境」のタグに気象データに関連するものも掲載されています。例えば1分間隔毎のPM2.5の数値もありました。こういったデータもビジネスによっては活用できそうでしょうか。
課題によっては活用できると思います。データの存在を知らなかったので、ありがとうございます。
環境データの中で結構人気がありそうなもので、大田区が公開している「大気環境測定データ」があります。大田区のみの公開となっていますが、ビジネスに活用するには、都内全域での公開が良いということになりますでしょうか?
出していただけるデータは出してほしいと思っているが、何に使うかというと課題ドリブンだと思っている。例えば、気象庁のアメダスより細かいデータが欲しいという状況だと非常に強力なデータになる。
実際ウェザーニューズにいたときには、自治体からデータをもらって活用するということもやっていたので、細かいデータがあることは把握している。それらがオープンになるとありがたいと思っている。
もう一つだけ質問いたします。
気象データと他のデータの掛け合わせで何かないかなと考えまして、インフルエンザだと思いますが「感染症の発生動向調査」をカタログサイトで見つけました。ただ、オープンデータカタログサイトではメンテナンス中になっていまして、中身は見ることができなくなっていました。ビジネスで使うデータは、急に使えなくなると困るかと思いますので、メンテナンスするなら前もってどれぐらい前にアナウンスしていただきたいとか、行政側に留意してほしいことはありますでしょうか。
どういった形でデータを使っているかによるので、一概には言えないが、リアルタイムでサービスに使うのか、過去の蓄積を使って調査研究も含め活用したサービスなのかによっても違ってくると思います。リアルタイム性のあるサービスだとサービスを継続する上でデータが使えないと、ボトルネックになる可能性があります。
加藤さん、ありがとうございました。その他、質問等あればお願いします。
畔上さん、お願いします。
一般財団法人GovTech東京の畔上と申します。
簡単に自己紹介させていただきます。池田さんと大迫さんのデータ利活用プロジェクトの連携しているチームに所属しています。私はデータアナリスト業務が長くて、いろんなデータを触ってきたのですが、本日の話を聞いてこんな使い方あるのか、ということを知りすごいなと思いました。
今日の加藤さんの発表で質問させてください。今回過去数年分の蓄積が必要で、リアルタイム性はあまり必要ないということでしたけど、ある程度のリアルタイム性があった方が需要予測とかしやすいのかなと思いました。リアルタイム性がどの程度あれば、事業インパクトを残せるみたいな目安はありますか?
サービス次第かと思いますが、気象予測をやっていた立場からすると、リアルタイム性は非常に重要です。一方で過去データの蓄積は、何らかの分析だったり、AIの学習に使う時に重要だと思います。
リアルタイムのデータを活用してアウトプットを得るサービスだと、できるだけリアルタ
イムにデータが欲しいということになります。一方で使う側としては、どの程度リアルタイム性があるデータなのか、そういう仕様である前提で技術やサービス開発をするかと思います。ですので一概にどれくらいリアルタイム性が必要か、とは言い難いです。
ありがとうございました。
それでは、各局と確認・調整した内容をお知らせしたいと思います。
この度ご提案いただいたうち、まず「高潮防災総合情報システム 潮位、風速・風向、気圧等の観測データ」ですが、こちらカタログサイトにおいて過去一年分を既にオープンデータとして公開しているものでございます。それ以前のデータについては現在のところ掲載がございません。そのため、この高潮防災総合情報システムのオープンデータを公開している港湾局に対して、引き続き確認を進めてまいります。
本日のラウンドテーブルを受けて、活用可能性を認識いただけたかと思います。
また、「風力発電データ」につきましては、こちら事業としてはすでに完了をしておりまして、新たにデータを取得することはないようです。ただし、すでに産業労働局HPに掲載されている過去分のデータにつきましては、今後オープンデータ化に向けた調整を進めてまいります。産業労働局におかれましては引き続きご協力よろしくお願いいたします。
以上です。
それでは続きまして、株式会社アーバンエックステクノロジーズ、福冨さんお願いいたします。
株式会社アーバンエックステクノロジーズの事業開発を担当している福冨と申します。よろしくお願いします。
いきなりですが、まず今日お伝えしたいことを最初にお伝えします。「データは品質が大事だよ」っていうことを今日私は言いたいです。読みやすい形式で出していただきたいというのがあります。
その前にまず、ビジネスの概要について説明いたします。弊社は、都市とテクノロジーを掛け合わせた東大発のスタートアップという会社でございまして、都市インフラをアップデートしすべての人の生活を豊かに、ということを掲げております。テクノロジーの力を使って、インフラの管理を持続可能なものにしていこうという会社でございます。
そして、業界の課題ですが、先日事故があったところなので、社会も今関心が高いかと思い
ますが、都市インフラはいろんなところで老朽化が課題になっております。その中でも弊社では特に道路に目をつけております。道路は数がとにかく多く、平均の経過年数も非常に長くて、老朽化も進んでおります。さらには、専門の職員の方がいらっしゃらない、土木の知識は特にない方々でなんとか支えている、というような区市町村さんもたくさんあるという状況でございます。
弊社としては道路には様々な構造物がある中で「舗装」に目をつけまして、それに関するデータを収集・点検ができるようなサービスを作っております。実は東京都さんや多くの区市町村さんにも導入いただいて、たくさんご利用いただいていております。
行政インフラ管理者向けに提供しているサービスとしては、三つ製品がございます。左側がスマートフォンを使った AI 道路点検ツール、真ん中がドライブレコーダーを使ったAI 道路点検ツール、一番右は少々AI とは異なりますが、市民の方々から投稿いただけるようなサービスになります。
スマホのものは、従来では道路のことに詳しい方が2人1組で道路の点検をするところ、弊社のこのスマートフォンのアプリを作動させて走ると、道路に空いている穴やひび割れを見つけることができるというサービスでございます。ですので、点検が楽になり、専門の方が乗っていなくても、公用車につけておけば、それで走った分データが貯まるという使い方も可能です。
ドラレコの方は、弊社が三井住友海上さんと共同で作っているサービスでございます。道路管理者の方が自ら走らなくても、三井住友海上さんの通信機能がついたドラレコのカメラで道路の損傷を検知し、契約いただいた区市町村さんの画面に表示をすることで、自分たちは走らなくても、カメラを回したところからデータを収集できます。
市民投稿サービスのアプリは、町で過ごされていて、「道路に穴がある」「標識が壊れている」ということがあったら、アプリで写真と位置情報をつけてすぐに投稿することができるというアプリでございます。平日の昼間にお仕事をされている方は、役所が開いている時間に電話かけるのはなかなか難しいです。電話だと場所が伝わりづらいですし、受ける側からしても写真等がないとまず現地に行かなければいけないのが負担になっています。ですが、これらの負担が解消されます。実は裏で自動的に管理画面にもなっており、区市町村さんの中で「これはうちの課かな?」「これは別の課にお願いしようかな」といったように、所掌管理の問題も解消しています。
以上が弊社の付属製品の紹介ですが、私は実は会社の中で別の仕事をしており、道路の舗装を中心に今まで培っていた弊社の技術を他の都市インフラの維持管理に応用できないかといったことを担当する部署におります。いろんなものの維持管理や点検時にデータが必要になる、という話です。 例えば、標識についての点検製品を開発しようと検討する場合ですが、道路標識の管理者や
標識所持数、場所、分布、点検・管理の方法など、もちろん本格的に展開・実装する時には細かくデータを見ていきますが、まずはスピード重視で、いろんなデータを見て可能性を検討したいです。
ここで最初にお伝えしたことが大事になってきます。コンピューターが読みやすいデータが揃っていると、これらをざっと検討ができるのが非常に助かります。実際に先日私が体験した例ですが、その時に私が知りたかったのは道路管理者別の道路の延長と舗装の面積でした。たどり着いたのがこの資料でしたが、データ自体はまさに求めていたもので、横軸で見ていくと、千代田区の中には全部で17万5千㎞の道路があって、そのうち東京都が管理しているのはこれだけで、千代田区が管理しているのがこれだけありました。非常に求めているデータなのですが、形式がPDFでした。そのため、実際に活用しようとすると、そのまま見る分にはともかく、実際には、例えば人口データや面積、予算等、いろんなものと組み合わせて人口一人当たりの数値を計算したかったのですが、これだと全くできませんでした、Excelに入れようとするのも結構大変です。しかも、PDFが公開される前に絶対Excelか何かがあるはずですが、そちらは掲載されておらず、こういったケースをなんとかしてほしいな、と思いました。
次に「データ公開時のお願い」ということで、どんなことが大事なのか、私なりにちょっとまとめてみました。私は土木屋で、決してデータサイエンティストではないので、もしかしたら本職の方から「それくらいなんとかしなよ」と言われてしまうのかもしれないですけれども、この3つを今日説明させていただきます。今まで、過去のラウンドテーブルの資料も拝見させていただきましたが、結構「可読性がない、コンピューター機械判読しやすいもので」ということは書いてある方もいらっしゃったんですけど、実際あの資料は、自治体の職員の方から見ても、どういうデータにすればいいのか、おそらくよくわからないのではないかと思いました。ここにいらっしゃる皆さんはすぐわかるような方だと思っていますが、せっかくなので今日は細かくお伝えしたいなと思っています。 PDFは人間が読みやすいデータですが、コンピューターが読みやすいデータというのは、こういうセルで区切られているものです。例えば、任意の一部のデータだけの合計を知りたい、千代田区・中央区・港区だけではどれぐらいなんだろう、というような場合、 PDF だと人間は電卓を叩くしかありませんが、CSVやExcelであればセルで計算するだけの話です。他のデータを組み合わせたりグラフを書いたりは、 PDF でそのままやるとかなり難しい、ということになります。
もう1つ、可能な限りデータベース形式でというものがあります。「データベース形式」の詳細は検索していただくとすぐわかると思いますが、一行目はヘッダーといって、各列にこんな情報が入っています、それぞれの列には同じ種類のデータが入っています、というものです。管理者区分という列には管理者区分のデータが入っています。1件のデータは1行。
このような形で入っていると非常にいろんな処理がしやすいことになります。 あとは、カラムの構成がダウンロードをする前にわかるとありがたいです。例えば、実際のデータがこの左側みたいな場合だったとします。これはダウンロードしてさっと見ていくとそれは分かりますが、この1 行目に具体的にどんな列があるのかをダウンロードする前にできれば知りたいです。
東京都さんには申し訳ないですが、今回データを探している時に、実際オープンデータカタログサイトでこんなデータを見つけました。「東京都における国・都・区市町村道の内訳」というのがあって、こういうデータがデータベース形式であるといいなと期待しました。そして、ダウンロードしてみましたが、結果このように、四行三列のこんなデータが入っていました。せめて、「このデータにはこういうのが入っています」、というのが書いてあったら「あ、これいらないな」って思ったのですが、ダウンロードしてみるまでわからなくて、してみた結果、これでした。さらに、ヘッダーもありませんでした。あと、数値ではなくキロメートルまで書かれた文字が入っているため、計算ができません。ここにもタイプミスがあります。良くない例をわざと出してしまって申し訳ないのですが、せめてダウンロードする前にどんなデータかわかると助かります。
なお、良い例もいくつかあったのでそれだけご紹介したいのですが、総務省さんが非常に良い資料を出されていました。統計表における機械判読可能なデータ作成に関する表記方法というのが出ており、その中に、「こういうのはいいよ」「こういうのはダメだよ」「何でダメか」というのが全部書いてあります。ですので、PDFや印刷することを目的として作成したものを掲載する場合であっても、それとは別に表の元データを登録してください、等の私が言いたいことは大体全てここに書いてあったので、ぜひこれを自治体の皆さんに見ていただけると非常にありがたいです。
その他に関連したサイトですと、総務省さんのルールをより具体的、実践的に解説してくださった文科省さんの資料があります。おそらく学校とかに通知するために作った資料だと思います。また、総務省からは「なんでこういうルールが必要で、今後どうしていくんだ」というような資料も見つけましたので、よろしければ自治体でオープンデータに携わっている皆様にはこういうところを見ていただくとありがたいかな、と思います。
あと警察庁さんの交通事故のデータがありまして、これはデータベース形式で非常に見やすいです。一行目にヘッダー行が、二行目以降にレコードが1行1件で入っております。これは簡単に機械判読できるので、例えば、事故の多い時間帯は、事故1件あたり死傷者数はどれぐらいが平均なのか、昼の事故と夜の事故で傾向の違いはあるのか、そういう分析がすぐにできます。人間にも機械にも優しいです。もちろん、Excelの方は数字だけでコードが書いてありますが、これも人間が読みやすいPDFの対応表とExcelの対応表もちゃんと用意されています。非常にこれは使いやすいです。
これ(国土数値情報)は位置情報が入っているデータなので、CSVの形式とは少し違いますが、「どんなデータが、どういう定義で、どういう型で入っているか」っていうのは、ダウンロードする前から明確だという点が非常に良かったので、これをご紹介します。国・都道府県の機関の位置情報が入っているデータで、カラムや、それぞれの中に入っているコードと対応する内容がちゃんと分かるので、これが欲しいデータかどうかというのがダウンロードしなくてもすぐわかります。中を開けてみると、1個1個その緯度経度と位置情報も入っており、国の機関とか東京都の機関の住所、コードと対応する内容の表、これの形がしっかりしていて、取り扱いが非常に簡単でした。
これは「kepler」という位置情報を可視化できるウェブサイトですが、データをダウンロードして1分でこの地図ができます。これ1個1個の点に、先ほどの緯度経度のデータが入っております。例えばここは、東京都庁新宿区西新宿2-8-1、このコード「2」というのは都道府県の機関を表しているため、東京都の機関とすぐわかります。きちんと決まった形式で公開していただくというのは大事なのではないでしょうか。
まとめますと、せっかくデータを出すなら使いやすい形式で出してください、ということをお伝えしたいと思っていました。米田さんの発表と違うことを言っているじゃないか、と思われるかもしれませんが、そうではございません。まずはデータを出していただきたいのは、私も米田さんと同じ気持ちです。ただ、例えばさっきの PDF はそもそも元データがあるはずですので、そっちを出してほしいのです。ただ、データベース形式に揃えるのは大変ですから、それで公開が遅くなるならまずはデータを出していただきたく、せっかく出すならこういう方が使いやすいです、ということです。相反する話ではないということはお伝えします。どうもありがとうございました。
福冨さん、ありがとうございました。
「行政のオープンデータに対するニーズについて」、ご提案をいただきました。
私もオープンデータを担当している所管ですので、皆さんから質問をいただく前に、コメントをさせていただければと思います。
カタログサイトの掲載リソース数が7万件を突破しましたというお話を最初にさせていただきましたけれども、カタログサイトの掲載について、各所管には「オープンデータの公開をお願いします」というお話だけでなく、CSV、Excelといったコンピューターで判読しやすい形式にしてほしいとお願いをしています。その際、「オープンデータってなんですか?」っていう質問が結構多く届きます。行政にいてもオープンデータに関わる機会はなかなかなく、「二次利用ってどういうことに使われるのか?」と聞かれることもあります。
そのために、都庁内各局や都内各区市町村に対し、オープンデータカタログサイトにデータ
を掲載するための「オープンデータ整備マニュアル」を作っています。本当に実務的な内容なので外に公開はしていませんが、説明会も開催しております。しかし、なかなかその説明会にデータを作る所管課の人が参加することがありません。その点についてはいろいろと東京都も努力をしつつ、我々もオープンデータを推進する立場として、やれることを進めているというところでございます。
実用化されているアプリで使っていた元データが紹介されていたので、一覧でいくつか見ました、やはりそういうのはオープンデータがしっかりしている例がほとんどでした。実際に使っている例を見ても、データが充実しているとサービスにつながります。しかし、究極的に目指しているのは、データ公開により、良いサービスが生まれて、都民市民のみなさんの生活が良くなるところだともちろん思います。そう考えると、データの質も結構大事だなと思います。
好循環サイクルを回していく我々の理念そのものだと思います。
Govtech東京の畔上さん、ご意見を頂戴できますでしょうか。
ご発表ありがとうございました。まず、とても共感する気持ちで聞いておりました。東京都に限らないとは思いますが、現状の行政組織側ではまずデータ公開を進めるということが大前提になっているので、使いづらいデータ
は多々あるとは思っています。本当はもっと出せるデータがあるだろうというのは、実際に私たちの方でもダッシュボードや可視化をやっているので、とても理解できると思います。
私の考えですが、オープンデータの利活用をさらに広げるためには、各現場の事情もあるため、一気に進めることは難しいと思います。しかし今後は、機械が扱いやすいフォーマットを標準化するために、「データの利用体験を向上させる」という意識やルール、技術的解決策などのデータ整備環境が重要になると考えています。
この「データの利用体験の向上」を前提として、こうした場やコミュニティを通じて、ニーズの高いデータから優先的に変換対応を行い、活用の機会を増やすことで、新たな需要を発掘するサイクルを生み出せるのではないかと思います。
このように、公開するデータの「量」だけでなく「質」も向上させる、持続可能なオープンデータ活用のエコシステムを強化していく必要があると考えます。
良質で使いやすいオープンデータにできるようにしていきたいと、オープンデータ担当と
しては思っております。
つづきまして、HollowByte合同会社、米田さん、お願いいたします。
それでは、私から3Dデータの公開促進について事業の説明をします。概要ですが、弊社はSaaSを提供しています。私は国土交通省が推進しているプロジェクトPLATEAUのアドボケイトであり、OSINTサービスAlchana(α版)を展開しています。
Alchanaとは、オープンソースインテリジェンス(OSINT)の略で、オープンデータを集めて解析し、意思決定に役立てるためのサービス。オープンデータを迅速に解析し、ノーコードで利用できる形で提供しています。
基本的にオープンデータを収集し、プログラムを使ってデータを加工します。このサービスはWebブラウザ上で完結するため、サーバーにデータが保存されず、メーカーのリスクがありません。ユーザーが自分のデータを使用することも可能です。
また、ユーザーが作成したノーコードのツールをマーケットプレイスで公開し、展開できるようにしています。
処理のイメージはこちらに記載の通りで、データを収集し、ユーザーが加工して使いやすい形にし、最後に公開するという流れです。AIによる自動収集についてですが、基本的に収集の部分は完全にサーバー側で機械が処理しており、人間は自覚することなく行われます。映像も解析しており、新宿のガイドカメラのYouTube映像をリアルタイムで配信し、その映像を常時観察しています。映像から得られる情報を静的なデータとして蓄積しています。
例えば、公開されている動画データを収集して解析し、別の情報に変換してデータとして活用しています。これがオープンデータの使い方の一例です。
さて、本題の公開してほしいデータについてですが、3Dデータがメインです。特に3D地下データは重要で、地下構造物の情報が少ないため、これをオープンデータとして公開することが重要だと考えています。最近の例では埼玉での陥没がありましたが、これに対してシビックテックとして解析することも可能だったと思います。
次に、3D点群データと画像について説明します。重点的に後程ご説明しますが、想定活用例として一般的なパターンを含めました。
よくある懸念として、地下データはインフラ関連であり、テロに利用されるのではないかという安全保障上のリスクが挙げられます。自治体が公開する際にはリスクがあると思いますが、正直なところ、民間は自分たちでデータを集めるので、リスクはそれほど高くないと思います。
また、3Dデータの作成にはコストがかかります。新たに作成するのではなく、既存のデー
タを公開するのが第一フェーズです。インフラの老朽化が進む中で、整備するための人手が不足しています。そのため、民間の力を借りてシビックテックを導入し、データを公開することで誰かが趣味で取り組むことができます。
3Dデータの重要性についてですが、最近3Dデータ増えています。都市の3Dモデルや地下鉄駅の点群データが公開されています。例えば、都庁前駅や渋谷駅の地下の駅が公開されています。また、3Dデータにはセマンティックデータが含まれており、建物の階数や建築年などの情報も公開されています。これらのデータは自治体や中央省庁が公開しており、民間企業や個人事業者には作成が難しいです。
3次元データの活用についてはいろいろな用途がありますが、実際にどのように使えばよいかわからない、ニーズがない、3Dが使いづらいという問題があります。3Dデータはインフラ系で多く使われています。土木や建築の分野では、CADで作成し事業を進めていますし、災害対応でも3Dデータが利用されています。
PDF化しているため動画は見えませんが、点群データをUniteyの3Dエンジンで取り込んで使用することができ、クリエイターが新しいシーンで活用することも可能です。
なぜ地下のデータが必要なのかという点について説明します。3Dデータが必要な理由、そして地下にフォーカスした理由です。
例えば地図アプリで都庁に行くルートを検索する場合、新宿三丁目駅から都庁までの地下の経路が分かりづらいです。地図アプリでは上空からの俯瞰図が多く、地下の情報が乏しいため、GPSも地下では機能しないことが多いです。地下では自分の位置を確認するのが難しく、現在地を把握するには視覚的な情報が重要です。
そこでビジュアルポジションシステムという技術があります。これはGPSや通信に頼らず、目で見て分かる特徴的な構造物を利用して自己位置を推定するものです。3次元のデータがあれば、自己位置を推定し、スマートフォンでナビゲーションAIが表示することができます。
今後、まだまだ研究段階のものが多いですが、カメラとAIを使った空間認識技術について説明します。右側の画像に小さく文字が表示されていますが、これはメガネに取り付けられたカメラが認識した情報をLLMが解析し、音声とディスプレイに表示するものです。視力障害の方には音声で自己位置を教え、聴覚障害の方には視覚情報で目の前にある物を示すことができます。
地上のデータは豊富ですが、地下のデータは少ないため、地下での利用が難しいという課題があります。
続いて点群のところになります。点群に加えて画像も公開してほしいというところです。点群はいろいろなところで公開しているのですけれど、点群の色情報の重要性を簡単にお伝えします。
点群は、左側の色がついていないのを点群とし、色がついている点群を色付き点群とします。
基本的に点群は3次元の点群の集まりなので、形状 XYZ座標、色付きになるとそれに対してRGB、レッド、グリーン、ブルー、そして透明度などがあります。
色があるのとないのでは、見た目の情報が全然違います。パッと見て分からないかもしれませんが、色があって柵や窓がわかったりします。
色付き点群は基本的には画像が必ず付属しています。スマートフォンで撮った写真や動画から点群を生成した画像になります。こういった形で画像が必ず紐づいています。ということは、点群処理と画像処理のハイブリッド処理が可能です。
これの何が良いかというと、点群処理だけでは課題解決可能な課題は多くありません。点群処理自体、3D情報を扱うということもあり高度な知識とコンピューターリソースが必要になります。一方で画像処理というのは長年研究されていて、コンピューターによる多くの処理ができます。点群と紐づいた画像がセットである場合、画像処理と点群処理のいいとこ取りができるわけです。
その一例をここで示しています。
左側は画像を映した点ですが、点群がいろいろと欠損しているんですね。点群と画像があれば、画像処理で輪郭線を抽出させたり、抽出した輪郭線の内側を平面としたときにその部分の点群の生成も可能です。このようにして点群の欠損を補うことができます。
実際にこういうことができるというところで、点群と画像を積極的に公開してほしいです。
参考までに、点群というのは3Dデータであり、これは土砂崩れ時の報道の動画から点群を生成したもの。これは熱海の土砂崩れで報道されていた動画データでから生成した点群です。この時の点群は公開されていないものですが、放送されている動画から民間の人たちが生成して当時のTwitterで公開していました。もしこの時に土砂崩れの前の点群があったらすぐに差分と比較することができた。そうすればきっと被害規模の把握や支援が容易になったと思います。また被害の場所を特定するツールとして機能します。こういったことも考慮して時系列のデータ、過去のデータや、それを更新していく点群データを時系列的に保存しておいてほしい。
その他要望です。
やってほしいこととしては、公開したデータはアーカイブしてほしいと思います。更新ではなくて、リンクもそうなのですがアーカイブしていってほしい。アクセスできていたデータがいつの間にかできなくなったり、いつの間にか変わっている場合、新旧の差分を確認しなければならない。調整を図っていただけるとありがたい。
やってもらわなくていいこころは、フォーマットを統一するのはやらなくてもいいです。そこにリソースを配分するくらいなら、どんどん公開するところ、点群を作るところにリソースを配分していただきたい。公開さえしてくれれば、あとはこちら側でなんとかします。
データフォーマットの統一は無理なのであきらめてください。数十年前に結論が出ておりまして、セマンティックWebなんですけれども。データの分子がきれいに整って、連携し
あって、うまい具合で整理されているというのをWebをつくったティム・バーナーズ=リーという先生が提唱したんですね。その時提唱したんですけれども。結局失敗したんですね。
自然言語処理をAIで研究し、データを収集・処理して、自然にデータを引っ張る形で進めています。これで成功しているため、正しい方法だと思います。
それでは説明を終了したいと思います。
米田さんありがとうございました。3Dデータの公開促進要望についてご説明をいただきました。データを出すなら使いやすい形式で出してほしいという福冨さんのお話と、公開さえしてくれれば利用者側でなんとかする、という米田さんの両者のお話で若干混乱をしていますが、公開できるものはしつつ、公開できるなら使いやすい形式でと認識しました。
補足しますが、PDFもLLMに読み込ませることができますので、オープンデータとして使いづらいといわれているデータも扱いやすくすることができます。自治体の人は通常業務が忙しく、わざわざデータをフォーマットして公開するのは負担が増えます。もしフォーマットを統一したいのであれば、デジタル庁がデータのフォーマットを統一するサービス(ツールのようなもの)を公開して全国で統一された方法に変換されるようにしてもらえると、自治体の人も利用する側も助かるかと考えます。
自由なフォーマットをコンピューターが自動で変換してくれるのは素晴らしいです。
それでは各局の皆さん、区市町村の皆さん、ご質問があればどうぞ。
よろしければデジタル庁の丸田さんに意見を頂戴できればと思います。
御社のサービスは、ツールをお客様に提供してお客様のほうで使っていただいているのか、ツールを使って御社で加工してデータを納品しているのかどちらになりますか?
前者です。お客様のほうで使っていただいています。
どういう業界のお客様が多いですか?
スタートは海外の掲示板のコミュニティから始まっているため、海外の個人ユーザが多いですが、保安系も一部実績があります。
公開してほしいデータについてです。これは質問ではないのですが、先ほどのお話で、テロを行う人は勝手に自分で調べて行動するため、データを公開してもしなくても関係ありません、とありました。しかし、いざテロが起こった際に、そのデータが利用されたとなると、公開した側に責任が発生するため、難しいと思っています。特に水道は広範囲に影響が及ぶ可能性があるため、厚労省さんからも管理を徹底しなければならないデータとして指定されています。オープンデータではないが、使用用途や使用する人を限定して公開することも方法の一つかと個人的には思います。
15ページの色付き点群についてです。自治体の公共機関データを扱うのは難しいと思うのですが、東京都が都内のデータを公開しましたが、恐らく飛行機によるレーザー測量によるデータだと色が付けれないと思います。レーザー測量のデータ色付けられる技術はありますか?
基本的には画像とセットで撮っているはずです。レーザーで立体的な情報を取得し、それに航空写真で色などのテクスチャを付加しているため、基本的には点群と画像はセットになっている認識です。
次に、スライドの欠損している点群を補完する話ですが、手作業でやるのではと思うのですが、自動的にできるものですか?
はい、できます。プログラムとして作れば、自動的に欠損部分の保管は対応可能です。
最後に、その他要望のところでアーカイブのところについてです。おっしゃる通り、未来のデータと過去のデータをずっと保存するのが理想ですが、しかし、アーカイブで置いておくとそれだけコストがかかります。どれくらい過去のものがあると勝手がよいのでしょうか。
正直言うと、私としては2〜3年くらい。オープンデータを東京都が公開していますが、すごいです。アーカイブしなくても良いと言えば良いです。ですけれども、普通に使うとなると2~3年くらいは欲しいところです。時系列データを使用するとなると、AIが結構研究されているのでその場合は50年という人がいるかもしれません。最近では2~3年の時系列データでは、軽いAIを用いてIPSで使われています。
過去のデータの管理について、各局において統計データを数年分カタログサイトに掲載しているものがありますが、例えば五年分しか掲載せず、年度がくるとそれ以上は削除するということもあります。行政の文書保存年限と関連していると思っており、持っていると文書公開が必要になります。ですので、保存年限が過ぎると廃棄しなければならないというサイクルを繰り返すという、行政の文書主義と同じになっていると思います。オープンデータと関連しているかわかりませんが、ホームページで公開されていないデータはカタログサイトでも載せられないという考え方があります。
そしてここからご紹介です。既に米田さん丸田さんからお話いただきましたように、東京都では3D点群データを共通基盤データとして都内全域のデータの取得・整備を2022年から二年間かけて進めてきました。カタログサイトにて区部点群データ、多摩地域点群データ、島しょ地域点群データを公開しています。ランキング上位になっていて、よく見られています。今後、防災やまちづくりなどさまざまな分野で活用できることが想定されています。この度の提案を受けまして、今回の内容を庁内や各市町村と連携しつつ、画像データの有意性を認識することが重要だと理解しました。今後の庁内の議論の参考にさせていただきます。米田さん、ありがとうございます。
それでは次第の4、ディスカッションとさせていただき、オープンデータに対する期待や課題、またオープンデータの利活用促進についてご意見を伺いたいと思います。
私はかなりピンポイントの要望を申し上げました。私はまだオープンデータのライトユーザーであり、東京都のオープンデータもそれほど頻繁には利用していませんが、気象データの観点では、気象庁のデータでは足りない部分で自治体がデータを持っていることも多いと感じています。そうしたデータを東京都のオープンデータカタログサイトから使えると嬉しいと思います。
また再生可能エネルギーについては、発電設備を増やすだけではなく、実際に運用する段階では発電量の予測が必要になります。発電量の予測技術の発展のため、もし都内・区内で公共性のある発電量データがあれば、30分単位で蓄積・公開を進めていただけると嬉しいです。
私、申し上げたようにデータ屋さんではないので、皆さんがおっしゃるとおりやってくれることを期待しています。一方で、私のようにそこまでデータやAIに詳しくない人でもあるデータがあったら使ってみたいという人はたくさんいると思います。使いやすいデータがあるに越したことはないと思います。使いやすいデータがあれば、すそ野も広がり新たなサービスも生まれやすいと思います。できる範囲で対応していただきたいです。
地下のデータは私も重要だと考えています。弊社としても、見えているカメラの部分、地上だけでの確認であり、陥没の話もありインフラの老朽化が進んでいるため、地下で見えない部分は老朽化が進んでいると思うので対応が必要です。現場では図面と実際の状況が異なることが多いため、正確なデータを作成することは非常に難しいので課題と思っています。
データの正確性の話が出ましたが、オープンデータでは、正確なデータを用いて不正確なデータを補正することが可能です。一つの事例で言えば、法務省の登記のエクセルケースでは、明治時代の測量データは原点の位置が分からず、補正が必要でした。オープンデータを組み合わせて正確なデータを作成することが可能です。
本日3者様からデジタルサービスでの課題やご提案、要望をいただいてまいりました。利用者視点でオープンデータを進めていくためのディスカッションとなったと思います。つづいて、ディスカッションを踏まえて丸田さんより感想をいただければと思います。
アーカイブについては簡単に答えが出ない問題ですが、国会図書館がWARPいう事業で公共団体のホームページは定期的にアーカイブされています。これにより過去のデータを使うことができます。問題はリアルタイムで提供されるデータなどは、過去のデータも含めてどのように残していくのかを考える必要があります。
データを持っている、役所で言う原課さんは、データの価値を理解していない場合が多いです。このデータは使われることがないと思っていることがありますが、特定の事業者にとっては非常に重要なデータなこともあります。
一方で、発電所の発電データなどビジネスに関わるデータは公表しづらい部分もあり、そのバランスを取るのが難しいので、今後調査が必要です。
データを持っている側がオープンデータを提供するように言われ、仕方なく提供していることもあります。そのデータがどう使われているか分からず、モチベーションが低下しています。今日紹介されたような活用事例があれば、自治体にも連絡し、事例を提供してほしい
です。デジタル庁も利活用事例をホームページにオープンデータ100として紹介しているので、積極的に出していただきたいです。ぜひお願いしたいと思います。
データの出し方、フォーマットの統一についてですが、デジタル庁としては形式を合わせて出すことを進めてきました。しかし、先ほども話にありましたようにAIの進化により、役所の職員が手間暇をかけてデータを整理する必要がなくなりつつあります。現状ではまだ完璧ではありませんが、近いうちにAIが賢くなり、迅速に対応できるようになるでしょう。
これからは、データを揃えて綺麗に出すよりも、数を多く出し、リアルタイムでどんどん公開することが重要です。変わりつつある時期なので、今後とも民間の皆さんの意見を聞きながら、どう進めていくか一緒に考えていきたいと思います。よろしくお願いします。
それでは最後に池田さんより、本日のラウンドテーブル全体を通してご発言いただければと思います。
ご提案者の皆様ありがとうございました。いくつか個別にコメントさせていただければと思います。
まず、加藤さんについてですが、私も別の機会に気象庁さんと意見交換する機会があり、気象データが防災に使われるというイメージが強かったのですが、ビジネス活用にも積極的に取り組んでいることを知りました。我々としても気象データが産業ビジネスに活用されるように、オープンデータの側面からも後押ししていきたいと思います。
福冨さんのマシンリーダブルデータについては、我々も各局や区市町村に、どうわかりやすく伝えるかを試行錯誤しながら行っています。福冨さんの提案を参考にしながら、記載をブラッシュアップしていきます。
最後の米田さんからお話のあったデータ形式の問題については、3Dデータは比較的データ形式が統一されている分野の側面もあるかと思っています。いずれにしましてもデータ形式のあり方が非常に重要だと思います。
利活用事例についてもデジタル庁だけでなく、我々も重要視しています。オープンデータカタログサイトの中でも利活用事例を提供していますので、差し支えなければ我々としてもデータ保有している部署にPRできますし、ご検討いただければと思います。
本日いただいた貴重な意見を参考に、オープンデータの取り組みを推進していきたいと思います。今後ともよろしくお願いいたします。
本日はありがとうございました。今回のヒアリングを通じて、データを保有するデータ所管局の皆様に引き続きデータの公開をご相談させていただく予定ですので、ご協力いただけ
ますと幸いです。
それでは、本日はこれにて閉会させていただきます。大変貴重なご議論をいただき、誠にありがとうございました。