清水正行インタビュー:データビジュアライズが与える多くの“きっかけ”

shimizu-ttl_03

26.Mar.2018

2014年4月14日に開催されるOpenCUワークショップ「DVVX:データビジュアライゼーション入門」の講師である清水正行さんにインタビュー。清水さんは数年前から個人ブログ「GUNMA GIS GEEK」で、D3.js*という技術を用いたデータビジュアライゼーション作品は発表しており、現在、日経新聞編集局に所属し仕事にてデータ関連のエンジニア業務を行なっています。昨今では“データビジュアライゼーション”というワードがバズり、何か見えない事実を可視化してくれる便利な手法のような認識もあります。しかし、それが特別な環境や特別なスキルによって実現されているわけでなく、日々の地道な作業の積み重ねによって産み出されるのが現状です。清水さんがなぜ個人活動でデータビジュアライゼーションにのめり込んだのか?その秘密を探ってみました。
インタビュー:藤田健介(ロフトワーク/テクニカルエンジニア)

 

* D3.js:Web上で動作するプログラムJavaScriptライブリの一種。プログラムの難易度は高いがもともとデータを格納し出力するなどの機能を実現するためにつくられており、なおかつWebブラウザ上での動作ができるため多くのデータビジュアライゼーション作品のプラットフォームとして活用されている。https://d3js.org/

 

ドラマ『NUMBERS』を見てデータを可視化する面白さに気づかされました

 
藤田 現在、日経新聞の編集局にお勤めで、主にデータビジュアライゼーションに関する業務を行っているとのことですが。
 
清水 はい、現職は2年目です。主に日経ビジュアルデータの記事に併載するものを内容に合わせてデータビジュアライゼーションする作業ですね。コンテンツを実装(プログラミング)しています。記事にはさまざまな人が関わっているので、あくまでその工程を担当している立場です。
 

藤田 ブログ「GUNMA GIS GEEK」での活動から、お声がけがきたとのことですが、そもそもブログを始めたきっかけは?
 
清水 もともと、このブログ以前から、ホームページや他にブログをいく作っていました。ほとんどは、自分が勉強した内容をメモのように残したいと備忘録です。2012年ごろに、D3.jsというライブラリを知り、データビジュアライゼーションやGIS(地図情報システム)に興味を持つようになったのでGISを含むタイトルに変更して、今も続いているといった感じです。なので、以前は技術的な内容の記事以外にも、見た映画の感想とかわりと雑多にエントリーを載せていました。
 

gunma-geek
library

清水さんの個人ブログGUNMA GIS GEEK(上)とD3.jsで作成したライブラリーを共有するオンライン個人スペースblocks(下)
いずれも長年のノウハウの結晶がつまった貴重なオープンソースとなっている

 
藤田 なるほど。ちなみに映画はどんなジャンルが好きなんですか? 
 
清水 SFとミステリーが好きです。あと海外ドラマが好きでNetfilxはHuluなどでよくみています。D3やGISの勉強を始めた頃、ちょうどHuluで『NUMBERS 天才数学者の事件ファイル』(2005-2010)という番組が配信されいてその影響を受けてコンテンツを作ったりしていました。事件に関わる地理データを分析する回などがあるのですが、それを見て大阪市が公開していたひったくり事件発生箇所のデータを使ったデータビジュアライゼーション(大阪ひったくりマップ)を作ったりとか。
 
藤田 僕も『NUMBERS』はまってました。水やりのシャワーなど日常的なところから分析のアイディアを得るところは面白いですよね。
 
清水 そうですね。感染経路をビジュアライズするなんて、データビジュアライゼーションそのもの。理論だけだと退屈なものが、ドラマをみると分析の仕方とか、技術とか知るとこができて役に立ちましたね。
 
藤田 その興味からGIS関連の技術に惹かれたわけですね。
 
清水 はい。当時はGISという用語すら理解していなかったのですが、D3.jsには地理情報の可視化を行うための機能が充実していいたので見よう見まねで初めてみて、本やネットで調べて新しく知ったことがあれば、ブログに残していくということをしていました。
 
藤田 さすが、解説ブログに落としていく所作が身についてますね。2012年ごろに作品を作りはじめて周りの反応はいかがでした?
 
清水 基本的には備忘録ですし、そもそも技術ブログはアクセス数が集まるようなものでもないのですが、当時あまりD3.jsについて記事を書いている人がいなかったのと、海外のメディアでデータジューナリズムやデータビジュアリゼーションという手法が注目され始めた時期と重なったので、そういったコンテンツや技術に興味をもたれた方から「ブログ読んでます」と声をかけていただくことがありました。
 

fujita-int

藤田健介/ロフトワークテクニカルディレクター

 

少しネガティブなデータでも使う人がいれば公開の後押しになると思う

 
藤田 作品が広く知られるきっかけは何だったのでしょう?
 
清水 先ほどあげた「大阪ひったくりマップ(http://shimz.me/datavis/osakaSnatching/)」がハフィントンポストなどいくつかのメディアに取り上げていただいたのがきっかけだったと思います。
とくに日本ではGISはデスクトップアプリを使った分析等が主流で専門性の高い技術だったようで、フロントエンドよりのGIS情報を発信している人が少なかったのか、「フロントエンドで何か面白いことをやっている人がいる。なぜか群馬に!」といった感じで注目されたみたいです。その結果、GISの勉強会やイベント等に読んでいただくことが増えました。
 

osaka-hittakuri

大阪ひったくりマップ。グラフとマップを組み合わせ、年代別と地域と発生時間など
さままざまな組み合わせを切り替えることができる

 
藤田 ブログのプロフィール欄では、『全国世帯年収マップ(http://shimz.me/datavis/mimanCity/)』も事例として紹介していますね。
 
清水 このコンテンツは、人気WebメディアのGIGAZINEに掲載されたのがきっかけで、かなり大くの方にみていただけたようです。普段の数十倍のアクセス数があってびっくりしました。
多くのメディアやブログで取り上げていただいて、この地図を観ながらいろいろな意見が交わされていたのが嬉しかったです。
 
藤田 『全国世帯年収マップ』はどうやって作りましたか?データの整理が大変だったのでは。
 
清水 統計局が出している「平成25年住宅・土地統計調査」とういうデータを使っているのですが、これをcsvに整理するのに2ヶ月ぐらいかかりました。整形したデータをGitHub(https://github.com/shimizu?tab=repositories)にアップしてあります。この地図ではつかっていませんが世帯年収以外のデータもふくまれているので、ぜひ、ほかの人にも活用してもらいたいですね。

 

setainenshu-map

清水作品で一番反響のあった『全国世帯年収マップ』 パラメーターである年収と
人口に対する割合をかけることで<該当地域の表示(赤)が変化する

 
藤田 労力をかけてでもデータを公開して、オープンソースに貢献されている姿勢がすばらしいですね。
 
清水 はい。ただ自分としてもスマフォに対応していない、県境が表示されていない(市町村の区切りのみ)など、改善して作り直したいとも考えています。
 
藤田 そのような個人の活動から現在の職業につながったり、ワークグループへの参加のきっかけだったんですね?
 
清水 そうですね、この頃からありがたいことにいろんなイベント等に呼んでいただけるようになりました。「群馬でデータビジュアライゼーションをやっている人」と認識されたようです。
 
藤田 データを探すときは作りたいものありきなんですか?それともデータをまずは発見してから作るものを考えるのでしょうか?
 
清水 両方でしょうか。はじめにテーマが決まっている場合もあれば、たまたま見つけたデータを可視化してみる場合もあります。NEVARに自分用に見つけたデータをまとめています。
 
本来、データは国民の財産なので透明性が当然ですべて公開するが原則だと思うのですが、情報公開が徹底している米国に比べ日本ではまだまだ消極的な場合が多いですね。その中でちょっとネガティブのデータを公表することは勇気がいると思うのです。なので、それを使う人がいれば公開の背中を押すことができると考えています。
 

toukeida-ta

経産省の統計データのページ。Webを探せば多くのデータが公表されている。
清水さんがまとめたオープンデータはこちらから (オープンデータ&公開データのまとめ)

 
藤田 なるほど、使う人がいて初めてデータの意味も出てくるわけですしね。
 
清水 あとは個人的な意見ですが、プログラミングのやり方、解析/分析ツールはどんどん共有され便利になってきています。多くはWebにオープンソースとしてあるのですぐに利用できます。ただ、<情報の入手>には格差が歴然とあります。企業ごと、団体ごとなど一部の人しか使えない情報もあります。その格差を埋めていくためにも公開されたものを積極的に使うを示すことができればうれしいですね。あと、AIなどの機械学習が発展していくなかで、データが誰でも触れることができることが重要になってくると考えています。
 
藤田 すでにD3.jsでの作品などもかなりの数になっていますが、今後、興味を持っていることは何ですか?
 
清水 単純にデータを分析した結果を可視化するのではなく、分析の過程も含めたコンテンツを作ってみたいと思います。2013年に出版された「Reproducible Research with R and R Studio」(著:クリストファー・ガンラッド/洋書)という本の中で「リプロデューシブル・リサーチ」という考え方が提唱されているのですが、これは「分析の結果だけではなく、その過程で使用したデータやプログラミングコードなどを含めて共有しよう」という提言です。
 
R言語*にはもともとワークフローそのものを共有する機能がありますし、最近ではPython/Jupyter Notebookなど分析過程を共有仕組みも一般的になっています。また、D3.jsの作者であるマイク・ボストックが関わっているobservableも同様の思想のもとに作られています。こんなふうに、データを分析する手法やアルゴリズなども共有していけたらいいなと考えています。

*R言語:オープンソース・フリーソフトウェアの統計解析向けのプログラミング言語及びその開発実行環境

futri

 

藤田 最後にワークショップに参加する人にアドバイスをひとこと
 
清水 設計方法や要件が決まっている「仕事」としてのプログラミングでなく、やっていくうちに発見をしていくのがD3.jsの楽しみであります。僕もはじめのころはいじくりまわして新しいもの作っていくことがとても楽しかったです。
 
また、データの見せ方って結構、既存の表現が多いことにも気づきます。同時に、データをまとめて処理すれば、専門家が何か新しい価値をつけてくれることも、きちんと前知識がないと生まれてきません。だからこそ、実際に自分で手を動かして理解すること、発見することから始めるのがよいと考えています。今回のワークショップがそのきっかけになるとうれしいですね。
 
藤田 ありがとうございました!ワークショップよろしくお願いします。
 

 

清水正行

日経新聞編集局

日経新聞社所属。高崎・東京間を毎日新幹線で行き来する出稼ぎエンジニア。ブログではGIS(地理情報システム)・データビジュアライゼーション・オープンデータなどについて執筆。個人サイトは多くのデータビジュアライズ作品を発信するGUNMA GIS GEEK:https://shimz.me/blog/
bl.ocks.orgに投稿した作品。D3.jsで作成した視覚化サンプルhttp://bl.ocks.org/shimizu

More Contents

藤田健介

ロフトワーク/テクニカルディレクター

大学ではグラフィックデザインを学ぶ傍ら、Adobe Flashを入り口にWebの世界にのめり込み、プロバイダーのSEとして就職。約6年間にわたり、CMSの開発や運用、カスタマイズに関わる。その後、元々興味のあった音楽を研究するため、ロンドンとベルリンに数ヶ月滞在。クラブミュージックへの知見を深める。2016年ロフトワーク入社。インフラからフロントまで幅広くこなすテクニカルディレクターとして様々な案件を担当中。

システムをデザインするという視点で、運用や拡張のしやすいCMSサイト設計を目指す一方、「創る力を市民の手に取り戻す」をテーマにファブリケーションやコミュニティの可能性にも関心を持っている。
https://loftwork.com/jp/people/kensuke_fujita

More Contents

  • Top
  • Ideas
  • 清水正行インタビュー:データビジュアライズが与える多くの“きっかけ”