比較
ありふれたグラフたち
シンプルなデータビジュアライゼーションはどこにでもある。円グラフ、棒グラフ、折れ線グラフ。簡単なストーリーを伝えるには十分だ。しかし、どのグラフにも表示できる次元数とデータ量に限界がある。その限界を理解することが、なぜ平行座標が重要なのかを理解する第一歩だ。
円グラフ
円グラフは1次元、1データポイント。円全体が1つの観測値をスライスに分解したものだ - カテゴリ別の予算、回答別のアンケート結果。全体に対する各部分の比率を示す。そしてそれだけをうまくやる。
棒グラフ
棒グラフはもう少し柔軟だ。シンプルな棒グラフは、1次元にN個のデータポイント(例:地域別の売上、学生ごとのテストの点数)。逆にすると、1データポイントに対してN次元になる(例:ある選手の筋力、速度、持久力、正確性のスタッツ。)
折れ線グラフ
折れ線グラフは、プロットを連続的にしたものだ。N個のデータポイントを2次元にわたって結ぶ - 通常X軸が時間、Y軸が測定値。これが折れ線グラフを強力に感じさせる理由だ。トレンド、軌跡、時間の変化を直感的に示してくれる。
平行座標プロット
平行座標プロットは、上述のすべての限界を突破する。N次元かつNデータポイントを同時に扱える。任意の量と複雑さのデータを理解し、精緻化できる。
各垂直軸が異なる次元を表す。すべてのデータポイントは、すべての軸を一度に横切る線であり、各次元の値をその軸との交点の位置で表現する。集約は一切ない - 個々のデータポイントがすべて見える。このサイトでは、1000匹以上のポケモンが10次元にわたって同時に表示されている。
視覚的な混沌を防いでいるのはインタラクティビティだ。 軸をブラッシングすると、データが範囲でフィルタリングされる。フィールドで色分けすると、クラスターや外れ値が浮かび上がる。ホバーすると、すべての次元を通る1本のパスがハイライトされる。例えば、すばやさが100以上かつとくこうが120以上のポケモンをフィルタリングすれば、高速な特殊アタッカーを即座に見つけられる。さらにタイプで色分けすれば、どのタイプがそのニッチを占めているかが一目でわかる。静的な平行座標プロットは圧倒的だが、インタラクティブなものは洞察に富んだ発見のツールだ。
トレードオフは現実にある。平行座標は、積極的に操作する意思のあるユーザーを必要とする。円グラフのようにちらっと見るだけでは使えない。しかし、まさにそれがポイントだ - 円グラフは一目で見るためのもの、平行座標は探索するためのものだ。
なぜこれが重要か
現実世界のデータは、ほとんど一次元ではない。科学的測定、ネットワークテレメトリ、患者の記録、金融商品、ゲームキャラクターのステータス - これらはすべて高次元空間に存在する。円グラフ、棒グラフ、折れ線グラフは、この複雑さを単純化しすぎたり、誤解を招いたりする要約に平坦化してしまう。
平行座標は生の構造を保つ。グラフを作った人が正しい集計方法を選んだと信じる代わりに、人間自身がパターンを見つけられるようにする。他の一般的なグラフでは扱えない次元とデータ量に対応できる。
データ分析は開発者や研究者だけのものではない。対戦ポケモンの構築を考えるプレイヤーにとっても、種族値の多次元比較は強力な武器になる。平行座標プロットは、データの構造を壊さずに探索できる数少ない可視化手法だ。
データが3次元以上、100行以上あるなら、平行座標プロットでデータを探索してみるべきだ。 何を見逃しているか分からないかもしれない。このプロジェクトはオープンソースで公開している。コードを読み、独自のデータに応用し、コントリビューションしてほしい。