1から始めるPythonデータ分析 - やりたいこと逆引きリスト ▶︎▶︎

相関関係とは?分かりやすく解説|ポケモンで学ぶデータ分析

ポケモンデータを使って相関関係を学ぶ

ポケモンのデータを使ってデータ分析を学ぶ企画の第三弾です

今回はデータ同士の関係性を表す相関関係をご紹介します

「相関」という言葉は知っているけど、どうやって使うか分からないという方向けに、

ポケモンに関するデータを用いて分かりやすく実践します

そして今回の分析テーマはこちら↓

ポケモンの高さ・重さは、ステータスと相関関係があるのか?

ポケモンデータの中身に関しては、第一弾の記事をご覧ください

ポケモンのデータ(Excel:105 KB)

ポケモンで学ぶデータ分析|データの中身を知ろう

そもそも相関とは?

相関とは「2つのデータまたは確率変数の間にある線形な関係の強弱を測る指標」であると定義されています

少し分かりにくい言葉だと思いますので、かみ砕いて説明すると「片方が上がると、もう片方も上がる関係」と覚えてみましょう

例えば「身長」と「体重」も相関関係にあると言われています

身長が高くなる(上がる)につれて、体重も重くなる(上がる)というのは、簡単に実感できるのではないでしょうか

ポケモンの高さ、重さで相関見てみる

フシギダネの画像
出典:Poke API(https://pokeapi.co/)

まずは初代御三家の「フシギダネ」系列の3匹の高さ、重さを見てみます

単位は高さ(m):重さ(kg)です

ポケモンの高さと重さの違い

ご想像の通り進化すればするほど、高さも重さも上がります

続いて同じデータを散布図という手法で可視化します

横軸に「高さ」を、縦軸に「重さ」としています

ポケモンの高さと重さの散布図

3つのデータしかないため少し分かりにくいですが、高さが上がれば重さも上がることが分かります

理解しやすいように傾向線も引いています


それではデータを増やしてみましょう(3匹→897匹)

全ポケモンの高さと重さの散布図

飛びぬけて高い・重いポケモンがいるのがいますが、3匹のときと同様に右肩上りの傾向があることも分かります

片方が上がると、もう片方も上がる関係」 にあるため、相関関係があると言えそうです

数値としての相関

相関関係は数値で表すことができ、「-1」から「1」の間になります

上で見たように 「片方が上がると、もう片方も上がる関係」 の場合は、正の相関と呼ばれ「1」により近い数値になります

また散布図では右肩上がりのグラフになります

一方で 「片方が下がると、片方が上がる関係」の場合は、負の相関と呼ばれて「-1」により近くなります

「-1」から「1」までの相関のイメージとグラフ
注意

相関に関してよくある間違いは、「負の相関=相関がない」という認識です

正しくは「0」は関係がなく、「1」か「-1」に近ければ関係が強くなります

相関係数がマイナスだから、相関が無いということではないので注意しましょう

マイナスの相関とは?

マイナスの相関とは「片方が下がると、片方が上がる関係」のことです

こちらもポケモンのデータを使って分かりやすく解説します

ポッポのイメージ図
出典:Poke API(https://pokeapi.co/)

ポケモンにはゲームでの「捕まえやすさ」という指標が存在していて、数値が大きくなればなるほど捕まえやすくなります

ちなみに最大の255はポッポなどの弱小ポケモンです

先ほどと同じように横軸に「捕まえやさ」を、縦軸に「ステータス」をグラフ化してみます

ポケモンの捕まえやすさとステータスの散布図

ご覧の通り、右肩下がりのグラフになります

つまり「捕まえやすさ」が上がるほど、そのポケモンの「ステータス」は低くなります

これがマイナスの相関の一例です

ポケモンのステータスの相関を見る

さて、ここからはデータ分析をさらに実践していきます

今回のテーマを中心に分析を実施していきます

ポケモンの高さ・重さは、ステータスと相関関係があるのか?

先ほどはポケモンの「高さ」と「重さ」の相関関係を分析しましたが、今度は各ステータス(こうげきやぼうぎょ)とどういう関係があるかを調べてみましょう

まずはステータス同士の相関関係を調べる

ポケモンのステータスには6種類存在しています

  • 体力を示す「HP」
  • 攻めの指標の「こうげき・とくこう」
  • 守りの指標の「ぼうぎょ・とくぼう」
  • 早さの指標の「すばやさ」

この6種類のステータスそれぞれの相関を可視化します

※同じ項目どうしは「1」となるのでそれ以外を見ましょう

ポケモンのステータス同士の相関関係

より色の濃い=数値の高い項目は「ぼうぎょ」と「とくぼう」でした

守りの指標は片方が上がると、もう片方も上がりそうです

また「とくこうーとくぼう」や「HPーこうげき」も一定の相関があります

高さとステータスの関係を見る

さて本題の高さ・重さと各ステータスの相関を調べてみましょう

ポケモンの高さとステータスの相関関係

調査の結果、ポケモンの「高さ」に対しては、全てのステータスに関して相関がありました

特に「HP」に関しては強い相関があるという結果でした

重さとステータスの関係を見る

ポケモンの重さとステータスの相関関係

ポケモンの「重さ」に対して相関があるのは「HP・こうげき・ぼうぎょ」という結果でした

一方で「すばやさ」は相関が無しという結果でした

本当にこの分析は正しいのか?

上記のデータ分析の結果をまとめると「高さと重さの指標と、ステータスには正の相関がある」となります

確かに背の高いポケモンは下で可視化している通り、屈強で強そうです…

高さのあるポケモンのイメージ図
出典:Poke API(https://pokeapi.co/)

一方で体重の重いポケモンが「すばやさ」が高いというのは本当でしょうか?

重ければ動きが遅く、すばやさが低くなるのでは?という仮説が立てられます

ではなぜ重さとすばやさには、弱い正の相関があるのでしょうか?

そもそも進化すればステータスは上がる

よく考えてみるとポケモンは進化するにつれて、ステータスは上昇します

「フシギダネ」系列の進化とステータスを見ても、進化するにつれてステータスは上がります

フシギダネの進化によるステータスの変化

つまり「重さ」と「すばやさ」の相関関係の中には、進化という結果が入っており

進化することによる全体的なステータス上昇によって、「重さ」も「すばやさ」も上がっているということです

先ほど実施した調査には「進化前のポケモン」も「進化後のポケモン」も両方区別なく入っていました

すばやさと重さの散布図

この問題を解決するために進化という概念をこの散布図に入れてみます

※数値の意味は何段階目の進化かを示しており、「0」は進化しないことを示しています

進化別すばやさと重さの散布図

進化の段階ごとに分けて分析をすると、下向きの傾向線になりました

つまり重くなればなるほど、すばやさは下がる傾向にあるということですね


最後に先ほどの「高さ・重さ」と「ステータス」の関係をもう一度調査してみます

第三進化のポケモンの高さとステータスの相関関係
第三進化のポケモンの重さとステータスの相関関係

先ほどとは異なった傾向の結果が出てきました

やはり仮設通り、「重さ」が上がれば上がるほど、「すばやさ」が下がることになりました

まとめ

今回のテーマは改めてこちら

ポケモンの高さ・重さは、ステータスと相関関係があるのか?

このテーマに関してデータ分析をした結果をまとめました

  1. 「高さ・重さ」と「ステータス」の間には主に正の相関がある
  2. 進化すると全ての数値が上がることから、分析から除く必要がありそう
  3. 進化を除くと、「高さ」に関しては「こうげき」と一番相関がある
  4. また、「重さ」に関しては仮設通り、「すばやさ」と負の相関がある
お気に入り登録お願いします

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です