1から始めるPythonデータ分析 - やりたいこと逆引きリスト ▶︎▶︎

偏差値を計算する方法|ポケモンで学ぶデータ分析

偏差値を計算する方法

今回は皆さんご存知の「偏差値」を計算する方法をご紹介します

学校のテストなどで、受験生の学力の高さを示す指標として知られている偏差値

点数が均一ではないテスト同士で、学力の高さを測るのに非常に便利な指標です

そしてこの「偏差値」をExcelとPythonを使って算出する方法について説明します

MEMO

「平均」や「標準偏差」などの統計ワードが出てきますが、

式に当てはめれば偏差値が出るようにご説明していきます

サンプルのデータとして「ポケモン」のデータを活用していきます!

ポケモンのデータ

ポケモンのデータ一覧

今回利用しているポケモンのデータはPoke APIを利用することで、無料でデータを取得することができます

Excelデータもご用意しているので、ぜひ手元で確認してみてください

ポケモンで学ぶデータ分析|データの中身を知ろう

偏差値を算出する式

偏差値を算出するには「平均」と「標準偏差」を利用します

「平均」は馴染みがあるワードかと思いますが、「標準偏差」はご存じない方が多いと思います

※統計を勉強しても、ここで躓く方が多数いらっしゃいます

しかし本記事では「統計に関するワード」を説明せず、システムに内蔵された関数で補います

つまり、ただ式に当てはめることで「偏差値」を算出することができいるように説明していきます

(スコア – 平均)÷ 標準偏差 × 10 + 50

この式にデータを当てはめていきます

例えば「ピカチュウ」の強さを表す「ステータス」を、ポケモン全体のステータスと比較して偏差値を出してみます

スコア :320

平均  :423

標準偏差:112

(320 – 423)÷ 112 × 10 + 50 = 40.80…

偏差値を求める式に照らし合わせると「40.8」という結果が出てきました

つまり「ピカチュウ」の強さの偏差値は真ん中よりだいぶ下ということです

標準偏差の出し方

標準偏差はこちらの公式で算出できますが、偏差値を出すためだけに覚える必要はありません

ExcelやPythonのシステムには「関数」として存在しているため、一発で算出できます

統計学をしっかり勉強したい方はぜひ理解してみてください

標準偏差の出し方

Excelで偏差値を出す

(スコア – 平均)÷ 標準偏差 × 10 + 50

Excelでは平均をAVERAGE()で、標準偏差をSTDEV.P()で出すことができます

AVERAGE() で全体の平均を出します
エクセルで平均を出す方法
STDEV.P() で標準偏差を出します
エクセルで標準偏差を出す方法
2つの数値を元に偏差値を出します
エクセルで偏差値を出す方法

式がずれないように絶対参照を忘れないようにつけてください

world map絶対参照・相対参照を分かりやすく解説しています|意外と知らないエクセルの基礎

Pythonで偏差値を出す

続いてPythonで偏差値を出す方法をご紹介します

まずポケモンのデータを読み取る準備します

import pandas as pd
df = pd.read_excel('pokemon_data.xlsx')
df.head()
pd.read_excel('pokemon_data.xlsx')

(スコア – 平均)÷ 標準偏差 × 10 + 50

Pythonでは平均をmean()で、標準偏差をstd()を使い算出します

(df['ステータス'] - df['ステータス'].mean()) / df['ステータス'].std() * 10 + 50
ポケモンのステータスの偏差値

変数の列に組み込んで、必要情報だけ取り出します

df['ステータス(偏差値)'] = (df['ステータス'] - df['ステータス'].mean()) / df['ステータス'].std() * 10 + 50
df[['名前','ステータス','ステータス(偏差値)']].head(10)
Pythonでポケモンの偏差値を出す

せっかくなので偏差値を降順にして並び替えてみましょう

df[['名前','ステータス','ステータス(偏差値)']].sort_values(
    'ステータス(偏差値)',ascending=False).head(10)
Pythonでポケモンの偏差値を出す

アルセウスというポケモンが驚異の偏差値76を叩き出していました

アルセウスの画像
出典:Poke API(https://pokeapi.co/)

まとめ

今回はExcelとPythonを使って偏差値を算出する方法をご紹介してきました

「標準偏差」という統計用語が出てきますが、システムに組み込まれている「関数」を使い、簡単に算出することが可能です

「偏差値」は受験でよく使われている指標で、説明しやすい数値だと思います

ぜひいろいろな場面で使ってみてください

回帰分析とは?分かりやすく解説|ポケモンで学ぶデータ分析
お気に入り登録お願いします

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です