目次
偏差値を計算する方法
今回は皆さんご存知の「偏差値」を計算する方法をご紹介します
学校のテストなどで、受験生の学力の高さを示す指標として知られている偏差値
点数が均一ではないテスト同士で、学力の高さを測るのに非常に便利な指標です
そしてこの「偏差値」をExcelとPythonを使って算出する方法について説明します
「平均」や「標準偏差」などの統計ワードが出てきますが、
式に当てはめれば偏差値が出るようにご説明していきます
サンプルのデータとして「ポケモン」のデータを活用していきます!
ポケモンのデータ
今回利用しているポケモンのデータはPoke APIを利用することで、無料でデータを取得することができます
Excelデータもご用意しているので、ぜひ手元で確認してみてください
ポケモンで学ぶデータ分析|データの中身を知ろう偏差値を算出する式
偏差値を算出するには「平均」と「標準偏差」を利用します
「平均」は馴染みがあるワードかと思いますが、「標準偏差」はご存じない方が多いと思います
※統計を勉強しても、ここで躓く方が多数いらっしゃいます
しかし本記事では「統計に関するワード」を説明せず、システムに内蔵された関数で補います
つまり、ただ式に当てはめることで「偏差値」を算出することができいるように説明していきます
(スコア – 平均)÷ 標準偏差 × 10 + 50
この式にデータを当てはめていきます
例えば「ピカチュウ」の強さを表す「ステータス」を、ポケモン全体のステータスと比較して偏差値を出してみます
スコア :320
平均 :423
標準偏差:112
(320 – 423)÷ 112 × 10 + 50 = 40.80…
偏差値を求める式に照らし合わせると「40.8」という結果が出てきました
つまり「ピカチュウ」の強さの偏差値は真ん中よりだいぶ下ということです
標準偏差はこちらの公式で算出できますが、偏差値を出すためだけに覚える必要はありません
ExcelやPythonのシステムには「関数」として存在しているため、一発で算出できます
統計学をしっかり勉強したい方はぜひ理解してみてください
Excelで偏差値を出す
(スコア – 平均)÷ 標準偏差 × 10 + 50
Excelでは平均をAVERAGE()で、標準偏差をSTDEV.P()で出すことができます
式がずれないように絶対参照を忘れないようにつけてください
絶対参照・相対参照を分かりやすく解説しています|意外と知らないエクセルの基礎Pythonで偏差値を出す
続いてPythonで偏差値を出す方法をご紹介します
まずポケモンのデータを読み取る準備します
import pandas as pd
df = pd.read_excel('pokemon_data.xlsx')
df.head()
(スコア – 平均)÷ 標準偏差 × 10 + 50
Pythonでは平均をmean()で、標準偏差をstd()を使い算出します
(df['ステータス'] - df['ステータス'].mean()) / df['ステータス'].std() * 10 + 50
変数の列に組み込んで、必要情報だけ取り出します
df['ステータス(偏差値)'] = (df['ステータス'] - df['ステータス'].mean()) / df['ステータス'].std() * 10 + 50
df[['名前','ステータス','ステータス(偏差値)']].head(10)
せっかくなので偏差値を降順にして並び替えてみましょう
df[['名前','ステータス','ステータス(偏差値)']].sort_values(
'ステータス(偏差値)',ascending=False).head(10)
アルセウスというポケモンが驚異の偏差値76を叩き出していました
まとめ
今回はExcelとPythonを使って偏差値を算出する方法をご紹介してきました
「標準偏差」という統計用語が出てきますが、システムに組み込まれている「関数」を使い、簡単に算出することが可能です
「偏差値」は受験でよく使われている指標で、説明しやすい数値だと思います
ぜひいろいろな場面で使ってみてください
回帰分析とは?分かりやすく解説|ポケモンで学ぶデータ分析