・偏差値の平均点は”50″で示される
→(大抵の場合)最高が”75″で最低が”25″
→偏差値40~60の間に全体数の約2/3
・成績は得点と順位だけでは表せられない
→前回のテストよりも得点が下がったとしても、今回のテストの平均点自体が下がっていた場合
→前回のテストよりも順位が下がったとしても、今回のテストの受験者数が増えていた場合
・受験者数、順位、得点、平均点のちらばりを組み込んで、統計的に数値にしたのが偏差値
・”点数のばらつき度合い”を標準偏差と呼ぶ
※偏差値は「全体の中の位置を、難易度とばらつきを考慮して出す値」
→難しいテストでも簡単なテストでもどのくらいの優秀さかがわかるように、平均を”50″としてばらつき度合いを加味してつけ直したもの
・偏差値は得点の分布(グラフ)が数学的にきれいな山型(正規分布)になるように想定している
→実際の得点の分布が正規分布から外れていると極端な偏差値が出る(100を超えたり、マイナスになったりする)
※2019/10/24追記
より詳しく
※偏差値はテストの点数が正規分布になると仮定し、その分布が平均50点、標準偏差10になるように得点を変換したもの。
※2018/02/22追記
中央値について
→有限個のデータを小さい順に並べたとき中央に位置する値。
算出方法
→厳密な計算式はちんぷんかんぷん。
簡単に考える。
例)1,1,3,4,5,8,9,10,12
上記の9つのデータが合った場合、真ん中の数字が中央値。
つまり五番目のデータ(並び順:4・1・4)
1,1,3,4,5,8,9,10,12ならば、5番目の”5″
→偶数個の10つのデータが有る場合、中央の2つの数字の平均が中央値(4・2・4)
例)1,1,3,4,5,8,9,10,12,15
という10つのデータ
中央の2つの数字は”5″と”8″、それの平均なので”6.5″
平均値と中央値の関係性
→それぞれメリット・デメリットがある。用途によって使い分ける。
極端な数字が出る場合は中央値のほうがメリットが大きい(格差が大きい場合の年収の比較など)
最頻値や代表値などは疲れたので後にまた記述。
参考URL→https://mathtrain.jp/daihyochi
※2018/03/09追記
最頻値について
・データの中で最も頻度が高い値を最頻値(モード)と言う。
算出方法
1,1,3,4,5,8,9,10,12ならば、一番多い(頻度が高い)”1″。
→デメリットは、データ数(サンプル数)が少ないと使用できない。
1,2,3,4,5,8,9,10,12ならば、重複する数字がない
代表値について
・データ群の特徴を一つの数値で表したものを代表値と呼ぶ。代表値の中でも平均値,中央値,最頻値が有名。
・正規分布(グラフが綺麗な山型)ならば、平均値,中央値,最頻値どれを使用してもほぼ同じ。
・逆に正規分布でない場合は、平均値,中央値,最頻値の順に並ぶことが多い(ピアソンの経験則)
※統計は便利だが、一つの代表値だけで判断するのは危険。背後にある分析の仕方、分析者の意図などに大きく結果が左右される。