競馬がきっかけで学習意欲が出るとは思わなかった。何があるかわからないな。しっかり数学勉強しておけばよかった。数学に限らないんだけど…。
統計学には2つの要素がある。
・記述統計…得られたデータから特徴を抜き出す。
・推測統計…確率を用いて、「とても大きな事象」や「未来に起こること」を推測する。
→部分から全体を推測する
統計…観測されたデータの集まり…過去
確率…未来
(過去…平均値 / 未来…期待値)
「様々な値を取る」ことを「分布する」という
→「不確実性」が働いているため、分布が発生する。「不確実」なものにも法則性、特徴がある。その特徴や癖、法則性を「分布の特性」と呼ぶ。
データの集まり(現実)から分布の特性を導き出すのが「統計」
「縮約」…ある基準で整理を行い、意味のある情報を抽出すること
→大きく分けて方法は2つある
・グラフ化する
度数分布表…統計において標本として得たある変量の値のリスト。情報を整理した表。
・1つの数字を代表とさせる。代表する数字を「統計量」と呼ぶ
データの細部を犠牲にすることによって、分布の特性がわかる。
階級値…度数分布表の1つの区間
度数…各階級のデータの個数(度数は数)
相対度数…各階級の度数を合計の度数で割ったもの
階級値 × 相対度数 = 平均値
※同じ階級の中なら、階級値×度数としても大きなズレはない。
平均値とは
・全データの中から「全データを代表する数値」として1点選んだもの。
・データは平均値周辺に分布している。
・多く現れるデータは平均値に与える影響が大きい。
普段の生活における”平均”とは”算術平均(全データを足して個数で割る)”だが、それ以外にも”平均”は多数存在する。
→前述したとおり、平均値は「データを代表する1つの数値」のこと。