統計学の基礎的な考え方や用語など

競馬がきっかけで学習意欲が出るとは思わなかった。何があるかわからないな。しっかり数学勉強しておけばよかった。数学に限らないんだけど…。

 

 

統計学には2つの要素がある。

記述統計…得られたデータから特徴を抜き出す。

推測統計…確率を用いて、「とても大きな事象」や「未来に起こること」を推測する。
→部分から全体を推測する

 

 

統計…観測されたデータの集まり…過去

確率…未来

(過去…平均値 / 未来…期待値)

 

 

「様々な値を取る」ことを「分布する」という

→「不確実性」が働いているため、分布が発生する。「不確実」なものにも法則性、特徴がある。その特徴や癖、法則性を「分布の特性」と呼ぶ。

 

 

データの集まり(現実)から分布の特性を導き出すのが「統計」

 

 

縮約」…ある基準で整理を行い、意味のある情報を抽出すること

→大きく分けて方法は2つある

 

・グラフ化する

度数分布表…統計において標本として得たある変量の値のリスト。情報を整理した表。

 

・1つの数字を代表とさせる。代表する数字を「統計量」と呼ぶ

 

 

データの細部を犠牲にすることによって、分布の特性がわかる。

 

 

階級値…度数分布表の1つの区間

度数…各階級のデータの個数(度数は数)

相対度数…各階級の度数を合計の度数で割ったもの

 

階級値 × 相対度数 = 平均値

※同じ階級の中なら、階級値×度数としても大きなズレはない。

 

平均値とは

・全データの中から「全データを代表する数値」として1点選んだもの。

・データは平均値周辺に分布している。

・多く現れるデータは平均値に与える影響が大きい。

 

普段の生活における”平均”とは”算術平均(全データを足して個数で割る)”だが、それ以外にも”平均”は多数存在する。

→前述したとおり、平均値は「データを代表する1つの数値」のこと。

タイトルとURLをコピーしました