分散で躓く

はじめに

あっ,どーも僕です.

ずっとほったらかしでしたが,何年かぶりにデータ分析を勉強しています. やっぱり楽しいなと思っていたらさっそく分散で躓きました. 基礎から崩れたという感覚で不安な精神状態は辛いのでメモしておきます.

その右辺は推定量じゃないのか問題

最近,図書と資料を併せて三つ読みました.

上記の資料ではいずれも同様の分散の定義でした. GCIの3章から該当部分を抜粋します.

f:id:aaaazzzz036:20190521204520p:plain
GCI3章より

「データ分析で学ぶ12のレッスン」ではじめてこの定義を見たとき 「右辺は分散の推定量であり母数の定義として使うのはおかしくないか」という印象がありました. 間違ってそう書いてしまったのかと思っておりましたが, その後に読んだ2つの資料でも同様の記述がされておりました.慶応の先生,博士号持ちのデータサイエンティスト,東大の有名研究室とそうそうたる人たちによる資料です.ブログでもいくつか同じ記述をしているものがありました.

・・・納得は出来ませんが,どうやらそうする場合もあるということでしょうか.

これを書いていて思い出しましたが昔読んだ次の図書でも同様に記述されています.2014年くらいの出版であるので,以前から上述のような分散の定義がされていたようですね.