2012年11月25日日曜日

統計学を拓いた異才たち



『統計学を拓いた異才たち』によると、統計学の基礎的な概念は生物学に関係していたんですね。「平均への回帰」「相関係数」はフランシス・ゴールトン、「分布族」などのカール・ピアソン。かれらはバイオメトリカ誌を発刊することになる。せいぜい100年前くらいなので統計学は意外に歴史が浅い。

「ほかのことはともかく、すべての科学者がゴセットの『平均についての起こりうる誤差』というタイトルの短い論文の恩恵を受けている。その論文は1908年にバイオメトリカ誌に発表された。この注目すべき論文の一般的な含意を指摘したのは、ロナルド・エイルマー・フィッシャーだった」

ウィリアム・シーリー・ゴセットはギネスビール社で麦芽汁を発酵させるために必要な酵母の濃度をより正確に評価する方法を考案し、会社はより安定した品質の製品を生産できるようになった。酵母は生き物なので絶えず増殖・分裂するが、ゴセットはデータを調べ、酵母細胞の数をポアソン分布でモデル化。

ゴセットはバイオメトリカ誌の編集者だったピアソンと親密になり、ピアソンはゴセットの論文を掲載したがったが、ギネス社は従業員での発表を禁止していた。そこでゴセットは「ステューデント」というペンネームで論文を発表した。

「以後30年以上にわたって、ステューデントは一連のきわめて重要な論文を書き、そのほとんどすべてがバイオメトリカ誌に掲載された」。ステューデントのt検定で有名ですね。仕事の多くは勤務時間後自宅に戻って行われていた。ゴセットは他人の気持ちを敏感に察し親切で思慮深い人だったそうです。

ゴセットは、そもそもの観測データは正規分布に従うと仮定していたが、実はもとの観測データが正規分布に従うかどうかにかかわらず、ステューデントのtが同じ分布を持つことが後にスタンフォード大学のブラッドリー・エフロンによって証明されている。

0 件のコメント: