2013年8月10日土曜日

「Amazon ランキングの謎を解く」服部哲弥


途中まで読んで積読だった「Amazonランキングの謎を解く」服部哲弥(2011)を読了。
刺激的でおもしろかったです。統計、確率(測度論)、偏微分方程式なども扱われます。ただ、それらが分からなくても読み進められるように工夫してあります。

Amazonのランキングの比較的シンプルな数学的モデルを作り、実際のランキングのデータを驚くほど再現できています。その結果、Amazonのビジネスモデルはロングテールではないと推定しています。

「ツェトリンの研究成果は、先頭に跳ぶ(move-to-front)確率を用いて定常状態を具体的に表したことである」

「b<1ということは書籍点数の大部分を占めている普通の本が点数Nの大きさを頼りに束になってかかっても、ひと握りのビッグヒットの売り上げにかなわない。この結果を見る限り、書籍に関してロングテールビジネスモデルは成立しないことが、データと理論をつき合わせて見出されたことになる」

「単純化されたモデルに基づく数学的結論が、社会現象のようなきわめて多くの要素が関係する複雑な現象―しかも、精密科学のようにお金や時間をかけて条件を精密に制御して実験することが期待できない現象―に関するデータを思いのほかよく説明できたことはそんなに当たり前とは思えない」

「インターネット時代の社会活動の集計においてランキングの順位をプログラムして表示し、結果としてロングテールの様子が公になりうるという意味で、本書で展開してきた確率順位付け模型の解析は、今後とも実際的な応用の場が広がるだろう」

《著者のウェブサイト》

"オンライン ランキングとロングテール,そして無限粒子系" 服部哲弥 あるいは, アマゾンの謎順位 - Amazon書店はロングテールに非ず

"Stochastic ranking process approach to the Amazon online bookstore ranks" T.Hattori

「Amazonランキングの謎を解く」を読むと、ビッグデータ時代になってもシンプルな統計モデルの重要性は変わらない気がします。むしろ、これまではデータがなくて確かめようもなかった統計モデルもビッグデータで検証可能になる機会が増えるんだと思います。確率・統計の知識の必要性は変わらない。

Amazonのビジネスモデルは投信ビジネスにもあてはまるかもしれませんね。「投信点数の大部分を占めている普通の投信が点数Nの大きさを頼りに束になってかかっても、ひと握りのビッグヒットの売り上げにかなわない。この結果を見る限り、投信に関してロングテールビジネスモデルは成立しないことが、データと理論をつき合わせて見出される...」なんてね。



0 件のコメント: