Zipf's law


某氏の検証をすべく、1000動画分たまるまで繰り返しランダム検索をかけて、コメント数の順位とコメント数を対数プロットしてみた。結果としては某氏の実験とほぼ同じものが得られた。某氏は上位200個を使っていたけどこちらはランダム検索からとったので、もっとも順位が高いものでも312コメント。どうもこれは Zipf 則を満たしていないといえそう。なんでだろう。上位200個の結果を見たときはシステム的な頭打ちになってるかと思ったがそういうことではないようだ。ところでランダム検索のアルゴリズムもまた興味深いけど深追いしても無駄そうなのでやらない。