チョコボール統計

チョコボールの秘密を統計解析で明らかにしていく。おもちゃのカンヅメ欲しい。

1年半の振り返り

【概要】

  • 当ブログを始めて5/19で1年半となりました
  • Amazonの広告貼っているんですがついに収益(525円)が発生したし、このあたりで振り返りをしてみます

f:id:hippy-hikky:20190212115414j:plain

【目次】

はじめに

当ブログは、「チョコボールに関するデータを収集し、統計分析して遊ぶ(秘密を暴く)」ことを目的にしています。 2017年11月19日から運営しており、先日1年半が経過しました。

また、Amazonの広告を貼っているのですが、やっとギフトカードがもらえる基準額(500円)に届き、 収益を発生することができました。
(1年半で500円の収入!)

ということで、 ここまでに得た知見をまとめ、今後の目標を整理していこうと思います。 なお、こんな分析をしてほしい、こんなことを知りたいといったリクエストがあれば 検討しますので(やるとは言ってない)、 記事へのコメントやTwitter等で連絡いただけたらと思います。

【トップに戻る】

アクセス数の推移から見る振り返り

まずは、当ブログへのアクセス数の推移などのデータを見ていきましょう。 なおこのデータは、Google Analyticsを用いて計測したデータです。

f:id:hippy-hikky:20190522000915p:plain
日毎のページビュー数の推移

上の図はブログ開設時(2018/11/19)からのページビュー数の推移です。

いきなりのバズり

始めの頃にいきなりページビューが多い時がありますよね。
これには正直ビビりました。

2018/12/10に投稿した以下の記事をTwitterFacebook等で拡散していただいたようです。

chocolate-ball.hatenablog.com

これは、エンゼルの出現確率の事後分布をMCMCで計算するという内容を書いた記事です。 エンゼルの確率はこの時点では全然わからなかったわけですが(なんせ金も銀もエンゼルは一つも出てないですから)、 ベイズ推定を使うというところが注目されたのかなと想像しています。 このような単純な問題はMCMCを使う意味は全然無いので、 そういうところ突っ込まれるかとヒヤヒヤしていたのですが特に突っ込まれずでした。

なお、私事ですが、この翌日に息子(第1子)が誕生しました。そういう意味でも忘れられない日です。
(分娩室でブログの話をしたら怒られた)

MA2018出場

次に、2018年11月くらいから徐々にページビュー数が増加しているように見えます。

明確な要因はわからないのですが、 このあたりで「MA2018 ヒーローズ・リーグ」という開発コンテストに ChocoballDetectorをエントリーしてプレゼンを毎週のようにやっていました。 結果は「ルーキーヒーロー賞」という賞をいただくことができて、このブログの知名度がここでそこそこ上がったような気がします。あと純粋に楽しかった。

この開発コンテストの参戦記録は以下の記事にまとめています。

chocolate-ball.hatenablog.com

Googleさんの効果すごいですね

また、いつの頃からかわからないのですが、 以下の記事がGoogle検索で「チョコボール 金 確率」みたいな検索語で上位に載るようになってました。

chocolate-ball.hatenablog.com

この影響はだいぶ大きいみたいで、常に当ブログ前記事の中でもアクセス数の3割以上を占めています。 しかし、エンゼルの確率を知りたい人にとって、記事の内容は必ずしもマッチしなさそうだなーと思います。

【トップに戻る】

これまでの発見・得たもののまとめ

前章では、アクセス数の推移からこの1年半でのイベントを振り返りました。 ここでは、1年半の活動でどのようなことがわかったのかをまとめて行きます。

エンゼルの出現確率

日々の計測で銀のエンゼルはそこそこ数が溜まってきました(2019/05/22現在、19個)。 ここまでの推定結果から、銀のエンゼルの出現確率は5%弱であろうということがわかってきています。

しかし、金のエンゼルはまだ出ておらず、今後も調査は継続していきます。

なお、エンゼル出現確率の推定方法については以下の記事を参照ください。

chocolate-ball.hatenablog.com

また、銀のエンゼルを5個獲得するまでに、いくらのチョコボールを購入する必要があるのか知りたい方は以下の記事を参照ください。

chocolate-ball.hatenablog.com

重量の傾向

私は重量の傾向が面白いと思っています。 この傾向を見ることで、森永さんの製造方針が垣間見えるのかなーと感じています。

日々の計測の結果、重量の分布は正規分布では無いことは明白です。 切断正規分布などでモデル化するのが良いかなと考えています。 これは、出荷時に基準未満の重量の商品は弾いている結果だと考えています。 しかも、その基準は表記上の内容量よりも大きい値に設定しているようで、 森永さんの太っ腹なところだと感じます。

重量の推定方法については、以下の記事を参照ください。 ただ、以下の記事は重量の分布を正規分布を仮定しているので、実データとのフィッティングが良くないです。 今後、モデルを変えて新たに記事を書く予定です。

chocolate-ball.hatenablog.com

個数の分布と季節差

チョコボールの個数って時期によって変化するんですよ!知ってました?
要因はわかっていませんが、入手経路によるものじゃないかなと考えています。 以下の記事でまとめた分析の結果、年に依らず賞味期限が8~10月の商品が個数が少ない=粒が大きい傾向にあると結論づけています。 が、まだ期間が短いので本当に言えるのかは微妙なところです。 これも今後引き続き調査していきます。

chocolate-ball.hatenablog.com

Chocoball Detector

上記の個数の分布に関係するのですが、 「チョコボールの個数を自動でカウントしたいなー」という思いつきで作ったのが以下のアプリケーションです。

www.chocolate-ball.net

開発イベントに出たり、 これをネタに色々な人と交流できたりと、思いつきで作った割にはすごく活躍してます。

こちらの仕組みについては、以下の記事を参照してください。

chocolate-ball.hatenablog.com

chocolate-ball.hatenablog.com

その他

f:id:hippy-hikky:20180512113407j:plain:w250

これは外せないですね。おもちゃのカンヅメです。

他にも具体的な課題を設定することで知識と経験を得ることができました。 統計分析は具体例があると色々な手法を落とし込むことができるので良いですね。

【トップに戻る】

今後の目標

ということで、この1年半を振り返りましたが、まだまだ調査は継続していきます。 特に力を入れていこうかなと思っていることを以下に列挙します。

  • 金のエンゼルを出して金のエンゼルの出現確率を更新したい(これは運だけど)
  • 箱買いした場合とバラでランダムに買った場合で出現確率の差を分析したい (実はセット買いするとエンゼルはランダムでは無いんじゃないかという仮説の検証)
  • 止まっている画像分類(この記事参照)を進めたい(エンゼルの有無が画像識別でわかるか?という課題。たぶんわからないと思う。わからないことがわかると期待。)
  • ChocoballDetectorを拡張して、チョコボール統計のWebサイトを開発したい(統計データの閲覧や計測のお手伝いができるようなサービスを作りたい)

ということで、今後もよろしくおねがいします。

【トップに戻る】

参考文献(お世話になった書籍)

  1. データ解析のための統計モデリング入門

    一般化線形モデルを軸に階層ベイズモデルまで丁寧に記載されている。 Rとstanを利用した実装例もあるが、実装部分は無視しても理解できる。 わかりやすいのでおすすめ。

  2. Pythonによるベイズ統計モデリング

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

    pymc3を使った入門書。 理論面も多少書かれており、こちらで手を動かしながら学習するのが良いと思う。

  3. Pythonで体験するベイズ推論

    Pythonで体験するベイズ推論 PyMCによるMCMC入門

    Pythonで体験するベイズ推論 PyMCによるMCMC入門

    pymc2を利用した事例ベースの参考書。 事例が豊富で参考になるシーンは出てくるかもしれないが、階層モデルについては記載がない。 また、pymc2なので、pymc3と記法が少し違うので注意。

  4. 統計学入門

    統計学入門 (基礎統計学?)

    統計学入門 (基礎統計学?)

    有名な統計学の入門書。かっちり書いてあるので、統計学の基礎(簡単というわけではない)を学ぶにはすごく良い。

【トップに戻る】

広告

Amazonの欲しいものリスト作りました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓  チョコボール<ピーナッツ>  28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

【トップに戻る】

第153回 チョコボール計測(ピーナツ)

本日の計測結果を報告します。 今日もピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-05-19 2019-12-01 34.052 4.785 17 小山工場 コンビニ(さいたま市 なし 29.267 1.722
2019-05-19 2019-12-01 34.157 4.797 16 小山工場 コンビニ(さいたま市 なし 29.360 1.835

今回はエンゼルさんは現れませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 390
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.384 32.232 29.476
個数 14.000 17.000 20.000 16.549

f:id:hippy-hikky:20190519235215p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 432
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.08%上側が6.38%という結果です。
f:id:hippy-hikky:20190519235300p:plain

現在の期待値は4.61%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.69%という予測になっています。
f:id:hippy-hikky:20190519235328p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第152回 チョコボール計測(ピーナツ)

本日の計測結果を報告します。 今日はレギュラー品のピーナツを2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-05-15 2019-11-01 34.591 4.762 18 小山工場 コンビニ(港区) なし 29.829 1.657
2019-05-15 2019-11-01 34.233 4.804 17 小山工場 コンビニ(港区) なし 29.429 1.731

今回はエンゼルさんは現れませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 388
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.384 32.232 29.477
個数 14.000 17.000 20.000 16.549

f:id:hippy-hikky:20190515231344p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 430
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.09%上側が6.40%という結果です。
f:id:hippy-hikky:20190515231434p:plain

現在の期待値は4.61%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.69%という予測になっています。
f:id:hippy-hikky:20190515231507p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第151回 チョコボール計測(グレープラムネ)

本日の計測結果を報告します。 グレープラムネ味という新味が出ていたので、これを4箱計測していきます。

以前あったラムネ味のグレープ版みたいです。 粒がかなり揃っていて、小さめです。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-05-14 2020-03-01 29.551 4.735 17 小山工場 スーパー(さいたま市 なし 24.816 1.460
2019-05-14 2020-03-01 30.891 4.791 18 小山工場 スーパー(さいたま市 なし 26.100 1.450
2019-05-14 2020-03-01 30.528 4.790 18 小山工場 スーパー(さいたま市 なし 25.738 1.430
2019-05-14 2020-03-01 29.358 4.765 17 小山工場 スーパー(さいたま市 なし 24.593 1.447

今回はエンゼルさんは現れませんでした。

基礎集計

グレープラムネ味の集計です。

項目
計測データ数 4
銀のエンゼル出現数 0
金のエンゼル出現数 0
最小 中央値 最大値 平均
正味重量 24.593 25.277 26.100 25.312
個数 17.000 17.500 18.000 17.500

f:id:hippy-hikky:20190514234726p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(23g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

まだ4箱だからなんにも言えないですね。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 428
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.11%上側が6.43%という結果です。
f:id:hippy-hikky:20190514234910p:plain

現在の期待値は4.65%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.70%という予測になっています。
f:id:hippy-hikky:20190514234957p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第150回 チョコボール計測(ピーナッツ)

本日の計測結果を報告します。 今日はピーナッツ味を3箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-04-25 2019-09-01 34.113 4.691 17 小山工場 ドラックストア(横浜市 なし 29.422 1.731
2019-04-25 2019-10-01 34.561 4.700 16 小山工場 コンビニ(港区) なし 29.861 1.866
2019-04-25 2019-10-01 33.995 4.698 17 小山工場 コンビニ(港区) なし 29.297 1.723

今回はエンゼルさんは現れませんでした。

基礎集計

ピーナッツ味の集計結果です。

項目
計測データ数 386
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.384 32.232 29.476
個数 14.000 17.000 20.000 16.544

f:id:hippy-hikky:20190426011312p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 424
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.16%上側が6.49%という結果です。
f:id:hippy-hikky:20190426011417p:plain

現在の期待値は4.70%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.71%という予測になっています。
f:id:hippy-hikky:20190426011448p:plain

今のところの金のエンゼルの期待値は0.24%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第149回 チョコボール計測(ピーナッツ)

本日の計測結果を報告します。 今日はピーナッツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-04-23 2019-11-01 34.248 4.807 18 小山工場 コンビニ(港区) なし 29.441 1.636
2019-04-23 2019-11-01 34.264 4.824 18 小山工場 コンビニ(港区) なし 29.440 1.636

今回はエンゼルさんは現れませんでした。

基礎集計

ピーナッツ味の集計結果です。

項目
計測データ数 383
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.383 32.232 29.476
個数 14.000 17.000 20.000 16.543

f:id:hippy-hikky:20190424012121p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 421
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.18%上側が6.53%という結果です。
f:id:hippy-hikky:20190424012206p:plain

現在の期待値は4.73%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.70%という予測になっています。
f:id:hippy-hikky:20190424012236p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第148回 チョコボール計測(ピーナッツ)

本日の計測結果を報告します。 今日はピーナッツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-04-22 2019-10-01 34.088 4.707 16 小山工場 コンビニ(港区) なし 29.381 1.836
2019-04-22 2019-10-01 34.251 4.705 16 小山工場 コンビニ(港区) なし 29.546 1.847

今回はエンゼルさんは現れませんでした。

基礎集計

ピーナッツ味の集計結果です。

項目
計測データ数 381
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.382 32.232 29.476
個数 14.000 16.000 20.000 16.535

f:id:hippy-hikky:20190423013116p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 419
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.17%上側が6.58%という結果です。
f:id:hippy-hikky:20190423013206p:plain

現在の期待値は4.75%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.71%という予測になっています。
f:id:hippy-hikky:20190423013239p:plain

今のところの金のエンゼルの期待値は0.24%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱