1年半の振り返り
【概要】
- 当ブログを始めて5/19で1年半となりました
- Amazonの広告貼っているんですがついに収益(525円)が発生したし、このあたりで振り返りをしてみます
【目次】
はじめに
当ブログは、「チョコボールに関するデータを収集し、統計分析して遊ぶ(秘密を暴く)」ことを目的にしています。 2017年11月19日から運営しており、先日1年半が経過しました。
また、Amazonの広告を貼っているのですが、やっとギフトカードがもらえる基準額(500円)に届き、
収益を発生することができました。
(1年半で500円の収入!)
ということで、 ここまでに得た知見をまとめ、今後の目標を整理していこうと思います。 なお、こんな分析をしてほしい、こんなことを知りたいといったリクエストがあれば 検討しますので(やるとは言ってない)、 記事へのコメントやTwitter等で連絡いただけたらと思います。
アクセス数の推移から見る振り返り
まずは、当ブログへのアクセス数の推移などのデータを見ていきましょう。 なおこのデータは、Google Analyticsを用いて計測したデータです。
上の図はブログ開設時(2018/11/19)からのページビュー数の推移です。
いきなりのバズり
始めの頃にいきなりページビューが多い時がありますよね。
これには正直ビビりました。
2018/12/10に投稿した以下の記事をTwitterやFacebook等で拡散していただいたようです。
これは、エンゼルの出現確率の事後分布をMCMCで計算するという内容を書いた記事です。 エンゼルの確率はこの時点では全然わからなかったわけですが(なんせ金も銀もエンゼルは一つも出てないですから)、 ベイズ推定を使うというところが注目されたのかなと想像しています。 このような単純な問題はMCMCを使う意味は全然無いので、 そういうところ突っ込まれるかとヒヤヒヤしていたのですが特に突っ込まれずでした。
なお、私事ですが、この翌日に息子(第1子)が誕生しました。そういう意味でも忘れられない日です。
(分娩室でブログの話をしたら怒られた)
MA2018出場
次に、2018年11月くらいから徐々にページビュー数が増加しているように見えます。
明確な要因はわからないのですが、 このあたりで「MA2018 ヒーローズ・リーグ」という開発コンテストに ChocoballDetectorをエントリーしてプレゼンを毎週のようにやっていました。 結果は「ルーキーヒーロー賞」という賞をいただくことができて、このブログの知名度がここでそこそこ上がったような気がします。あと純粋に楽しかった。
この開発コンテストの参戦記録は以下の記事にまとめています。
Googleさんの効果すごいですね
また、いつの頃からかわからないのですが、 以下の記事がGoogle検索で「チョコボール 金 確率」みたいな検索語で上位に載るようになってました。
この影響はだいぶ大きいみたいで、常に当ブログ前記事の中でもアクセス数の3割以上を占めています。 しかし、エンゼルの確率を知りたい人にとって、記事の内容は必ずしもマッチしなさそうだなーと思います。
これまでの発見・得たもののまとめ
前章では、アクセス数の推移からこの1年半でのイベントを振り返りました。 ここでは、1年半の活動でどのようなことがわかったのかをまとめて行きます。
エンゼルの出現確率
日々の計測で銀のエンゼルはそこそこ数が溜まってきました(2019/05/22現在、19個)。 ここまでの推定結果から、銀のエンゼルの出現確率は5%弱であろうということがわかってきています。
しかし、金のエンゼルはまだ出ておらず、今後も調査は継続していきます。
なお、エンゼル出現確率の推定方法については以下の記事を参照ください。
また、銀のエンゼルを5個獲得するまでに、いくらのチョコボールを購入する必要があるのか知りたい方は以下の記事を参照ください。
重量の傾向
私は重量の傾向が面白いと思っています。 この傾向を見ることで、森永さんの製造方針が垣間見えるのかなーと感じています。
日々の計測の結果、重量の分布は正規分布では無いことは明白です。 切断正規分布などでモデル化するのが良いかなと考えています。 これは、出荷時に基準未満の重量の商品は弾いている結果だと考えています。 しかも、その基準は表記上の内容量よりも大きい値に設定しているようで、 森永さんの太っ腹なところだと感じます。
重量の推定方法については、以下の記事を参照ください。 ただ、以下の記事は重量の分布を正規分布を仮定しているので、実データとのフィッティングが良くないです。 今後、モデルを変えて新たに記事を書く予定です。
個数の分布と季節差
チョコボールの個数って時期によって変化するんですよ!知ってました?
要因はわかっていませんが、入手経路によるものじゃないかなと考えています。
以下の記事でまとめた分析の結果、年に依らず賞味期限が8~10月の商品が個数が少ない=粒が大きい傾向にあると結論づけています。
が、まだ期間が短いので本当に言えるのかは微妙なところです。
これも今後引き続き調査していきます。
Chocoball Detector
上記の個数の分布に関係するのですが、 「チョコボールの個数を自動でカウントしたいなー」という思いつきで作ったのが以下のアプリケーションです。
開発イベントに出たり、 これをネタに色々な人と交流できたりと、思いつきで作った割にはすごく活躍してます。
こちらの仕組みについては、以下の記事を参照してください。
その他
これは外せないですね。おもちゃのカンヅメです。
他にも具体的な課題を設定することで知識と経験を得ることができました。 統計分析は具体例があると色々な手法を落とし込むことができるので良いですね。
今後の目標
ということで、この1年半を振り返りましたが、まだまだ調査は継続していきます。 特に力を入れていこうかなと思っていることを以下に列挙します。
- 金のエンゼルを出して金のエンゼルの出現確率を更新したい(これは運だけど)
- 箱買いした場合とバラでランダムに買った場合で出現確率の差を分析したい (実はセット買いするとエンゼルはランダムでは無いんじゃないかという仮説の検証)
- 止まっている画像分類(この記事参照)を進めたい(エンゼルの有無が画像識別でわかるか?という課題。たぶんわからないと思う。わからないことがわかると期待。)
- ChocoballDetectorを拡張して、チョコボール統計のWebサイトを開発したい(統計データの閲覧や計測のお手伝いができるようなサービスを作りたい)
ということで、今後もよろしくおねがいします。
参考文献(お世話になった書籍)
データ解析のための統計モデリング入門
一般化線形モデルを軸に階層ベイズモデルまで丁寧に記載されている。 Rとstanを利用した実装例もあるが、実装部分は無視しても理解できる。 わかりやすいのでおすすめ。データ解析のための統計モデリング入門――一般化線形モデル・階層ベイズモデル・MCMC (確率と情報の科学)
- 作者: 久保拓弥
- 出版社/メーカー: 岩波書店
- 発売日: 2012/05/19
- メディア: 単行本
- 購入: 16人 クリック: 163回
- この商品を含むブログ (29件) を見る
- pymc3を使った入門書。 理論面も多少書かれており、こちらで手を動かしながら学習するのが良いと思う。
Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド
- 作者: オズワルドマーティン,Osvaldo Martin,金子武久
- 出版社/メーカー: 共立出版
- 発売日: 2018/06/22
- メディア: 単行本
- この商品を含むブログを見る
- pymc2を利用した事例ベースの参考書。 事例が豊富で参考になるシーンは出てくるかもしれないが、階層モデルについては記載がない。 また、pymc2なので、pymc3と記法が少し違うので注意。
Pythonで体験するベイズ推論 PyMCによるMCMC入門
- 作者: キャメロンデビッドソン=ピロン,玉木徹
- 出版社/メーカー: 森北出版
- 発売日: 2017/04/06
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (1件) を見る
統計学入門
有名な統計学の入門書。かっちり書いてあるので、統計学の基礎(簡単というわけではない)を学ぶにはすごく良い。- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る
広告
Amazonの欲しいものリスト作りました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第153回 チョコボール計測(ピーナツ)
本日の計測結果を報告します。 今日もピーナツ味を2箱計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-05-19 | 2019-12-01 | 34.052 | 4.785 | 17 | 小山工場 | コンビニ(さいたま市) | なし | 29.267 | 1.722 |
2019-05-19 | 2019-12-01 | 34.157 | 4.797 | 16 | 小山工場 | コンビニ(さいたま市) | なし | 29.360 | 1.835 |
今回はエンゼルさんは現れませんでした。
基礎集計
ピーナツ味の集計です。
項目 | 数 |
---|---|
計測データ数 | 390 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.594 | 29.384 | 32.232 | 29.476 |
個数 | 14.000 | 17.000 | 20.000 | 16.549 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 432 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.08%上側が6.38%という結果です。
現在の期待値は4.61%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.69%という予測になっています。
今のところの金のエンゼルの期待値は0.23%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
第152回 チョコボール計測(ピーナツ)
本日の計測結果を報告します。 今日はレギュラー品のピーナツを2箱計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-05-15 | 2019-11-01 | 34.591 | 4.762 | 18 | 小山工場 | コンビニ(港区) | なし | 29.829 | 1.657 |
2019-05-15 | 2019-11-01 | 34.233 | 4.804 | 17 | 小山工場 | コンビニ(港区) | なし | 29.429 | 1.731 |
今回はエンゼルさんは現れませんでした。
基礎集計
ピーナツ味の集計です。
項目 | 数 |
---|---|
計測データ数 | 388 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.594 | 29.384 | 32.232 | 29.477 |
個数 | 14.000 | 17.000 | 20.000 | 16.549 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 430 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.09%上側が6.40%という結果です。
現在の期待値は4.61%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.69%という予測になっています。
今のところの金のエンゼルの期待値は0.23%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
第151回 チョコボール計測(グレープラムネ)
本日の計測結果を報告します。 グレープラムネ味という新味が出ていたので、これを4箱計測していきます。
以前あったラムネ味のグレープ版みたいです。 粒がかなり揃っていて、小さめです。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-05-14 | 2020-03-01 | 29.551 | 4.735 | 17 | 小山工場 | スーパー(さいたま市) | なし | 24.816 | 1.460 |
2019-05-14 | 2020-03-01 | 30.891 | 4.791 | 18 | 小山工場 | スーパー(さいたま市) | なし | 26.100 | 1.450 |
2019-05-14 | 2020-03-01 | 30.528 | 4.790 | 18 | 小山工場 | スーパー(さいたま市) | なし | 25.738 | 1.430 |
2019-05-14 | 2020-03-01 | 29.358 | 4.765 | 17 | 小山工場 | スーパー(さいたま市) | なし | 24.593 | 1.447 |
今回はエンゼルさんは現れませんでした。
基礎集計
グレープラムネ味の集計です。
項目 | 数 |
---|---|
計測データ数 | 4 |
銀のエンゼル出現数 | 0 |
金のエンゼル出現数 | 0 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 24.593 | 25.277 | 26.100 | 25.312 |
個数 | 17.000 | 17.500 | 18.000 | 17.500 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(23g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
まだ4箱だからなんにも言えないですね。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 428 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.11%上側が6.43%という結果です。
現在の期待値は4.65%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.70%という予測になっています。
今のところの金のエンゼルの期待値は0.23%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第150回 チョコボール計測(ピーナッツ)
本日の計測結果を報告します。 今日はピーナッツ味を3箱計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-04-25 | 2019-09-01 | 34.113 | 4.691 | 17 | 小山工場 | ドラックストア(横浜市) | なし | 29.422 | 1.731 |
2019-04-25 | 2019-10-01 | 34.561 | 4.700 | 16 | 小山工場 | コンビニ(港区) | なし | 29.861 | 1.866 |
2019-04-25 | 2019-10-01 | 33.995 | 4.698 | 17 | 小山工場 | コンビニ(港区) | なし | 29.297 | 1.723 |
今回はエンゼルさんは現れませんでした。
基礎集計
ピーナッツ味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 386 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.594 | 29.384 | 32.232 | 29.476 |
個数 | 14.000 | 17.000 | 20.000 | 16.544 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 424 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.16%上側が6.49%という結果です。
現在の期待値は4.70%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.71%という予測になっています。
今のところの金のエンゼルの期待値は0.24%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第149回 チョコボール計測(ピーナッツ)
本日の計測結果を報告します。 今日はピーナッツ味を2箱計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-04-23 | 2019-11-01 | 34.248 | 4.807 | 18 | 小山工場 | コンビニ(港区) | なし | 29.441 | 1.636 |
2019-04-23 | 2019-11-01 | 34.264 | 4.824 | 18 | 小山工場 | コンビニ(港区) | なし | 29.440 | 1.636 |
今回はエンゼルさんは現れませんでした。
基礎集計
ピーナッツ味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 383 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.594 | 29.383 | 32.232 | 29.476 |
個数 | 14.000 | 17.000 | 20.000 | 16.543 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 421 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.18%上側が6.53%という結果です。
現在の期待値は4.73%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.70%という予測になっています。
今のところの金のエンゼルの期待値は0.23%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第148回 チョコボール計測(ピーナッツ)
本日の計測結果を報告します。 今日はピーナッツ味を2箱計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2019-04-22 | 2019-10-01 | 34.088 | 4.707 | 16 | 小山工場 | コンビニ(港区) | なし | 29.381 | 1.836 |
2019-04-22 | 2019-10-01 | 34.251 | 4.705 | 16 | 小山工場 | コンビニ(港区) | なし | 29.546 | 1.847 |
今回はエンゼルさんは現れませんでした。
基礎集計
ピーナッツ味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 381 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.594 | 29.382 | 32.232 | 29.476 |
個数 | 14.000 | 16.000 | 20.000 | 16.535 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 419 |
銀のエンゼル出現数 | 19 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.17%上側が6.58%という結果です。
現在の期待値は4.75%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.71%という予測になっています。
今のところの金のエンゼルの期待値は0.24%です。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る