チョコボール統計

チョコボールの秘密を統計解析で明らかにしていく。おもちゃのカンヅメ欲しい。

チョコボール統計の研究背景とMA2018参戦記録

この記事は、「MashupAwardsヒーローズ・リーグ Advent Calendar 2018」18日目のエントリーです。
投稿日時が19日だって?太陽が登るまでは今日なんです。

概要

  • MashupAwards2018 ヒーローズ・リーグという開発コンテストに初参加し、「ルーキーヒーロー賞」という賞を頂いた(めっちゃ嬉しい)
  • MA初参加なので初参加の経緯、参加しての感想をまとめるよ
  • それから、当ブログでもMAのプレゼンの中でも言い切れていなかった「チョコボールデータ分析の背景」をざっくりまとめるよ
  • チョコボールの秘密はまだまだ解明されていないので、今後も研究を継続するよ

f:id:hippy-hikky:20181217194505j:plain
モノづくりの祭典FESTAでの展示の様子

目次

はじめに

Mashup Awards 2018 ヒーローズ・リーグ というものに参加してきました。

私、MashupAwardsはもちろん、ハッカソンや開発イベントなどに参加するの初めてでした。 ついでに、アドベントカレンダーに記事を投稿するのも初めてなので初めてづくしです。

本記事は、当ブログの通常の記事とはちょっと毛色が異なり、 MAアドベントカレンダー向けの記事で、 MAに初めて参加した経緯、参加しての感想、当研究の背景について書いて行きます。

MA、めっちゃ楽しかった。

【トップに戻る】

出展作品

出展した作品は、ChocoballDetectorといって、 以下の記事に書いたものです。

chocolate-ball.hatenablog.com

ベースの技術についてはこっち。

chocolate-ball.hatenablog.com

概要

「ChocoballDetector」とは、チョコボールの画像からチョコボールの個数をカウントしてくれるアプリです。

f:id:hippy-hikky:20181118000107p:plain:w300
左の写真が元画像(カメラで撮影)、右の画像が検出結果。

それだけ?って思います?
よく考えてください。 みんながチョコボールをカウントするちょっとの手間を削減できると考えれば 人類にとってとても大きな貢献と言えないですか?

アプリはこちらから試すことができます。
1st Stageを通過した辺りでフロント周りを手伝ってくれている同僚のやる気が倍増したので(笑)、 途中でフロントがだいぶ変わりました。

コンテストの結果

審査がいくつあるのか正直よくわからなくなったのですが、整理すると以下の通りです。

  • みんなで選ぶヒーロー賞
    • 1st Stage(東京1部) → 敗退
    • 2nd Stage → 敗退
  • プロが選ぶヒーロー賞
    • オレトク部門 決勝ノミネート → 敗退
    • ルーキー部門(オンライン審査) → ルーキーヒーロー任命!!

ということで、ありがたいことに、ルーキーヒーローに任命頂きました!

f:id:hippy-hikky:20181218003825j:plain:w250
マントを着ているのが僕です。

【トップに戻る】

参加の経緯

11月頭に、開発途中のChocoballDetectorを紹介する場があり、 そこでE2D3の五十嵐さん(大学院の先輩)にMAへの参加を勧められたのがきっかけです。 (ぶっちゃけ、MAという存在は知っていたものの、MAでどんな作品が出されているのか全く知らない状態でした)

おバカなアプリが評価されるというアドバイス(?)に疑問を感じながらも登録。 (全人類が欲しがるアプリなのに!)

【トップに戻る】

参加しての感想

MAへの参加を勧められたのが応募締め切りの1週間前ということで、応募前も応募後もバタバタでした。 そんな浮ついた状態で参加したものの、めっちゃ楽しかったです。

こんなにいろんな作品を見ることができて、自分にとって大きな刺激になりました。
特に強く感じたことを3つにまとめると以下のようになります。

戸惑い

何にエントリーしたら良いんだ?賞はいくつあるんだ?何回プレゼンするんだ?FESTAってなんだ? どんな作品がエントリーされてるんだ?何が評価されるんだ? って状態でした(汗)。

何度も参加されてる方には当たり前なんでしょうけど、初心者にはガイドが無いとハードルあるなと(苦笑)

レベルたけー

作品のレベルもですが、特にプレゼンテーションが劇的にうまい人が多いですね。 作品への愛とか情熱が根底にあるんですが、 人を引き込むデモの作り方に感動しました。 とにかくあんなにLTが上手い人だらけのイベント初めてでした。

技術もアイディアも考えれば可能性は広がるんだってことごとく思い知らされ、 すごい衝撃を受けました。 可能性を限定していたのは自分なんだなって。

そんな中、そこそこウケて良かったです。

変なこと考える人だらけ

頭のおかしい人がいっぱいでめっちゃ楽しかった。 苔と会話を試みるとか。 メガネっ子とのチューを妄想するとか。 先端に行ってみたりとか。

僕ももっと狂気を身に着けたいなと思いました。

【トップに戻る】

なぜチョコボール

ここからは、開発背景というか、そもそもなぜチョコボールデータの収集と分析をしているのかについてお話します。

きっかけは突然に

チョコボールって美味しいじゃないですか。
しかも、エンゼルを集めるとおもちゃがもらえるがなかなかエンゼルは出ないということで、射幸心をもりもり煽ってくるわけです。

そんなある日、チョコボールを眺めてたら、ビビッと来たんです。
エンゼルの出現確率はいくらなんだ?と。

届かない想い

そこで、まず私は、ネットを駆使して調査することに。 でも、エンゼルの出現確率は公表されていないという事実がわかっただけでした(公式に非公開とされています)。

何人かのブロガーさんやYouTuberさんが調査した結果が上がっていましたが、 どれもスポット調査で終わっており、統計的に有効な調査というには難しいと感じました。
俺が求めているのはこれじゃない!

抑えきれない衝動

そんな日々を過ごす中、衝動が抑えられなくなったのです。

これじゃチョコボールの秘密はわから無い。
自分が納得いくまでチョコボールの秘密を丸裸にしてやろう。

ということで、チョコボールに関するデータを取り始めたのでした。

【トップに戻る】

チョコボールは丸裸になったの?

2018年12月18日時点、約1年と1ヶ月かけて405箱のチョコボールを計測してきました。
これまでに、特殊な重量傾向のフレーバーがあったり(この記事この記事)、 個数の変化点を見つけたりと 発見はいろいろしてきました。

また、銀のエンゼルの予測分布はかなり収束してきており、約3%〜7%の間に収まるであろうということまではわかってきました。

f:id:hippy-hikky:20181217233130p:plain:w250
銀のエンゼル出現確率の予測分布(期待値は4.8%)

しかし、まだまだ400程度です。

調査は全然足りていません。
通常版の金のエンゼル出てないですし。

深淵を覗く時、深淵もまたこちらを覗いているのです。

【トップに戻る】

まとめ

ここまで、MA2018に参加しての感想、研究背景と現状をざっくりとお話ししてきました。 以上をまとめると、

チョコボールって超楽しいね

【トップに戻る】

今後の活動

チョコボールを丸裸にするためには、まだまだ調べなきゃいけないことがたくさんあります。

調査項目としては次のようなことをやっていこうと思います。

  • パッケージからエンゼルの予測ができるのか調査
  • 金のエンゼルの確率分布を収束させたい

あとは、この面白さをより多くの人に知ってもらうために、 データビジュアライズのためのWebサービスを開発していくつもりです。

f:id:hippy-hikky:20181217195041j:plain
盾とTシャツとマント(!?)をもらいました

あと、アイディアを出すための訓練にめちゃくちゃなりそうなので、ハッカソン積極的に参加していきたい。

【トップに戻る】

参考文献

  1. 統計学入門

    統計学入門 (基礎統計学?)

    統計学入門 (基礎統計学?)

  2. Pythonによるベイズ統計モデリング

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

  3. 深層学習(機械学習プロフェッショナルシリーズ)

    深層学習 (機械学習プロフェッショナルシリーズ)

    深層学習 (機械学習プロフェッショナルシリーズ)

  4. ChainerCV — ChainerCV 0.11.0 documentation
    chainercvの公式ドキュメント。とりあえあずこれを見れば動かせるようになります

  5. GitHub - chainer/chainercv: ChainerCV: a Library for Deep Learning in Computer Vision
    chainercvの公式Git

  6. http://flask.pocoo.org/
    flaskのドキュメント

  7. https://getbootstrap.com/
    bootstrapのドキュメント

  8. Vue.js入門 基礎から実践アプリケーション開発まで

    Vue.js入門 基礎から実践アプリケーション開発まで

    Vue.js入門 基礎から実践アプリケーション開発まで

【トップに戻る】

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第108回 チョコボール計測

本日の計測結果の報告です。

今回はミルクキャラメル味を計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-17 2019-09-01 26.935 4.874 14 小山工場 コンビニ(さいたま市 なし 22.061 1.576
2018-12-17 2019-09-01 28.612 4.793 16 小山工場 コンビニ(さいたま市 なし 23.819 1.489

エンゼルさんは現れませんでした!

基礎集計

これまでのミルクキャラメル味の集計結果です。

項目
計測データ数 16
銀のエンゼル出現数 0
金のエンゼル出現数 0
最小 中央値 最大値 平均
正味重量 21.937 22.121 23.819 22.391
個数 14.000 14.000 16.000 14.312

f:id:hippy-hikky:20181217232751p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

昨日計測したチョコバナナ味に似てきたような気がします。 今日の計測で23.8g(仕様+1.8g)がこれまでと比較してだいぶ多く入っていました。
時期によって傾向が変わったりするとまた面白いんですが、それは別の機会に調査してみます。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 291
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が2.98%上側が6.81%という結果です。
f:id:hippy-hikky:20181217233130p:plain

現在の期待値は4.79%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が1.02%という予測になっています。
f:id:hippy-hikky:20181217233233p:plain

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第107回 チョコボール計測

本日の計測結果報告なんですが、 その前に、当ブログの方針の変更をします。

これまでピーナツ味の計測を基本としていたため、 記事のナンバリングはピーナツ味の計測以外を「番外編」として扱ってきました。 しかし、最近の新味の傾向差などを見ると、これらを番外編として「おまけ」としての扱いにするのが良いのか疑問に感じていました。 ピーナツと同じかそれ以上に分析しがいのある対象ではないかという思いが強くなってきたのです。

そこでピーナツ以外も、番外編としての位置づけではなく、 ピーナツと同列にナンバリングすることに決めました。

ということで、改めて、第107回の計測報告は、 チョコバナナ味といちご味です。

ちなみに、この二つの味を一緒に食べると、別のフルーツの味がするらしいです。 公式で公表しています。
私は全然理解できなかったですが。

計測結果

こちらはチョコバナナ味

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-16 2019-10-01 27.414 4.883 15 小山工場 コンビニ(さいたま市 なし 22.531 1.502
2018-12-16 2019-10-01 27.81 4.938 15 小山工場 コンビニ(さいたま市 なし 22.872 1.525

次はいちご味

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-16 2019-07-01 32.078 4.873 16 小山工場 コンビニ(さいたま市 なし 27.205 1.700
2018-12-16 2019-07-01 32.371 4.88 16 小山工場 コンビニ(さいたま市 なし 27.491 1.718

エンゼルさんは現れませんでした!

基礎集計

まず、チョコバナナ味の集計結果です。

項目
計測データ数 13
銀のエンゼル出現数 1
金のエンゼル出現数 0
最小 中央値 最大値 平均
正味重量 22.107 22.531 23.789 22.598
個数 14.000 15.000 16.000 14.615

f:id:hippy-hikky:20181216220615p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

チョコバナナ味は不思議な分布ですね。 工業製品であるのに、バラつきが大きすぎると思うんですよね。

次にいちご味の集計結果です。

項目
計測データ数 16
銀のエンゼル出現数 0
金のエンゼル出現数 0
最小 中央値 最大値 平均
正味重量 26.036 26.683 27.491 26.714
個数 15.000 15.000 16.000 15.375

f:id:hippy-hikky:20181216220758p:plain

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 289
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が2.89%上側が6.90%という結果です。
f:id:hippy-hikky:20181216220938p:plain

現在の期待値は4.76%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.94%という予測になっています。
f:id:hippy-hikky:20181216221012p:plain

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第106回 チョコボール計測

本日の計測です。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-13 2019-05-01 34.052 4.828 19 小山工場 コンビニ(さいたま市 なし 29.224 1.538
2018-12-13 2019-07-01 34.239 4.862 17 小山工場 コンビニ(さいたま市 なし 29.377 1.728
2018-12-13 2019-07-01 34.510 4.844 16 小山工場 コンビニ(さいたま市 なし 29.666 1.854

今日もエンゼルさんは現れませんでした!

基礎集計

この集計はピーナツ味のチョコボールの集計結果です。

項目
計測データ数 307
銀のエンゼル出現数 9
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.750 29.389 32.232 29.495
個数 14.000 17.000 20.000 16.570

f:id:hippy-hikky:20181214001302p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 285
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.00%上側が7.14%という結果です。
f:id:hippy-hikky:20181214001338p:plain

現在の期待値は4.89%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.95%という予測になっています。
f:id:hippy-hikky:20181214001411p:plain

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第105回 チョコボール計測

本日の計測行きます。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-12 2019-05-01 33.939 4.898 16 小山工場 ドラックストア(横浜市 なし 29.041 1.815
2018-12-12 2019-05-01 34.129 4.914 16 小山工場 ドラックストア(横浜市 なし 29.215 1.826

今日はエンゼルさん現れませんでした!

基礎集計

この集計はピーナツ味のチョコボールの集計結果です。

項目
計測データ数 304
銀のエンゼル出現数 9
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.750 29.390 32.232 29.495
個数 14.000 16.500 20.000 16.562

f:id:hippy-hikky:20181212235501p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 282
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.03%上側が7.30%という結果です。
f:id:hippy-hikky:20181212235532p:plain

現在の期待値は4.94%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が1.02%という予測になっています。
f:id:hippy-hikky:20181212235557p:plain

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第ex25回 チョコボール計測

番外編の計測、25回目。
今回の番外編もチョコバナナ味を計測していきます。

計測結果

計測結果はこちらです。

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-11 2019-10-01 26.999 4.892 14 小山工場 コンビニ(さいたま市 なし 22.107 1.579
2018-12-11 2019-09-01 27.720 4.906 15 小山工場 コンビニ(さいたま市 なし 22.814 1.521
2018-12-11 2019-09-01 27.053 4.936 14 小山工場 コンビニ(さいたま市 なし 22.117 1.580

エンゼルさんは出ませんでした。

基礎集計

「チョコバナナ」味の集計です

項目
計測データ数 11
銀のエンゼル出現数 1
金のエンゼル出現数 0
最小 中央値 最大値 平均
正味重量 22.107 22.299 23.789 22.580
個数 14.000 14.000 16.000 14.545

重量分布

f:id:hippy-hikky:20181211235139p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

番外編24回でも指摘しましたが、重量のバラつきが大きいです。 他の味はだいたい1g程度の範囲でばらつくのに対して、 チョコバナナ味の最小値と最大値の差は1.7g程度もあります。

また、重量傾向は、前回の記事でも指摘したように、従来品と比較して明らかな差が出てきました(下図)。

f:id:hippy-hikky:20181211235632p:plain
正味重量からの差分の平均値の予測分布。パイナップル、ミルクキャラメル、チョコバナナは従来品と平均が明らかに異なる。

平均の分布が異なるということは、 何らかの理由により傾向が違っているということでしょう。 製造時の設定か何か、明確な理由はわかりませんが。

エンゼルの出現確率推定

エンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 280
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.09%上側が7.441%という結果です。
f:id:hippy-hikky:20181211235932p:plain

現在の期待値は5.00%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.96%という予測になっています。
f:id:hippy-hikky:20181212000003p:plain

金のエンゼルの予測確率はほぼ0ですね。 金のエンゼルが出てくれないと、収束しない。。。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第104回 チョコボール計測

本日の計測行きます。 今日はさくっと1箱だけ計測です。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2018-12-10 2019-07-01 34.298 4.863 18 小山工場 コンビニ(港区) なし 29.435 1.635

3日連続とは行かなかったです。

基礎集計

この集計はピーナツ味のチョコボールの集計結果です。

項目
計測データ数 302
銀のエンゼル出現数 9
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.750 29.392 32.232 29.498
個数 14.000 17.000 20.000 16.566

f:id:hippy-hikky:20181211020051p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 277
銀のエンゼル出現数 13
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.07%上側が7.38%という結果です。
f:id:hippy-hikky:20181211020136p:plain

現在の期待値は4.99%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が1.01%という予測になっています。
f:id:hippy-hikky:20181211020206p:plain

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする