チョコボール統計の研究背景とMA2018参戦記録
この記事は、「MashupAwardsヒーローズ・リーグ Advent Calendar 2018」18日目のエントリーです。
投稿日時が19日だって?太陽が登るまでは今日なんです。
概要
- MashupAwards2018 ヒーローズ・リーグという開発コンテストに初参加し、「ルーキーヒーロー賞」という賞を頂いた(めっちゃ嬉しい)
- MA初参加なので初参加の経緯、参加しての感想をまとめるよ
- それから、当ブログでもMAのプレゼンの中でも言い切れていなかった「チョコボールデータ分析の背景」をざっくりまとめるよ
- チョコボールの秘密はまだまだ解明されていないので、今後も研究を継続するよ
目次
はじめに
Mashup Awards 2018 ヒーローズ・リーグ というものに参加してきました。
私、MashupAwardsはもちろん、ハッカソンや開発イベントなどに参加するの初めてでした。 ついでに、アドベントカレンダーに記事を投稿するのも初めてなので初めてづくしです。
本記事は、当ブログの通常の記事とはちょっと毛色が異なり、 MAアドベントカレンダー向けの記事で、 MAに初めて参加した経緯、参加しての感想、当研究の背景について書いて行きます。
MA、めっちゃ楽しかった。
出展作品
出展した作品は、ChocoballDetectorといって、 以下の記事に書いたものです。
ベースの技術についてはこっち。
概要
「ChocoballDetector」とは、チョコボールの画像からチョコボールの個数をカウントしてくれるアプリです。
それだけ?って思います?
よく考えてください。
みんながチョコボールをカウントするちょっとの手間を削減できると考えれば
人類にとってとても大きな貢献と言えないですか?
アプリはこちらから試すことができます。
1st Stageを通過した辺りでフロント周りを手伝ってくれている同僚のやる気が倍増したので(笑)、
途中でフロントがだいぶ変わりました。
コンテストの結果
審査がいくつあるのか正直よくわからなくなったのですが、整理すると以下の通りです。
- みんなで選ぶヒーロー賞
- 1st Stage(東京1部) → 敗退
- 2nd Stage → 敗退
- プロが選ぶヒーロー賞
- オレトク部門 決勝ノミネート → 敗退
- ルーキー部門(オンライン審査) → ルーキーヒーロー任命!!
ということで、ありがたいことに、ルーキーヒーローに任命頂きました!
参加の経緯
11月頭に、開発途中のChocoballDetectorを紹介する場があり、 そこでE2D3の五十嵐さん(大学院の先輩)にMAへの参加を勧められたのがきっかけです。 (ぶっちゃけ、MAという存在は知っていたものの、MAでどんな作品が出されているのか全く知らない状態でした)
おバカなアプリが評価されるというアドバイス(?)に疑問を感じながらも登録。 (全人類が欲しがるアプリなのに!)
参加しての感想
MAへの参加を勧められたのが応募締め切りの1週間前ということで、応募前も応募後もバタバタでした。 そんな浮ついた状態で参加したものの、めっちゃ楽しかったです。
こんなにいろんな作品を見ることができて、自分にとって大きな刺激になりました。
特に強く感じたことを3つにまとめると以下のようになります。
戸惑い
何にエントリーしたら良いんだ?賞はいくつあるんだ?何回プレゼンするんだ?FESTAってなんだ? どんな作品がエントリーされてるんだ?何が評価されるんだ? って状態でした(汗)。
何度も参加されてる方には当たり前なんでしょうけど、初心者にはガイドが無いとハードルあるなと(苦笑)
レベルたけー
作品のレベルもですが、特にプレゼンテーションが劇的にうまい人が多いですね。 作品への愛とか情熱が根底にあるんですが、 人を引き込むデモの作り方に感動しました。 とにかくあんなにLTが上手い人だらけのイベント初めてでした。
技術もアイディアも考えれば可能性は広がるんだってことごとく思い知らされ、 すごい衝撃を受けました。 可能性を限定していたのは自分なんだなって。
そんな中、そこそこウケて良かったです。
変なこと考える人だらけ
頭のおかしい人がいっぱいでめっちゃ楽しかった。 苔と会話を試みるとか。 メガネっ子とのチューを妄想するとか。 先端に行ってみたりとか。
僕ももっと狂気を身に着けたいなと思いました。
なぜチョコボール?
ここからは、開発背景というか、そもそもなぜチョコボールデータの収集と分析をしているのかについてお話します。
きっかけは突然に
チョコボールって美味しいじゃないですか。
しかも、エンゼルを集めるとおもちゃがもらえるがなかなかエンゼルは出ないということで、射幸心をもりもり煽ってくるわけです。
そんなある日、チョコボールを眺めてたら、ビビッと来たんです。
エンゼルの出現確率はいくらなんだ?と。
届かない想い
そこで、まず私は、ネットを駆使して調査することに。 でも、エンゼルの出現確率は公表されていないという事実がわかっただけでした(公式に非公開とされています)。
何人かのブロガーさんやYouTuberさんが調査した結果が上がっていましたが、
どれもスポット調査で終わっており、統計的に有効な調査というには難しいと感じました。
俺が求めているのはこれじゃない!
抑えきれない衝動
そんな日々を過ごす中、衝動が抑えられなくなったのです。
これじゃチョコボールの秘密はわから無い。
自分が納得いくまでチョコボールの秘密を丸裸にしてやろう。
ということで、チョコボールに関するデータを取り始めたのでした。
チョコボールは丸裸になったの?
2018年12月18日時点、約1年と1ヶ月かけて405箱のチョコボールを計測してきました。
これまでに、特殊な重量傾向のフレーバーがあったり(この記事や
この記事)、
個数の変化点を見つけたりと
発見はいろいろしてきました。
また、銀のエンゼルの予測分布はかなり収束してきており、約3%〜7%の間に収まるであろうということまではわかってきました。
しかし、まだまだ400程度です。
調査は全然足りていません。
通常版の金のエンゼル出てないですし。
深淵を覗く時、深淵もまたこちらを覗いているのです。
まとめ
ここまで、MA2018に参加しての感想、研究背景と現状をざっくりとお話ししてきました。 以上をまとめると、
チョコボールって超楽しいね
今後の活動
チョコボールを丸裸にするためには、まだまだ調べなきゃいけないことがたくさんあります。
調査項目としては次のようなことをやっていこうと思います。
- パッケージからエンゼルの予測ができるのか調査
- 金のエンゼルの確率分布を収束させたい
あとは、この面白さをより多くの人に知ってもらうために、 データビジュアライズのためのWebサービスを開発していくつもりです。
あと、アイディアを出すための訓練にめちゃくちゃなりそうなので、ハッカソン積極的に参加していきたい。
参考文献
統計学入門
- 作者: 東京大学教養学部統計学教室
- 出版社/メーカー: 東京大学出版会
- 発売日: 1991/07/09
- メディア: 単行本
- 購入: 158人 クリック: 3,604回
- この商品を含むブログ (79件) を見る
Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド
- 作者: オズワルドマーティン,Osvaldo Martin,金子武久
- 出版社/メーカー: 共立出版
- 発売日: 2018/06/22
- メディア: 単行本
- この商品を含むブログを見る
深層学習(機械学習プロフェッショナルシリーズ)
- 作者: 岡谷貴之
- 出版社/メーカー: 講談社
- 発売日: 2015/04/08
- メディア: 単行本(ソフトカバー)
- この商品を含むブログ (13件) を見る
ChainerCV — ChainerCV 0.11.0 documentation
chainercvの公式ドキュメント。とりあえあずこれを見れば動かせるようになりますGitHub - chainer/chainercv: ChainerCV: a Library for Deep Learning in Computer Vision
chainercvの公式Githttp://flask.pocoo.org/
flaskのドキュメントhttps://getbootstrap.com/
bootstrapのドキュメントVue.js入門 基礎から実践アプリケーション開発まで
- 作者: 川口和也,喜多啓介,野田陽平,手島拓也,片山真也
- 出版社/メーカー: 技術評論社
- 発売日: 2018/09/22
- メディア: 単行本(ソフトカバー)
- この商品を含むブログを見る
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第108回 チョコボール計測
本日の計測結果の報告です。
今回はミルクキャラメル味を計測します。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-17 | 2019-09-01 | 26.935 | 4.874 | 14 | 小山工場 | コンビニ(さいたま市) | なし | 22.061 | 1.576 |
2018-12-17 | 2019-09-01 | 28.612 | 4.793 | 16 | 小山工場 | コンビニ(さいたま市) | なし | 23.819 | 1.489 |
エンゼルさんは現れませんでした!
基礎集計
これまでのミルクキャラメル味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 16 |
銀のエンゼル出現数 | 0 |
金のエンゼル出現数 | 0 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 21.937 | 22.121 | 23.819 | 22.391 |
個数 | 14.000 | 14.000 | 16.000 | 14.312 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
昨日計測したチョコバナナ味に似てきたような気がします。
今日の計測で23.8g(仕様+1.8g)がこれまでと比較してだいぶ多く入っていました。
時期によって傾向が変わったりするとまた面白いんですが、それは別の機会に調査してみます。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 291 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が2.98%上側が6.81%という結果です。
現在の期待値は4.79%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が1.02%という予測になっています。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
第107回 チョコボール計測
本日の計測結果報告なんですが、 その前に、当ブログの方針の変更をします。
これまでピーナツ味の計測を基本としていたため、 記事のナンバリングはピーナツ味の計測以外を「番外編」として扱ってきました。 しかし、最近の新味の傾向差などを見ると、これらを番外編として「おまけ」としての扱いにするのが良いのか疑問に感じていました。 ピーナツと同じかそれ以上に分析しがいのある対象ではないかという思いが強くなってきたのです。
そこでピーナツ以外も、番外編としての位置づけではなく、 ピーナツと同列にナンバリングすることに決めました。
ということで、改めて、第107回の計測報告は、 チョコバナナ味といちご味です。
ちなみに、この二つの味を一緒に食べると、別のフルーツの味がするらしいです。
公式で公表しています。
私は全然理解できなかったですが。
計測結果
こちらはチョコバナナ味
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-16 | 2019-10-01 | 27.414 | 4.883 | 15 | 小山工場 | コンビニ(さいたま市) | なし | 22.531 | 1.502 |
2018-12-16 | 2019-10-01 | 27.81 | 4.938 | 15 | 小山工場 | コンビニ(さいたま市) | なし | 22.872 | 1.525 |
次はいちご味
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-16 | 2019-07-01 | 32.078 | 4.873 | 16 | 小山工場 | コンビニ(さいたま市) | なし | 27.205 | 1.700 |
2018-12-16 | 2019-07-01 | 32.371 | 4.88 | 16 | 小山工場 | コンビニ(さいたま市) | なし | 27.491 | 1.718 |
エンゼルさんは現れませんでした!
基礎集計
まず、チョコバナナ味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 13 |
銀のエンゼル出現数 | 1 |
金のエンゼル出現数 | 0 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 22.107 | 22.531 | 23.789 | 22.598 |
個数 | 14.000 | 15.000 | 16.000 | 14.615 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
チョコバナナ味は不思議な分布ですね。 工業製品であるのに、バラつきが大きすぎると思うんですよね。
次にいちご味の集計結果です。
項目 | 数 |
---|---|
計測データ数 | 16 |
銀のエンゼル出現数 | 0 |
金のエンゼル出現数 | 0 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 26.036 | 26.683 | 27.491 | 26.714 |
個数 | 15.000 | 15.000 | 16.000 | 15.375 |
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 289 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が2.89%上側が6.90%という結果です。
現在の期待値は4.76%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.94%という予測になっています。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第106回 チョコボール計測
本日の計測です。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-13 | 2019-05-01 | 34.052 | 4.828 | 19 | 小山工場 | コンビニ(さいたま市) | なし | 29.224 | 1.538 |
2018-12-13 | 2019-07-01 | 34.239 | 4.862 | 17 | 小山工場 | コンビニ(さいたま市) | なし | 29.377 | 1.728 |
2018-12-13 | 2019-07-01 | 34.510 | 4.844 | 16 | 小山工場 | コンビニ(さいたま市) | なし | 29.666 | 1.854 |
今日もエンゼルさんは現れませんでした!
基礎集計
この集計はピーナツ味のチョコボールの集計結果です。
項目 | 数 |
---|---|
計測データ数 | 307 |
銀のエンゼル出現数 | 9 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.750 | 29.389 | 32.232 | 29.495 |
個数 | 14.000 | 17.000 | 20.000 | 16.570 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 285 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.00%上側が7.14%という結果です。
現在の期待値は4.89%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.95%という予測になっています。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
- 出版社/メーカー: 森永製菓
- 発売日: 2016/03/01
- メディア: 食品&飲料
- この商品を含むブログを見る
SIMERST 改良版 携帯タイプはかり ポケットデジタルスケール(秤) 0.001g-100g精密 業務用(プロ用) デジタルスケール 電子天秤
- 出版社/メーカー: Simerst
- メディア:
- この商品を含むブログを見る
第105回 チョコボール計測
本日の計測行きます。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-12 | 2019-05-01 | 33.939 | 4.898 | 16 | 小山工場 | ドラックストア(横浜市) | なし | 29.041 | 1.815 |
2018-12-12 | 2019-05-01 | 34.129 | 4.914 | 16 | 小山工場 | ドラックストア(横浜市) | なし | 29.215 | 1.826 |
今日はエンゼルさん現れませんでした!
基礎集計
この集計はピーナツ味のチョコボールの集計結果です。
項目 | 数 |
---|---|
計測データ数 | 304 |
銀のエンゼル出現数 | 9 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.750 | 29.390 | 32.232 | 29.495 |
個数 | 14.000 | 16.500 | 20.000 | 16.562 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 282 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.03%上側が7.30%という結果です。
現在の期待値は4.94%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が1.02%という予測になっています。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
第ex25回 チョコボール計測
番外編の計測、25回目。
今回の番外編もチョコバナナ味を計測していきます。
計測結果
計測結果はこちらです。
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-11 | 2019-10-01 | 26.999 | 4.892 | 14 | 小山工場 | コンビニ(さいたま市) | なし | 22.107 | 1.579 |
2018-12-11 | 2019-09-01 | 27.720 | 4.906 | 15 | 小山工場 | コンビニ(さいたま市) | なし | 22.814 | 1.521 |
2018-12-11 | 2019-09-01 | 27.053 | 4.936 | 14 | 小山工場 | コンビニ(さいたま市) | なし | 22.117 | 1.580 |
エンゼルさんは出ませんでした。
基礎集計
「チョコバナナ」味の集計です
項目 | 数 |
---|---|
計測データ数 | 11 |
銀のエンゼル出現数 | 1 |
金のエンゼル出現数 | 0 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 22.107 | 22.299 | 23.789 | 22.580 |
個数 | 14.000 | 14.000 | 16.000 | 14.545 |
重量分布
この図は正味の重量のヒストグラムです。 赤い縦線が仕様を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
番外編24回でも指摘しましたが、重量のバラつきが大きいです。 他の味はだいたい1g程度の範囲でばらつくのに対して、 チョコバナナ味の最小値と最大値の差は1.7g程度もあります。
また、重量傾向は、前回の記事でも指摘したように、従来品と比較して明らかな差が出てきました(下図)。
平均の分布が異なるということは、 何らかの理由により傾向が違っているということでしょう。 製造時の設定か何か、明確な理由はわかりませんが。
エンゼルの出現確率推定
エンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 280 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.09%上側が7.441%という結果です。
現在の期待値は5.00%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が0.96%という予測になっています。
金のエンゼルの予測確率はほぼ0ですね。 金のエンゼルが出てくれないと、収束しない。。。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする
第104回 チョコボール計測
本日の計測行きます。 今日はさくっと1箱だけ計測です。
計測結果
date | best_before | weight | box_weight | number | factory | shop | angel | net_weight | mean_weight |
---|---|---|---|---|---|---|---|---|---|
2018-12-10 | 2019-07-01 | 34.298 | 4.863 | 18 | 小山工場 | コンビニ(港区) | なし | 29.435 | 1.635 |
3日連続とは行かなかったです。
基礎集計
この集計はピーナツ味のチョコボールの集計結果です。
項目 | 数 |
---|---|
計測データ数 | 302 |
銀のエンゼル出現数 | 9 |
金のエンゼル出現数 | 1 |
最小 | 中央値 | 最大値 | 平均 | |
---|---|---|---|---|
正味重量 | 28.750 | 29.392 | 32.232 | 29.498 |
個数 | 14.000 | 17.000 | 20.000 | 16.566 |
この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。
エンゼル出現確率の予測
通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。
項目 | 数 |
---|---|
計測データ数 | 277 |
銀のエンゼル出現数 | 13 |
金のエンゼル出現数 | 0 |
この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。
はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.07%上側が7.38%という結果です。
現在の期待値は4.99%です。
次に金のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が0.02%、上側が1.01%という予測になっています。
広告
Amazonの欲しいものリスト作ってみました。
チョコボールのカンパ募集中です。
チョコボールをカンパする