チョコボール統計

チョコボールの秘密を統計解析で明らかにしていく。おもちゃのカンヅメ欲しい。

チョコボール計測データのデータビューワーを作った

【概要】

  • 当ブログでは2017年11月から不定期にチョコボールの計測結果をブログ記事として公開してきました
  • もっと簡単にデータを見られるようにしたい
  • ということでデータビューワー作った

【目次】


はじめに

当ブログは、2017年11月に立ち上げて以来、合計で250回、計791箱のチョコボールを計測してきました。(2021年1月14日現在)

計測結果は毎回ブログ記事で公開してきたのと合わせて集計をたまに記事化していました(これとかこれ)。 しかし、不定期に更新される記事でのみデータを確認できるというのはあまりに不便です。そこで、データをインタラクティブに確認できるWebアプリを作ったので公開しました。

chocolate-view.herokuapp.com

是非触ってみてください。

【トップに戻る】

機能説明

言いたいことは全て書いたんですが、一応機能について説明を書いておきます。

全体概要

このWebサービスでは、チョコボールの計測データを確認できます。

確認できる項目は、以下の3つです。

  1. 内容量の分布
  2. チョコボール個数の傾向
  3. エンゼル出現確率の推定結果

このうち1と2については、フレーバー毎の集計結果となります。

Flavor選択

サイドバーに味の選択ができるプルダウンメニューがあります。

ピーナッツといちご以外はデータが少ないので選択されないことをお勧めします。

f:id:hippy-hikky:20210115143020g:plain

内容量の分布

全体の重さから、空箱の重さを引いた正味の重量の分布を確認できます。

詳しくは以下の記事に記載していますが、期間によって内容量の傾向が変わったようなので時期による違いが確認できるようにスライダーを設けています。

f:id:hippy-hikky:20210115143701g:plain

chocolate-ball.hatenablog.com

チョコボール個数の傾向

個数の時系列データについてはおまけです。

パッケージ記載の賞味期限月毎の平均を実線で、最大個数と最小個数をグレーの領域で表しています。

大きな変化はみられないような気がします。が、ここも詳しくみていくと面白そうな傾向があるような気がします。詳しくは以下の記事をみてください。

この辺の分析データも実装するかは検討中です。

chocolate-ball.hatenablog.com

エンゼル出現確率

エンゼル の出現確率の推定結果です。詳しくは以下の記事を見てください。推論方法とソースコードを公開しています。

chocolate-ball.hatenablog.com

エンゼル出現確率については、ハズレ、銀のエンゼル 、金のエンゼルの出現確率の事後分布(MCMCサンプルのヒストグラム)を掲載しています。

f:id:hippy-hikky:20210115144412p:plain

また、銀のエンゼルをN個当てるまでに必要なチョコボールの購入数を見積もれるシミュレータも実装しました。

欲しいエンゼルの個数を選択し(初期値は5)、確率の見積もり値を設定します(初期値は80%)。シミュレーション結果として、確率p%以上で銀のエンゼルがN個得られるまでに必要な個数の予測値が図と数値で出てきます。

予算の確保に役立ててください。

f:id:hippy-hikky:20210115150455g:plain

【トップに戻る】

開発環境

Webアプリ関連の知識と技術が謙遜抜きでほぼ0なので、すごく簡単な手段を使っています。

ビューワー自体はStreamlitを利用しました。JupyterLabを触る感覚でめちゃくちゃ手軽にフロントができます。

インフラとしてはHerokuを利用しました。

herokuへのデプロイのやり方については以下のブログを参考にさせてもらいました。

Show your ML Project to the Internet in Minutes | by Patryk Oleniuk | Dec, 2020 | Towards Data Science

【トップに戻る】

まとめ

ということで、チョコボールの計測データの簡易的なビューワーを作りました。

動きがもっさりしているのは改善していきたいです。 あと、公開停止しちゃったけど、ChocoballDetectorとも連携させるようにしたいな。

【トップに戻る】