チョコボール統計

チョコボールの秘密を統計解析で明らかにしていく。おもちゃのカンヅメ欲しい。

銀のエンゼルと金のエンゼルの出現確率をベイズ推定する(金と銀を合わせて推定)

【概要】

  • これまで本ブログでは、金のエンゼルと銀のエンゼルの出現確率の推定を日々行っています
  • しかしこれまでの推定は、簡単のために金と銀のエンゼルを独立に推定してきました
  • そこで本記事では、金と銀のエンゼルを合わせて推定するため、多項分布を利用したモデルを構築します

【目次】

はじめに

当ブログでは、日々のチョコボール開封結果に基づいて金のエンゼルと銀のエンゼルの出現確率を推定しています。 これまでの推定では、簡単のために、金のエンゼルと銀のエンゼルの出現確率をそれぞれベルヌーイ試行と仮定して独立に推定してきました( ベイズ推定でエンゼルの出現確率を予測する - チョコボール統計 )。

しかしこのモデルは、現実を正しく表現していません。

チョコボールのエンゼルは金のエンゼルと銀のエンゼルが同時に現れることは無いですよね。 「金のエンゼル」、「銀のエンゼル」、または、「ハズレ」の3状態のいずれかが実現します。 そのため、金のエンゼルの出現確率と銀のエンゼルの出現確率を同時に推定する必要があります *1 *2

また、「金のエンゼル2倍キャンペーン」という期間があったのですが、 これも簡単のために、この期間のデータを除外して推定してきました。 単純にデータが減るだけなので、この期間のデータも積極的に利用していきたいと思います。

ということで、これまで単純化するためにおいていた仮定を見直し*3、 より現実に即したモデルでエンゼルの出現確率を推定していこうと思います。

【トップに戻る】

アプローチ

具体的に3つの状態(金のエンゼル、銀のエンゼル、ハズレ)を合わせて推定するモデルを考えていきます。 モデルを考える前に、前提、仮定を明示しておきます。

前提と仮定

金のエンゼル、銀のエンゼルはランダムに発生し、データの全期間を通してエンゼルの出現確率は一定であるとします (金のエンゼル2倍キャンペーンは除く)。 また、フレーバーによって出現確率は変わらないと仮定します。

次に、金のエンゼル2倍キャンペーン中は、 金のエンゼルの出現確率が通常の出現確率の2倍であるとします (そのように公表されているので信じることにします)。

モデル

次に、チョコボールのエンゼルの発生過程をモデル化します。

まず、1章で述べたとおり実現値は3値{金、銀、ハズレ}です。 そのため、多項分布を利用します。

{ \displaystyle
m \sim {\rm Mult}(m | \pi, M)
}

ここで、mは全試行回数Mのうち、{金、銀、ハズレ}のそれぞれの個数を表すベクトルです。 \piは、{金、銀、ハズレ}の出現確率を表す3次元のベクトルで、このパラメータが推定対象です。

今回は、最尤推定ではなく、ベイズ推論を行いたいので、事前分布を設定する必要があります。 そこで事前分布には、多項分布の共役事前分布であるディリクレ分布を利用します。

{ \displaystyle
\pi \sim {\rm Dir}(\pi | \alpha)
}

ここで、\alphaはディリクレ分布のハイパーパラメータです。

ここまでを合わせて、Kruschkeのダイアグラム*4にすると以下のようなモデルとなります。

f:id:hippy-hikky:20190709230449p:plain
図1.単純な多項分布のモデル.多項分布のパラメータの事前分布にはディリクレ分布を利用する.

次に、金のエンゼル2倍キャンペーンのデータを利用する方法を考えます。 実はこのアイディアはネタが丸かぶりしている以下の記事を参考にさせていただきました(参考にというかほぼそのままです…)。

bayesmax.sblo.jp

上記の記事では、このキャンペーン期間のデータには確率に重みが付くというモデルにされています。 それぞれの事象の重みをw_*とすると、多項分布のパラメータ\piは以下のベクトルとなります。

{ \displaystyle
\pi = (\pi_{none} w_{none},  \pi_{silver} w_{silver}, \pi_{gold} w_{gold})^{T}
}

ここで、重みw_*は以下の値とします。

期間 w_{none} w_{silver} w_{gold}
通常期間 1.0 1.0 1.0
2倍キャンペーン 1.0 0.0 2.0

データ

今回利用するデータは、2017年11月~2019年7月までに当ブログ内で開封した566箱が対象です。 なおグアムで購入したチョコボールについては、金のエンゼルも銀のエンゼルも共に存在しないため、対象外としています*5

データをまとめると以下の通りです。 2.1説で説明した仮定により、 推定対象のパラメータ(エンゼルの出現確率)は金のエンゼル2倍キャンペーン中の商品か否かにのみ依存するため、 以下のように2つの期間に分けたデータとしました。

キャンペーン ハズレ 銀のエンゼル 金のエンゼル
通常 432 20 0
金2倍 113 0 1

実験

パラメータ推論

2.2節に示した多項分布モデルのパラメータを推論します。 2.2節で述べたとおり今回の実験では、事前分布には共役事前分布であるディリクレ分布を利用します。 そのため、ベイズの定理に従って事後分布を計算すると以下の通りディリクレ分布になります*6

{ \displaystyle
p(\pi | D ) \propto p(D | \pi)p(\pi) \\
\ = {\rm Mult}(m | \pi, M){\rm Dir}(\pi | \alpha) \\
\ = {\rm C} \prod^{K}_{k=1}\pi_k^{\alpha_k+m_k-1} = {\rm Dir}(\pi | \alpha+m)
}

ここで、\piは事象の発生確率のベクトル(ここでは3次元ベクトル)、 mはデータを表し、各事象の発生回数を並べたベクトルで、 Mはデータの総数を表します(\sum{m}=M)。 \alphaはディリクレ事前分布のハイパーパラメータで、今回は適当な値を設定します。 Cは定数項を表します。

ということなのですが、 今回はあえてPyMC3*7を利用し、サンプルによる近似事後分布を求めます(MCMC*8。 単純に私がPyMCを使いたかったのと、事前分布に共役ではない事前分布を設定できる柔軟さがあるので、 今回は近似事後分布を求めました*9

具体的なコードは、以下を参照ください。

実験結果

3章で示したデータを利用して、金のエンゼルと銀のエンゼルの出現確率を推定した結果を示します。 2章で述べたとおり、金のエンゼル2倍キャンペーンを含めないモデルと含めるモデルをそれぞれ推定しました。

金のエンゼル2倍キャンペーンを除いた場合

まず、問題を単純にするために金のエンゼル2倍キャンペーンを除いた場合の結果です。

f:id:hippy-hikky:20190709003916p:plain
図x1. 各状態のパラメータの推定事後分布.左から,ハズレ,銀のエンゼル,金のエンゼルのそれぞれの出現確率事後分布

図x1は、多項分布のパラメータの事後分布をプロットしたものです。 3つの図はそれぞれ左から、ハズレ,銀のエンゼル,金のエンゼルの出現確率を表しています。 それぞれの図には、期待値(mean)と95%HPD*10が記載されています。 図x1から、95%の確率でハズレを引き、銀のエンゼルは約4.6%(2.8%~6.6%の間)で出現するであろうと推定できていることがわかります。 一方、金のエンゼルは0.2%(0%~0.7%の間)であると推定しています*11。 ここで利用したデータでは金のエンゼルは一つも出現していません。 そのため最尤推定では0%と推定することになってしまいますが、 事後分布では0.7%以下になるだろうと柔軟な予測ができています。

全てのデータを含めた場合

次に、2章で述べたように、エンゼルの出現確率に重みを載せて、全てのデータを利用して推定した結果を示します。

f:id:hippy-hikky:20190709005602p:plain
図x2. 各状態のパラメータの事後分布(全データ利用).左から,ハズレ,銀のエンゼル,金のエンゼルのそれぞれの出現確率事後分布

図x2は全てのデータを利用して、多項分布のパラメータの事後分布を推定した結果です。 図のそれぞれの位置関係は、先の図x1と同じです。

図x1と図x2を比較すると、ほぼ同じような結果なのですが、金のエンゼルの事後分布を見ていただくと、分布の形状が微妙に異なっていることがわかると思います。 今回のデータでは、金のエンゼル2倍キャンペーンの期間で金のエンゼルが一つ出ています*12。 つまり確率0%では無いことははっきりしているため、0の付近の山が少し下がり、分布が右にシフトしている様子が確認できます。 なお、図x1と同様に95%HPDの下限は0.0と表示されていますが、正確には、9.1e^{-3}\%と推定されました。

銀のエンゼルについては、4.2.1で利用したデータに加えてデータが追加されてはいますが、 追加データについては銀のエンゼルの出現確率が0%として重みを設定しているため、 推定結果には影響を与えていないということがわかります。

いくら買ったらエンゼルが当たるのか?

エンゼルの出現確率が推定できたのなら、次は、何個買えばエンゼルが当たるのかの見積もりが気になりますよね。

確率\thetaのベルヌーイ試行において、n回成功するまでにk回失敗する確率を表現した分布として、「負の二項分布」が知られています (参考1, 参考2)。

{ \displaystyle
f(k) = NB(k|\theta, n) = \binom{k+n-1}{n-1}\theta^{n}(1-\theta)^{k}
}

この分布を利用することで、エンゼルを得るまでに必要なチョコボールの個数を見積もることができそうです。 しかし、上記の負の二項分布の定義を見ると、確率はpとして一点を代入する式になっていますが、 4.2節の推定で得られた結果は確率分布(事後分布)でした。 事後分布で得られた推定結果の期待値*13を使って予測することもできますが、 この確率分布にはデータがまだ十分でないための曖昧性が表現されているため、代表点で推定することは避けたいです。

そのため、以下の積分を計算することで、事後分布を利用した予測結果を得ることができます。

{ \displaystyle
p(k | D) = \int p(k|\theta)p(\theta|D)d\theta \\
\ = \int NB(k|\theta, n)p(\theta | D)
}

p(\theta | D)は4.2節で推定した事後分布です。 期待値を計算するということですね。

ここで、今手元にある事後分布p(\theta | D)はサンプル集合として得られていることを思い出します。 サンプル集合のためこのままでは上記の期待値を計算することはできません *14。 しかし、サンプル集合で事後分布を予測できているため、サンプルごとの平均で積分を計算することができます。

{ \displaystyle
p(k | D) \simeq \frac{1}{M}\sum^{M} NB(k|\theta_m, n)
}

ここで、Mはサンプルの数で、\theta_mはm番目の\thetaのサンプルを表します。

では早速金のエンゼル1枚と銀のエンゼルを5枚出すために必要なチョコボールの購入数を見積もって見ます。

銀のエンゼルを5つ得るまでに必要なチョコボールの購入数

f:id:hippy-hikky:20190709015215p:plain
図x3.銀のエンゼルを5つ手に入れるまでに必要なチョコボールの個数の分布.

図x3は銀のエンゼルを5つ得るまでに必要な個数の分布(累積確率)です。 事後分布を使って推定した結果(青線)と事後分布の期待値を使って推定した結果(赤線)を載せています。 この図から、100個程度のチョコボールを買うことで、銀のエンゼルが5個得られる確率が50%を超えそうだということがわかります。 また、銀のエンゼルの予測は、期待値を使った場合も事後分布を使った場合も概ね同じ程度であることがわかります。

金のエンゼルを5つ得るまでに必要なチョコボールの購入数

f:id:hippy-hikky:20190709015306p:plain
図x4.金のエンゼルを1つ手に入れるまでに必要なチョコボールの個数の分布.

次に、図x4は金のエンゼルを1枚得るまでに必要な個数の分布(累積確率)です。 こちらの図でも事後分布を使って推定した結果(青線)と事後分布の期待値を使って推定した結果(赤線)を載せています。 この図から、金のエンゼルを得るためには、250個ほど買うことで50%を超えるということがわかります。 1,000個も買えば80%の確率で金のエンゼルが当たるという予想になっています。

期待値を使って予測した結果と事後分布を使って予測した結果を比較してみると、 期待値を使って予測した方がポジティブな予測になっているのがわかります。 図x2の事後分布を確認すると、金のエンゼルは右に裾が長い分布になっているため、 期待値が少し高めなのだろうということがわかります。

終わりに

以上本記事は、金のエンゼルと銀のエンゼルを合わせて推定してみました。

結果としては、これまでの計測記事で示している独立に推定した場合とほぼ変わらないのですが、 金のエンゼルは0.3%、銀のエンゼルは4.6%という推定値となりました。

また、エンゼルを得るまでに必要なチョコボールの購入数の見積もりを計算することで、 事後分布を活用したメリットに触れることができました。

しかし、金のエンゼルはまだ一つで、しかも「金のエンゼル2倍キャンペーン」という特別な期間に出ただけなので、 正確に推定するにはもっと多くのデータが必要です。 そのため、今後も計測を続けていこうと思います。

参考文献(お世話になった書籍)

  1. パターン認識機械学習

    パターン認識と機械学習 上

    パターン認識と機械学習 上

    ベイズ的な手法を軸にした機械学習の参考書。

  2. Pythonによるベイズ統計モデリング

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

    Pythonによるベイズ統計モデリング: PyMCでのデータ分析実践ガイド

    pymc3を使った入門書。 理論面も多少書かれており、こちらで手を動かしながら学習するのが良いと思う。

【トップに戻る】

広告

Amazonの欲しいものリスト作りました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓  チョコボール<ピーナッツ>  28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

【トップに戻る】

*1:独立に計算するということは、金のエンゼルと銀のエンゼルが共に出現する状態を許容してしまいます。 というか、金のエンゼルと銀のエンゼルは互いに関係ない別のものと考えることになっちゃいます。

*2:たまたま、金のエンゼルの出現確率が極端に低いためにこれまでに問題にはならなかっただけです

*3:ただただ単純にサボっていただけという。。。

*4:参考文献2参照

*5:参考: 日本のチョコボールとチョコボール Hawaii(グアム) の傾向の差を調べる - チョコボール統計

*6:参考文献1参照

*7:参考:https://docs.pymc.io/

*8:参考文献2参照

*9:これはあくまで趣味ですので

*10:HPD:HighestPosteriorDensity, 知りたいパラメータが95%の確率で含まれる区間

*11:正確には、95%HPDの下限はは0%ではありません。今回の推定では6e^{-7}\%が下限でした。

*12:参考: 第30回 チョコボール計測 - チョコボール統計

*13:MAP値もよく使われます

*14:共役事前分布を使うことで、事後分布をディリクレ分布として推定することができるため、解析的に計算することは可能です。

第163回 チョコボール計測(ピーナツ)

本日の計測結果です。 ピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-07-03 2019-10-01 34.152 4.800 16 小山工場 ドンキホーテ なし 29.352 1.835
2019-07-03 2019-10-01 34.427 4.803 17 小山工場 ドンキホーテ なし 29.624 1.743

今日はエンゼルさんは出ませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 410
銀のエンゼル出現数 14
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.387 32.232 29.481
個数 14.000 16.000 20.000 16.527

f:id:hippy-hikky:20190704004652p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 452
銀のエンゼル出現数 20
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.14%上側が6.36%という結果です。
f:id:hippy-hikky:20190704004734p:plain

現在の期待値は4.63%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.65%という予測になっています。
f:id:hippy-hikky:20190704004808p:plain

今のところの金のエンゼルの期待値は0.22%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第162回 チョコボール計測(ピーナツ)

本日の計測結果です。 ピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-07-02 2019-10-01 34.354 4.826 16 小山工場 ドンキホーテ なし 29.528 1.845
2019-07-02 2019-10-01 34.257 4.823 17 小山工場 ドンキホーテ なし 29.434 1.731

今日はエンゼルさんは出ませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 408
銀のエンゼル出現数 14
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.387 32.232 29.481
個数 14.000 16.000 20.000 16.527

f:id:hippy-hikky:20190703005411p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 450
銀のエンゼル出現数 20
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.15%上側が6.39%という結果です。
f:id:hippy-hikky:20190703005447p:plain

現在の期待値は4.66%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.66%という予測になっています。
f:id:hippy-hikky:20190703005518p:plain

今のところの金のエンゼルの期待値は0.22%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓 チョコボール<ピーナッツ> 28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

  • 発売日: 2016/03/01
  • メディア: 食品&飲料

第161回 チョコボール計測(ピーナツ)

本日の計測結果です。 今日はピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-06-24 2019-10-01 34.001 4.815 16 小山工場 ドンキホーテ なし 29.186 1.824
2019-06-24 2019-10-01 35.816 4.815 17 小山工場 ドンキホーテ なし 31.001 1.824

ひさしぶりに銀のエンゼルさん出現です!

基礎集計

ピーナツ味の集計です。

項目
計測データ数 406
銀のエンゼル出現数 14
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.387 32.232 29.481
個数 14.000 16.000 20.000 16.527

f:id:hippy-hikky:20190625002140p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 448
銀のエンゼル出現数 20
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.16%上側が6.41%という結果です。
f:id:hippy-hikky:20190625002236p:plain

現在の期待値は4.68%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.66%という予測になっています。
f:id:hippy-hikky:20190625002311p:plain

今のところの金のエンゼルの期待値は0.22%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

第160回 チョコボール計測(ピーナツ)

本日の計測結果です。 今日はピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-06-20 2019-10-01 34.271 4.802 16 小山工場 ドンキホーテ なし 29.469 1.842
2019-06-20 2019-10-01 34.212 4.791 15 小山工場 ドンキホーテ なし 29.421 1.961

今回もエンゼルさんは現れませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 404
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.387 32.232 29.478
個数 14.000 16.000 20.000 16.527

f:id:hippy-hikky:20190620232029p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 446
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が2.99%上側が6.18%という結果です。
f:id:hippy-hikky:20190620232118p:plain

現在の期待値は4.46%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.67%という予測になっています。
f:id:hippy-hikky:20190620232159p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓  チョコボール<ピーナッツ>  28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第159回 チョコボール計測(ピーナツ)

本日の計測結果です。 今日はピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-06-18 2019-10-01 33.995 4.786 16 小山工場 ドンキホーテ なし 29.209 1.826
2019-06-18 2019-10-01 34.275 4.78 016 小山工場 ドンキホーテ なし 29.495 1.843

今回もエンゼルさんは現れませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 42
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.386 32.232 29.478
個数 14.000 16.000 20.000 16.532

f:id:hippy-hikky:20190618235713p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 444
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.00%上側が6.23%という結果です。
f:id:hippy-hikky:20190618235809p:plain

現在の期待値は4.50%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.68%という予測になっています。
f:id:hippy-hikky:20190618235833p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓  チョコボール<ピーナッツ>  28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱

第158回 チョコボール計測(ピーナツ)

本日の計測結果です。 今日はピーナツ味を2箱計測します。

計測結果

date best_before weight box_weight number factory shop angel net_weight mean_weight
2019-06-17 2019-10-01 34.375 4.822 15 小山工場 ドンキホーテ なし 29.553 1.970
2019-06-17 2019-10-01 34.201 4.785 15 小山工場 ドンキホーテ なし 29.416 1.961

今回もエンゼルさんは現れませんでした。

基礎集計

ピーナツ味の集計です。

項目
計測データ数 400
銀のエンゼル出現数 13
金のエンゼル出現数 1
最小 中央値 最大値 平均
正味重量 28.594 29.386 32.232 29.479
個数 14.000 16.500 20.000 16.535

f:id:hippy-hikky:20190618011534p:plain この図は正味の重量のヒストグラムです。 赤い縦線が仕様(28g)を表しています。 青い太線で正規分布と仮定した最尤推定量をプロットしています。

エンゼル出現確率の予測

通常版のエンゼルの予測を行っていきます。 これまでの通常版パッケージの開封結果は次の通りです。

項目
計測データ数 442
銀のエンゼル出現数 19
金のエンゼル出現数 0

この結果を使ってベイズ推定によるエンゼルの出現確率推定を行います。

はじめに銀のエンゼルの出現確率の推定です。
90%信用区間(上下それぞれ5%)は、下側が3.01%上側が6.22%という結果です。
f:id:hippy-hikky:20190618011625p:plain

現在の期待値は4.51%です。

次に金のエンゼルの出現確率の推定です。 90%信用区間(上下それぞれ5%)は、下側が0.01%、上側が0.67%という予測になっています。
f:id:hippy-hikky:20190618011700p:plain

今のところの金のエンゼルの期待値は0.23%です。

広告

Amazonの欲しいものリスト作ってみました。 チョコボールのカンパ募集中です。
チョコボールをカンパする

森永製菓  チョコボール<ピーナッツ>  28g×20箱

森永製菓 チョコボール<ピーナッツ> 28g×20箱