チョコボール統計

チョコボールの秘密を統計解析で明らかにしていく。おもちゃのカンヅメ欲しい。

日本のチョコボールとチョコボール Hawaii(グアム) の傾向の差を調べる

概要

  • グアムでチョコボールを発見!
  • 日本で売られているチョコボールと傾向に差異があるのかを調べてみた
  • 結論としては、内容量の傾向に差があるようだ。製造工場の違いか?

【トップに戻る】

目次

はじめに

私事で恐縮ですが、先日、グアムに旅行に行っておりました。
その際、ガイドブックにも載っているコンビニ的なお店、「ABC stores」にて「チョコボール Hawaii」なる商品を発見したのです。
下図参照。二枚目のようにおみやげ品として売られてました。

残念ながら、おもちゃのカンヅメには対応していないようなので、エンゼルは入っていないのですが、 日本で売られているチョコボールと傾向に差異があるのか気になります。

そこで今回は、日本とグアム(ハワイ?)のチョコボールの“重さの違い”に注目して差異を分析してみようと思います。

当ブログの「第ex16回 チョコボール計測 - チョコボール統計」も参照ください。

【トップに戻る】

基礎データ

まず、基礎データを比べてみます。 日本で売られているものとしては、2018/10/11現在10箱以上開封している4商品を対象とします。

内容量(仕様) 価格 開封 外観
ピーナッツ 28g 約80円 257 f:id:hippy-hikky:20181009234317j:plain:w130
いちご 25g 約80円 13 f:id:hippy-hikky:20181009234418j:plain:w130
甘酒 22g 約80円 10 f:id:hippy-hikky:20181009234502j:plain:w70
パチパチ 26g 約80円 10 f:id:hippy-hikky:20181009234542j:plain:w130
パイナップル(グアム) 22g 約284円 11 f:id:hippy-hikky:20181009234557j:plain:w130

5つめのパイナップル味がグアムの商品です。値段は2018/10/01の為替レートで計算しています。

基礎データを並べてみると、値段の高さが際立って見えますね。 3倍ですよ。
輸入しているからこのような値段設定になっているのでしょうか?

外観からは形状に大きな特徴は見られません。 ピーナツ味は中身がピーナツなので、大きさのバラつきはあります。

ちなみに、パイナップル味は球状のビスケットにパイナップルフレーバーのチョコがコーティングされているものなので、 いちご味や甘酒味と同じような作りになっているものと思われます。

日本の商品は全て栃木県の小山工場で製造されているようですが、 グアムの商品は製造工場までは記載が無かったです。 ただし、生産者は森永製菓と明記されています。

【トップに戻る】

内容量の傾向の差異検証

アプローチ

今回は、比較のしやすさから、内容量(重量)に注目して比較を行っていきます。

これまでに計測できている正味重量を味毎にヒストグラムにすると以下の図のようになります。

f:id:hippy-hikky:20181011225113p:plain
正味重量のヒストグラム. (左)正味重量の単純なヒストグラム. (右)正味重量から仕様分を引き、仕様からどれほど多いのかを表したヒストグラム.

上図は、味毎に色分けしています。 図から明らかなように、仕様上の重量が異なりますので、重量の分布が味毎に大きくずれます(上図の左)。 また、同じ味でも重量には多少のバラつきがあります。

味毎に仕様が異なるので、統一した指標で評価を行う必要があります。 そこで、重量から仕様分を引き、実際には仕様に対してどれほど多く入っているのかの傾向を比較してみることにします(上図の右)。
この時点でパイナップル味とその他は傾向に違いが見えそうですよね。

重量の予測

日本で売られている商品は仕様からだいたい1.5g程度多く入っている傾向があるのに対し、 パイナップル味は仕様に対して0.7g程度しか多く入っていない傾向が上記の図から見えます。 これを定量的に評価します。

定量的な評価としては、単純に計測値の平均を代表値として評価する方法が考えられます。 しかし、これまでに4章で示した表の通り、 ピーナツ味の計測数は非常に多いのに対し、他の味は10個程度しか計測数がありません。 そのため、単純に平均を出しただけでは、偏りが生じている可能性を捨て切れません。

そこで、ベイズ推定により重量の平均値の予測分布を計算し、 予測分布がどれほど離れているのかを評価指標とします。

ベイズ推定での重量の予測については以下の記事を参照ください。 chocolate-ball.hatenablog.com

モデル

上記の記事の通り、重量分布は正規分布に従うと仮定します。 そのため、予測するパラメータは正規分布の平均と分散です。

結果

味毎に正味重量の平均値を予測した結果は以下の通りです。

f:id:hippy-hikky:20181011232133p:plain
(左)正味重量の平均値の予測分布. (右)正味重量の予測値から仕様分を引き、仕様からどれほど多いのかを表した分布.

ピーナツ味はデータ数が多いため、平均値の予測分布の分散が少ないですが、 他の予測はまだ不確定さを持っている様子が見えます。
期待値を表にすると以下のようになります。

正味重量 正味重量-仕様
peanut 29.51 1.51
strawberry 26.67 1.67
ama-zake 24.07 2.07
pachi-pachi 27.67 1.67
pineapple 22.66 0.66

期待値を見ると明らかに異なって見えますが、このままでは平均値で比較しているのと何ら変わりありません。 データ数の少なさによる予測の曖昧さを予測分布という形で表現しているので、 予測分布を使って比較しましょう。

予測分布の図を見ると、パイナップル味が他と比較して仕様に対してあまり多く入っていないようです。 パイナップル味の95%信用区間の上限が他の味の95%信用区間の下限を上回る場合がありえそうなのかを確認します。

信用区間下限 正味重量-仕様の期待値 信用区間上限
peanut 1.466 1.51 1.54
strawberry 1.54 1.67 1.80
ama-zake 1.71 2.07 2.47
pachi-pachi 1.28 1.67 2.04
pineapple 0.54 0.66 0.77

この表から、 パイナップル味は他の味と比較して明らかに平均が異なっていると予測していることがわかります。

現在のデータに基づけば、 パイナップル味は他の味と比べて仕様に対する増加分が少ないということがわかりました。

また、甘酒味(今は売っていない)が仕様に対して2g近くも多く入っているということもわかりました。

【トップに戻る】

まとめ

今回は、日本で売られているチョコボールと海外(グアム)のチョコボールの重量の傾向を比較してみました。 その結果、どちらも仕様よりは多くの量が入っていることがわかりましたが、 その増加分は海外(グアム)の商品は少なそうであることがわかりした。

パイナップル味とその他で作りやすさに大きな違いがあるようには思えないので(ピーナッツを除く)、 製造時の設定が異なるのではないかと予想します。
日本で売られている商品の平均の予測分布の重なり方を見ると、 仕様に対してどの程度多く入れるかという設定は、商品に依ってそんなに大きく変えていないと想像します。

ということは、パイナップル味とその他の商品の違いは、製造工場の違いによるものなのかなと考えます。 (海外で売られてるんだから海外で作ってると考えるのが普通なのかな)

というわけで、差が見れてとても楽しかったです。

【トップに戻る】

参考文献

  1. 統計学入門

    統計学入門 (基礎統計学?)

    統計学入門 (基礎統計学?)

    有名な統計学の入門書。かっちり書いてあるので、統計学を学ぶにはすごく良い。

  2. Pythonで体験するベイズ推論

    Pythonで体験するベイズ推論 PyMCによるMCMC入門

    Pythonで体験するベイズ推論 PyMCによるMCMC入門

    pythonのMCMCパッケージであるpymcの使い方を学ぶにはちょうどよい。 ただし、プログラムとして書くためのノウハウが主なので、理論的な部分はほとんど載っていない。 理論は上記の参考書などを読むと良い。

【トップに戻る】