今回は、前回の基本データを基に、仮説検定で高額配当狙いの分析をします。
10月中の約束を守れず、申し訳ありませんでした。
仮説検定とは、仮説を立て、あらかじめ決めておいた基準に基づいて仮説の真偽を判定する方法です。
特に今回のように、確率的な出来事による結果をいくつかのグループに分けて、その出現頻度に傾向があるか否かを判定するには、「分割表による独立性の検定」がよく使われます。この講座でも第2回などで使いました。
これは、
という流れで行います。「基準が0.5%」ならば、3の結果が0.5%以下であれば「仮説を棄却(否定)」するということです。
よって、「基準」はあらかじめ決めておくことが前提となりますが、今回は3までで止めておいて、判定はみなさんそれぞれにお任せします。
例えば、3で得た確率が0.1%以下と出たら、あなたはどう思いますか? 1000回に1回も起こらないとしたら、偶然ではなくそこには何か理由があると考えた方が良いと思いませんか?
A 日付不可&重数(ストレート)
これは、第4回で検証したものをさらに絞り込んだものです。
例えば第4回では「449」は日付不可&重数としましたが、平成4年4月9日と読めるので、今回は入れません。(第4回では「平成年」を考慮していませんでした)
結果、000〜999の数字千個のウチ、このグループに入る数字は、
010,020,..,090(9個)
011,022,..,099(9個)
100,200,..,900(9個)
440,550,..,990(6個)
001,002,..,009,000(10個)
の合計43個(4.3%)です。早速分割表を見てみましょう。
日付不可 &重数 | その他 | 計 | 日付不可 &重数率 | |
平均賞金を上回るグループ | 9 | 116 | 125 | 7.2% |
平均賞金を下回るグループ | 1 | 174 | 175 | 0.6% |
計 | 10 | 290 | 300 | 3.3% |
平均賞金 | ¥148,160 | ¥98,955 | ¥100,595 |
理論出現率4.3%に対して、3.3%と低く感じますが、あと2〜3回出ていれば理論値に到達しますので、気にするほどではないでしょう。1000通りの出目に対して300回の試行ではまだまだ少ないのです。
検定の手順は、
となります。このカイ自乗分布表は、次のようになっています。
Y | 確率 |
0.4549 | 50% |
1.323 | 25% |
2.706 | 10% |
3.841 | 5% |
5.024 | 2.5% |
6.635 | 1% |
7.879 | 0.5% |
10.82 | 0.1% |
統計量Yが大きいほど、それが起こる確率が低いということです。
では、統計量Yを計算しましょう。
計算方法を説明するため、分割表をもう一度簡単に書きます。
日付不可&重数 | その他 | 計 | |
平均賞金を上回るグループ | X11 | X12 | X1. |
平均賞金を下回るグループ | X21 | X22 | X2. |
計 | X.1 | X.2 | n |
この表中の記号に合わせて、次のように計算します。
統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(9-1/300×125×10)2/((1/300)×125×10)
+(116-1/300×125×290)2/((1/300)×125×290)
+(1-1/300×175×10)2/((1/300)×175×10)
+(174-1/300×175×290)2/((1/300)×175×290)
≒9.943
表から、確率は「0.1%以上0.5%以下」とわかります。
つまり、この傾向(日付不可&重数は配当が高い)は単に偶然起きたとするなら、その確率は1000回に5回以下ということです。
ちなみに0.5%の確率というのは、硬貨を投げて表か裏かを当てるゲームで7〜8回続けて勝つ確率です。
(0.57=0.78%、0.58=0.39%)
どれだけ起こり得ないか試してみて下さい。
B 日付不可(ミニ)
これは、第2回で検証したものと同じです。
ミニは、本来あるべき百位の数字を無視するわけですが、百位に何が来ても日付不可となるのは以下の7個だけです。(理論出現率7%)
分割表を見てみましょう。
日付不可 | その他 | 計 | 日付不可率 | |
平均賞金を上回るグループ | 20 | 104 | 124 | 16.1% |
平均賞金を下回るグループ | 2 | 174 | 176 | 1.1% |
計 | 22 | 278 | 300 | 7.3% |
平均賞金 | ¥13,309 | ¥9,753 | ¥10,013 |
理論出現率7%に対して、7.3%。100通りの出目に対して300回ならまあまあですね。
では、統計量Yを計算しましょう。
計算方法は上と同様です。
統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(20-1/300×124×22)2/((1/300)×124×22)
+(104-1/300×124×278)2/((1/300)×124×278)
+(2-1/300×176×22)2/((1/300)×176×22)
+(174-1/300×176×278)2/((1/300)×176×278)
≒24.063
私の持っている表には、確率0.1%以下の部分がありません(T_T)。かなり低い確率になることは明白ですが、一応「0.1%以下」としましょうか。(どなたか、自由度1のカイ自乗分布の自力計算方法を教えて下さい)
この傾向(00、40、50、60、70、80、90は配当が高い)は単に偶然起きたとするなら、その確率は1000回に1回以下ということです。
C 百位0(ストレート)
これは、新しいグループです。
前回の分析で、桁別の出現頻度を見ましたが、百位が0のときの平均配当が高いので、検証することにしました。
分割表は次の通りです。
百位0 | その他 | 計 | 百位0率 | |
平均賞金を上回るグループ | 19 | 106 | 125 | 15.2% |
平均賞金を下回るグループ | 8 | 167 | 175 | 4.6% |
計 | 27 | 273 | 300 | 9.0% |
平均賞金 | ¥119,504 | ¥98,725 | ¥100,595 |
理論出現率10%に対して、9.0%。まあまあですね。
では、統計量Yを計算しましょう。
統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(19-1/300×125×27)2/((1/300)×125×27)
+(106-1/300×125×273)2/((1/300)×125×273)
+(8-1/300×175×27)2/((1/300)×175×27)
+(167-1/300×175×273)2/((1/300)×175×273)
≒10.058
表から、確率は「0.1%以上0.5%以下」となりますが、ほぼ0.1%に近いので、「0.2%以下」としてもいいでしょう。
つまり、この傾向(百位0は配当が高い)は単に偶然起きたとするなら、その確率は1000回に2回程度ということです。
この桁別頻度の偏りは、他にも見られます。前回の表を見ていただければ一目瞭然ですが、高配当は、「十位7」「一位0」、低配当は「百位2」「十位1」「十位2」などがあります。これらもいつか検証したいと思います。
D 複数出現出目は低配当?(ストレート)
これも、新しいグループです。
前回の分析で、ストレートの数字別の出現頻度を見ましたが、どうも2回以上出ている目の2回目以降は配当が低いようです。
で、計50件の2度目以降がありました。
ちなみに、出現回毎に平均配当を調べると、
1回目 | 2回目 | 3回目 | |
3回出た目 | ¥106,720 | ¥88,020 | ¥83,060 |
2回出た目 | ¥105,282 | ¥92,190 | − |
と、徐々に平均配当が下がっています。
「一度出た目は人気薄だろう」と思っている人が多い? 分割表は次の通りです。
2度目以降 | その他 | 計 | 2度目以降率 | |
平均賞金を上回るグループ | 15 | 110 | 125 | 12.0% |
平均賞金を下回るグループ | 35 | 140 | 175 | 20.0% |
計 | 50 | 250 | 300 | 16.7% |
平均賞金 | ¥90,860 | ¥102,542 | ¥100,595 |
では、統計量Yを計算しましょう。
統計量Y=Σ(i=1,2)Σ(j=1,2)((Xij-1/n×Xi.×X.j)2/((1/n)×Xi.×X.j)
=(15-1/300×125×50)2/((1/300)×125×50)
+(110-1/300×125×250)2/((1/300)×125×250)
+(35-1/300×175×50)2/((1/300)×175×50)
+(140-1/300×175×250)2/((1/300)×175×250)
≒3.36
表から、確率は「5%以上10%以下」となります。
この傾向(2度目以降は配当が低い)は単に偶然起きたとするなら、その確率は100回に5〜10回程度ということです。
これはあまり傾向があるとは言えそうもありませんね。先の硬貨投げのゲームでいえば、4連勝(6.25%)ぐらいの確率です。たまにはそういうこともあるでしょう
見た目には低配当傾向が見えるのに何故でしょう? 前回の分析で見ましたが、ストレートの配当は開始当初に比べて全体的に下がっています。そうです低配当傾向にあるのは何もこのグループに限ったことではないのです。
さて、いくつかの傾向について検証してきました。皆さんはどう思われたでしょうか? 「日付不可&重数」で「百位0」で「300回の抽選で一度も出ていない目」というと、
010、020、030、040、050、060、070、080、090、
011、033、044、055、099、001、002、005、006、
007、008、009、000
の22点です。このウチ「001」は第302回で出て¥103,100でした。平均よりは上ですが、あまり高配当とは言えないですね。これは、「777」が超低配当(第309回 ¥57,100)だったのと同じ様なことだと思います。あまりにも特殊な数字ということでしょうか。
そこで私のお勧めは、桁別平均配当から、
です。ただし、これは出目予想ではありませんのでご注意を。
まだ分析したいことがいくつかあります。 例えばナンバーズの抽選は、数字の書かれた回転する円盤に矢を射る方法を採っています。そこで隣り合う数字同士で何か傾向があるのでは? これはデータの分析からしなければなりません。
また、「前回の数字の種類(3つ同じ、2つ同じ、全て異なる)による配当の違いに傾向があると言えるか?」と、データを添えてメールをくださった方がいらっしゃるので、その件についても調べたいと思っています。
他にも分析依頼大募集中です!(ただし、期限無しに限る...)
次回は何をしよう...ネタがない...またナンバーズか...
ネタも大募集中! よろしくお願いします。