イチローの安打数とサッカー1試合あたり得点数とポアソン分布

イチローの1試合あたり安打数はポアソン分布に従いそうに思われるが従わないという記事が少し前に話題になったようだ。
rikei-logistics.com
これに対し、ポアソン分布に従わないのは当たり前と指摘する記事も出ていた。
www.anlyznews.com

安打数の分布に関する論点の整理

まず、もとの記事では1994年のパ・リーグ規定打席以上の打者の安打数が試合数より少ない(安打数/試合数=0.93)ことをもって「これくらいだと、1試合当たりの安打数は「滅多に起こらない事象の確率分布」であるポアソン分布に従」うとしているが、これは自明ではないように思う。

ポアソン分布はめったに起こらない事象に当てはまりがよい確率分布とされるが、ここでのめったに起こらないとは、試行回数に対して事象が起きる回数が極めて少ないことをいう。
数学的にいえば、二項分布のnを∞に飛ばすとポアソン分布に収束する。
では安打という事象に対応する試行は何かというと打席に立つことだろう。1試合フル出場した選手1人に回ってくる打席数はだいたい4か5、多くても6、7である。この程度の試行回数に対して規定打席到達選手が平均で0.93本、イチローが1.62本のヒットを打っているのだから、めったに起こらない事象ではない。ゆえにポアソン分布に従わないのではないか。
もとの記事では2021年セ・リーグ首位打者鈴木誠也の安打数の分布のほうがイチローよりポアソン分布に近いと指摘しているが、これも1994年イチロー(.385)より2021年鈴木誠也(.317)の打率(≒安打を打つ確率)のほうが低いことから自明だと思われる。

サッカーではどうか

一方で、サッカーで1試合あたりの得点数がポアソン分布に従うことは定説のように扱われていて、検索すると数多くの記事がヒットする。
つまりサッカーの得点は試行回数のわりに起きにくい事象ということになるが、ここでの試行とは何か。
以下のページの説明を引用してみる。

サッカーは得点の少ないスポーツです.その一方,得点が決まる最小単位の時間,10秒くらいを考えればよいでしょうか,に対して試合時間は90分と非常に長いです.すると,サッカーでの得点は,「挑戦回数が多いものの成功回数が少ないできごと」と解釈できます.

プロサッカーの場合,1試合1チーム当たりの平均得点は1.30(2017年J1)くらいで,試合時間の最小単位を10秒とすると,成功確率が0.0024のできごとに対して540回(=90*60/10)挑戦したときの成功回数が得点となります.成否は確率的なので,成功回数(つまり,得点)も確率的にばらつくことになります.

www-ie.meijo-u.ac.jp

この仮定は妥当なのだろうか。最終的には得点することを目標にしてプレーしているとはいえ、あらゆる10秒単位の時間を得点に対する試行と考えることに無理はないか。
もっと単純に、野球における打席のような試行をサッカーで考えてみれば、シュートになるのではないか。
1試合のシュート数くらいの大きさをパラメータに設定した二項分布は、ぱっと見にはポアソン分布に近いかもしれない。
上のページにあわせ2017年J1リーグのデータを使うと、以下によれば1試合1チーム当たりの平均得点は1.30、平均シュート数は12.95である。
www.football-lab.jp
そこで12.95と1.30/12.95をパラメータとする二項分布をパラメータ1.30のポアソン分布とあわせて描画してみる。

試行回数13くらいで二項分布はポアソン分布とそう変わらない形状になっているように見える。
一方、実データへの当てはまりはどちらがよりよいのか。
集計データが入手できなかったので、上のページと目視で比較するくらいしかできないのだが、得点数0、1ではポアソン分布の当てはまりがよく、2では二項分布の当てはまりがよいか。

これだけの結果で断言はできないが、シュート数を試行回数にすることも単純に過ぎるのだろう。実際、シュートではないが得点に結びつきうるプレーは数多くあるはずだ。
実用上、得点数の近似はポアソン分布で十分なのだろうが、より真に迫った分布と試行回数が解明されれば、スポーツアナリティクスへの貢献になるのかもしれない。