<?xml version="1.0" encoding="UTF-8"?><!-- generator="wordpress.com" -->
<rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	>

<channel>
	<title>statistik-fussball &amp;laquo; WordPress.com Tag Feed</title>
	<link>http://en.wordpress.com/tag/statistik-fussball/</link>
	<description>Feed of posts on WordPress.com tagged "statistik-fussball"</description>
	<pubDate>Mon, 04 Jan 2010 03:24:10 +0000</pubDate>

	<generator>http://en.wordpress.com/tags/</generator>
	<language>en</language>

<item>
<title><![CDATA[Ist die Relegation fair?]]></title>
<link>http://ballbesitz.wordpress.com/2008/02/23/ist-die-relegation-fair/</link>
<pubDate>Sat, 23 Feb 2008 11:28:49 +0000</pubDate>
<dc:creator>ballbesitz</dc:creator>
<guid>http://ballbesitz.wordpress.com/2008/02/23/ist-die-relegation-fair/</guid>
<description><![CDATA[[Vorbemerkung: Die Autorin freut sich, Jan als ersten Gastblogger begrüssen zu dürfen, viel Vergnüge]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p><span class="Apple-style-span" style="font-style:italic;">[Vorbemerkung: Die Autorin freut sich, <span class="Apple-style-span" style="font-weight:bold;">Jan</span> als ersten Gastblogger begrüssen zu dürfen, viel Vergnügen beim Lesen!]</span>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Im kommenden Jahr wird es, wie schon zwischen 1982 und 1991, Relegationsspiele geben. Der geneigte Anhänger der, sagen wir einmal, SpVgg Greuther Fürth wird sich sicher fragen, ob dies gerecht ist, da dies die Chancen auf Aufstieg in die Bundesliga ab der nächsten Saison schmälern wird.</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Bevor jetzt der Anhänger eines latent abstiegsgefährdeten Erstliga-Vereins aufschreit, versuchen wir mal, das ganze statistisch anzugehen. Was ist ein gutes Maß dafür, wie viele Vereine auf- und absteigen dürfen? Ein paar Vorschläge:</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">a) Der aufsteigende Verein sollte eine mindestens 50%-ige Chance haben, das erste Bundesligajahr zu überstehen.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">b) Die Chance sollte so groß sein, dass nur 1 Aufsteiger im Mittel absteigt.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">c) Der Verein sollte sich dauerhaft in der 1. Liga etablieren können.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">d) Der Aufsteiger sollte stärker sein als ein Absteiger.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">e) Der Aufsteiger sollte stärker sein als alle Absteiger.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">f) Der Verein sollte finanziell zum Wohlergehen der 1. Liga beitragen.</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Letzteres klingt abstrus? &#8211; In der Tat sind Varianten von a)-f) in verschiedenen Sportarten durchaus realisiert. Z.B. kann man eine höhere Liga nach einer bestimmten Zahl von Spielen teilen, und die unteren x Vereine mit den oberen y Vereine der nächstunteren Liga eine Teilrunde spielen lassen (eine Variante von d) und e)). Eine andere Variante von d) und e) sind Relegationsspiele, oder gar Relegationsturniere. f) ist eher in amerikanischen oder amerikanisch geprägten Ligen ein Thema. Diese Variante ist jedoch nicht weit entfernt von c) &#8211; eine hohe Finanzkraft kann durchaus ein Indiz für die Chance zur dauerhaften Etablierung sein. Gibt es ein anderes Maß dafür, ob sich ein Verein dauerhaft etablieren kann? Hier könnte uns die Statistik helfen. Jedoch &#8211; das wollen wir hier zunächst nicht betrachten. Aufgrund der relativ hohen Zahl der Auf- und Absteiger im Fußball setzen wir voraus, dass nicht c) die Voraussetzung für Aufstieg ist, sondern eine Variante von a) &#38; b). Kurz gesagt: Ein Aufsteiger sollte momentan (und das ist der springende Punkt!) stark genug sein, um sich in der 1. Liga durchzusetzen. Und, das naheliegendste Maß für Durchsetzen ist &#8211; in unserer Betrachtung &#8211; Nicht-Abstieg.</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Wenden wir uns wieder ein wenig der Statistik zu: Mit welcher Wahrscheinlichkeit sollte ein Aufsteiger die Klasse halten? Spontane Meinung bitte! </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">&#8230;</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Ich denke, 50% klingt zunächst fair. Das würde bedeuten, im Mittel ist die Hälfte der Aufsteiger gut genug, nicht abzusteigen. Einwände? Gut! Bevor wir weitere Betrachtungen starten, widmen wir uns doch &#8211; Daten. (NB: Es geht doch nichts über Daten!)</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Welche Plätze in der 1. Liga erreichten die Aufsteiger in den zurückliegenden 10 Jahren? Die Verteilung ist im folgenden Bild dargestellt:</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;"><a href="http://ballbesitz.wordpress.com/files/2008/02/platzierungen-aufsteiger.png" title="platzierungen-aufsteiger.png"><img src="http://ballbesitz.wordpress.com/files/2008/02/platzierungen-aufsteiger.png" alt="platzierungen-aufsteiger.png" width="400" /></a></p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Wir sehen, dass ein Aufsteiger im Durchschnitt zwischen Rang 13 und 14 erreicht. Die Streuung ist durchaus relativ breit. Und der Ausreißer nach oben ist auch noch knapp drin. Zurück zum Thema: Wie groß ist die Wahrscheinlichkeit, dass ein Aufsteiger die Klasse hält? Zählen wir die Platzierungen von 16-18 &#8211; es sind 11. Bei 30 Absteigern ergibt das eine Wahrscheinlichkeit von ca. 63%, nicht abzusteigen. Das sind deutlich mehr als 50%! In guter Näherung wollen wir sagen: Nur jeder dritte Aufsteiger steigt wieder ab &#8211; das heißt, im Mittel genau einer der Aufsteiger. Klingt das nicht fair? Das heißt, die Aufsteiger steigen mit deutlich mehr als 50%-iger Wahrscheinlichkeit nicht wieder ab und sind damit zu fast 2/3 reif für die 1. Liga.</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Unser freundlicher Fan von Greuther Fürth wird sich jetzt, hoffentlich, ärgern: Die Aufsteiger können offensichtlich mehr als mithalten, und jetzt werden Relegationsspiele eingeführt? Und vielleicht fordern sie gar den 4. Aufsteiger. Es gibt, selbstverständlich, Argumente für die Gegenseite: </p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">1) Die Fluktuation zwischen 1. und 2. Liga sollte nicht zu hoch sein &#8211; Stichworte: Planbarkeit, Sicherheit.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">2) Die Aufsteiger haben einen Aufstiegsbonus (Schwung aus der Vorsaison, etc.), und deshalb ist 50% etwas niedrig angesetzt.</p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">3) Der beste Aufsteiger ist vielleicht gut genug für die 1. Liga, aber ist es deshalb auch der zweitbeste, oder gar der Drittplatzierte der 2. Liga?</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Während die ersten beiden Punkte etwas schwer zu fassen sind &#8211; aber sicher Zustimmung finden, ich denke, wir können uns darauf einigen, dass ein Wert jenseits von 50% Klassenerhaltswahrscheinlichkeit durchaus sinnvoll ist &#8211; klingt Punkt 3 doch sehr naheliegend. Jeder dritte Aufsteiger steigt wieder ab, also lassen wir einfach nur die beiden hoch, die drinbleiben.</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;">Hier unterbrechen wir einmal kurz. Klang das nicht alles zu sehr nach der Perspektive der 2. Liga? Warum fragen wir uns nicht, ob die Zahl von 3 Absteigern fair ist? Genug der Worte, lassen wir Daten sprechen, über die der Leser sich Gedanken machen kann &#8211; die Platzierungen der 1. Liga-Absteiger in der 2. Liga der letzten 10 Jahre:</p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p style="font:normal normal normal 12px/normal Helvetica;margin:0;"><a href="http://ballbesitz.wordpress.com/files/2008/02/platzierungen-absteiger.png" title="platzierungen-absteiger.png"><img src="http://ballbesitz.wordpress.com/files/2008/02/platzierungen-absteiger.png" width="400" alt="platzierungen-absteiger.png" /></a></p>
<p style="font:normal normal normal 12px/normal Helvetica;min-height:14px;margin:0;"> </p>
<p><span class="Apple-style-span" style="font-family:Helvetica;font-size:12px;line-height:normal;">Um zu sehen, was man mit Statistik noch alles machen kann, gibt es &#8211; demnächst &#8211; einen 2. Teil</span> </p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Wann fällt es denn, das Tor?]]></title>
<link>http://ballbesitz.wordpress.com/2008/02/11/wann-fallt-es-denn-das-tor/</link>
<pubDate>Sun, 10 Feb 2008 23:21:43 +0000</pubDate>
<dc:creator>ballbesitz</dc:creator>
<guid>http://ballbesitz.wordpress.com/2008/02/11/wann-fallt-es-denn-das-tor/</guid>
<description><![CDATA[Jeder (regelmäßige Stadionbesucher) kennt das Problem: das Bier ist leer, man muss auf Toilette und ]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p align="justify">Jeder (regelmäßige Stadionbesucher) kennt das Problem: das Bier ist leer, man muss auf Toilette und in der Halbzeit ist es zu voll, aber man will das entscheidende Siegtor der eigenen Mannschaft  natürlich nicht verpassen, auch wenn es in den moderneren Stadien praktischerweise auch an den Wurstständen Bildschirme gibt.</p>
<p align="justify">Wüsste man also, wann das nächste Tor wahrscheinlicherweise fallen würde, könnte man seine Bedürfnisse darauf einstellen und eben genau dann den Platz verlassen, wenn es höchst wahrscheinlich nicht fällt. Dass es dann erfahrungsgemäß natürlich doch dann fällt, muss ich nicht erwähnen.</p>
<p align="justify">Also habe ich mir mal angeguckt, wann es denn so fällt, das Tor. Berücksichtigt sind alle Tore der letzten 19 Spieltage in der 1.Fussballbundesliga. Erste Liga deshalb, weil ich den aktuellen Spieltag berücksichtigen wollte und in der zweiten noch ein Spiel fehlt (auch wenn dort natürlich die entscheidenden Tore meiner Mannschaft praktisch im Minutentakt fallen werden, ist ja klar).</p>
<p align="justify">Insgesamt sind also an den letzten 19 Spieltagen <span style="font-weight:bold;" class="Apple-style-span">489</span> Tore gefallen. Das heißt, im Durchschnitt fallen pro Spieltag <span style="font-weight:bold;" class="Apple-style-span">25.7 </span>Tore bzw. pro Partie <span style="font-weight:bold;" class="Apple-style-span">2.85</span> Tore.  Umgerechnet auf 93 Spielminuten, um auch die spätesten Tore in der Nachspielzeit zu berücksichtigen, sollten also in jeder Minute <span style="font-weight:bold;" class="Apple-style-span">5.258</span> Tore gefallen sein, wenn man animmt, dass die Wahrscheinlichkeit für ein Tor in jeder Spielminute gleich hoch ist.</p>
<p align="justify">In der Realität sieht das ganze dann so aus:</p>
<p align="justify"><span class="Apple-style-span" style="color:#0000ee;text-decoration:underline;"><a href="http://ballbesitz.wordpress.com/files/2008/02/spielminute1.jpg" title="spielminute1.jpg"><img src="http://ballbesitz.wordpress.com/files/2008/02/spielminute1.jpg" width="400" alt="spielminute1.jpg" /></a></span></p>
<p align="justify">Die rote Linie zeigt den Durchschnittswert von 5.258 Toren an, die Punkte stehen für die tatsächlich gefallene Anzahl Tore in jeder Spielminute.</p>
<p align="justify">Man sieht deutlich, dass die Wahrscheinlichkeit für ein Tor in den ersten ~30 Spielminuten unter dem Durchschnitt liegt, allerdings ist dann das Bedürfnis für einen Besuch von Toilette/Bierbude wohl auch am geringsten.</p>
<p align="justify">Auf jeden Fall sollte man in der <b>36</b>. Minute auf seinem Platz sein, schon <b>14 </b>Tore sind zu diesem Zeitpunkt gefallen. Zum späteren Zeitpunkt empfehlenswert wären also die <b>58.</b> Spielminute und die <span style="font-weight:bold;" class="Apple-style-span">71</span>. Spielminute, allerdings sollte man sich auch dann etwas beeilen.</p>
<p align="justify">Erstaunlich finde ich, dass kurz vor Spielschluss bzw. auch kurz vor der Halbzeit gar nicht so viele Tore fallen, wie man (ich) das so denkt. Dazu die gleichen Tore nochmal unterteilt in 10minütige Pakete:</p>
<p align="justify"><span class="Apple-style-span" style="text-decoration:underline;color:#0000ee;"><a href="http://ballbesitz.wordpress.com/files/2008/02/spielphase.jpg" title="spielphase.jpg"><img src="http://ballbesitz.wordpress.com/files/2008/02/spielphase.jpg" alt="spielphase.jpg" width="400" /></a></span></p>
<p align="justify">Das Verhalten lässt sich schon relativ einfach durch ein Polynom 2.Grades beschreiben:</p>
<p align="justify"><a href="http://ballbesitz.wordpress.com/files/2008/02/spielphasefit.jpg" title="spielphasefit.jpg"><img src="http://ballbesitz.wordpress.com/files/2008/02/spielphasefit.jpg" alt="spielphasefit.jpg" width="400" /></a></p>
<p align="justify">Merke also: nicht alle Tore fallen in der letzten Minute, sondern die meisten in der 36.!</p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Torschusseffizienz und Exponentialfunktionen]]></title>
<link>http://ballbesitz.wordpress.com/2007/11/22/torschusseffizienz-und-exponentialfunktionen/</link>
<pubDate>Thu, 22 Nov 2007 21:59:12 +0000</pubDate>
<dc:creator>ballbesitz</dc:creator>
<guid>http://ballbesitz.wordpress.com/2007/11/22/torschusseffizienz-und-exponentialfunktionen/</guid>
<description><![CDATA[Ein weiterer Beitrag aus der Reihe &#8220;auch der Fussball folgt statistischen Gesetzen&#8221;, nac]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Ein weiterer Beitrag aus der Reihe &#8220;auch der Fussball folgt statistischen Gesetzen&#8221;, nach dem Einstieg mit der Gauß-Verteilung folgt nun die Exponentialfunktion.<br />
Allgemein kann man jede Funktion der Form<br />
<img src='http://l.wordpress.com/latex.php?latex=%5Cmathsf%7By%28x%29+%3D+a%5Ex%7D+&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{y(x) = a^x} ' title='\mathsf{y(x) = a^x} ' class='latex' /><br />
als Exponentialfunktion bezeichnen, die spannendste und gebräuchlichste ist aber eine Funktion<br />
<img src='http://l.wordpress.com/latex.php?latex=%5Cmathsf%7By%28x%29+%3D+A+%5Ccdot+e%5E%7Bb+%5Ccdot+x%7D%7D+&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{y(x) = A \cdot e^{b \cdot x}} ' title='\mathsf{y(x) = A \cdot e^{b \cdot x}} ' class='latex' /></p>
<p>Damit zum Fussball. Mit einem Spieltag mehr, d.h. jetzt den Spieltagen 1,2,3,4,5 und 13 der laufenden 2.Liga-Saison gucke ich mir jetzt das Verhältnis der geschossenen Tore zur Anzahl der Torschüsse (die <b>Torschusseffizienz</b>) jeder Mannschaft an jedem dieser Spieltage an &#8211; diese Daten sind mit einem roten Punkt im Plot gekennzeichnet, der Fehler ergibt sich als Wurzel aus der Anzahl der Einträge pro Bin (Bins sind die Abschnitte, in die die x-Achse unterteilt ist). </p>
<p><a href='http://ballbesitz.wordpress.com/files/2007/11/torfractionb.jpg' title='torfractionb.jpg'><img src='http://ballbesitz.wordpress.com/files/2007/11/torfractionb.jpg' alt='torfractionb.jpg' width="400/"></a></p>
<p>Grundsätzlich sieht man, guckt man nur auf die roten Punkte, schonmal, dass jede Mannschaft mindestens zwei Torschüsse braucht um ein Tor zu schiessen, denn sonst hätten wir auf der x-Achse Einträge jenseits von 0.5. Insgesamt bedeutet z.B. ein Wert von 0.1 auf der x-Achse, dass diese Mannschaft pro Torschuss 0.1 Tore geschossen hat, d.h. also 10 Versuche für ein Tor gebraucht hat.<br />
Auch der große Anteil der Einträge bei 0 lässt sich erklären &#8211; schiesst eine Mannschaft keine Tore, ist natürlich auch das Verhältnis der geschossenen Tore zu den Torschüssen 0. </p>
<p>Insgesamt sieht man daran schon, dass die meisten Torschüsse &#8220;vergeblich&#8221; sind, nur die wenigsten Mannschaften haben eine hohe Torschusseffizienz. Trotzdem kann aber natürlich auch eine Mannschaft A mit einer Effizienz von 0.1 gegen eine Mannschaft B mit einer Effizienz von 0.2 (jeweils für ein einziges Spiel) gewinnen &#8211; die Mannschaft A muss nur mehr als doppelt so oft aufs Tor schiessen wie Mannschaft B.</p>
<p>Zurück zum Plot:<br />
Um den Abfall der Einträge zu höheren Werten zu beschreiben bietet sich eben eine e-Funktion an, deren Fit, d.h. die bestmögliche Anpassung einer Funktion an die Daten, durch die schwarze Kurve dargestellt ist. Die zugehörige Formel (ohne Fehler auf die Fitparameter) ist ebenfalls angegeben.</p>
<p>Vergleicht man die schwarze Kurve mit den Datenpunkten, sieht man eine gute Übereinstimmung innerhalb der Fehler &#8211; ein Maß dafür ist das &#8220;Chi-Quadrat per Freiheitsgrad&#8221;, in der Box rechts als <img src='http://l.wordpress.com/latex.php?latex=%5Cmathsf%7B%5Cchi%5E2+%2F+ndof%7D&#038;bg=ffffff&#038;fg=000000&#038;s=0' alt='\mathsf{\chi^2 / ndof}' title='\mathsf{\chi^2 / ndof}' class='latex' />. Liegt das Resultat im Bereich von 1, ist der Fit gelungen. </p>
<p>Zusätzlich kann man noch die Skala der y-Achse ändern, denn die Umkehrfunktion einer e-Funktion ist der <i>logarithmus naturalis</i>, in dieser Darstellung sollte der Zusammenhang also linear sein &#8211; und siehe da, logarithmiert man die y-Achse, sieht man deutlich, dass die Datenpunkte in etwa auf einer Linie liegen:</p>
<p><a href='http://ballbesitz.wordpress.com/files/2007/11/torfractionlog.jpg' title='torfractionlog.jpg'><img src='http://ballbesitz.wordpress.com/files/2007/11/torfractionlog.jpg' alt='torfractionlog.jpg' width="400" /></a></p>
</div>]]></content:encoded>
</item>
<item>
<title><![CDATA[Gauß und die Pässe - ein erster Versuch]]></title>
<link>http://ballbesitz.wordpress.com/2007/11/20/gaus-und-die-passe-ein-erster-versuch/</link>
<pubDate>Tue, 20 Nov 2007 13:28:58 +0000</pubDate>
<dc:creator>ballbesitz</dc:creator>
<guid>http://ballbesitz.wordpress.com/2007/11/20/gaus-und-die-passe-ein-erster-versuch/</guid>
<description><![CDATA[Wie wir alle wissen (spätestens jetzt) folgen nach dem zentralen Grenzwertsatz alle unkorrelierten Z]]></description>
<content:encoded><![CDATA[<div class='snap_preview'><p>Wie wir alle wissen (spätestens jetzt) folgen nach dem <a href="http://de.wikipedia.org/wiki/Zentraler_Grenzwertsatz">zentralen Grenzwertsatz</a> alle unkorrelierten <a href="http://de.wikipedia.org/wiki/Normalverteilung">Zufallsvariablen</a> irgendwann einer Gauß-Verteilung. Wie sehr der Fussball also der Statistik bzw. dem Zufall unterliegt, wird sich zeigen, wenn man sich mal <i>Fussballvariablen</i> unter diesem Gesichtspunkt ansieht.</p>
<p>Und siehe da:<br />
<a href='http://ballbesitz.wordpress.com/files/2007/11/paesse.png' title='paesse'><img src='http://ballbesitz.wordpress.com/files/2007/11/paesse.png' alt='paesse' width="400/"></a><br />
(Ich weiß, liebe Physiker, das Binning ist suboptimal&#8230;)</p>
<p>Man sieht die Anzahl der Pässe einer Mannschaft pro Spiel, das ganze für alle Mannschaften der 2.Liga an den Spieltagen 1,2,3,4 und 13 der aktuellen Saison 2007/2008.<br />
Der eine Ausreißer nach rechts ist übrigens die Anzahl der Pässe des 1.FC Köln bei der Heimniederlage gegen Alemannia Aachen. </p>
<p>Trotz der relativ geringen Statistik von nur 90 Einträgen passt der Gauß-Fit schon ganz gut, mehr dann, wenn ich mehr Statistik habe.</p>
</div>]]></content:encoded>
</item>

</channel>
</rss>
