Statistische Signifikanz: Definition, Konzept, Signifikanz, Regressionsgleichungen und Hypothesentests

Inhaltsverzeichnis:

Statistische Signifikanz: Definition, Konzept, Signifikanz, Regressionsgleichungen und Hypothesentests
Statistische Signifikanz: Definition, Konzept, Signifikanz, Regressionsgleichungen und Hypothesentests

Video: Statistische Signifikanz: Definition, Konzept, Signifikanz, Regressionsgleichungen und Hypothesentests

Video: Statistische Signifikanz: Definition, Konzept, Signifikanz, Regressionsgleichungen und Hypothesentests
Video: Einfache Lineare Regression Basics | Statistik | Mathe by Daniel Jung 2024, Kann
Anonim

Statistiken sind seit langem ein fester Bestandteil des Lebens. Die Menschen sind überall damit konfrontiert. Anhand von Statistiken werden Rückschlüsse gezogen, wo und welche Krankheiten verbreitet sind, was in einer bestimmten Region oder bei einem bestimmten Bevölkerungssegment stärker nachgefragt wird. Sogar die Konstruktion politischer Programme von Kandidaten für Regierungsgremien basiert auf statistischen Daten. Sie werden auch von Einzelhandelsketten beim Einkauf von Waren verwendet, und Hersteller orientieren sich in ihren Vorschlägen an diesen Daten.

Statistik spielt eine wichtige Rolle im Leben der Gesellschaft und betrifft jedes einzelne ihrer Mitglieder, auch in kleinen Dingen. Wenn zum Beispiel laut Statistik die meisten Menschen dunkle Farben in der Kleidung in einer bestimmten Stadt oder Region bevorzugen, dann wird es äußerst schwierig sein, einen leuchtend gelben Regenmantel mit Blumendruck in lokalen Geschäften zu finden. Aber welche Mengensummieren sich diese Daten, um eine solche Wirkung zu haben? Was ist zum Beispiel „statistisch signifikant“? Was genau ist mit dieser Definition gemeint?

Was ist das?

Statistik als Wissenschaft besteht aus einer Kombination verschiedener Größen und Konzepte. Eines davon ist das Konzept der „statistischen Signifikanz“. Dies ist der Name des Werts von Variablen, bei denen die Wahrscheinlichkeit des Auftretens anderer Indikatoren vernachlässigbar ist.

Berechnung statistischer Kennzahlen
Berechnung statistischer Kennzahlen

Zum Beispiel ziehen 9 von 10 Menschen Gummischuhe an, während sie nach einer regnerischen Nacht morgens im Herbstwald nach Pilzen suchen. Die Wahrscheinlichkeit, dass irgendwann 8 von ihnen Leinwandmokassins anziehen, ist vernachlässigbar. In diesem speziellen Beispiel ist die Zahl 9 also das, was man „statistische Signifikanz“nennt.

Dementsprechend, wenn wir das gegebene Praxisbeispiel weiterentwickeln, kaufen Schuhgeschäfte Gummistiefel zum Ende der Sommersaison in größeren Mengen als zu anderen Jahreszeiten. Die Größe des statistischen Werts hat also Auswirkungen auf das gewöhnliche Leben.

Natürlich werden bei komplexen Berechnungen, etwa bei der Vorhersage der Ausbreitung von Viren, eine Vielzahl von Variablen berücksichtigt. Aber das Wesen der Bestimmung eines signifikanten Indikators für statistische Daten ist ähnlich, unabhängig von der Komplexität der Berechnungen und der Anzahl der Variablenwerte.

Wie wird es berechnet?

Wird verwendet, wenn der Wert des Indikators "statistische Signifikanz" der Gleichung berechnet wird. Das heißt, man kann argumentieren, dass in diesem Fall alles von der Mathematik entschieden wird. Die einfachste Rechenmöglichkeit ist eine Kette mathematischer Operationen, an der folgende Parameter beteiligt sind:

  • zwei Arten von Ergebnissen, die aus Umfragen oder dem Studium objektiver Daten stammen, wie z. B. die Anzahl der Einkäufe, gekennzeichnet durch a und b;
  • Stichprobengrößenindikator für beide Gruppen – n;
  • Wert des kombinierten Stichprobenanteils - p;
  • Standardfehler - SE.

Der nächste Schritt besteht darin, das Gesamttestergebnis zu bestimmen - t, sein Wert wird mit der Zahl 1,96 verglichen. 1,96 ist der Durchschnittswert, der einen Bereich von 95 % gemäß der t-Verteilungsfunktion des Schülers angibt.

Formel für einfache Berechnung
Formel für einfache Berechnung

Oft stellt sich die Frage, was der Unterschied zwischen den Werten von n und p ist. Diese Nuance lässt sich leicht an einem Beispiel verdeutlichen. Nehmen wir an, dass die statistische Signifikanz der Loyalität gegenüber einem Produkt oder einer Marke von Männern und Frauen berechnet wird.

In diesem Fall steht hinter den Buchstaben:

  • n - Anzahl der Befragten;
  • p - Anzahl der mit dem Produkt zufriedenen.

Die Anzahl der befragten Frauen wird in diesem Fall mit n1 bezeichnet. Dementsprechend Männer - n2. Derselbe Wert hat die Zahlen "1" und "2" des Symbols p.

Der Vergleich des Testergebnisses mit dem Durchschnitt der Tabellenkalkulationen des Schülers wird zu dem, was als "statistische Signifikanz" bezeichnet wird.

Was ist mit Bestätigung gemeint?

Die Ergebnisse jeder mathematischen Berechnung können immer überprüft werden, dies wird Kindern in der Grundschule beigebracht. Es ist logisch anzunehmenDa die Statistik anhand der Rechenkette ermittelt wird, werden sie überprüft.

Testen auf statistische Signifikanz ist jedoch nicht nur Mathematik. Die Statistik befasst sich mit einer großen Anzahl von Variablen und verschiedenen Wahrscheinlichkeiten, die bei weitem nicht immer einer Berechnung zugänglich sind. Das heißt, wenn wir auf das Beispiel der Gummischuhe am Anfang des Artikels zurückkommen, kann die logische Konstruktion statistischer Daten, auf die sich Käufer von Waren für Geschäfte verlassen, durch trockenes und heißes Wetter gestört werden, was für den Herbst nicht typisch ist. Als Folge dieses Phänomens wird die Zahl der Käufer von Gummistiefeln zurückgehen und die Verkaufsstellen werden Verluste erleiden. Natürlich ist eine mathematische Formel nicht in der Lage, eine Wetteranomalie vorherzusagen. Dieser Moment wird „Fehler“genannt.

Tools zur Visualisierung statistischer Daten
Tools zur Visualisierung statistischer Daten

Das ist nur die Wahrscheinlichkeit solcher Fehler und berücksichtigt die Überprüfung des berechneten Signifikanzniveaus. Es berücksichtigt sowohl berechnete Indikatoren als auch akzeptierte Signifikanzniveaus sowie Größen, die herkömmlicherweise als Hypothesen bezeichnet werden.

Was ist das Signifikanzniveau?

Das Konzept des "Niveaus" ist in den Hauptkriterien für statistische Signifikanz enth alten. Es wird in der angewandten und praktischen Statistik verwendet. Das ist eine Art Wert, der die Wahrscheinlichkeit möglicher Abweichungen oder Fehler berücksichtigt.

Das Niveau basiert auf der Identifizierung von Unterschieden in vorgefertigten Proben und ermöglicht es Ihnen, ihre Signifikanz oder umgekehrt die Zufälligkeit festzustellen. Dieses Konzept hat nicht nur digitale Bedeutungen, sondern auch ihre eigentümlichen Interpretationen. Sie erklärenwie Sie den Wert verstehen müssen, und das Niveau selbst bestimmt wird, indem das Ergebnis mit dem Durchschnittsindex verglichen wird, zeigt dies den Grad der Zuverlässigkeit der Unterschiede.

Diskussion über Statistiken
Diskussion über Statistiken

Daher können wir uns das Konzept eines Niveaus einfach vorstellen - es ist ein Indikator für einen akzeptablen, wahrscheinlichen Fehler oder Fehler in den Schlussfolgerungen, die aus den erh altenen statistischen Daten gezogen werden.

Welche Signifikanzniveaus werden verwendet?

Die statistische Signifikanz von Fehlerwahrscheinlichkeitskoeffizienten in der Praxis basiert auf drei Grundebenen.

Die erste Stufe ist die Schwelle, bei der der Wert 5 % beträgt. Das heißt, die Irrtumswahrscheinlichkeit übersteigt das Signifikanzniveau von 5 % nicht. Das bedeutet, dass das Vertrauen in die Eindeutigkeit und Unfehlbarkeit der auf Basis statistischer Forschungsdaten getroffenen Schlussfolgerungen 95 % beträgt.

Die zweite Ebene ist die 1%-Schwelle. Dementsprechend bedeutet diese Zahl, dass man sich mit 99%iger Sicherheit an den Daten orientieren kann, die bei statistischen Berechnungen gewonnen wurden.

Dritte Stufe - 0,1 %. Bei diesem Wert liegt die Fehlerwahrscheinlichkeit bei einem Bruchteil eines Prozents, d.h. Fehler sind praktisch ausgeschlossen.

Was ist eine Hypothese in der Statistik?

Fehler als Konzept werden in zwei Bereiche unterteilt, die die Annahme oder Ablehnung der Nullhypothese betreffen. Eine Hypothese ist ein Konzept, hinter dem sich laut Definition eine Reihe von Umfrageergebnissen, sonstigen Daten oder Aussagen verbirgt. Das heißt, eine Beschreibung der Wahrscheinlichkeitsverteilung von etwas, das mit dem Thema statistische Buchh altung zu tun hat.

statistische Signifikanz der Regression
statistische Signifikanz der Regression

Bei einfachen Berechnungen gibt es zwei Hypothesen - Null und Alternative. Der Unterschied zwischen ihnen besteht darin, dass die Nullhypothese auf der Idee basiert, dass es keine grundlegenden Unterschiede zwischen den Stichproben gibt, die an der Bestimmung der statistischen Signifikanz beteiligt sind, und die Alternative dazu völlig entgegengesetzt ist. Das heißt, die Alternativhypothese basiert auf dem Vorhandensein eines signifikanten Unterschieds in diesen Stichproben.

Was sind die Fehler?

Fehler als Konzept in der Statistik stehen in direktem Verhältnis zur Annahme dieser oder jener Hypothese als wahr. Sie können in zwei Richtungen oder Typen unterteilt werden:

  • der erste Typ ist auf die Annahme der Nullhypothese zurückzuführen, die sich als falsch herausstellte;
  • zweite - verursacht durch Befolgen der Alternative.
Statistische Diagramme anzeigen
Statistische Diagramme anzeigen

Die erste Art von Fehler wird falsch positiv genannt und ist in allen Bereichen, in denen Statistiken verwendet werden, recht häufig. Dementsprechend wird der Fehler der zweiten Art als falsch negativ bezeichnet.

Warum brauchen wir Regression in der Statistik?

Die statistische Signifikanz der Regression besteht darin, dass mit ihrer Hilfe festgestellt werden kann, wie sehr das anhand der Daten berechnete Modell verschiedener Abhängigkeiten der Realität entspricht; ermöglicht es Ihnen, die Angemessenheit oder das Fehlen von Faktoren für die Rechnungslegung und Schlussfolgerungen zu identifizieren.

Der Regressionswert wird bestimmt, indem die Ergebnisse mit den in den Fisher-Tabellen aufgeführten Daten verglichen werden. Oder mit Varianzanalyse. Regressionsindikatoren sind wichtig, wennkomplexe statistische Studien und Berechnungen mit einer großen Anzahl von Variablen, Zufallsdaten und wahrscheinlichen Änderungen.

Empfohlen: