Haupt » Makler » T-Test

T-Test

Makler : T-Test
Was ist ein T-Test?

Ein t-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen zusammenhängen können. Es wird meistens verwendet, wenn die Datensätze, wie der Datensatz, der als Ergebnis des 100-maligen Münzwurfs aufgezeichnet wurde, einer Normalverteilung folgen und möglicherweise unbekannte Abweichungen aufweisen. Ein t-Test wird als Hypothesentest-Tool verwendet, mit dem eine für eine Population geltende Annahme getestet werden kann.

Ein t-Test untersucht die t-Statistik, die t-Verteilungswerte und die Freiheitsgrade, um die Wahrscheinlichkeit eines Unterschieds zwischen zwei Datensätzen zu bestimmen. Um einen Test mit drei oder mehr Variablen durchzuführen, muss eine Varianzanalyse durchgeführt werden.

1:38

T-Test

Den T-Test erklären

Im Wesentlichen können wir mit einem t-Test die Durchschnittswerte der beiden Datensätze vergleichen und feststellen, ob sie aus derselben Grundgesamtheit stammen. Wenn wir in den obigen Beispielen eine Stichprobe von Schülern der Klasse A und eine weitere Stichprobe von Schülern der Klasse B nehmen würden, würden wir nicht erwarten, dass sie genau den gleichen Mittelwert und die gleiche Standardabweichung aufweisen. In ähnlicher Weise sollten Proben aus der mit Placebo gefütterten Kontrollgruppe und Proben aus der mit dem Medikament verschriebenen Gruppe einen geringfügig anderen Mittelwert und eine etwas andere Standardabweichung aufweisen.

Mathematisch nimmt der t-Test eine Stichprobe aus jeder der beiden Mengen und stellt die Problemstellung her, indem er eine Nullhypothese annimmt, dass die beiden Mittelwerte gleich sind. Basierend auf den anwendbaren Formeln werden bestimmte Werte berechnet und mit den Standardwerten verglichen, und die angenommene Nullhypothese wird entsprechend akzeptiert oder abgelehnt.

Wenn die Nullhypothese abgelehnt werden kann, bedeutet dies, dass die Daten stark und nicht zufällig gelesen werden. Der t-Test ist nur einer von vielen Tests, die für diesen Zweck verwendet werden. Statistiker müssen zusätzlich andere Tests als den T-Test verwenden, um mehr Variablen und Tests mit größeren Stichprobengrößen zu untersuchen. Für eine große Stichprobe verwenden Statistiker einen Z-Test. Weitere Testmöglichkeiten sind der Chi-Quadrat-Test und der F-Test.

Es gibt drei Arten von T-Tests, die als abhängige und unabhängige T-Tests klassifiziert werden.

Die zentralen Thesen

  • Ein t-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen zusammenhängen können.
  • Der t-Test ist einer von vielen Tests, die zum Testen von Hypothesen in der Statistik verwendet werden.
  • Die Berechnung eines t-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.
  • Es gibt verschiedene Arten von T-Tests, die abhängig von den erforderlichen Daten und der Art der Analyse durchgeführt werden können.

Mehrdeutige Testergebnisse

Bedenken Sie, dass ein Arzneimittelhersteller ein neu erfundenes Arzneimittel testen möchte. Es folgt dem Standardverfahren, bei dem das Medikament an einer Patientengruppe ausprobiert und einer anderen Gruppe, der Kontrollgruppe, ein Placebo verabreicht wird. Das Placebo, das der Kontrollgruppe verabreicht wird, ist eine Substanz ohne beabsichtigten therapeutischen Wert und dient als Benchmark, um zu messen, wie die andere Gruppe, der das eigentliche Arzneimittel verabreicht wird, reagiert.

Nach der Arzneimittelstudie berichteten die Mitglieder der mit Placebo gefütterten Kontrollgruppe über einen Anstieg der durchschnittlichen Lebenserwartung um drei Jahre, während die Mitglieder der Gruppe, denen das neue Arzneimittel verschrieben wurde, einen Anstieg der durchschnittlichen Lebenserwartung um vier Jahre berichteten. Eine sofortige Beobachtung kann darauf hindeuten, dass das Medikament tatsächlich wirkt, da die Ergebnisse für die Gruppe, die das Medikament einnimmt, besser sind. Es ist jedoch auch möglich, dass die Beobachtung auf ein zufälliges Vorkommen zurückzuführen ist, insbesondere auf ein überraschendes Glück. Ein t-Test ist hilfreich, um festzustellen, ob die Ergebnisse tatsächlich korrekt sind und für die gesamte Bevölkerung gelten.

In einer Schule erzielten 100 Schüler der Klasse A durchschnittlich 85% mit einer Standardabweichung von 3%. Weitere 100 Schüler der Klasse B erzielten durchschnittlich 87% mit einer Standardabweichung von 4%. Während der Durchschnitt der Klasse B besser ist als der der Klasse A, kann es nicht richtig sein, zu der Schlussfolgerung zu gelangen, dass die Gesamtleistung der Schüler der Klasse B besser ist als die der Schüler der Klasse A. Dies liegt daran, dass zusammen mit dem Mittelwert ist die Standardabweichung der Klasse B auch höher als die der Klasse A. Dies zeigt, dass ihre extremen Prozentsätze auf der unteren und oberen Seite im Vergleich zu der der Klasse A viel weiter auseinander lagen. Ein t-Test kann dabei helfen, dies festzustellen Welcher Klasse erging es besser?

T-Test Annahmen

  1. Die erste Annahme, die in Bezug auf t-Tests gemacht wurde, betrifft den Maßstab der Messung. Bei einem t-Test wird davon ausgegangen, dass die Messskala für die erfassten Daten einer kontinuierlichen oder ordinalen Skala folgt, z. B. den Bewertungen für einen IQ-Test.
  2. Die zweite getroffene Annahme ist die einer einfachen Zufallsstichprobe, bei der die Daten von einem repräsentativen, zufällig ausgewählten Teil der Gesamtbevölkerung gesammelt werden.
  3. Die dritte Annahme ist, dass die Daten, wenn sie aufgezeichnet werden, zu einer normalverteilten, glockenförmigen Verteilungskurve führen.
  4. Die vierte Annahme ist, dass eine relativ große Stichprobengröße verwendet wird. Eine größere Stichprobe bedeutet, dass sich die Verteilung der Ergebnisse einer normalen glockenförmigen Kurve annähern sollte.
  5. Die letzte Annahme ist die Homogenität der Varianz. Eine homogene oder gleiche Varianz liegt vor, wenn die Standardabweichungen der Stichproben ungefähr gleich sind.

Berechnung von T-Tests

Die Berechnung eines t-Tests erfordert drei Schlüsseldatenwerte. Sie umfassen die Differenz zwischen den Mittelwerten aus jedem Datensatz (als Mittelwertdifferenz bezeichnet), die Standardabweichung jeder Gruppe und die Anzahl der Datenwerte jeder Gruppe.

Das Ergebnis des t-Tests ergibt den t-Wert. Dieser berechnete t-Wert wird dann mit einem Wert verglichen, der aus einer kritischen Wertetabelle (der sogenannten T-Verteilungstabelle) erhalten wurde. Dieser Vergleich hilft zu bestimmen, wie wahrscheinlich es ist, dass die Differenz zwischen den Mitteln zufällig aufgetreten ist oder ob die Datensätze tatsächlich intrinsische Unterschiede aufweisen. Der t-Test fragt, ob der Unterschied zwischen den Gruppen einen wahren Unterschied in der Studie darstellt oder ob es sich wahrscheinlich um einen bedeutungslosen statistischen Unterschied handelt.

T-Verteilungstabellen

Die T-Verteilertabelle ist in den Formaten einseitig und zweiseitig verfügbar. Ersteres wird zur Beurteilung von Fällen verwendet, die einen festen Wert oder Bereich mit einer eindeutigen Richtung (positiv oder negativ) haben. Wie groß ist beispielsweise die Wahrscheinlichkeit, dass der Ausgabewert unter -3 bleibt oder mehr als sieben erreicht, wenn ein Würfelpaar gewürfelt wird? Letzteres wird für die bereichsgebundene Analyse verwendet, z. B. um zu fragen, ob die Koordinaten zwischen -2 und +2 liegen.

Die Berechnungen können mit Standard-Softwareprogrammen durchgeführt werden, die die erforderlichen statistischen Funktionen unterstützen, wie sie in MS Excel enthalten sind.

T-Werte und Freiheitsgrade

Der t-Test liefert zwei Werte als Ausgabe: t-Wert und Freiheitsgrade. Der t-Wert ist ein Verhältnis der Differenz zwischen dem Mittelwert der beiden Stichproben und der Differenz, die innerhalb der Stichproben besteht. Während der Zählerwert (die Differenz zwischen dem Mittelwert der beiden Stichproben) einfach zu berechnen ist, kann der Nenner (die Differenz innerhalb der Stichproben) je nach Art der Datenwerte etwas kompliziert werden. Der Nenner des Verhältnisses ist ein Maß für die Streuung oder Variabilität. Höhere Werte des t-Werts, auch t-Score genannt, weisen darauf hin, dass zwischen den beiden Stichproben ein großer Unterschied besteht. Je kleiner der t-Wert ist, desto mehr Ähnlichkeit besteht zwischen den beiden Stichproben.

  • Ein großer t-Score zeigt an, dass die Gruppen unterschiedlich sind.
  • Ein kleiner t-Score zeigt an, dass die Gruppen ähnlich sind.

Freiheitsgrade beziehen sich auf die Werte in einer Studie, die die Freiheit haben zu variieren und wesentlich für die Beurteilung der Wichtigkeit und der Gültigkeit der Nullhypothese sind. Die Berechnung dieser Werte hängt normalerweise von der Anzahl der im Probensatz verfügbaren Datensätze ab.

Korrelierter (oder gepaarter) T-Test

Der korrelierte t-Test wird durchgeführt, wenn die Stichproben typischerweise aus übereinstimmenden Paaren ähnlicher Einheiten bestehen oder wenn Fälle wiederholter Messungen vorliegen. Beispielsweise kann es vorkommen, dass dieselben Patienten wiederholt getestet werden - vor und nach einer bestimmten Behandlung. In solchen Fällen wird jeder Patient als Kontrollprobe gegen sich selbst verwendet.

Diese Methode gilt auch für Fälle, in denen die Stichproben in irgendeiner Weise verwandt sind oder übereinstimmende Merkmale aufweisen, z. B. eine vergleichende Analyse mit Kindern, Eltern oder Geschwistern. Korrelierte oder gepaarte t-Tests sind von einem abhängigen Typ, da es sich um Fälle handelt, in denen die beiden Stichprobensätze zusammenhängen.

Die Formel zur Berechnung des t-Werts und der Freiheitsgrade für einen gepaarten t-Test lautet:

  • Mean1 und Mean2 sind die Durchschnittswerte der einzelnen Stichproben, während var1 und var2 die Varianz der einzelnen Stichproben darstellen.

Die verbleibenden zwei Typen gehören zu den unabhängigen t-Tests. Die Stichproben dieser Typen werden unabhängig voneinander ausgewählt, dh, die Datensätze in den beiden Gruppen beziehen sich nicht auf dieselben Werte. Dazu gehören Fälle wie eine Gruppe von 100 Patienten, die in zwei Gruppen zu je 50 Patienten aufgeteilt werden. Eine der Gruppen wird zur Kontrollgruppe und erhält ein Placebo, während die andere Gruppe die verschriebene Behandlung erhält. Dies sind zwei unabhängige Stichprobengruppen, die nicht miteinander gepaart sind.

T-Test mit gleicher Varianz (oder gepoolt)

Der t-Test mit gleicher Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe gleich ist oder die Varianz der beiden Datensätze ähnlich ist. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für den t-Test mit gleicher Varianz verwendet:

T-Wert = Mittelwert1 - Mittelwert2 (n1 - 1) × Var12 + (n2 - 1) × Var22n1 + n2 - 2 × 1n1 + 1n2 wobei: Mittelwert1 und Mittelwert2 = Durchschnittswerte von jedem der Probensätze Var1 und Var2 = Varianz von jedem der Beispielsätze n1 und n2 = Anzahl der Datensätze in jedem Beispielsatz \ begin {align} & \ text {T-Wert} = \ frac {mean1 - mean2} {\ sqrt {\ frac {(n1 - 1) \ times var1 ^ 2 + (n2 - 1) \ times var2 ^ 2} {n1 + n2 - 2}} \ times \ sqrt {\ frac {1} {n1} + \ frac {1} {n2}} \\ & \ textbf { Dabei gilt:} \\ & mean1 \ text {und} mean2 = \ text {Durchschnittswerte der einzelnen} \\ & \ text {der Beispielsätze} \\ & var1 \ text {und} var2 = \ text {Varianz der einzelnen Beispielsätze} \\ & n1 \ text {und} n2 = \ text {Anzahl der Datensätze in jedem Beispielsatz} \\ \ end {ausgerichtet} T-Wert = n1 + n2−2 (n1−1) × var12 + (n2 −1) × var22 × n11 + n21 mean1 − mean2 wobei: mean1 und mean2 = Durchschnittswerte der einzelnen Probensätze var1 und var2 = Varianz der einzelnen Probensätze n1 und n2 = Anzahl der Datensätze in jeder Probe einstellen

und,

Freiheitsgrade = n1 + n2−2wo: n1 und n2 = Anzahl der Datensätze in jedem Beispielsatz \ begin {align} & \ text {Freiheitsgrade} = n1 + n2 - 2 \\ & \ textbf {where:} \\ & n1 \ text {und} n2 = \ text {Anzahl der Datensätze in jedem Beispielsatz} \\ \ end {align} Freiheitsgrade = n1 + n2−2where: n1 und n2 = Anzahl der Datensätze in jedem Beispielsatz Für den Fall, dass Sie nicht mehr weiterkommen möchten

Ungleicher Varianz-T-Test

Der t-Test mit ungleicher Varianz wird verwendet, wenn die Anzahl der Stichproben in jeder Gruppe unterschiedlich ist und die Varianz der beiden Datensätze ebenfalls unterschiedlich ist. Dieser Test wird auch als Welch-T-Test bezeichnet. Die folgende Formel wird zur Berechnung des t-Werts und der Freiheitsgrade für einen ungleichen Varianz-t-Test verwendet:

T-Wert = Mittelwert1 - Mittelwert2Var12N1 + Var22N2Wo: Mittelwert1 und Mittelwert2 = Durchschnittswerte der einzelnen ProbensätzeVar1 und Var2 = Varianz der einzelnen ProbensätzeN1 und N2 = Anzahl der Datensätze in jedem Probensatz \ Beginn {ausgerichtet} & \ Text {T-value} = \ frac {mean1 - mean2} {\ sqrt {\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2}} \\ & \ textbf {where:} \ \ & mean1 \ text {und} mean2 = \ text {Durchschnittswerte der einzelnen} \\ & \ text {der Beispielsätze} \\ & var1 \ text {und} var2 = \ text {Varianz der einzelnen Beispielsätze} \ \ & n1 \ text {und} n2 = \ text {Anzahl der Datensätze in jedem Probensatz} \\ \ end {align} T-Wert = n1var12 + n2var22 mean1 - mean2 wobei: mean1 und mean2 = Durchschnittswerte von jedem der Probensätze var1 und var2 = Varianz von jedem der Probensätze n1 und n2 = Anzahl der Datensätze in jedem Probensatz

und,

Freiheitsgrade = (var12n1 + var22n2) 2 (var12n1) 2n1−1 + (var22n2) 2n2−1 wobei: var1 und var2 = Varianz der einzelnen Stichprobenmengen n1 und n2 = Anzahl der Datensätze in jeder Stichprobenmenge \ begin {aligned } & \ text {Freiheitsgrade} = \ frac {\ left (\ frac {var1 ^ 2} {n1} + \ frac {var2 ^ 2} {n2} \ right) ^ 2} {\ frac {\ left ( \ frac {var1 ^ 2} {n1} \ right) ^ 2} {n1 - 1} + \ frac {\ left (\ frac {var2 ^ 2} {n2} \ right) ^ 2} {n2 - 1}} \\ & \ textbf {where:} \\ & var1 \ text {and} var2 = \ text {Varianz der einzelnen Beispielsätze} \\ & n1 \ text {and} n2 = \ text {Anzahl der Datensätze in jedem Beispielsatz } \\ \ end {align} Freiheitsgrade = n1−1 (n1var12) 2 + n2−1 (n2var22) 2 (n1var12 + n2var22) 2 wobei: var1 und var2 = Varianz von jedem of the sample setsn1 and n2 = Anzahl der Datensätze in jedem Sample-Set

Bestimmen des richtigen zu verwendenden T-Tests

Das folgende Flussdiagramm kann verwendet werden, um zu bestimmen, welcher t-Test basierend auf den Eigenschaften der Probensätze verwendet werden soll. Zu den wichtigsten zu berücksichtigenden Punkten gehören die Ähnlichkeit der Stichprobendatensätze, die Anzahl der Datensätze in jedem Stichprobensatz und die Varianz jedes Stichprobensatzes.

Bild von Julie Bang © Investopedia 2019

T-Test-Beispiel für ungleiche Varianz

Angenommen, wir messen die in einer Kunstgalerie erhaltenen Bilder diagonal. Eine Gruppe von Beispielen umfasst 10 Gemälde, während die andere 20 Gemälde umfasst. Die Datensätze mit den entsprechenden Mittel- und Varianzwerten lauten wie folgt:

Set 1Set 2
19.728.3
20.426.7
19.620.1
17.823.3
18.525.2
18.922.1
18.317.7
18.927.6
19.520.6
21, 9513.7
23.2
17.5
20.6
18
23.9
21.6
24.3
20.4
23.9
13.3
Bedeuten19.421.6
Varianz1.417.1

Obwohl der Mittelwert von Satz 2 höher ist als der von Satz 1, können wir nicht den Schluss ziehen, dass alle Gemälde eine durchschnittliche Länge von etwa 21, 6 Einheiten haben, da die Varianz von Satz 2 signifikant höher ist als die von Satz 1. Ist dies zufällig oder gibt es tatsächlich Unterschiede? in der Gesamtbevölkerung aller in der Kunstgalerie erhaltenen Bilder ">

Da die Anzahl der Datensätze unterschiedlich ist (n1 = 10 und n2 = 20) und auch die Varianz unterschiedlich ist, werden für den obigen Datensatz der t-Wert und die Freiheitsgrade nach der im T-Test Ungleiche Varianz genannten Formel berechnet Sektion.

Der t-Wert beträgt -2, 24787. Da das Minuszeichen beim Vergleich der beiden t-Werte ignoriert werden kann, beträgt der berechnete Wert 2, 24787.

Der Wert für die Freiheitsgrade beträgt 24, 38 und wird aufgrund der Formeldefinition, die das Abrunden des Werts auf den kleinstmöglichen ganzzahligen Wert erfordert, auf 24 reduziert.

Wann immer von einer Normalverteilung ausgegangen wird, kann als Akzeptanzkriterium ein Wahrscheinlichkeitsniveau (Alpha-Niveau, Signifikanzniveau, p ) angegeben werden. In den meisten Fällen kann ein 5% -Wert angenommen werden.

Unter Verwendung des Freiheitsgradwerts als 24 und eines Signifikanzniveaus von 5% ergibt ein Blick auf die T-Wert-Verteilungstabelle einen Wert von 2, 064. Ein Vergleich dieses Werts mit dem berechneten Wert von 2, 247 zeigt an, dass der berechnete t-Wert bei einem Signifikanzniveau von 5% größer als der Tabellenwert ist. Daher ist es sicher, die Nullhypothese abzulehnen, dass es keinen Unterschied zwischen den Mitteln gibt. Die Bevölkerungsgruppe weist intrinsische Unterschiede auf und sie sind nicht zufällig.

Vergleich von Anlagekonten Name des Anbieters Beschreibung Angaben zum Werbetreibenden × Die in dieser Tabelle aufgeführten Angebote stammen von Partnerschaften, von denen Investopedia eine Vergütung erhält.

Verwandte Begriffe

Funktionsweise der Varianzanalyse (ANOVA) Die Varianzanalyse (ANOVA) ist ein statistisches Analysewerkzeug, das die in einem Datensatz gefundene Gesamtvariabilität in zwei Komponenten unterteilt: zufällige und systematische Faktoren. Weitere Informationen zur T-Verteilung Die AT-Verteilung ist eine Art von Wahrscheinlichkeitsfunktion, die zum Schätzen von Populationsparametern für kleine Stichprobengrößen oder unbekannte Varianzen geeignet ist. mehr Freiheitsgrade Definition Freiheitsgrade bezieht sich auf die maximale Anzahl logisch unabhängiger Werte in der Datenstichprobe, bei denen es sich um Werte handelt, die die Freiheit haben, sich zu ändern. mehr Wie die Reststandardabweichung funktioniert Die Reststandardabweichung ist ein statistischer Begriff, der zur Beschreibung der Differenz der Standardabweichungen von beobachteten Werten gegenüber vorhergesagten Werten verwendet wird, wie durch Punkte in einer Regressionsanalyse gezeigt. mehr Funktionsweise der Chi-Quadrat-Statistik Eine Chi-Quadrat-Statistik (χ2) ist ein Test, der misst, wie die Erwartungen mit den tatsächlich beobachteten Daten (oder Modellergebnissen) verglichen werden. Die zur Berechnung einer Chi-Quadrat-Statistik verwendeten Daten müssen zufällig, roh, sich gegenseitig ausschließend, aus unabhängigen Variablen und aus einer ausreichend großen Stichprobe stammen. mehr Wie der Wilcoxon-Test angewendet wird Der Wilcoxon-Test, der sich entweder auf den Rang-Summen-Test oder den Vorzeichen-Rang-Test bezieht, ist ein nichtparametrischer Test, der zwei gepaarte Gruppen vergleicht. mehr Partner Links
Empfohlen
Lassen Sie Ihren Kommentar