Haupt » algorithmischer Handel » Geschichtete Zufallsauswahl

Geschichtete Zufallsauswahl

algorithmischer Handel : Geschichtete Zufallsauswahl
Was ist geschichtete Zufallsauswahl?

Geschichtete Zufallsstichproben sind Stichprobenverfahren, bei denen eine Population in kleinere Untergruppen unterteilt wird, die als Schichten bezeichnet werden. Bei der geschichteten Zufallsauswahl oder -schichtung werden die Schichten auf der Grundlage der gemeinsamen Attribute oder Merkmale der Mitglieder wie Einkommen oder Bildungsabschluss gebildet.

Geschichtete Zufallsstichproben werden auch als proportionale Zufallsstichproben oder Quotenzufallsstichproben bezeichnet.

[Wichtig: Die geschichtete Stichprobe wird verwendet, um Unterschiede zwischen Gruppen in einer Population hervorzuheben, im Gegensatz zur einfachen Zufallsstichprobe, bei der alle Mitglieder einer Population als gleich behandelt werden, wobei die Wahrscheinlichkeit einer Stichprobe gleich ist.]

1:40

Geschichtete Zufallsauswahl

So funktioniert geschichtete Zufallsauswahl

Wenn ein Forscher eine Analyse oder Forschung an einer Gruppe von Entitäten mit ähnlichen Merkmalen durchführt, stellt er möglicherweise fest, dass die Bevölkerungszahl zu groß ist, um die Forschung abzuschließen. Um Zeit und Geld zu sparen, kann ein Analyst einen praktikableren Ansatz wählen, indem er eine kleine Gruppe aus der Bevölkerung auswählt. Die kleine Gruppe wird als Stichprobengröße bezeichnet. Dabei handelt es sich um eine Teilmenge der Population, die zur Darstellung der gesamten Population verwendet wird. Eine Stichprobe kann auf verschiedene Arten aus einer Grundgesamtheit ausgewählt werden, von denen eine die Methode der geschichteten Zufallsstichprobe ist.

Bei einer geschichteten Zufallsstichprobe wird die gesamte Population in homogene Gruppen, so genannte Schichten (Plural für Schicht), aufgeteilt. Aus jeder Schicht werden dann Zufallsstichproben ausgewählt. Stellen Sie sich beispielsweise einen akademischen Forscher vor, der wissen möchte, wie viele MBA-Studenten 2007 innerhalb von drei Monaten nach Abschluss ein Stellenangebot erhalten haben.

Bald wird er feststellen, dass es in diesem Jahr fast 200.000 MBA-Absolventen gab. Er könnte beschließen, einfach eine Zufallsstichprobe von 50.000 Absolventen zu ziehen und eine Umfrage durchzuführen. Besser noch, er konnte die Bevölkerung in Schichten aufteilen und eine Zufallsstichprobe aus den Schichten ziehen. Zu diesem Zweck erstellte er Bevölkerungsgruppen basierend auf Geschlecht, Altersgruppe, Rasse, Land der Staatsangehörigkeit und beruflichem Hintergrund. Aus jeder Schicht wird eine Zufallsstichprobe in einer Zahl entnommen, die im Vergleich zur Population proportional zur Schichtgröße ist. Diese Teilmengen der Schichten werden dann zu einer Zufallsstichprobe zusammengefasst.

Die zentralen Thesen

  • Durch geschichtete Zufallsstichproben erhalten die Forscher eine Stichprobenpopulation, die die gesamte untersuchte Population am besten repräsentiert.
  • Bei der geschichteten Zufallsstichprobe wird die gesamte Bevölkerung in homogene Gruppen, sogenannte Schichten, aufgeteilt.
  • Geschichtete Zufallsstichproben unterscheiden sich von einfachen Zufallsstichproben, bei denen Daten aus einer gesamten Grundgesamtheit zufällig ausgewählt werden. Daher ist es wahrscheinlich, dass jede mögliche Stichprobe gleichermaßen auftritt.

Beispiel für eine geschichtete Zufallsauswahl

Angenommen, ein Forschungsteam möchte den GPA von College-Studenten in den USA ermitteln. Das Forschungsteam hat Schwierigkeiten, Daten von allen 21 Millionen College-Studenten zu sammeln. es beschließt, eine zufällige Stichprobe der Bevölkerung unter Verwendung von 4.000 Schülern zu ziehen.

Angenommen, das Team untersucht die verschiedenen Attribute der Probanden und fragt sich, ob es Unterschiede bei den GPAs und den Hauptfächern der Schüler gibt. Angenommen, 560 Studenten sind englische Hauptfächer, 1.135 wissenschaftliche Hauptfächer, 800 Informatik-Hauptfächer, 1.090 technische Hauptfächer und 415 Mathematik-Hauptfächer. Das Team möchte eine proportionale geschichtete Zufallsstichprobe verwenden, bei der die Schicht der Stichprobe proportional zur Zufallsstichprobe in der Bevölkerung ist.

Angenommen, das Team untersucht die Demografie von College-Studenten in den USA und ermittelt den Prozentsatz der Hauptschüler in Englisch (12%), in Wissenschaft (28%), in Informatik (24%), in Ingenieurwissenschaften (21%) und in Ingenieurwissenschaften (15%) in Mathematik. Somit werden aus dem geschichteten Zufallsstichprobenverfahren fünf Schichten erzeugt.

Das Team muss dann bestätigen, dass die Bevölkerungsschicht proportional zur Schicht in der Stichprobe ist. Sie stellen jedoch fest, dass die Proportionen nicht gleich sind. Das Team muss dann 4.000 Studenten aus der Bevölkerung erneut befragen und nach dem Zufallsprinzip 480 Englisch-, 1.120 Naturwissenschafts-, 960 Informatik-, 840 Ingenieur- und 600 Mathematikstudenten auswählen.

Mit diesen hat es eine proportionale geschichtete Zufallsstichprobe von College-Studenten, die eine bessere Darstellung der College-Majors der Studenten in den USA bietet. Die Forscher können dann eine bestimmte Schicht hervorheben, die unterschiedlichen Studien von US-College-Studenten beobachten und die verschiedenen Notendurchschnitte beobachten .

Einfache zufällige versus geschichtete zufällige Stichproben

Einfache Zufallsstichproben und geschichtete Zufallsstichproben sind statistische Messinstrumente. Eine einfache Zufallsstichprobe wird verwendet, um die gesamte Datenpopulation darzustellen. Eine geschichtete Zufallsstichprobe unterteilt die Bevölkerung auf der Grundlage gemeinsamer Merkmale in kleinere Gruppen oder Schichten.

Die einfache Zufallsstichprobe wird häufig verwendet, wenn nur sehr wenige Informationen über die Datenpopulation verfügbar sind, wenn die Datenpopulation viel zu viele Unterschiede aufweist, um in verschiedene Teilmengen unterteilt zu werden, oder wenn es nur ein bestimmtes Merkmal unter der Datenpopulation gibt.

Beispielsweise möchte ein Süßwarenunternehmen möglicherweise die Kaufgewohnheiten seiner Kunden untersuchen, um die Zukunft seiner Produktlinie zu bestimmen. Wenn es 10.000 Kunden gibt, kann es 100 dieser Kunden als Zufallsstichprobe verwenden. Es kann dann das, was es von diesen 100 Kunden findet, auf den Rest seiner Basis anwenden. Anders als bei der Schichtung werden 100 Mitglieder rein zufällig ausgewählt, ohne Rücksicht auf ihre individuellen Merkmale.

Verhältnismäßige und unverhältnismäßige Schichtung

Durch geschichtete Zufallsstichproben wird sichergestellt, dass jede Untergruppe einer bestimmten Population in der gesamten Stichprobenpopulation einer Forschungsstudie angemessen vertreten ist. Die Schichtung kann verhältnismäßig oder unverhältnismäßig sein. Bei einer proportional geschichteten Methode ist die Stichprobengröße jeder Schicht proportional zur Populationsgröße der Schicht.

Wünschte der Forscher beispielsweise eine Stichprobe von 50.000 Absolventen in der Altersgruppe, so wird die proportionale geschichtete Zufallsstichprobe nach folgender Formel erhalten: (Stichprobengröße / Bevölkerungsgröße) x Schichtgröße. Die folgende Tabelle geht von einer Bevölkerungszahl von 180.000 MBA-Absolventen pro Jahr aus.

Altersgruppe


24-28


29-33


34-37


Gesamt


Anzahl der Personen in der Schicht


90.000


60.000


30.000


180.000


Schichtstichprobengröße


25.000


16, 667


8, 333


50.000


Die Schichtenzahl für MBA-Absolventen im Alter von 24 bis 28 Jahren wird mit (50.000 / 180.000) x 90.000 = 25.000 berechnet. Die gleiche Methode wird für die anderen Altersgruppen angewendet. Nachdem die Stichprobengröße der Schichten bekannt ist, kann der Forscher in jeder Schicht eine einfache Zufallsstichprobe durchführen, um seine Umfrageteilnehmer auszuwählen. Mit anderen Worten, 25.000 Absolventen aus der Altersgruppe 24-28 werden zufällig aus der Gesamtbevölkerung ausgewählt, 16.667 Absolventen aus der Altersgruppe 29-33 werden zufällig aus der Bevölkerung ausgewählt und so weiter.

In einer überproportional geschichteten Stichprobe ist die Größe jeder Schicht nicht proportional zu ihrer Größe in der Bevölkerung. Der Forscher kann beschließen, 1/2 der Absolventen der Altersgruppe 34-37 und 1/3 der Absolventen der Altersgruppe 29-33 zu befragen.

Es ist wichtig zu beachten, dass eine Person nicht in mehrere Schichten passen kann. Jede Entität darf nur in eine Schicht passen. Überlappende Untergruppen bedeuten, dass einige Personen eine höhere Wahrscheinlichkeit haben, für die Umfrage ausgewählt zu werden, was das Konzept der geschichteten Stichprobe als eine Art Wahrscheinlichkeitsstichprobe vollständig negiert.

[Wichtig: Portfoliomanager können mithilfe einer geschichteten Zufallsstichprobe Portfolios erstellen, indem sie einen Index wie einen Anleihenindex replizieren.]

Vorteile der geschichteten Zufallsauswahl

Der Hauptvorteil der geschichteten Zufallsauswahl besteht darin, dass wichtige Populationsmerkmale in der Stichprobe erfasst werden. Ähnlich einem gewichteten Durchschnitt liefert diese Methode der Stichprobe Merkmale in der Stichprobe, die proportional zur Gesamtbevölkerung sind. Geschichtete Zufallsstichproben eignen sich gut für Populationen mit einer Vielzahl von Attributen, sind jedoch ansonsten unwirksam, wenn keine Untergruppen gebildet werden können.

Die Schichtung ergibt einen kleineren Schätzfehler und eine größere Genauigkeit als die einfache Zufallsstichprobenmethode. Je größer die Unterschiede zwischen den Schichten sind, desto größer ist der Genauigkeitsgewinn.

Nachteile der geschichteten Zufallsauswahl

Leider kann diese Forschungsmethode nicht in jeder Studie angewendet werden. Der Nachteil der Methode besteht darin, dass mehrere Bedingungen erfüllt sein müssen, damit sie ordnungsgemäß verwendet werden kann. Die Forscher müssen jedes Mitglied einer untersuchten Population identifizieren und in eine und nur eine Subpopulation einteilen. Infolgedessen ist eine geschichtete Zufallsstichprobe nachteilig, wenn Forscher nicht jedes Mitglied der Bevölkerung sicher in eine Untergruppe einordnen können. Es kann auch eine Herausforderung sein, eine vollständige und endgültige Liste der Gesamtbevölkerung zu finden.

Überlappung kann ein Problem sein, wenn es Themen gibt, die in mehrere Untergruppen fallen. Wenn einfache Zufallsstichproben durchgeführt werden, ist die Wahrscheinlichkeit größer, dass diejenigen ausgewählt werden, die sich in mehreren Untergruppen befinden. Das Ergebnis könnte eine falsche Darstellung oder ungenaue Darstellung der Bevölkerung sein.

Die obigen Beispiele machen es einfach: Studenten, Absolventen, Männer und Frauen sind klar definierte Gruppen. In anderen Situationen könnte es jedoch weitaus schwieriger sein. Stellen Sie sich vor, Sie beziehen Merkmale wie Rasse, ethnische Zugehörigkeit oder Religion ein. Der Sortiervorgang wird schwieriger, wodurch die geschichtete Zufallsstichprobe eine ineffektive und weniger als ideale Methode darstellt.

Vergleich von Anlagekonten Name des Anbieters Beschreibung Angaben zum Werbetreibenden × Die in dieser Tabelle aufgeführten Angebote stammen von Partnerschaften, von denen Investopedia eine Vergütung erhält.

Verwandte Begriffe

Beispiel Ein Beispiel ist eine kleinere, überschaubare Version einer größeren Gruppe. Stichproben werden in statistischen Tests verwendet, wenn die Population zu groß ist. mehr Funktionsweise einfacher Zufallsstichproben Eine einfache Zufallsstichprobe ist eine Teilmenge einer statistischen Grundgesamtheit, in der jedes Mitglied der Teilmenge die gleiche Wahrscheinlichkeit hat, ausgewählt zu werden. Eine einfache Zufallsstichprobe soll eine unvoreingenommene Darstellung einer Gruppe sein. mehr Repräsentative Stichprobe wird häufig verwendet, um eine breitere Stimmung zu extrapolieren. Eine repräsentative Stichprobe ist eine Teilmenge einer Population, die Merkmale der gesamten Bevölkerung widerspiegelt. mehr Die Vor- und Nachteile der systematischen Stichprobe Die systematische Stichprobe ist eine Wahrscheinlichkeitsstichprobenmethode, bei der eine Zufallsstichprobe aus einer größeren Grundgesamtheit ausgewählt wird. mehr Sampling Definition Sampling ist ein Verfahren zur statistischen Analyse, bei dem eine Gruppe von Beobachtungen aus einer größeren Population extrahiert wird. mehr T-Test Definition Ein T-Test ist eine Art Inferenzstatistik, die verwendet wird, um festzustellen, ob es einen signifikanten Unterschied zwischen den Mitteln zweier Gruppen gibt, die in bestimmten Merkmalen zusammenhängen können. mehr Partner Links
Empfohlen
Lassen Sie Ihren Kommentar