Korrelationskoeffizient in der Statistik. Fechner-Koeffizient (Vorzeichenkorrelationskoeffizient). Beim Tragen kommen andere Koeffizienten zur Bewertung in Betracht

Antipyretika für Kinder werden von einem Kinderarzt verschrieben. Es gibt jedoch Notfallsituationen mit Fieber, in denen dem Kind sofort Medikamente verabreicht werden müssen. Dann übernehmen die Eltern die Verantwortung und greifen zu fiebersenkenden Medikamenten. Was darf man Kleinkindern geben? Wie kann man die Temperatur bei älteren Kindern senken? Welche Medikamente sind die sichersten?

Fechner-Verhältnis- Hierbei handelt es sich um eine Beurteilung des Konsistenzgrades in den Richtungen der Abweichungen einzelner Faktorwerte und resultierender Merkmale von den Durchschnittswerten des Faktors und resultierender Merkmale. Der Fechner-Koeffizient bezieht sich zusammen mit Koeffizienten wie dem Spearman-Koeffizienten und dem Kandel-Koeffizienten auf Vorzeichenkorrelationskoeffizienten. Der Vbasiert auf der Beurteilung des Konsistenzgrades der Abweichungsrichtungen der einzelnen Werte des Faktors und der daraus resultierenden Vorzeichen von den entsprechenden Durchschnittswerten. Es wird wie folgt berechnet:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K f ">Berechnen Sie Ihren Wert


Der Fechner-Koeffizient kann Werte von –1 bis +1 annehmen. Kf = 1 zeigt das mögliche Vorhandensein einer direkten Verbindung an, Kf = -1 zeigt das mögliche Vorhandensein einer Rückkopplung an.

Zweck des Dienstes. Dieser Dienst dient der Online-Berechnung des Fechner-Koeffizienten. Die Bedeutung dieses Koeffizienten wird ebenfalls bestimmt.

Anweisungen. Geben Sie die Datenmenge (Anzahl der Zeilen) an und klicken Sie auf Weiter. Die resultierende Lösung wird in einer Word-Datei gespeichert. Außerdem wird automatisch eine Vorlage zum Testen der Lösung in Excel erstellt.

Berechnung des Fechner-Koeffizienten besteht aus folgenden Schritten:

  1. Für jedes Merkmal (X und Y) werden die Durchschnittswerte ermittelt.
  2. Für jedes Merkmal werden die Vorzeichen der Abweichung (-,+) vom Mittelwert ermittelt.
  3. Wenn die Vorzeichen übereinstimmen, weisen Sie den Wert A zu, andernfalls B.
  4. Die Anzahl von A und B wird gezählt und der Fechner-Koeffizient anhand der Formel berechnet: K f = (n a – n b)/(n a + n b) wobei n a die Anzahl der Übereinstimmungen der Vorzeichen von Abweichungen einzelner Werte vom Durchschnitt ist ; n b – Anzahl der Nichtübereinstimmungen.
Fechner-Verhältnis variiert innerhalb von [-1;+1] und wird verwendet, um die Nähe der Beziehung zwischen qualitativen Merkmalen zu beurteilen (nichtparametrische Methoden).

Grafische Darstellung des Fechner-Koeffizienten


Beispiel Nr. 1. Bei der Entwicklung einer Tonlösung mit reduziertem Flüssigkeitsverlust unter Hochtemperaturbedingungen wurden zwei Formulierungen parallel getestet, von denen eine 2 % CMC und 1 % Na2CO3 enthielt und die andere 2 % CMC, 1 % Na2CO3 und 0,1 % Kaliumdichromat. Als Ergebnis wurden folgende X-Werte erhalten (Wasserverlust nach 30 s).

X19 9 11 9 8 11 10 8 10
X210 11 10 12 11 12 12 10 9
Überprüft, ob die betreffenden Lösungen anhand ihres Flüssigkeitsverlustwerts unterscheidbar sind.

Beispiel Nr. 2. Vorzeichenkorrelationskoeffizient, oder der Fechner-Koeffizient, basiert auf der Beurteilung des Konsistenzgrades der Richtungen der Abweichungen einzelner Faktorwerte und resultierender Merkmale von den entsprechenden Durchschnittswerten. Es wird wie folgt berechnet:

,

wobei n a die Anzahl der Übereinstimmungen der Anzeichen von Abweichungen einzelner Werte vom Durchschnitt ist; n b – Anzahl der Nichtübereinstimmungen.

Fechner-Verhältnis kann Werte von -1 bis +1 annehmen. Kf = 1 zeigt das mögliche Vorhandensein einer direkten Verbindung an, Kf = -1 zeigt das mögliche Vorhandensein einer Rückkopplung an.

Beispiel Nr. 2
Schauen wir uns das Beispiel der Berechnung des Fechner-Koeffizienten anhand der in der Tabelle angegebenen Daten an:
Durchschnittliche Werte:


Anzeichen von Abweichungen vom Mittelwert X

Anzeichen von Abweichungen vom Mittelwert Y

Übereinstimmende (a) oder nicht übereinstimmende (b) Zeichen


Der Wert des Koeffizienten zeigt an, dass wir von einer Rückkopplung ausgehen können.

Schätzung des Vorzeichenkorrelationskoeffizienten.

Um den Fechner-Koeffizienten abzuschätzen, reicht es aus, seine Signifikanz zu bewerten und das Konfidenzintervall zu ermitteln.
Bedeutung des Fechner-Koeffizienten.

Unter Verwendung der Student-Tabelle finden wir die t-Tabelle:
t Tabelle (n-m-1;a) = (6;0,05) = 1,943
Da Tob > ttable ist, lehnen wir die Hypothese ab, dass der Vgleich 0 ist. Mit anderen Worten: Der Fechner-Koeffizient ist statistisch signifikant.


Konfidenzintervall für den Fechner-Koeffizienten:
r(-1,0;-0,4495)

Beispiel Nr. 3.
Schauen wir uns das Beispiel der Berechnung des Voranhand der in der Tabelle angegebenen Daten an.

Fechner-Verhältnis- Hierbei handelt es sich um eine Beurteilung des Konsistenzgrades in den Richtungen der Abweichungen einzelner Faktorwerte und resultierender Merkmale von den Durchschnittswerten des Faktors und resultierender Merkmale. Der Fechner-Koeffizient bezieht sich zusammen mit Koeffizienten wie dem Spearman-Koeffizienten und dem Kandel-Koeffizienten auf Vorzeichenkorrelationskoeffizienten. Der Vbasiert auf der Beurteilung des Konsistenzgrades der Abweichungsrichtungen der einzelnen Werte des Faktors und der daraus resultierenden Vorzeichen von den entsprechenden Durchschnittswerten. Es wird wie folgt berechnet:

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K f ">Berechnen Sie Ihren Wert


Der Fechner-Koeffizient kann Werte von –1 bis +1 annehmen. Kf = 1 zeigt das mögliche Vorhandensein einer direkten Verbindung an, Kf = -1 zeigt das mögliche Vorhandensein einer Rückkopplung an.

Zweck des Dienstes. Dieser Dienst dient der Online-Berechnung des Fechner-Koeffizienten. Die Bedeutung dieses Koeffizienten wird ebenfalls bestimmt.

Anweisungen. Geben Sie die Datenmenge (Anzahl der Zeilen) an und klicken Sie auf Weiter. Die resultierende Lösung wird in einer Word-Datei gespeichert. Außerdem wird automatisch eine Vorlage zum Testen der Lösung in Excel erstellt.

Berechnung des Fechner-Koeffizienten besteht aus folgenden Schritten:

  1. Für jedes Merkmal (X und Y) werden die Durchschnittswerte ermittelt.
  2. Für jedes Merkmal werden die Vorzeichen der Abweichung (-,+) vom Mittelwert ermittelt.
  3. Wenn die Vorzeichen übereinstimmen, weisen Sie den Wert A zu, andernfalls B.
  4. Die Anzahl von A und B wird gezählt und der Fechner-Koeffizient anhand der Formel berechnet: K f = (n a – n b)/(n a + n b) wobei n a die Anzahl der Übereinstimmungen der Vorzeichen von Abweichungen einzelner Werte vom Durchschnitt ist ; n b – Anzahl der Nichtübereinstimmungen.
Fechner-Verhältnis variiert innerhalb von [-1;+1] und wird verwendet, um die Nähe der Beziehung zwischen qualitativen Merkmalen zu beurteilen (nichtparametrische Methoden).

Grafische Darstellung des Fechner-Koeffizienten


Beispiel Nr. 1. Bei der Entwicklung einer Tonlösung mit reduziertem Flüssigkeitsverlust unter Hochtemperaturbedingungen wurden zwei Formulierungen parallel getestet, von denen eine 2 % CMC und 1 % Na2CO3 enthielt und die andere 2 % CMC, 1 % Na2CO3 und 0,1 % Kaliumdichromat. Als Ergebnis wurden folgende X-Werte erhalten (Wasserverlust nach 30 s).

X19 9 11 9 8 11 10 8 10
X210 11 10 12 11 12 12 10 9
Überprüft, ob die betreffenden Lösungen anhand ihres Flüssigkeitsverlustwerts unterscheidbar sind.

Beispiel Nr. 2. Vorzeichenkorrelationskoeffizient, oder der Fechner-Koeffizient, basiert auf der Beurteilung des Konsistenzgrades der Richtungen der Abweichungen einzelner Faktorwerte und resultierender Merkmale von den entsprechenden Durchschnittswerten. Es wird wie folgt berechnet:

,

wobei n a die Anzahl der Übereinstimmungen der Anzeichen von Abweichungen einzelner Werte vom Durchschnitt ist; n b – Anzahl der Nichtübereinstimmungen.

Fechner-Verhältnis kann Werte von -1 bis +1 annehmen. Kf = 1 zeigt das mögliche Vorhandensein einer direkten Verbindung an, Kf = -1 zeigt das mögliche Vorhandensein einer Rückkopplung an.

Beispiel Nr. 2
Schauen wir uns das Beispiel der Berechnung des Fechner-Koeffizienten anhand der in der Tabelle angegebenen Daten an:
Durchschnittliche Werte:


Anzeichen von Abweichungen vom Mittelwert X

Anzeichen von Abweichungen vom Mittelwert Y

Übereinstimmende (a) oder nicht übereinstimmende (b) Zeichen


Der Wert des Koeffizienten zeigt an, dass wir von einer Rückkopplung ausgehen können.

Schätzung des Vorzeichenkorrelationskoeffizienten.

Um den Fechner-Koeffizienten abzuschätzen, reicht es aus, seine Signifikanz zu bewerten und das Konfidenzintervall zu ermitteln.
Bedeutung des Fechner-Koeffizienten.

Unter Verwendung der Student-Tabelle finden wir die t-Tabelle:
t Tabelle (n-m-1;a) = (6;0,05) = 1,943
Da Tob > ttable ist, lehnen wir die Hypothese ab, dass der Vgleich 0 ist. Mit anderen Worten: Der Fechner-Koeffizient ist statistisch signifikant.


Konfidenzintervall für den Fechner-Koeffizienten:
r(-1,0;-0,4495)

Beispiel Nr. 3.
Schauen wir uns das Beispiel der Berechnung des Voranhand der in der Tabelle angegebenen Daten an.

  • Kendalls Rangkorrelationskoeffizient.
    Die Berechnungsformel hat die Form: Wir ordnen alle Elemente nach dem Merkmal x^, nach einer Reihe eines anderen Merkmals x 10 ): Wo ia/2 - Quantil ermittelt aus der Normalverteilungstabelle für das ausgewählte Signifikanzniveau a (zum Beispiel für a = 0,05 erhalten wir ia/2 = 1,96). Wenn P 10, dann berechnen sie...
    (Multivariate statistische Methoden in den Wirtschaftswissenschaften)
  • Korrelationskoeffizienten von Indikatoren des Zustands regionaler Subsysteme mit dem Investitionsindikator
    Fruchtbarkeitsrate -0,08 (p = 0,768) 0,10 (p = 0,707) Sterberate -0,36 (p = 0,158) -0,65 (p = 0,004) Säuglingssterblichkeitsrate -0,13 (p = 0,619) ) -0,40 (p = 0,113) Bevölkerung 0,98 (p = 0,000) 0,62 (p = 0,008) Lebenserwartung bei der Geburt, Jahre 0,20...
    (Regionale Entwicklung: Regionale Unterschiede diagnostizieren)
  • Korrelationskoeffizienten von Indikatoren des Zustands regionaler Subsysteme mit dem Investitionsindikator
    Fruchtbarkeitsrate -0,08 (p = 0,768) 0,10 (p = 0,707) Sterberate -0,36 (p = 0,158) -0,65 (p = 0,004) Säuglingssterblichkeitsrate -0,13 (p = 0,619) ) -0,40 (p = 0,113) Bevölkerung 0,98 (p = 0,000) 0,62 (p = 0,008) Lebenserwartung bei der Geburt, Jahre 0,20...
    (Regionale Entwicklung: Regionale Unterschiede diagnostizieren)
  • Rangkorrelationskoeffizient nach Spearman
    Dieser Koeffizient bezieht sich auf Rangfolgekoeffizienten, d. h. es sind nicht die Werte des Faktors und der resultierenden Merkmale selbst, die korrelieren, sondern ihre Ränge (die Anzahl ihrer Plätze, die sie in jeder Wertereihe in aufsteigender oder absteigender Reihenfolge einnehmen). . Der Rangkorrelationskoeffizient nach Spearman basiert auf der Berücksichtigung der Rangunterschiede der Faktorwerte ...
    (Allgemeine Theorie der Statistik)

Der Korrelationskoeffizient, der in der zweiten Hälfte des 19. Jahrhunderts von G. T. Fechner vorgeschlagen wurde, ist das einfachste Maß für die Beziehung zwischen zwei Variablen. Es basiert auf einem Vergleich zweier psychologischer Merkmale X ich Und j ich, gemessen an derselben Probe, durch Vergleich der Anzeichen von Abweichungen einzelner Werte vom Durchschnitt: und
. Die Schlussfolgerung über die Korrelation zwischen zwei Variablen wird auf der Grundlage der Zählung der Anzahl der Übereinstimmungen und Nichtübereinstimmungen dieser Zeichen gezogen.

Beispiel

Lassen X ich Und j ich– zwei Merkmale, die an derselben Stichprobe von Probanden gemessen wurden. Um den Fechner-Koeffizienten zu berechnen, müssen die Durchschnittswerte für jedes Merkmal sowie für jeden Wert der Variablen berechnet werden – das Vorzeichen der Abweichung vom Durchschnitt (Tabelle 8.1):

Tabelle 8.1

X ich

j ich

Bezeichnung

In der Tabelle: A– Zusammentreffen von Zeichen, B– Nichtübereinstimmung der Zeichen; N a – Anzahl der Übereinstimmungen, N b – Anzahl der Nichtübereinstimmungen (in diesem Fall N a = 4, N b = 6).

Der Fechner-Korrelationskoeffizient wird nach folgender Formel berechnet:

(8.1)

In diesem Fall:

Abschluss

Es besteht ein schwacher negativer Zusammenhang zwischen den untersuchten Variablen.

Es ist zu beachten, dass der Fechner-Korrelationskoeffizient kein ausreichend strenges Kriterium ist und daher nur in der Anfangsphase der Datenverarbeitung und zur Formulierung vorläufiger Schlussfolgerungen verwendet werden kann.

8. 4. Pearson-Korrelationskoeffizient

Das ursprüngliche Prinzip des Pearson-Korrelationskoeffizienten ist die Verwendung des Produkts von Momenten (Abweichungen des Werts einer Variablen vom Durchschnittswert):

Wenn die Summe der Momentprodukte groß und positiv ist, dann X Und bei stehen in direktem Zusammenhang; wenn die Summe groß und negativ ist, dann X Und bei stark umgekehrt verwandt; schließlich, wenn es keine Verbindung zwischen gibt X Und bei die Summe der Momentenprodukte ist nahe Null.

Um sicherzustellen, dass die Statistik nicht von der Stichprobengröße abhängt, wird der Durchschnittswert und nicht die Summe der Momentprodukte genommen. Allerdings erfolgt die Aufteilung nicht nach der Stichprobengröße, sondern nach der Anzahl der Freiheitsgrade N - 1.

Größe
ist ein Maß für den Zusammenhang zwischen X Und bei und wird Kovarianz genannt X Und bei.

Bei vielen Problemen in den Natur- und Technikwissenschaften ist die Kovarianz ein völlig zufriedenstellendes Maß für den Zusammenhang. Sein Nachteil besteht darin, dass der Wertebereich nicht festgelegt ist, d. h. er kann innerhalb unbestimmter Grenzen variieren.

Um ein Assoziationsmaß zu standardisieren, ist es notwendig, die Kovarianz vom Einfluss von Standardabweichungen zu befreien. Dazu müssen Sie teilen S xy An S x und S y:

(8.3)

Wo R xy- Korrelationskoeffizient oder Produkt von Pearson-Momenten.

Die allgemeine Formel zur Berechnung des Korrelationskoeffizienten lautet wie folgt:

(einige Konvertierungen)

(8.4)

Auswirkungen der Datenkonvertierung auf R xy:

1. Lineare Transformationen X Und j Typ bx + A Und dy + Cändert nichts an der Größe der Korrelation zwischen X Und j.

2. Lineare Transformationen X Und j bei B < 0, D> 0, und auch wann B> 0 und D < 0 изменяют знак коэффициента корреляции, не меняя его величины.

Die Zuverlässigkeit (oder anders gesagt die statistische Signifikanz) des Pearson-Korrelationskoeffizienten kann auf verschiedene Arten bestimmt werden:

Gemäß den Tabellen der kritischen Werte der Korrelationskoeffizienten von Pearson und Spearman (siehe Anhang, Tabelle XIII). Wenn der in den Berechnungen erhaltene Wert R xy den kritischen (tabellarischen) Wert für eine bestimmte Stichprobe überschreitet, gilt der Pearson-Koeffizient als statistisch signifikant. Die Anzahl der Freiheitsgrade entspricht in diesem Fall N– 2, wo N– Anzahl der verglichenen Wertepaare (Stichprobengröße).

Gemäß Tabelle XV des Anhangs mit dem Titel „Die Anzahl der für die statistische Signifikanz des Korrelationskoeffizienten erforderlichen Wertepaare“. In diesem Fall muss man sich auf den in den Berechnungen erhaltenen Korrelationskoeffizienten konzentrieren. Es gilt als statistisch signifikant, wenn die Stichprobengröße gleich oder größer als die tabellierte Anzahl von Wertepaaren für einen bestimmten Koeffizienten ist.

Gemäß dem Student-Koeffizienten, der als Verhältnis des Korrelationskoeffizienten zu seinem Fehler berechnet wird:

(8.5)

Fehler des Korrelationskoeffizienten berechnet nach folgender Formel:

Wo M r - Korrelationskoeffizientenfehler, R- Korrelationskoeffizient; N- Anzahl der verglichenen Paare.

Betrachten wir das Verfahren zur Berechnung und Bestimmung der statistischen Signifikanz des Pearson-Korrelationskoeffizienten am Beispiel der Lösung des folgenden Problems.

Die Aufgabe

22 Oberstufenschüler wurden in zwei Tests getestet: USK (Grad der subjektiven Kontrolle) und MkU (Motivation zum Erfolg). Folgende Ergebnisse wurden erzielt (Tabelle 8.2):

Tabelle 8.2

USK ( X ich)

MkU ( j ich)

USK ( X ich)

MkU ( j ich)

Übung

Um die Hypothese zu testen, dass Menschen mit einem hohen Maß an Internalität (USC-Score) durch ein hohes Maß an Erfolgsmotivation gekennzeichnet sind.

Lösung

1. Wir verwenden den Pearson-Korrelationskoeffizienten in der folgenden Modifikation (siehe Formel 8.4):

Zur Vereinfachung der Datenverarbeitung auf einem Mikrorechner (in Ermangelung des erforderlichen Computerprogramms) wird empfohlen, eine Zwischenarbeitstabelle der folgenden Form zu erstellen (Tabelle 8.3):

Tabelle 8.3

X ich j ich

X 1 j 1

X 2 j 2

X 3 j 3

X N j N

Σ X ich j ich

2. Wir führen Berechnungen durch und setzen die Werte in die Formel ein:

3. Wir bestimmen die statistische Signifikanz des Pearson-Korrelationskoeffizienten auf drei Arten:

1. Methode:

In der Tabelle Im Anhang XIII finden wir die kritischen Werte des Koeffizienten für das 1. und 2. Signifikanzniveau: R cr.= 0,42; 0,54 (ν = N – 2 = 20).

Wir schließen daraus R xy > R cr . , d. h. die Korrelation ist für beide Ebenen statistisch signifikant.

2. Methode:

Benutzen wir die Tabelle. XV, in dem wir die Anzahl der Wertepaare (Anzahl der Probanden) bestimmen, die für die statistische Signifikanz des Pearson-Korrelationskoeffizienten von 0,58 ausreichen: Für das 1., 2. und 3. Signifikanzniveau sind es 12, 18 und 28, jeweils .

Daraus schließen wir, dass der Korrelationskoeffizient für die 1. und 2. Ebene signifikant ist, aber die 3. Signifikanzebene „nicht erreicht“.

3. Methode:

Wir berechnen den Fehler des Korrelationskoeffizienten und des Student-Koeffizienten als Verhältnis des Pearson-Koeffizienten zum Fehler:

In der Tabelle X finden wir die Standardwerte des Student-Koeffizienten für das 1., 2. und 3. Signifikanzniveau mit der Anzahl der Freiheitsgrade ν = N – 2 = 20: T cr. = 2,09; 2,85; 3,85.

Allgemeine Schlussfolgerung

Die Korrelation zwischen den Indikatoren der USC- und MkU-Tests ist für die 1. und 2. Signifikanzstufe statistisch signifikant.

Notiz:

Bei der Interpretation des Pearson-Korrelationskoeffizienten müssen folgende Punkte berücksichtigt werden:

    Der Pearson-Koeffizient kann mit Ausnahme der dichotomen Skala für verschiedene Skalen (Verhältnis, Intervall oder Ordinalzahl) verwendet werden.

    Eine Korrelation bedeutet nicht immer eine Ursache-Wirkungs-Beziehung. Mit anderen Worten: Wenn wir beispielsweise eine positive Korrelation zwischen Größe und Gewicht in einer Gruppe von Probanden feststellen, bedeutet dies nicht, dass die Größe vom Gewicht abhängt oder umgekehrt (beide Merkmale hängen von einer dritten (externen) Variablen ab, die in diesem Fall mit genetischen Konstitutionsmerkmalen einer Person verbunden).

    R xu » 0 kann nicht nur beobachtet werden, wenn kein Zusammenhang zwischen ihnen besteht X Und j, aber auch im Fall eines starken nichtlinearen Zusammenhangs (Abb. 8.2 a). In diesem Fall sind die negativen und positiven Korrelationen ausgeglichen, sodass die Illusion entsteht, dass es keinen Zusammenhang gibt.

    R xy kann recht klein sein, wenn zwischen ihnen eine starke Verbindung besteht X Und bei in einem engeren Wertebereich als dem untersuchten beobachtet (Abb. 8.2 b).

    Durch die Kombination von Stichproben mit unterschiedlichen Mittelwerten kann die Illusion einer relativ hohen Korrelation entstehen (Abb. 8.2 c).

j ich j ich j ich

+ + . .

X ich X ich X ich

Reis. 8.2. Mögliche Fehlerquellen bei der Interpretation des Wertes des Korrelationskoeffizienten (Erläuterungen im Text (Punkte 3 – 5 Anmerkungen))

Allgemeines Verständnis der Korrelations-Regressionsanalyse

Die zwischen Phänomenen bestehenden Formen und Arten von Zusammenhängen sind in ihrer Klassifizierung sehr unterschiedlich. sind nur solche, die quantitativer Natur sind und mit quantitativen Methoden untersucht werden. Betrachten wir die Methode der Korrelations-Regressionsanalyse, die für die Untersuchung der Beziehungen zwischen Phänomenen von grundlegender Bedeutung ist.

Diese Methode enthält seine beiden Bestandteile— Korrelationsanalyse und Regressionsanalyse. Korrelationsanalyse ist eine quantitative Methode zur Bestimmung der Stärke und Richtung der Beziehung zwischen Stichprobenvariablen. Regressionsanalyse ist eine quantitative Methode zur Bestimmung der Art der mathematischen Funktion in der Ursache-Wirkungs-Beziehung zwischen Variablen.

Um die Stärke einer Verbindung in der Korrelationstheorie einzuschätzen, wird die Skala des englischen Statistikers Chaddock verwendet: schwach – von 0,1 bis 0,3; mäßig - von 0,3 bis 0,5; spürbar - von 0,5 bis 0,7; hoch - von 0,7 bis 0,9; sehr hoch (stark) - von 0,9 bis 1,0. Es wird in Beispielen zum Thema weiter verwendet.

Lineare Korrelation

Diese Korrelation charakterisiert eine lineare Beziehung in Variationen von Variablen. Sie kann paarweise (zwei korrelierte Variablen) oder mehrfach (mehr als zwei Variablen) sein, direkt oder invers – positiv oder negativ, wenn die Variablen in die gleiche bzw. unterschiedliche Richtung variieren.

Wenn die Variablen quantitativ und in ihren unabhängigen Beobachtungen mit ihrer Gesamtzahl gleichwertig sind, dann sind die wichtigsten empirischen Maße für die Nähe ihrer linearen Beziehung der Koeffizient der direkten Korrelation der Zeichen des österreichischen Psychologen G.T Koeffizienten der gepaarten, reinen (privaten) und mehrfachen (kumulativen) Korrelation des englischen Statistikers und Biometrikers K. Pearson (1857-1936).

Fechner-Zeichenpaar-Korrelationskoeffizient bestimmt die Richtungskonsistenz bei einzelnen Abweichungen von Variablen von ihren Durchschnittswerten und . Es ist gleich dem Verhältnis der Differenz zwischen den Summen übereinstimmender () und nicht übereinstimmender () Zeichenpaare in Abweichungen und der Summe dieser Summen:

Größe Kf variiert von -1 bis +1. Die Summierung in (1) erfolgt der Einfachheit halber über Beobachtungen, die in den Summen nicht aufgeführt sind. Sollte es eine Abweichung oder geben, so wird diese nicht in die Berechnung einbezogen. Wenn beide Abweichungen gleichzeitig Null sind: , dann gilt ein solcher Fall als vorzeichengleich und wird in einbezogen. In Tabelle 12.1. zeigt die Aufbereitung der Daten für die Berechnung (1).

Tabelle 12.1 Daten zur Berechnung des Fechner-Koeffizienten.

Anzahl der Mitarbeiter, Tausend Personen

Handelsumsatz, c.u.

Abweichung vom Durchschnitt

Vergleich von Zeichen und

Zufall
(Von bis)

Nichtübereinstimmung (N k)

Nach (1) haben wir Kf = (3 – 2)/(3 + 2) = 0,20. Die Richtung des Zusammenhangs in den Variationen!!Durchschnittliche Mitarbeiterzahl|Anzahl der Mitarbeiter]] und ist positiv (geradlinig): Die Vorzeichen in den Abweichungen und und fallen in der Mehrzahl (in 3 von 5 Fällen) zusammen. Die Nähe der Beziehung zwischen Variablen auf der Chaddock-Skala ist schwach.

Das Pearson-Paar, reine (partielle) und multiple (gesamte) lineare Korrelationskoeffizienten, berücksichtigen im Gegensatz zum Fechner-Koeffizienten nicht nur die Vorzeichen, sondern auch die Größen der Abweichungen der Variablen. Zur Berechnung kommen unterschiedliche Methoden zum Einsatz. Somit hat der Pearson-Paarkorrelationskoeffizient gemäß der direkten Zählmethode für nicht gruppierte Daten die Form:

Dieser Koeffizient variiert ebenfalls von -1 bis +1. Bei mehreren Variablen wird der multiple (kumulative) lineare Korrelationskoeffizient nach Pearson berechnet. Für drei Variablen x, y, z es sieht aus wie

Dieser Koeffizient variiert zwischen 0 und 1. Wenn wir den Einfluss auf und eliminieren (vollständig ausschließen oder auf einem konstanten Niveau fixieren), wird ihre „allgemeine“ Beziehung zu einer „reinen“ und bildet eine reine (partielle) lineare Pearson-Korrelation Koeffizient:

Dieser Koeffizient variiert von -1 bis +1. Die Quadrate der Korrelationskoeffizienten (2)–(4) werden Bestimmungskoeffizienten (Indizes) genannt – Paar, rein (einzeln), mehrfach (insgesamt):

Jeder der Bestimmungskoeffizienten variiert von 0 bis 1 und bewertet den Grad der Variationssicherheit in der linearen Beziehung von Variablen. Er zeigt den Anteil der Variation in einer Variablen (y) aufgrund der Variation der anderen (anderen) – x und y . Der multivariate Fall von mehr als drei Variablen wird hier nicht berücksichtigt.

Nach den Entwicklungen des englischen Statistikers R.E. Fisher (1890-1962) wird die statistische Signifikanz gepaarter und reiner (partieller) Pearson-Korrelationskoeffizienten überprüft, wenn ihre Verteilung normal ist, basierend auf der Verteilung des englischen Statistikers V.S. Gosset (Pseudonym „Student“; 1876-1937) mit einem bestimmten Maß an probabilistischer Signifikanz und verfügbarem Freiheitsgrad, wobei die Anzahl der Verbindungen (Faktorvariablen) angegeben ist. Für einen gepaarten Koeffizienten haben wir seinen quadratischen Mittelwertfehler und den tatsächlichen Wert des Student-t-Tests:

Für den reinen Korrelationskoeffizienten muss bei seiner Berechnung anstelle von (n-2) verwendet werden, weil in diesem Fall gibt es m=2 (zwei Faktorvariablen x und z). Für eine große Zahl n>100 können Sie anstelle von (n-2) oder (n-3) in (6) n nehmen und dabei die Genauigkeit der Berechnung vernachlässigen.

Wenn t r > t Tabelle, dann ist der Paarkorrelationskoeffizient – ​​insgesamt oder rein – statistisch signifikant, und wann t r ≤ t tab.- unbedeutend.

Die Signifikanz des multiplen Korrelationskoeffizienten R wird überprüft durch F— Fisher-Kriterium durch Berechnung seines tatsächlichen Wertes

Bei F R > F-Registerkarte. Der Koeffizient R gilt als signifikant mit einem gegebenen Signifikanzniveau a und den verfügbaren Freiheitsgraden und , und bei F r ≤ F Tabelle- unbedeutend.

In großvolumigen Populationen n > 100 wird anstelle der t- und F-Tests direkt das Normalverteilungsgesetz (tabellenförmige Laplace-Sheppard-Funktion) verwendet, um die Signifikanz aller Pearson-Koeffizienten zu bewerten.

Wenn schließlich die Pearson-Koeffizienten nicht dem Normalgesetz gehorchen, wird Z als Kriterium für ihre Signifikanz verwendet – der Fisher-Test, der hier nicht berücksichtigt wird.

Beispiel für eine bedingte Berechnung(2) - (7) ist in der Tabelle angegeben. 12.2, wobei die Anfangsdaten von Tabelle 12.1 unter Hinzufügung einer dritten Variablen z übernommen werden – der Größe der Gesamtfläche des Geschäfts (100 m²).

Tabelle 12.2.Vorbereiten von Daten zur Berechnung von Pearson-Korrelationskoeffizienten

Indikatoren

Gemäß (2) – (5) sind die linearen Pearson-Korrelationskoeffizienten gleich:

Beziehung von Variablen X Und j ist positiv, aber nicht annähernd, was einer Größe entspricht, die auf ihrem Paarkorrelationskoeffizienten und einer Größe basiert, die auf dem reinen Korrelationskoeffizienten basiert, und wurde auf der Chaddock-Skala als „auffällig“ bzw. „schwach“ bewertet.

Bestimmungskoeffizienten d xy =0,354 Und dxy. z = 0,0037 zeigen an, dass die Variation bei(Umsatz) ist auf lineare Variation zurückzuführen X(Anzahl der Mitarbeiter) von 35,4% in ihrem allgemeinen Zusammenhang und in reinem Zusammenhang - nur auf 0,37% . Diese Situation ist auf die erheblichen Auswirkungen auf zurückzuführen X Und j dritte Variable z— Gesamtfläche, die von Geschäften eingenommen wird. Die Nähe seiner Beziehung zu ihnen ist jeweils r xz =0,677 und r yz =0,844.

Der multiple (kumulative) Korrelationskoeffizient von drei Variablen zeigt die Nähe der linearen Beziehung X Und z C j beläuft sich auf R = 0,844, auf der Chaddock-Skala als „hoch“ bewertet, und der Mehrfachbestimmungskoeffizient ist der Wert D=0,713, anzeigt, dass 71,3 % die ganze Variation bei(Handelsumsatz) werden durch die kumulative Auswirkung von Variablen darauf bestimmt X Und z. Ausruhen 28,7% aufgrund der Auswirkungen auf j andere Faktoren oder eine krummlinige Beziehung von Variablen y, x, z.

Um die Signifikanz von Korrelationskoeffizienten zu beurteilen, nehmen wir das Signifikanzniveau. Nach den Ausgangsdaten haben wir Freiheitsgrade für und für . Gemäß der theoretischen Tabelle finden wir jeweils t Tabelle 1. = 3,182 und t Tabelle 2. = 4,303. Für den F-Test haben wir und und aus der Tabelle finden wir die F-Tabelle. = 19,0. Die tatsächlichen Werte jedes Kriteriums gemäß (6) und (7) sind gleich:

Alle berechneten Kriterien liegen unter ihren Tabellenwerten: Alle Pearson-Korrelationskoeffizienten sind statistisch nicht signifikant.



Unterstützen Sie das Projekt – teilen Sie den Link, vielen Dank!
Lesen Sie auch
Ehefrau des Außenministers Sergej Lawrow Ehefrau des Außenministers Sergej Lawrow Unterrichtsvorlesung Die Geburt der Quantenphysik Unterrichtsvorlesung Die Geburt der Quantenphysik Die Kraft der Gleichgültigkeit: Wie die Philosophie des Stoizismus Ihnen beim Leben und Arbeiten hilft. Wer sind die Stoiker in der Philosophie? Die Kraft der Gleichgültigkeit: Wie die Philosophie des Stoizismus Ihnen beim Leben und Arbeiten hilft. Wer sind die Stoiker in der Philosophie?