Coefficient de corrélation dans les statistiques. Coefficient de Fechner (coefficient de corrélation de signe). Au port, il existe d'autres coefficients d'évaluation

Les antipyrétiques pour enfants sont prescrits par un pédiatre. Mais il existe des situations d'urgence avec de la fièvre où l'enfant doit recevoir immédiatement des médicaments. Ensuite, les parents prennent leurs responsabilités et utilisent des médicaments antipyrétiques. Qu'est-ce qu'il est permis de donner aux nourrissons ? Comment faire baisser la température chez les enfants plus âgés ? Quels médicaments sont les plus sûrs ?

Rapport de Fechner- il s'agit d'une évaluation du degré de cohérence dans les directions des écarts des valeurs individuelles du facteur et des caractéristiques résultantes par rapport aux valeurs moyennes du facteur et des caractéristiques résultantes. Le coefficient de Fechner, ainsi que des coefficients tels que le coefficient de Spearman et le coefficient de Kandel, font référence à coefficients de corrélation de signes. Le coefficient de corrélation des signes est basé sur l'évaluation du degré de cohérence des directions d'écarts des valeurs individuelles du facteur et des signes résultants des moyennes correspondantes. Il est calculé comme suit :

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K f ">Calculez votre valeur


Le coefficient de Fechner peut prendre des valeurs de –1 à +1. Kf = 1 indique la présence éventuelle d'une connexion directe, Kf = -1 indique la présence éventuelle d'un feedback.

Objet de la prestation. Ce service est conçu pour calculer le coefficient de Fechner en ligne. La signification de ce coefficient est également déterminée.

Instructions. Spécifiez la quantité de données (nombre de lignes), cliquez sur Suivant. La solution résultante est enregistrée dans un fichier Word. Un modèle est également automatiquement créé pour tester la solution dans Excel.

Calcul du coefficient de Fechner comprend les étapes suivantes :

  1. Les valeurs moyennes pour chaque caractéristique (X et Y) sont déterminées.
  2. Les signes d'écart (-,+) par rapport à la valeur moyenne de chacune des caractéristiques sont déterminés.
  3. Si les signes correspondent, attribuez la valeur A, sinon B.
  4. Le nombre de A et B est compté en calculant le coefficient de Fechner à l'aide de la formule : K f = (n a - n b)/(n a + n b) où n a est le nombre de coïncidences de signes d'écarts de valeurs individuelles par rapport à la moyenne ; n b - nombre de non-concordances.
Rapport de Fechner varie entre [-1;+1] et est utilisé pour évaluer l'étroitesse de la relation entre les caractéristiques qualitatives (méthodes non paramétriques).

Représentation graphique du coefficient de Fechner


Exemple n°1. Lors du développement d'une solution d'argile avec perte de fluide réduite dans des conditions de haute température, deux formulations ont été testées en parallèle, dont l'une contenait 2 % de CMC et 1 % de Na2CO3, et l'autre 2 % de CMC, 1 % de Na2CO3 et 0,1 % de dichromate de potassium. En conséquence, les valeurs X suivantes ont été obtenues (perte d'eau après 30 s).

X19 9 11 9 8 11 10 8 10
X210 11 10 12 11 12 12 10 9
Vérifie si les solutions en question se distinguent par leur valeur de perte de fluide.

Exemple n°2. Coefficient de corrélation des signes, ou coefficient de Fechner, est basé sur l'évaluation du degré de cohérence des directions d'écarts des valeurs individuelles du facteur et des caractéristiques résultantes par rapport aux moyennes correspondantes. Il est calculé comme suit :

,

où n a est le nombre de correspondances de signes d'écarts de valeurs individuelles par rapport à la moyenne ; n b - nombre de non-concordances.

Rapport de Fechner peut prendre des valeurs de -1 à +1. Kf = 1 indique la présence éventuelle d'une connexion directe, Kf = -1 indique la présence éventuelle d'un feedback.

Exemple n°2
Regardons l'exemple de calcul du coefficient de Fechner à l'aide des données données dans le tableau :
Valeurs moyennes:


Signes d'écarts par rapport à la moyenne X

Signes d'écarts par rapport à la moyenne Y

Caractères correspondants (a) ou incompatibles (b)


La valeur du coefficient indique que l'on peut supposer la présence d'un feedback.

Estimation du coefficient de corrélation des signes.

Pour estimer le coefficient de Fechner, il suffit d'évaluer sa signification et de trouver l'intervalle de confiance.
Importance du coefficient de Fechner.

En utilisant la table de Student on trouve la table t :
tableau t (n-m-1;a) = (6;0,05) = 1,943
Puisque Tob > ttable, nous rejetons l’hypothèse selon laquelle le coefficient de corrélation de signe est égal à 0. Autrement dit, le coefficient de Fechner est statistiquement significatif.


Intervalle de confiance pour le coefficient de Fechner :
r(-1,0;-0,4495)

Exemple n°3.
Regardons l'exemple de calcul du coefficient de corrélation de signe à l'aide des données données dans le tableau.

Rapport de Fechner- il s'agit d'une évaluation du degré de cohérence dans les directions des écarts des valeurs individuelles du facteur et des caractéristiques résultantes par rapport aux valeurs moyennes du facteur et des caractéristiques résultantes. Le coefficient de Fechner, ainsi que des coefficients tels que le coefficient de Spearman et le coefficient de Kandel, font référence à coefficients de corrélation de signes. Le coefficient de corrélation des signes est basé sur l'évaluation du degré de cohérence des directions d'écarts des valeurs individuelles du facteur et des signes résultants des moyennes correspondantes. Il est calculé comme suit :

A #n b " data-id="a;b" data-formul="(a-b)/(a+b)" data-r="K f ">Calculez votre valeur


Le coefficient de Fechner peut prendre des valeurs de –1 à +1. Kf = 1 indique la présence éventuelle d'une connexion directe, Kf = -1 indique la présence éventuelle d'un feedback.

Objet de la prestation. Ce service est conçu pour calculer le coefficient de Fechner en ligne. La signification de ce coefficient est également déterminée.

Instructions. Spécifiez la quantité de données (nombre de lignes), cliquez sur Suivant. La solution résultante est enregistrée dans un fichier Word. Un modèle est également automatiquement créé pour tester la solution dans Excel.

Calcul du coefficient de Fechner comprend les étapes suivantes :

  1. Les valeurs moyennes pour chaque caractéristique (X et Y) sont déterminées.
  2. Les signes d'écart (-,+) par rapport à la valeur moyenne de chacune des caractéristiques sont déterminés.
  3. Si les signes correspondent, attribuez la valeur A, sinon B.
  4. Le nombre de A et B est compté en calculant le coefficient de Fechner à l'aide de la formule : K f = (n a - n b)/(n a + n b) où n a est le nombre de coïncidences de signes d'écarts de valeurs individuelles par rapport à la moyenne ; n b - nombre de non-concordances.
Rapport de Fechner varie entre [-1;+1] et est utilisé pour évaluer l'étroitesse de la relation entre les caractéristiques qualitatives (méthodes non paramétriques).

Représentation graphique du coefficient de Fechner


Exemple n°1. Lors du développement d'une solution d'argile avec perte de fluide réduite dans des conditions de haute température, deux formulations ont été testées en parallèle, dont l'une contenait 2 % de CMC et 1 % de Na2CO3, et l'autre 2 % de CMC, 1 % de Na2CO3 et 0,1 % de dichromate de potassium. En conséquence, les valeurs X suivantes ont été obtenues (perte d'eau après 30 s).

X19 9 11 9 8 11 10 8 10
X210 11 10 12 11 12 12 10 9
Vérifie si les solutions en question se distinguent par leur valeur de perte de fluide.

Exemple n°2. Coefficient de corrélation des signes, ou coefficient de Fechner, est basé sur l'évaluation du degré de cohérence des directions d'écarts des valeurs individuelles du facteur et des caractéristiques résultantes par rapport aux moyennes correspondantes. Il est calculé comme suit :

,

où n a est le nombre de correspondances de signes d'écarts de valeurs individuelles par rapport à la moyenne ; n b - nombre de non-concordances.

Rapport de Fechner peut prendre des valeurs de -1 à +1. Kf = 1 indique la présence éventuelle d'une connexion directe, Kf = -1 indique la présence éventuelle d'un feedback.

Exemple n°2
Regardons l'exemple de calcul du coefficient de Fechner à l'aide des données données dans le tableau :
Valeurs moyennes:


Signes d'écarts par rapport à la moyenne X

Signes d'écarts par rapport à la moyenne Y

Caractères correspondants (a) ou incompatibles (b)


La valeur du coefficient indique que l'on peut supposer la présence d'un feedback.

Estimation du coefficient de corrélation des signes.

Pour estimer le coefficient de Fechner, il suffit d'évaluer sa signification et de trouver l'intervalle de confiance.
Importance du coefficient de Fechner.

En utilisant la table de Student on trouve la table t :
tableau t (n-m-1;a) = (6;0,05) = 1,943
Puisque Tob > ttable, nous rejetons l’hypothèse selon laquelle le coefficient de corrélation de signe est égal à 0. Autrement dit, le coefficient de Fechner est statistiquement significatif.


Intervalle de confiance pour le coefficient de Fechner :
r(-1,0;-0,4495)

Exemple n°3.
Regardons l'exemple de calcul du coefficient de corrélation de signe à l'aide des données données dans le tableau.

  • Coefficient de corrélation de rang de Kendall.
    La formule de calcul a la forme : Nous classons tous les éléments selon l'attribut x^, selon un certain nombre d'autres attributs x 10 ): Où ia/2 - quantile déterminé à partir de la table de distribution normale pour le niveau de signification sélectionné a (par exemple, pour a = 0,05 on obtient ia/2 = 1,96). Si P. 10, puis ils calculent...
    (Méthodes statistiques multivariées en économie)
  • Coefficients de corrélation des indicateurs de l'état des sous-systèmes régionaux avec l'indicateur d'investissement
    Taux de fécondité -0,08 (p = 0,768) 0,10 (p = 0,707) Taux de mortalité -0,36 (p = 0,158) -0,65 (p = 0,004) Taux de mortalité infantile -0,13 (p = 0,619) -0,40 (p = 0,113) Population 0,98 (p = 0,000) 0,62 (p = 0,008) Espérance de vie à la naissance, années 0,20...
    (Développement régional : diagnostiquer les différences régionales)
  • Coefficients de corrélation des indicateurs de l'état des sous-systèmes régionaux avec l'indicateur d'investissement
    Taux de fécondité -0,08 (p = 0,768) 0,10 (p = 0,707) Taux de mortalité -0,36 (p = 0,158) -0,65 (p = 0,004) Taux de mortalité infantile -0,13 (p = 0,619) -0,40 (p = 0,113) Population 0,98 (p = 0,000) 0,62 (p = 0,008) Espérance de vie à la naissance, années 0,20...
    (Développement régional : diagnostiquer les différences régionales)
  • Coefficient de corrélation de rang de Spearman
    Ce coefficient fait référence à ceux de classement, c'est-à-dire que ce ne sont pas les valeurs du facteur et les caractéristiques qui en résultent elles-mêmes qui sont corrélées, mais leurs rangs (le nombre de leurs places occupées dans chaque rangée de valeurs par ordre croissant ou décroissant) . Le coefficient de corrélation des rangs de Spearman est basé sur la prise en compte de la différence dans les rangs des valeurs des facteurs...
    (Théorie générale des statistiques)

Le coefficient de corrélation, proposé dans la seconde moitié du XIXe siècle par G. T. Fechner, est la mesure la plus simple de la relation entre deux variables. Il est basé sur une comparaison de deux caractéristiques psychologiques X je Et oui je, mesuré sur le même échantillon, en comparant les signes d'écarts des valeurs individuelles par rapport à la moyenne : et
. La conclusion sur la corrélation entre deux variables est tirée du comptage du nombre de correspondances et d'inadéquations de ces signes.

Exemple

Laisser X je Et oui je– deux traits mesurés sur le même échantillon de sujets. Pour calculer le coefficient de Fechner, il est nécessaire de calculer les valeurs moyennes pour chaque caractéristique, ainsi que pour chaque valeur de la variable - le signe de l'écart par rapport à la moyenne (tableau 8.1) :

Tableau 8.1

X je

oui je

Désignation

Dans la table: UN– coïncidence de signes, b– inadéquation des signes ; n a – nombre de matchs, n b – nombre de non-concordances (dans ce cas n une = 4, n b = 6).

Le coefficient de corrélation de Fechner est calculé à l'aide de la formule :

(8.1)

Dans ce cas:

Conclusion

Il existe une faible relation négative entre les variables étudiées.

Il convient de noter que le coefficient de corrélation de Fechner n'est pas un critère suffisamment strict, il ne peut donc être utilisé qu'au stade initial du traitement des données et pour formuler des conclusions préliminaires.

8. 4. Coefficient de corrélation de Pearson

Le principe original du coefficient de corrélation de Pearson est l'utilisation du produit des moments (écarts de la valeur d'une variable par rapport à la valeur moyenne) :

Si la somme des produits des moments est grande et positive, alors X Et à sont directement liés ; si la somme est grande et négative, alors X Et à fortement inversement lié; enfin, s'il n'y a aucun lien entre X Et à la somme des produits des moments est proche de zéro.

Pour garantir que les statistiques ne dépendent pas de la taille de l'échantillon, la valeur moyenne est prise plutôt que la somme des produits des moments. Cependant, la division n'est pas effectuée en fonction de la taille de l'échantillon, mais en fonction du nombre de degrés de liberté. n - 1.

Ordre de grandeur
est une mesure du lien entre X Et à et s'appelle covariance X Et à.

Dans de nombreux problèmes des sciences naturelles et techniques, la covariance est une mesure de connexion tout à fait satisfaisante. Son inconvénient est que la plage de ses valeurs n'est pas fixe, c'est-à-dire qu'elle peut varier dans des limites indéfinies.

Afin de standardiser une mesure d’association, il est nécessaire de libérer la covariance de l’influence des écarts types. Pour ce faire, vous devez diviser S xy sur s x et s oui :

(8.3)

r xy- coefficient de corrélation, ou produit des moments de Pearson.

La formule générale de calcul du coefficient de corrélation est la suivante :

(quelques conversions)

(8.4)

Impact de la conversion des données sur r xy :

1. Transformations linéaires X Et oui taper bx + un Et mourir + c ne changera pas l’ampleur de la corrélation entre X Et oui.

2. Transformations linéaires X Et ouià b < 0, d> 0, et aussi quand b> 0 et d < 0 изменяют знак коэффициента корреляции, не меняя его величины.

La fiabilité (ou, à défaut, la signification statistique) du coefficient de corrélation de Pearson peut être déterminée de différentes manières :

D'après les tableaux des valeurs critiques des coefficients de corrélation de Pearson et Spearman (voir Annexe, Tableau XIII). Si la valeur obtenue dans les calculs r xy dépasse la valeur critique (tabulaire) pour un échantillon donné, le coefficient de Pearson est considéré comme statistiquement significatif. Le nombre de degrés de liberté dans ce cas correspond à n– 2, où n– nombre de paires de valeurs comparées (taille de l'échantillon).

Selon le tableau XV de l'annexe, intitulé « Le nombre de paires de valeurs requises pour la signification statistique du coefficient de corrélation ». Dans ce cas, il faut se concentrer sur le coefficient de corrélation obtenu dans les calculs. Il est considéré comme statistiquement significatif si la taille de l'échantillon est égale ou supérieure au nombre tabulé de paires de valeurs pour un coefficient donné.

Selon le coefficient de Student, qui est calculé comme le rapport du coefficient de corrélation à son erreur :

(8.5)

Erreur de coefficient de corrélation calculé à l'aide de la formule suivante :

m r - erreur du coefficient de corrélation, r- Coefficient de corrélation; n- nombre de paires comparées.

Considérons la procédure de calcul et la détermination de la signification statistique du coefficient de corrélation de Pearson en utilisant l'exemple de résolution du problème suivant.

La tâche

22 lycéens ont été testés sur deux tests : USK (niveau de contrôle subjectif) et MkU (motivation pour réussir). Les résultats suivants ont été obtenus (tableau 8.2) :

Tableau 8.2

USK ( X je)

MkU ( oui je)

USK ( X je)

MkU ( oui je)

Exercice

Tester l’hypothèse selon laquelle les personnes ayant un niveau élevé d’intériorité (score USC) se caractérisent par un niveau élevé de motivation pour réussir.

Solution

1. Nous utilisons le coefficient de corrélation de Pearson dans la modification suivante (voir formule 8.4) :

Pour la commodité du traitement des données sur une microcalculatrice (en l'absence du programme informatique nécessaire), il est recommandé de créer une table de travail intermédiaire de la forme suivante (tableau 8.3) :

Tableau 8.3

X je oui je

X 1 oui 1

X 2 oui 2

X 3 oui 3

X n oui n

Σ X je oui je

2. Nous effectuons des calculs et substituons les valeurs dans la formule :

3. Nous déterminons la signification statistique du coefficient de corrélation de Pearson de trois manières :

1ère méthode :

Dans le tableau XIII Annexe on retrouve les valeurs critiques du coefficient pour les 1er et 2ème niveaux de signification : r cr.= 0,42 ; 0,54 (ν = n – 2 = 20).

Nous concluons que r xy > r cr . , c'est-à-dire que la corrélation est statistiquement significative pour les deux niveaux.

2ème méthode :

Utilisons le tableau. XV, dans lequel on détermine le nombre de couples de valeurs (nombre de sujets) suffisants pour la signification statistique du coefficient de corrélation de Pearson égal à 0,58 : pour les 1er, 2e et 3e niveaux de signification il est de 12, 18 et 28, respectivement .

De là, nous concluons que le coefficient de corrélation est significatif pour les 1er et 2ème niveaux, mais « n'atteint pas » le 3ème niveau de signification.

3ème méthode :

Nous calculons l'erreur du coefficient de corrélation et du coefficient de Student comme le rapport du coefficient de Pearson à l'erreur :

Dans le tableau X on retrouve les valeurs standards du coefficient de Student pour les 1er, 2e et 3e niveaux de signification avec le nombre de degrés de liberté ν = n – 2 = 20: t cr. = 2,09; 2,85; 3,85.

Conclusion générale

La corrélation entre les indicateurs des tests USC et MkU est statistiquement significative pour les 1er et 2ème niveaux de signification.

Note:

Lors de l’interprétation du coefficient de corrélation de Pearson, les points suivants doivent être pris en compte :

    Le coefficient de Pearson peut être utilisé pour différentes échelles (rapport, intervalle ou ordinal) à l'exception de l'échelle dichotomique.

    Une corrélation ne signifie pas toujours une relation de cause à effet. En d’autres termes, si nous trouvons, par exemple, une corrélation positive entre la taille et le poids dans un groupe de sujets, cela ne signifie pas que la taille dépend du poids ou vice versa (ces deux caractéristiques dépendent d’une troisième variable (externe), qui dans ce cas, est associé aux caractéristiques génétiques constitutionnelles d’une personne).

    r xu » 0 peut être observé non seulement en l’absence de lien entre X Et oui, mais aussi dans le cas d'une connexion non linéaire forte (Fig. 8.2 a). Dans ce cas, les corrélations négatives et positives sont équilibrées, ce qui donne l’illusion d’une absence de connexion.

    r xy peut être assez faible s'il existe un lien fort entre X Et à observé dans une plage de valeurs plus étroite que celle étudiée (Fig. 8.2 b).

    La combinaison d'échantillons avec des moyennes différentes peut créer l'illusion d'une corrélation assez élevée (Fig. 8.2 c).

oui je oui je oui je

+ + . .

X je X je X je

Riz. 8.2. Sources possibles d'erreurs lors de l'interprétation de la valeur du coefficient de corrélation (explications dans le texte (points 3 – 5 notes))

Compréhension générale de l'analyse de corrélation-régression

Les formes et types de connexions qui existent entre les phénomènes sont très diverses dans leur classification. ne sont que ceux qui sont de nature quantitative et sont étudiés à l’aide de méthodes quantitatives. Considérons la méthode d'analyse de corrélation-régression, fondamentale dans l'étude des relations entre phénomènes.

Cette méthode contient ses deux parties constitutives— analyse de corrélation et analyse de régression. Analyse de corrélation est une méthode quantitative permettant de déterminer la force et la direction de la relation entre les variables de l'échantillon. Analyse de régression est une méthode quantitative permettant de déterminer le type de fonction mathématique dans la relation de cause à effet entre les variables.

Pour évaluer la force d'une connexion dans la théorie de la corrélation, l'échelle du statisticien anglais Chaddock est utilisée : faible - de 0,1 à 0,3 ; modéré - de 0,3 à 0,5; perceptible - de 0,5 à 0,7; élevé - de 0,7 à 0,9 ; très élevé (fort) - de 0,9 à 1,0. Il est utilisé plus loin dans des exemples sur le sujet.

Corrélation linéaire

Cette corrélation caractérise une relation linéaire dans les variations des variables. Il peut être apparié (deux variables corrélées) ou multiple (plus de deux variables), direct ou inverse - positif ou négatif, lorsque les variables varient respectivement dans le même sens ou dans des directions différentes.

Si les variables sont quantitatives et équivalentes dans leurs observations indépendantes avec leur nombre total, alors les mesures empiriques les plus importantes de l'étroitesse de leur relation linéaire sont le coefficient de corrélation directe des signes du psychologue autrichien G.T. Fechner (1801-1887) et le coefficient de corrélation directe des signes du psychologue autrichien G.T. Fechner (1801-1887). coefficients de corrélation appariée, pure (privée) et multiple (cumulative) du statisticien-biomètre anglais K. Pearson (1857-1936).

Coefficient de corrélation des paires de signes de Fechner détermine la cohérence des directions dans les écarts individuels des variables par rapport à leurs moyennes et . Il est égal au rapport de la différence entre les sommes des couples de signes correspondants () et mésappariés () en écarts et à la somme de ces sommes :

Ordre de grandeur Kf varie de -1 à +1. La sommation en (1) est effectuée sur des observations qui ne sont pas répertoriées dans les sommes par souci de simplicité. S'il y a un écart ou , alors il n'est pas inclus dans le calcul. Si les deux écarts sont nuls à la fois : , alors un tel cas est considéré comme ayant les mêmes signes et est inclus dans . Dans le tableau 12.1. montre la préparation des données pour le calcul (1).

Tableau 12.1 Données pour le calcul du coefficient de Fechner.

Nombre d'employés, milliers de personnes

Chiffre d'affaires commercial, c.u.

Écart par rapport à la moyenne

Comparaison des signes et

coïncidence
(De à)

décalage (Nk)

Par (1) nous avons K f = (3 - 2)/(3 + 2) = 0,20. Le sens de la relation dans les variations !!Nombre moyen d'employés|nombre d'employés]] et est positif (simple) : les signes dans les écarts et et dans la majorité (dans 3 cas sur 5) coïncident les uns avec les autres. L'étroitesse de la relation entre les variables de l'échelle de Chaddock est faible.

La paire de Pearson, les coefficients de corrélation linéaire pure (partielle) et multiple (totale), contrairement au coefficient de Fechner, prennent en compte non seulement les signes, mais aussi les ampleurs des écarts des variables. Différentes méthodes sont utilisées pour les calculer. Ainsi, selon la méthode de comptage direct pour données non groupées, le coefficient de corrélation de paires de Pearson a la forme :

Ce coefficient varie également de -1 à +1. S'il y a plusieurs variables, le coefficient de corrélation linéaire multiple (cumulatif) de Pearson est calculé. Pour trois variables x, y, z On dirait

Ce coefficient varie de 0 à 1. Si nous éliminons (excluons complètement ou fixons à un niveau constant) l'influence sur et , alors leur relation « générale » se transformera en une relation « pure », formant une corrélation linéaire de Pearson pure (partielle). coefficient:

Ce coefficient varie de -1 à +1. Les carrés des coefficients de corrélation (2)-(4) sont appelés coefficients (indices) de détermination - paire, pur (particulier), multiple (total), respectivement :

Chacun des coefficients de détermination varie de 0 à 1 et évalue le degré de certitude variationnelle dans la relation linéaire des variables, montrant la proportion de variation d'une variable (y) due à la variation de l'autre (autres) - x et y . Le cas multivarié de plus de trois variables n’est pas considéré ici.

D'après les développements du statisticien anglais R.E. Fisher (1890-1962), la signification statistique des coefficients de corrélation de Pearson appariés et purs (partiels) est vérifiée si leur distribution est normale, sur la base de la distribution du statisticien anglais V.S. Gosset (pseudonyme « Étudiant » ; 1876-1937) avec un niveau de signification probabiliste donné et un degré de liberté disponible, où est le nombre de connexions (variables factorielles). Pour un coefficient apparié, nous avons son erreur quadratique moyenne et la valeur réelle du test t de Student :

Pour un coefficient de corrélation pur, lors de son calcul, au lieu de (n-2), il faut prendre , car dans ce cas, il y a m=2 (deux variables factorielles x et z). Pour un grand nombre n>100, au lieu de (n-2) ou (n-3) dans (6), on peut prendre n, en négligeant la précision du calcul.

Si t r > t tableau, alors le coefficient de corrélation de paire - total ou pur - est statistiquement significatif, et lorsque t r ≤ t onglet.- insignifiant.

La signification du coefficient de corrélation multiple R est vérifiée par F— Critère de Fisher en calculant sa valeur réelle

À Onglet F R > F. le coefficient R est considéré comme significatif avec un niveau de signification a donné et les degrés de liberté disponibles et , et à Tableau F r ≤ F- insignifiant.

Dans les populations à grand volume n > 100, la loi de distribution normale (fonction de Laplace-Sheppard tabulée) est utilisée directement pour évaluer la signification de tous les coefficients de Pearson au lieu des tests t et F.

Enfin, si les coefficients de Pearson n'obéissent pas à la loi normale, alors Z est utilisé comme critère de significativité - test de Fisher, qui n'est pas considéré ici.

Exemple de calcul conditionnel(2) - (7) est donné dans le tableau. 12.2, où les données initiales du tableau 12.1 sont prises avec l'ajout d'une troisième variable z - la taille de la superficie totale du magasin (100 m²).

Tableau 12.2.Préparation des données pour calculer les coefficients de corrélation de Pearson

Indicateurs

D'après (2) - (5), les coefficients de corrélation linéaire de Pearson sont égaux à :

Relation des variables X Et oui est positif, mais pas proche, équivalant à une ampleur basée sur leur coefficient de corrélation apparié et à une ampleur basée sur le coefficient de corrélation pur, et a été évalué sur l'échelle de Chaddock, respectivement, comme « remarquable » et « faible ».

Coefficients de détermination dxy =0,354 Et dxy. z = 0,0037 indiquer que la variation à(turnover) est dû à une variation linéaire X(nombre d'employés) par 35,4% dans leur interrelation générale et en interrelation pure - seulement sur 0,37% . Cette situation est due à l'impact important sur X Et oui troisième variable z— superficie totale occupée par les magasins. L'étroitesse de ses relations avec eux est, respectivement, r xz =0,677 et r yz =0,844.

Le coefficient de corrélation multiple (cumulatif) de trois variables montre que l'étroitesse de la relation linéaire X Et z c oui s'élève à R = 0,844, évalué sur l'échelle de Chaddock comme « élevé », et le coefficient de détermination multiple est la valeur D=0,713, indiquant que 71,3 % toute la variante à(chiffre d'affaires commercial) sont déterminés par l'impact cumulé des variables sur celui-ci X Et z. Repos 28,7% en raison de l'impact sur oui d'autres facteurs ou une relation curviligne de variables y, x, z.

Pour évaluer la signification des coefficients de corrélation, nous prenons le niveau de signification . D'après les données initiales, nous disposons de degrés de liberté pour et pour . D'après le tableau théorique, on retrouve respectivement le tableau 1. = 3,182 et t tableau 2. = 4,303. Pour le test F, nous avons et et à partir du tableau, nous trouvons le tableau F. = 19,0. Les valeurs réelles de chaque critère selon (6) et (7) sont égales à :

Tous les critères calculés sont inférieurs aux valeurs du tableau : tous les coefficients de corrélation de Pearson sont statistiquement non significatifs.



Soutenez le projet - partagez le lien, merci !
Lire aussi
Épouse de Sergueï Lavrov, ministre des Affaires étrangères Épouse de Sergueï Lavrov, ministre des Affaires étrangères Leçon-conférence La naissance de la physique quantique Leçon-conférence La naissance de la physique quantique Le pouvoir de l'indifférence : comment la philosophie du stoïcisme vous aide à vivre et à travailler Qui sont les stoïciens en philosophie Le pouvoir de l'indifférence : comment la philosophie du stoïcisme vous aide à vivre et à travailler Qui sont les stoïciens en philosophie