Jak obliczyć współczynnik korelacji liniowej

Autor: Eric Farmer
Data Utworzenia: 7 Marsz 2021
Data Aktualizacji: 1 Lipiec 2024
Anonim
Correlation Coefficient
Wideo: Correlation Coefficient

Zawartość

Współczynnik korelacji (lub współczynnik korelacji liniowej) jest oznaczony jako „r” (w rzadkich przypadkach jako „ρ”) i charakteryzuje korelację liniową (to znaczy związek, który jest określony przez pewną wartość i kierunek) dwóch lub więcej zmiennych. Wartość współczynnika mieści się w przedziale od -1 do +1, czyli korelacja może być zarówno dodatnia, jak i ujemna. Jeśli współczynnik korelacji wynosi -1, istnieje doskonała korelacja ujemna; jeśli współczynnik korelacji wynosi +1, istnieje doskonała korelacja dodatnia. W przeciwnym razie istnieje dodatnia korelacja między dwiema zmiennymi, ujemna korelacja lub brak korelacji. Współczynnik korelacji można obliczyć ręcznie, za pomocą bezpłatnych kalkulatorów online lub za pomocą dobrego kalkulatora graficznego.

Kroki

Metoda 1 z 4: Ręczne obliczanie współczynnika korelacji

  1. 1 Zbieraj dane. Zanim zaczniesz obliczać współczynnik korelacji, przestudiuj te pary liczb. Lepiej zapisać je w tabeli, którą można ułożyć pionowo lub poziomo. Oznacz każdy wiersz lub kolumnę znakami „x” i „y”.
    • Na przykład podane cztery pary wartości (liczby) zmiennych „x” i „y”. Możesz utworzyć następującą tabelę:
      • x || tak
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. 2 Oblicz średnią arytmetyczną „x”. Aby to zrobić, zsumuj wszystkie wartości x, a następnie podziel wynik przez liczbę wartości.
    • W naszym przykładzie są cztery wartości zmiennej „x”. Aby obliczyć średnią arytmetyczną „x”, dodaj te wartości, a następnie podziel sumę przez 4. Obliczenia są zapisane w następujący sposób:
    • μx=(1+2+4+5)/4{ styl wyświetlania mu _ {x} = (1 + 2 + 4 + 5) / 4}
    • μx=12/4{ styl wyświetlania mu _ {x} = 12/4}
    • μx=3{ styl wyświetlania mu _ {x} = 3}
  3. 3 Znajdź średnią arytmetyczną „y”. Aby to zrobić, wykonaj te same kroki, czyli dodaj wszystkie wartości y, a następnie podziel sumę przez liczbę wartości.
    • W naszym przykładzie podane są cztery wartości zmiennej „y”. Dodaj te wartości, a następnie podziel sumę przez 4. Obliczenia zostaną zapisane w następujący sposób:
    • μtak=(1+3+5+7)/4{ displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}
    • μtak=16/4{ styl wyświetlania mu _ {y} = 16/4}
    • μtak=4{ styl wyświetlania mu _ {y} = 4}
  4. 4 Oblicz odchylenie standardowe „x”. Po obliczeniu średnich „x” i „y” znajdź odchylenia standardowe tych zmiennych. Odchylenie standardowe oblicza się według następującego wzoru:
    • σx=1n1Σ(xμx)2{ displaystyle sigma _ {x} = { sqrt {{ frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}
    • W naszym przykładzie obliczenia będą napisane tak:
    • σx=141((13)2+(23)2+(43)2+(53)2){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {4-1}} * ((1-3) ^ {2} + (2-3) ^ {2} + ( 4-3) ^ {2} + (5-3) ^ {2})}}}
    • σx=13(4+1+1+4){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (4 + 1 + 1 + 4)}}}
    • σx=13(10){ displaystyle sigma _ {x} = { sqrt {{ frac {1} {3}} * (10)}}}
    • σx=103{ displaystyle sigma _ {x} = { sqrt { frac {10} {3}}}}
    • σx=1,83{ styl wyświetlania sigma _ {x} = 1,83}
  5. 5 Oblicz odchylenie standardowe „y”. Wykonaj czynności opisane w poprzednim kroku. Użyj tej samej formuły, ale wprowadź wartości y.
    • W naszym przykładzie obliczenia będą napisane tak:
    • σtak=141((14)2+(34)2+(54)2+(74)2){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}
    • σtak=13(9+1+1+9){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (9 + 1 + 1 + 9)}}}
    • σtak=13(20){ displaystyle sigma _ {y} = { sqrt {{ frac {1} {3}} * (20)}}}
    • σtak=203{ displaystyle sigma _ {y} = { sqrt { frac {20} {3}}}}
    • σtak=2,58{ styl wyświetlania sigma _ {y} = 2,58}
  6. 6 Zapisz podstawowy wzór na obliczenie współczynnika korelacji. Ten wzór zawiera średnie, odchylenia standardowe oraz liczbę (n) par liczb obu zmiennych. Współczynnik korelacji jest oznaczony jako „r” (w rzadkich przypadkach jako „ρ”). W tym artykule zastosowano wzór do obliczenia współczynnika korelacji Pearsona.
    • ρ=(1n1)Σ(xμxσx)(takμtakσtak){ displaystyle rho = lewo ({ frac {1} {n-1}} prawo) Sigma lewo ({ frac {x- mu _ {x}} { sigma _ {x}} } po prawej) * po lewej ({ frac {y- mu _ {y}} { sigma _ {y}}} po prawej)}
    • Tutaj iw innych źródłach ilości można oznaczać na różne sposoby. Na przykład niektóre formuły zawierają „ρ” i „σ”, podczas gdy inne zawierają „r” i „s”. Niektóre podręczniki podają różne formuły, ale są one matematycznymi odpowiednikami powyższej formuły.
  7. 7 Oblicz współczynnik korelacji. Obliczyłeś średnie i odchylenia standardowe obu zmiennych, więc możesz użyć wzoru do obliczenia współczynnika korelacji. Przypomnijmy, że „n” to liczba par wartości dla obu zmiennych. Inne wartości zostały obliczone wcześniej.
    • W naszym przykładzie obliczenia będą napisane tak:
    • ρ=(1n1)Σ(xμxσx)(takμtakσtak){ displaystyle rho = lewo ({ frac {1} {n-1}} prawo) Sigma lewo ({ frac {x- mu _ {x}} { sigma _ {x}} } po prawej) * po lewej ({ frac {y- mu _ {y}} { sigma _ {y}}} po prawej)}
    • ρ=(13){ displaystyle rho = lewo ({ frac {1} {3}} prawo) *}[(131,83)(142,58)+(231,83)(342,58){ displaystyle po lewej ({ frac {1-3} {1,83}} po prawej) * po lewej ({ frac {1-4} {2,58}} po prawej) + po lewej ({ frac {2 -3} {1.83}} prawy) * lewy ({ frac {3-4} {2.58}} prawy)}
         +(431,83)(542,58)+(531,83)(742,58){ displaystyle + po lewej ({ frac {4-3} {1,83}} po prawej) * po lewej ({ frac {5-4} {2,58}} po prawej) + po lewej ( { frac { 5-3} {1.83}} prawy) * lewy ({ frac {7-4} {2.58}} prawy)}]
    • ρ=(13)(6+1+1+64,721){ displaystyle rho = po lewej ({ frac {1} {3}} po prawej) * po lewej ({ frac {6 + 1 + 1 + 6} {4.721}} po prawej)}
    • ρ=(13)2,965{ displaystyle rho = lewo ({ frac {1} {3}} prawo) * 2,965}
    • ρ=(2,9653){ displaystyle rho = po lewej ({ frac {2965} {3}} po prawej)}
    • ρ=0,988{ styl wyświetlania rho = 0,988}
  8. 8 Przeanalizuj wynik. W naszym przykładzie współczynnik korelacji wynosi 0,988. Ta wartość w pewien sposób charakteryzuje dany zestaw par liczb. Zwróć uwagę na znak i wielkość wartości.
    • Ponieważ wartość współczynnika korelacji jest dodatnia, istnieje dodatnia korelacja między zmiennymi „x” i „y”. Oznacza to, że wraz ze wzrostem wartości „x” rośnie również wartość „y”.
    • Ponieważ wartość współczynnika korelacji jest bardzo bliska +1, wartości zmiennych „x” i „y” są silnie skorelowane. Jeśli umieścisz punkty na płaszczyźnie współrzędnych, będą one znajdować się blisko jakiejś linii prostej.

Metoda 2 z 4: Obliczanie współczynnika korelacji za pomocą kalkulatorów online

  1. 1 Znajdź kalkulator w Internecie, aby obliczyć współczynnik korelacji. Współczynnik ten jest często obliczany w statystykach. Jeśli istnieje wiele par liczb, ręczne obliczenie współczynnika korelacji jest prawie niemożliwe. Dlatego istnieją kalkulatory online do obliczania współczynnika korelacji. W wyszukiwarce wpisz „kalkulator współczynnika korelacji” (bez cudzysłowów).
  2. 2 Wprowadzanie danych. Sprawdź instrukcje na stronie, aby wprowadzić poprawne dane (pary cyfr). Konieczne jest wprowadzenie odpowiednich par liczb; w przeciwnym razie otrzymasz zły wynik. Pamiętaj, że różne strony internetowe mają różne formaty wejściowe.
    • Na przykład pod adresem http://ncalculators.com/statistics/correlation-coefficient-calculator.htm wartości zmiennych x i y są wprowadzane w dwóch poziomych liniach. Wartości są oddzielone przecinkami. Czyli w naszym przykładzie wartości „x” wpisujemy tak: 1,2,4,5, a wartości „y” tak: 1,3,5,7.
    • Na innej stronie, http://www.alcula.com/calculators/statistics/correlation-coefficient/, dane są wprowadzane pionowo; w takim przypadku nie myl odpowiednich par liczb.
  3. 3 Oblicz współczynnik korelacji. Po wprowadzeniu danych wystarczy kliknąć przycisk „Oblicz”, „Oblicz” lub podobny, aby uzyskać wynik.

Metoda 3 z 4: Korzystanie z kalkulatora graficznego

  1. 1 Wprowadzanie danych. Weź kalkulator graficzny, przejdź do trybu obliczeń statystycznych i wybierz polecenie „Edytuj”.
    • Różne kalkulatory wymagają naciśnięcia różnych klawiszy. W tym artykule omówiono kalkulator Texas Instruments TI-86.
    • Naciśnij [2nd] - Stat (nad klawiszem +), aby wejść w tryb obliczeń statystycznych. Następnie naciśnij F2 - Edytuj.
  2. 2 Usuń poprzednio zapisane dane. Większość kalkulatorów przechowuje wprowadzone statystyki, dopóki ich nie usuniesz. Aby uniknąć pomylenia starych danych z nowymi, najpierw usuń wszystkie zapisane informacje.
    • Użyj klawiszy strzałek, aby przesunąć kursor i podświetl nagłówek „xStat”. Następnie naciśnij Clear i Enter, aby wyczyścić wszystkie wartości wprowadzone w kolumnie xStat.
    • Użyj klawiszy strzałek, aby podświetlić nagłówek „yStat”. Następnie naciśnij Clear i Enter, aby wyczyścić wszystkie wartości wprowadzone w kolumnie yStat.
  3. 3 Wprowadź dane początkowe. Użyj klawiszy strzałek, aby przesunąć kursor do pierwszej komórki pod nagłówkiem „xStat”. Wprowadź pierwszą wartość i naciśnij Enter. Na dole ekranu wyświetlany jest napis „xStat (1) = __”, a wpisana wartość zastępuje spację. Po naciśnięciu Enter wprowadzona wartość pojawi się w tabeli, a kursor przesunie się do następnej linii; spowoduje to wyświetlenie „xStat (2) = __” na dole ekranu.
    • Wprowadź wszystkie wartości dla zmiennej „x”.
    • Po wprowadzeniu wszystkich wartości dla x, użyj klawiszy strzałek, aby przejść do kolumny yStat i wprowadź wartości dla y.
    • Po wprowadzeniu wszystkich par liczb naciśnij Wyjdź, aby wyczyścić ekran i wyjść z trybu agregacji.
  4. 4 Oblicz współczynnik korelacji. Charakteryzuje, jak blisko są dane do pewnej linii prostej. Kalkulator graficzny może szybko określić odpowiednią linię prostą i obliczyć współczynnik korelacji.
    • Kliknij Statystyka - Oblicz. W TI-86 naciśnij [2nd] - [Stat] - [F1].
    • Wybierz funkcję regresji liniowej. W TI-86 naciśnij [F3], który jest oznaczony jako „LinR”. Na ekranie pojawi się wiersz „LinR _” z migającym kursorem.
    • Teraz wpisz nazwy dwóch zmiennych: xStat i yStat.
      • W TI-86 otwórz listę nazwisk; w tym celu naciśnij [2nd] - [List] - [F3].
      • Dostępne zmienne są wyświetlane w dolnej linii ekranu. Wybierz [xStat] (prawdopodobnie musisz nacisnąć F1 lub F2, aby to zrobić), wprowadź przecinek, a następnie wybierz [yStat].
      • Naciśnij Enter, aby przetworzyć wprowadzone dane.
  5. 5 Przeanalizuj swoje wyniki. Po naciśnięciu klawisza Enter na ekranie pojawią się następujące informacje:
    • tak=a+bx{ styl wyświetlania y = a + bx}: jest to funkcja opisująca linię. Należy pamiętać, że funkcja nie jest napisana w standardowej formie (y = kx + b).
    • a={ styl wyświetlania a =}... Jest to współrzędna y przecięcia linii prostej z osią y.
    • b={ styl wyświetlania b =}... To jest nachylenie linii.
    • Corr={ displaystyle { text {corr}} =}... To jest współczynnik korelacji.
    • n={ styl wyświetlania n =}... Jest to liczba par liczb, które zostały użyte w obliczeniach.

Metoda 4 z 4: Wyjaśnianie podstawowych pojęć

  1. 1 Zrozum pojęcie korelacji. Korelacja to statystyczna zależność między dwiema wielkościami. Współczynnik korelacji to wartość liczbowa, którą można obliczyć dla dowolnych dwóch zestawów danych. Wartość współczynnika korelacji zawsze mieści się w przedziale od -1 do +1 i charakteryzuje stopień powiązania dwóch zmiennych.
    • Na przykład biorąc pod uwagę wzrost i wiek dzieci (około 12 lat). Najprawdopodobniej pojawi się silna pozytywna korelacja, ponieważ dzieci rosną z wiekiem.
    • Przykład negatywnej korelacji: sekundy karne i czas spędzony na treningu biathlonowym, czyli im więcej trenuje zawodnik, tym mniej sekund karnych zostanie przyznanych.
    • Wreszcie, czasami występuje bardzo niewielka korelacja (pozytywna lub negatywna), na przykład między rozmiarem buta a wynikami matematycznymi.
  2. 2 Pamiętaj, jak obliczyć średnią arytmetyczną. Aby obliczyć średnią arytmetyczną (lub średnią), musisz znaleźć sumę wszystkich tych wartości, a następnie podzielić ją przez liczbę wartości. Pamiętaj, że do obliczenia współczynnika korelacji potrzebna jest średnia arytmetyczna.
    • Średnia wartość zmiennej jest oznaczona literą z poziomym paskiem nad nią. Np. w przypadku zmiennych „x” i „y” ich wartości średnie oznaczono następująco: x̅ i y̅. Średnia jest czasami oznaczana grecką literą „μ” (mu). Aby zapisać średnią arytmetyczną wartości zmiennej „x”, użyj notacji μx lub μ (x).
    • Na przykład, biorąc pod uwagę następujące wartości zmiennej „x”: 1,2,5,6,9,10. Średnia arytmetyczna tych wartości jest obliczana w następujący sposób:
      • μx=(1+2+5+6+9+10)/6{ displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}
      • μx=33/6{ styl wyświetlania mu _ {x} = 33/6}
      • μx=5,5{ styl wyświetlania mu _ {x} = 5,5}
  3. 3 Zwróć uwagę na znaczenie odchylenia standardowego. W statystyce odchylenie standardowe charakteryzuje stopień rozproszenia liczb w stosunku do ich średniej. Jeśli odchylenie standardowe jest małe, liczby są zbliżone do średniej; jeśli odchylenie standardowe jest duże, liczby są dalekie od średniej.
    • Odchylenie standardowe jest oznaczone literą „s” lub grecką literą „σ” (sigma). Zatem odchylenie standardowe wartości zmiennej „x” oznacza się następująco: sx lub σx.
  4. 4 Zapamiętaj symbol operacji sumowania. Symbol sumowania jest jednym z najczęstszych symboli w matematyce i wskazuje sumę wartości. Ten symbol to grecka litera „Σ” (wielka sigma).
    • Na przykład, jeśli podano następujące wartości zmiennej „x”: 1,2,5,6,9,10, to Σx oznacza:
      • 1 + 2 + 5 + 6 + 9 + 10 = 33.

Porady

  • Współczynnik korelacji jest czasami nazywany „współczynnikiem korelacji Pearsona” od jego twórcy Carla Pearsona.
  • W większości przypadków, gdy współczynnik korelacji jest większy niż 0,8 (dodatni lub ujemny), występuje silna korelacja; jeśli współczynnik korelacji jest mniejszy niż 0,5 (dodatni lub ujemny), obserwuje się słabą korelację.

Ostrzeżenia

  • Korelacja charakteryzuje zależność między wartościami dwóch zmiennych. Pamiętaj jednak, że korelacja nie ma nic wspólnego z przyczynowością. Na przykład, jeśli porównasz wzrost i rozmiar butów ludzi, prawdopodobnie znajdziesz silną pozytywną korelację. Ogólnie rzecz biorąc, im wyższa osoba, tym większy rozmiar buta. Nie oznacza to jednak, że wzrost wysokości prowadzi do automatycznego zwiększenia rozmiaru buta lub że większe stopy doprowadzą do szybszego wzrostu. Te ilości są po prostu ze sobą powiązane.