Określ współczynnik korelacji

Autor: Morris Wright
Data Utworzenia: 28 Kwiecień 2021
Data Aktualizacji: 19 Czerwiec 2024
Anonim
Correlation Coefficient
Wideo: Correlation Coefficient

Zawartość

Współczynnik korelacji, oznaczony jako r lub ρ, jest miarą korelacji liniowej (zależności, zarówno pod względem siły, jak i kierunku) między dwiema zmiennymi. Zakres waha się od -1 do +1, przy użyciu znaków plus i minus do przedstawienia dodatniej i ujemnej korelacji. Jeśli współczynnik korelacji wynosi dokładnie -1, to zależność między dwiema zmiennymi jest całkowicie ujemna; jeśli współczynnik korelacji wynosi dokładnie +1, to zależność jest całkowicie dodatnia. Dwie zmienne mogą mieć korelację dodatnią, korelację ujemną lub wcale. Możesz obliczyć korelację ręcznie, korzystając z niektórych bezpłatnych obliczeń korelacji dostępnych online lub korzystając z funkcji statystycznych dobrego kalkulatora graficznego.

Do kroku

Metoda 1 z 4: Oblicz ręcznie współczynnik korelacji

  1. Najpierw zbierz swoje dane. Aby rozpocząć obliczanie efektywnej korelacji, najpierw zbadaj pary danych. Warto umieścić je w tabeli, zarówno w pionie, jak iw poziomie. Oznacz każdy wiersz lub kolumnę x i y.
    • Na przykład załóżmy, że masz cztery pary danych dla X i y. Tabela może wtedy wyglądać następująco:
      • x || y
      • 1 || 1
      • 2 || 3
      • 4 || 5
      • 5 || 7
  2. Oblicz średnią X. Aby obliczyć średnią, potrzebujesz wszystkich wartości X dodaj, a następnie podziel przez liczbę wartości.
    • Korzystając z powyższego przykładu, zwróć uwagę, że masz cztery wartości dla X. Aby obliczyć średnią, zsumujesz wszystkie wartości X i podziel przez 4. Obliczenie wygląda następująco:
    • μX=(1+2+4+5)/4{ Displaystyle mu _ {x} = (1 + 2 + 4 + 5) / 4}Znajdź średnią y. Do średniej y Aby go znaleźć, wykonaj te same kroki, dodając wszystkie wartości y do siebie, a następnie dzieląc przez liczbę wartości.
      • W powyższym przykładzie masz również cztery wartości y. Dodaj wszystkie te wartości do siebie, a następnie podziel je przez 4. Obliczenia będą wyglądać następująco:
      • μy=(1+3+5+7)/4{ Displaystyle mu _ {y} = (1 + 3 + 5 + 7) / 4}Określ odchylenie standardowe X. Gdy masz już swoje środki, możesz obliczyć odchylenie standardowe. Aby to zrobić, użyj wzoru:
        • σX=1n1Σ(XμX)2{ Displaystyle sigma _ {x} = { sqrt {{ Frac {1} {n-1}} Sigma (x- mu _ {x}) ^ {2}}}}Oblicz odchylenie standardowe y. Wykonując te same podstawowe kroki, znajdź odchylenie standardowe y. Użyjesz tej samej formuły, używając punktów danych dla y.
          • Z przykładowymi danymi Twoje obliczenia będą wyglądać następująco:
          • σy=141((14)2+(34)2+(54)2+(74)2){ Displaystyle sigma _ {y} = { sqrt {{ Frac {1} {4-1}} * ((1-4) ^ {2} + (3-4) ^ {2} + ( 5-4) ^ {2} + (7-4) ^ {2})}}}Przejrzyj podstawową formułę do określania współczynnika korelacji. Wzór do obliczania współczynnika korelacji wykorzystuje średnie, odchylenia standardowe i liczbę par w zbiorze danych (reprezentowaną przez n). Sam współczynnik korelacji jest reprezentowany przez małą literę r lub grecką literę ρ (rho). W tym artykule użyjemy wzoru znanego jako współczynnik korelacji Pearsona, jak pokazano poniżej:
            • ρ=(1n1)Σ(XμXσX)(yμyσy){ Displaystyle rho = lewo ({ Frac {1} {n-1}} prawo) Sigma lewo ({ Frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Określ współczynnik korelacji. Masz teraz średnie i odchylenia standardowe dla swoich zmiennych, więc możesz przejść do wzoru na współczynnik korelacji. Zapamietaj to n reprezentuje liczbę posiadanych wartości. W powyższych krokach wypracowałeś już inne istotne informacje.
              • Korzystając z przykładowych danych, możesz wprowadzić dane do wzoru na współczynnik korelacji i obliczyć je w następujący sposób:
              • ρ=(1n1)Σ(XμXσX)(yμyσy){ Displaystyle rho = lewo ({ Frac {1} {n-1}} prawo) Sigma lewo ({ Frac {x- mu _ {x}} { sigma _ {x}} } right) * left ({ frac {y- mu _ {y}} { sigma _ {y}}} right)}Zinterpretuj wynik. Dla tego zbioru danych współczynnik korelacji wynosi 0,988. Ta liczba mówi ci o dwóch rzeczach o danych. Spójrz na znak liczby i rozmiar liczby.
                • Ponieważ współczynnik korelacji jest dodatni, można powiedzieć, że istnieje dodatnia korelacja między danymi x a danymi y. Oznacza to, że jeśli wartości x wzrosną, spodziewasz się, że wzrosną również wartości y.
                • Ponieważ współczynnik korelacji jest bardzo bliski +1, dane x i dane y są bardzo blisko powiązane. Gdybyś miał narysować te punkty, zobaczyłbyś, że są one bardzo dobrym przybliżeniem linii prostej.

Metoda 2 z 4: Korzystanie z kalkulatorów korelacji online

  1. Wyszukaj online kalkulatory korelacji. Pomiar korelacji jest dość standardowym obliczeniem dla statystyków. Obliczenia mogą być bardzo uciążliwe w przypadku dużych zestawów danych, jeśli są wykonywane ręcznie. Dlatego wiele źródeł udostępniło w Internecie wspólne obliczenia korelacji. Skorzystaj z dowolnej wyszukiwarki i wprowadź hasło „kalkulator korelacji”.
  2. Wprowadź dane. Przeczytaj uważnie instrukcje na stronie, aby poprawnie wprowadzić dane. Ważne jest, aby pary danych były utrzymywane w porządku, w przeciwnym razie uzyskasz niepoprawny wynik korelacji. Różne strony internetowe używają różnych formatów do wprowadzania danych.
    • Na przykład na stronie http://ncalculators.com/statistics/correlation-coefficient-calculator.htm znajdziesz poziome okienko do wpisywania wartości x i drugie poziome okienko do wprowadzania wartości y. Wprowadzasz terminy, oddzielając je tylko przecinkami. Zatem zestaw danych x obliczony wcześniej w tym artykule należy wprowadzić jako 1,2,4,5. Zestaw danych y jest wprowadzany jako 1,3,5,7.
    • W innej witrynie, http://www.alcula.com/calculators/statistics/correlation-coefficient/, możesz wprowadzać dane w poziomie lub w pionie, o ile punkty danych są uporządkowane.
  3. Oblicz wyniki. Te strony kalkulacyjne są popularne, ponieważ po wprowadzeniu danych generalnie wystarczy kliknąć przycisk „Oblicz” - wynik pojawi się automatycznie.

Metoda 3 z 4: Korzystanie z kalkulatora graficznego

  1. Wprowadź swoje dane. W kalkulatorze graficznym włącz funkcję statystyki, a następnie wybierz polecenie „Edytuj”.
    • Każdy kalkulator ma nieco inne polecenia klawiszowe. Ten artykuł zawiera szczegółowe instrukcje dotyczące Texas Instruments TI-86.
    • Aby uzyskać dostęp do funkcji Stat, naciśnij [2nd] -Stat (nad klawiszem „+”), a następnie naciśnij klawisz F2-Edit.
  2. Usuń wszystkie stare zapisane dane. Większość kalkulatorów zachowa dane statystyczne, dopóki nie zostaną wyczyszczone. Aby nie pomylić starych danych z nowymi, należy najpierw usunąć wszystkie zapisane wcześniej informacje.
    • Za pomocą klawiszy strzałek przesuń kursor, aby podświetlić kategorię „xStat”. Następnie naciśnij „Wyczyść” i „Enter”. Powinno to wyczyścić wszystkie wartości w kolumnie xStat.
    • Za pomocą klawiszy strzałek podświetl kategorię „yStat”. Naciśnij „Wyczyść” i „Enter”, aby również wyczyścić dane w tej kolumnie.
  3. Wprowadź wartości danych. Za pomocą klawiszy strzałek przesuń kursor do pierwszej spacji pod nagłówkiem xStat. Wpisz pierwszą wartość danych, a następnie naciśnij klawisz Enter. Powinieneś zobaczyć spację u dołu ekranu „xStat (1) = __”, gdzie twoja wartość wypełnia puste miejsce. Po naciśnięciu klawisza Enter dane wypełnią tabelę, kursor przesunie się do następnego wiersza, a wiersz na dole ekranu powinien teraz brzmieć „xStat (2) = __”.
    • Kontynuuj wprowadzanie wszystkich wartości x.
    • Po wprowadzeniu wartości x użyj klawiszy strzałek, aby przejść do kolumny yStat i wprowadzić wartości y.
    • Po wprowadzeniu wszystkich danych naciśnij przycisk Exit, aby wyczyścić ekran i wyjść z menu Stat.
  4. Oblicz statystyki regresji liniowej. Współczynnik korelacji jest miarą tego, jak blisko dane przybliżają linię prostą. Kalkulator graficzny z funkcjami statystycznymi może bardzo szybko obliczyć najlepszą linię dopasowania i współczynnik korelacji.
    • Wejdź w funkcję Stat, a następnie naciśnij przycisk Calc. W TI-86 jest to [2nd] [Stat] [F1].
    • Wybierz obliczenia regresji liniowej. W TI-86 jest to [F3], oznaczone jako „LinR”. Wyświetlacz graficzny wyświetli wówczas wiersz „LinR _” z migającym kursorem.
    • Musisz teraz wprowadzić nazwy dwóch zmiennych, które chcesz obliczyć. Są to xStat i yStat.
      • W kalkulatorze TI-86 wybierz listę nazw („Names”), naciskając klawisz [2nd] [List] [F3].
      • Dolna linia ekranu powinna teraz pokazywać dostępne zmienne. Wybierz [xStat] (prawdopodobnie jest to przycisk F1 lub F2), następnie wpisz przecinek, a następnie [yStat].
      • Naciśnij klawisz Enter, aby obliczyć dane
  5. Zinterpretuj wyniki. Po naciśnięciu klawisza Enter kalkulator natychmiast obliczy następujące informacje dla wprowadzonych danych:
    • y=za+bX{ displaystyle y = a + bx}Zrozum pojęcie korelacji. Korelacja odnosi się do statystycznej zależności między dwiema wielkościami. Współczynnik korelacji to pojedyncza liczba, którą można obliczyć dla dwóch zestawów punktów danych. Liczba zawsze mieści się w przedziale od -1 do +1 i wskazuje, jak blisko są dwa zestawy danych.
      • Na przykład, jeśli zmierzyłeś wzrost i wiek dzieci w wieku do około 12 lat, spodziewasz się, że znajdziesz silną dodatnią korelację. Gdy dzieci się starzeją, stają się wyższe.
      • Przykładem negatywnej korelacji jest porównanie czasu spędzonego przez kogoś na ćwiczeniu golfa z wynikiem golfowym tej osoby. W miarę postępów w praktyce wynik powinien spadać.
      • Ostatecznie można by oczekiwać niewielkiej korelacji, pozytywnej lub negatywnej, na przykład między rozmiarem buta danej osoby a jej ocenami z egzaminu.
    • Oblicz średnią. Średnia arytmetyczna lub „średnia” zbioru danych jest obliczana poprzez dodanie wszystkich wartości danych, a następnie podzielenie przez liczbę wartości w zestawie. Aby określić współczynnik korelacji dla swoich danych, musisz obliczyć średnią każdego zestawu danych.
      • Średnia zmiennej jest wskazywana przez zmienną z poziomą linią nad nią. Jest to często określane jako „x-bar” lub „y-bar” dla zestawów danych x i y. Alternatywnie, średnią można oznaczyć małą literą grecką μ (mu). Na przykład, aby wskazać średnią punktów danych x, możesz użyć μX lub μ (x).
      • Na przykład, jeśli masz zbiór x (1,2,5,6,9,10), średnia z tych danych jest obliczana w następujący sposób:
        • μX=(1+2+5+6+9+10)/6{ Displaystyle mu _ {x} = (1 + 2 + 5 + 6 + 9 + 10) / 6}Poznaj znaczenie odchylenia standardowego. W statystyce odchylenie standardowe mierzy zmienność, pokazując rozrzut liczb od średniej. Grupa liczb o niskim odchyleniu standardowym jest dość blisko siebie. Grupa liczb o wysokim odchyleniu standardowym jest bardziej rozproszona.
          • Jako symbol odchylenie standardowe jest wyrażane za pomocą małej litery s lub greckiej litery σ (sigma). W związku z tym odchylenie standardowe danych x jest zapisywane jako sX lub σX.
        • Rozpoznaj notację podsumowania. Operator sumowania jest jednym z najpowszechniejszych operatorów w matematyce i wskazuje sumę wartości. Jest reprezentowany przez grecką wielką literę, sigma lub ∑.
          • Na przykład, jeśli masz zbiór punktów danych x (1,2,5,6,9,10), wówczas ∑x oznacza:
            • 1+2+5+6+9+10 = 33

Porady

  • Współczynnik korelacji jest czasami nazywany „współczynnikiem korelacji momentu iloczynu Pearsona” na cześć Karla Pearsona, jego twórcy.
  • Ogólnie współczynnik korelacji wyższy niż 0,8 (dodatni lub ujemny) oznacza silną korelację; współczynnik korelacji niższy niż 0,5 (ponownie dodatni lub ujemny) oznacza słaby współczynnik korelacji.

Ostrzeżenia

  • Korelacja pokazuje, że dwa zbiory danych są w jakiś sposób połączone. Uważaj jednak, aby nie interpretować tego jako związku przyczynowego. Na przykład, jeśli porównasz rozmiary butów ludzi i ich wzrost, prawdopodobnie znajdziesz silną dodatnią korelację. Więksi ludzie na ogół mają większe stopy. Nie oznacza to jednak, że wzrost sprawi, że twoje stopy urosną, lub że duże stopy sprawią, że staniesz się wysoki. Po prostu zdarzają się razem.