Jak ocenić istotność statystyczną

Autor: Randy Alexander
Data Utworzenia: 2 Kwiecień 2021
Data Aktualizacji: 26 Czerwiec 2024
Anonim
4  Parametryczne testy istotnosci
Wideo: 4 Parametryczne testy istotnosci

Zawartość

Testowanie hipotez opiera się na analizie statystycznej. Statystycznie istotna ufność jest obliczana przy użyciu wartości p - która wskazuje prawdopodobieństwo zaobserwowanego wyniku, gdy pewne twierdzenie (hipoteza zerowa) jest prawdziwe. Jeśli wartość p jest mniejsza niż poziom istotności (zwykle 0,05), eksperymentator może dojść do wniosku, że jest wystarczająco dużo dowodów, aby obalić hipotezę zerową i przyjąć hipotezę odwrotną. Za pomocą prostego testu t można obliczyć wartość p i określić istotność między dwiema różnymi grupami danych.

Kroki

Część 1 z 3: Skonfiguruj eksperymenty

  1. Określ swoją hipotezę. Pierwszym krokiem w ocenie istotności statystycznej jest określenie pytań, na które należy odpowiedzieć, i zadeklarowanie hipotezy. Hipoteza jest stwierdzeniem danych empirycznych i możliwych rozbieżności w populacji. Każdy eksperyment ma hipotezę zerową i hipotezę odwrotną. Ogólnie porównujesz dwie grupy, aby sprawdzić, czy są takie same, czy różne.
    • Generalnie hipoteza nie jest (H.0) potwierdzają, że nie ma różnicy między dwiema grupami danych. Przykład: Uczniowie, którzy przeczytali materiał przed zajęciami, nie dostaną lepszych ocen końcowych.
    • Hipoteza odwrotna (H.za) jest sprzeczne z hipotezą zerową i jest stwierdzeniem, które próbujesz poprzeć swoimi danymi empirycznymi. Na przykład: Uczniowie, którzy przeczytali materiał przed zajęciami, w rzeczywistości uzyskują lepsze oceny końcowe.

  2. Wybierz poziom istotności, aby określić stopień różnicy, który można uznać za znaczący w danych. Poziom istotności (znany również jako alfa) to próg, który wybierasz do określenia znaczenia. Jeżeli wartość p jest mniejsza lub równa danemu poziomowi istotności, dane uważa się za statystycznie istotne.
    • Zasadniczo poziom istotności (lub alfa) jest zwykle wybierany na poziomie 0,05 - co oznacza, że ​​szansa zaobserwowania różnicy widocznej na danych jest przypadkowa tylko 5%.
    • Im wyższy poziom ufności (a zatem niższa wartość p), tym bardziej miarodajne wyniki.
    • Jeśli wymagana jest większa pewność, obniż wartość p do 0,01. Niska wartość p jest często stosowana w produkcji w celu wykrycia wad produktu. Wysoki stopień niezawodności jest krytyczny, aby zaakceptować fakt, że każda część będzie działać tak, jak powinna.
    • W przypadku większości eksperymentów opartych na hipotezach akceptowalny jest poziom istotności 0,05.

  3. Zdecyduj, czy użyć testu jednostronnego, czy dwustronnego. Jednym z założeń testu t jest to, że dane mają rozkład normalny. Rozkład normalny utworzy krzywą dzwonową z wyśrodkowaniem większości obserwacji. Test t to test matematyczny, który sprawdza, czy dane znajdują się poza rozkładem normalnym, powyżej lub poniżej, w „górnej” części krzywej.
    • Jeśli nie masz pewności, czy dane są powyżej, czy poniżej grupy kontrolnej, użyj testu dwustronnego. Pozwala sprawdzić znaczenie w obu kierunkach.
    • Jeśli wiesz, jaki jest oczekiwany kierunek Twoich danych, użyj testu jednostronnego. W powyższym przykładzie spodziewasz się, że wyniki ucznia poprawią się. Dlatego używasz testu jednostronnego.

  4. Określić wielkość próbki za pomocą analizy siły. Siłą testu jest zdolność obserwacji oczekiwanego wyniku przy danej wielkości próby. Wspólny próg siły (lub β) wynosi 80%. Analiza sił może być dość skomplikowana bez pewnych wstępnych danych, ponieważ potrzebujesz pewnych informacji o spodziewanej średniej między grupami i ich odchyleniach standardowych. Użyj analizy siły online, aby określić optymalną wielkość próbki dla swoich danych.
    • Naukowcy często przeprowadzają niewielkie badanie wstępne, aby uzyskać informacje na temat analizy siły i zdecydować o wielkości próby potrzebnej do dużego i kompleksowego badania.
    • Jeśli nie ma możliwości przeprowadzenia złożonych badań przesłanek, oszacuj możliwą średnią na podstawie przeczytania artykułów i badań, które mogły przeprowadzić inne osoby. Może zapewnić dobry początek w określaniu wielkości próbek.
    Reklama

Część 2 z 3: Oblicz odchylenie standardowe

  1. Określ wzór na odchylenie standardowe. Odchylenie standardowe mierzy rozproszenie danych. Dostarcza informacji o tożsamości każdego punktu danych w próbce. Na początku równania mogą wyglądać na dość skomplikowane. Jednak poniższe kroki pomogą ci w łatwym zrozumieniu procesu obliczania. Formuła to s = √∑ ((xja - µ) / (N - 1)).
    • s to odchylenie standardowe.
    • ∑ wskazuje, że będziesz musiał zsumować wszystkie zebrane obserwacje.
    • xja każdy reprezentuje wartość danych.
    • µ jest średnią danych dla każdej grupy.
    • N to całkowita liczba obserwacji.
  2. Uśredniono obserwowane dane dla każdej grupy. Aby obliczyć odchylenie standardowe, należy najpierw obliczyć średnią z obserwacji dla każdej grupy. Wartość ta jest symbolizowana grecką literą mu lub µ. Aby to zrobić, po prostu dodaj obserwacje i podziel przez całkowitą liczbę obserwacji.
    • Na przykład, aby znaleźć średni wynik grupy czytającej dokument przed zajęciami, spójrzmy na niektóre dane. Dla uproszczenia użyjemy zestawu danych składającego się z 5 punktów: 90, 91, 85, 83 i 94 (w 100-punktowej skali).
    • Dodaj wszystkie obserwacje: 90 + 91 + 85 + 83 + 94 = 443.
    • Podziel powyższą sumę przez liczbę obserwacji N (N = 5): 443/5 = 88,6.
    • Średnia ocen w tej grupie to 88,6.
  3. Odejmij średnią od każdej zaobserwowanej wartości. Następny krok obejmuje część (xja - µ) równania. Odejmij średnią wartość od każdej zaobserwowanej wartości. W powyższym przykładzie mamy pięć odejmowań.
    • (90 - 88,6), (91 - 88,6), (85 - 88,6), (83 - 88,6) i (94 - 88,6).
    • Obliczona wartość to 1,4; 2,4; -3,6; -5,6 i 5,4.
  4. Wyrównaj powyższe różnice do kwadratu i zsumuj. Każda nowa obliczona wartość zostanie teraz podniesiona do kwadratu. Tutaj również zostanie usunięty znak minus. Jeśli po tym kroku lub na końcu obliczeń pojawi się znak minus, być może zapomniałeś wykonać powyższy krok.
    • W naszym przykładzie będziemy teraz pracować z 1,96; 5,76; 12,96; 31,36 i 29,16.
    • Dodaj te kwadraty do siebie: 1,96 + 5,76 + 12,96 + 31,36 + 29,16 = 81,2.
  5. Podzielić przez całkowitą liczbę obserwacji minus 1. Dzielenie przez N - 1 pomaga skompensować obliczenia, które nie są wykonywane na populacji jako całości, ale są oparte na próbie wszystkich uczniów.
    • Odejmij: N - 1 = 5 - 1 = 4
    • Podziel: 81,2 / 4 = 20,3
  6. Uzyskaj pierwiastek kwadratowy. Po podzieleniu przez liczbę obserwacji minus 1, weź pierwiastek kwadratowy z uzyskanej wartości. To ostatni krok w obliczaniu odchylenia standardowego. Niektóre programy statystyczne pomogą w wykonaniu tych obliczeń po zaimportowaniu oryginalnych danych.
    • W powyższym przykładzie odchylenie standardowe końcowej oceny studentów czytających dokument przed zajęciami wynosi: s = √20,3 = 4,51.
    Reklama

Część 3 z 3: Określenie istotności statystycznej

  1. Oblicz wariancję między dwiema grupami obserwacji. Do tego momentu przykład dotyczył tylko jednej grupy obserwacji. Aby porównać dwie grupy, potrzebujesz oczywiście danych z obu. Oblicz odchylenie standardowe drugiej grupy obserwacji i użyj go do obliczenia wariancji między dwiema grupami eksperymentalnymi. Wzór na obliczenie wariancji to: sre = √ ((s1/ N1) + (s2/ N2)).
    • Sre to różnica między grupami.
    • S1 oznacza odchylenie standardowe grup 1 i N.1 jest wielkością grupy 1.
    • S2 oznacza odchylenie standardowe grup 2 i N.2 to wielkość grupy 2.
    • W naszym przykładzie załóżmy, że dane z grupy 2 (uczniowie, którzy nie czytali tekstu przed zajęciami) mają wielkość 5 i odchylenie standardowe 5,81. Wariancja to:
      • Sre = √ ((s1) / N1) + ((s2) / N2))
      • Sre = √(((4.51)/5) + ((5.81)/5)) = √((20.34/5) + (33.76/5)) = √(4.07 + 6.75) = √10.82 = 3.29.
  2. Oblicz wynik t danych. Statystyki T pozwalają konwertować dane do postaci porównywalnej z innymi danymi. Wartość t umożliwia również wykonanie testu t, testu, który pozwala obliczyć prawdopodobieństwo statystycznie istotnej różnicy między dwiema grupami. Wzór na obliczenie statystyki t jest następujący: t = (µ1 – µ2) / S.re.
    • µ1 jest średnią z pierwszej grupy.
    • µ2 jest średnią z drugiej grupy.
    • Sre jest wariancją między obserwacjami.
    • Użyj większej średniej jako µ1 aby nie uzyskać ujemnej statystyki t.
    • Dla naszego przykładu załóżmy, że obserwowana średnia dla grupy 2 (która nie czytała poprzedniego artykułu) wynosi 80. Wynik t wynosi: t = (µ1 – µ2) / S.re = (88,6 – 80)/3,29 = 2,61.
  3. Określ stopień swobody próbki. W przypadku korzystania ze statystyki t stopnie swobody są określane na podstawie wielkości próbki. Dodaj liczbę obserwacji dla każdej grupy, a następnie odejmij dwa. W powyższym przykładzie stopień swobody (d.f.) wynosi 8, ponieważ w pierwszej grupie jest 5 próbek, aw drugiej 5 próbek ((5 + 5) - 2 = 8).
  4. Użyj tabeli t do oceny istotności. Tabele wartości t i stopni swobody można znaleźć w standardowej książce statystycznej lub w Internecie. Znajdź wiersz zawierający stopnie swobody danych i wartość p, która odpowiada posiadanej statystyce t.
    • Przy stopniach swobody 8 it = 2,61, wartość p dla testu jednostronnego mieści się między 0,01 a 0,025. Ponieważ wybrany poziom istotności jest mniejszy lub równy 0,05, nasze dane są statystycznie istotne. Mając te dane, odrzucamy hipotezę zerową i akceptujemy hipotezę odwrotną: uczniowie, którzy przeczytali materiał przed zajęciami, mają wyższe wyniki końcowe.
  5. Rozważ przeprowadzenie dalszych badań. Wielu badaczy przeprowadza wstępne badania z kilkoma parametrami, aby zrozumieć, jak zaprojektować większe badanie. Wykonywanie innych badań z większą liczbą wskaźników zwiększy Twoją pewność wyciągania wniosków. Reklama

Rada

  • Statystyka to obszerna i złożona dziedzina. Weź udział w kursie testowania hipotez statystycznych w szkole średniej lub na uniwersytecie (lub wyższym), aby zrozumieć znaczenie statystyczne.

Ostrzeżenie

  • Ta analiza koncentruje się na teście t, aby sprawdzić różnicę między dwiema populacjami o rozkładzie normalnym. W zależności od złożoności danych może być potrzebny kolejny test statystyczny.