Wyklad 2, PK, Statystyka

Poza tym na świecie jest niewiele istot groźniejszych od kobiety.

 

ROZKŁADY ZMIENNYCH LOSOWYCH SKOKOWYCH

 

Rozkład dwumianowy (rozkład Bernoulliego)

 

Rozpatrzmy serię n kolejnych powtórzeń pewnego doświadczenia (np. n kolejnych rzutów kostką). W wyniku każdego z tych powtórzeń może zostać zrealizowane pewne zdarzenie A (np. na wyrzuceniu 2 oczek). Jeżeli prawdopodobieństwo wystąpienia zdarzenia A jest w każdym powtórzeniu takie same (nie zależy od kolejności i częstości powtórzenia) i wynosi p (tzw. prawdopodobieństwo sukcesu), to model probabilistyczny takiej serii doświadczeń nazywamy schematem Bernoulliego.

Zmienną losową o rozkładzie dwumianowym można interpretować jako liczbę wystąpień określonego zdarzenia w serii doświadczeń przebiegających zgodnie ze schematem Bernoulliego. Zatem zmienna losowa X ma rozkład dwumianowy (rozkład Bernoulliego), gdy funkcja prawdopodobieństwa ma postać:

,

gdzie k jest liczbą realizacji pewnego doświadczenia w serii n kolejnych powtórzeń tego doświadczenia.

W praktyce przyjmuje się prawdopodobieństwo sukcesu a liczbę niezależnych wyników obserwacji statystycznej .

Parametry rozkładu zmiennej losowej o rozkładzie dwumianowym:

·         wartość oczekiwana:    

·         wariancja:                     

Rozkład Poissona

Rozkład Poissona jest rozkładem granicznym dla rozkładu Bernoulliego, czyli rozkład dwumianowy zmierza do rozkładu Poissona, gdy prawdopodobieństwo sukcesu p maleje a liczebność serii doświadczeń n wzrasta.

W praktyce przyjmuje się prawdopodobieństwo sukcesu a liczbę niezależnych wyników obserwacji statystycznej .

Zmienna losowa X ma rozkład Poissona, gdy funkcja prawdopodobieństwa ma postać:

,

gdzie k jest liczbą realizacji pewnego doświadczenia w serii n kolejnych powtórzeń tego doświadczenia, pewną stałą (definiowaną jako ), a .

Parametry rozkładu zmiennej losowej o rozkładzie Poissona:

·         wartość oczekiwana:    

·         wariancja:                     

 

TESTOWANIE HIPOTEZ STATYSTYCZNYCH

 

Statystyka matematyczna zajmuje się metodami wnioskowania o całej zbiorowości na podstawie zbadania pewnej jej części – zwanej próbą, którą wybiera się w sposób losowy. Dyscyplinę tę tworzą trzy działy:

a)      teoria estymacji,

b)     weryfikacja hipotez statystycznych,

c)      metoda reprezentacyjna.

Przedmiotem estymacji są zagadnienia szacowania nieznanych parametrów zbiorowości statystycznej (populacji) na podstawie danych z próby losowej.

Weryfikacja hipotez statystycznych obejmuje zasady i metody sprawdzania określonych przypuszczeń dotyczących parametrów populacji na podstawie próby losowej.

Metoda reprezentacyjna zajmuje się sposobami losowego wyboru próby ze zbiorowości skończonych.

 

Hipoteza statystyczna jest sformułowanym przypuszczeniem dotyczącym rozkładu zbiorowości. Hipoteza może być parametryczna, gdy weryfikacja obejmuje średnią, wariancję czy wskaźnik struktury, lub nieparametryczna, gdy dotyczy np. postaci rozkładu zbiorowości czy współzależności cech. Wyróżniamy hipotezę zerową będącą hipotezą sprawdzaną (testowaną, weryfikowaną) oraz hipotezę alternatywną , którą jesteśmy skłonni przyjąć, gdy odrzucimy . Testem statystycznym nazywamy regułę postępowania, która przyporządkowuje wynikom próby losowej decyzję dotyczącą nie odrzucenia albo odrzucenia hipotezy . Poziomem istotności nazywamy prawdopodobieństwo popełnienia błędu I rodzaju, które polega na odrzuceniu , mimo iż jest ona prawdziwa. Najczęściej przyjmuje się w naukach ekonomicznych =0,05, a w naukach medycznych =0,01. Zbiorem krytycznym nazywamy zbiór tych wartości, które pozwalają na odrzucenie . Zbiór krytyczny wyznaczony jest przez wartość lub wartości krytyczne odpowiedniego rozkładu badanej statystyki np. średniej czy wskaźnika struktury.

Testowanie hipotez obejmuje następujące etapy:

1.      postawienie hipotezy zerowej i alternatywnej,

2.      wybranie odpowiedniego testu statystycznego,

3.      wyznaczenie wartości krytycznej na podstawie tablic statystycznych i zbioru krytycznego,

4.      weryfikacja hipotezy zerowej.

Przyjęto następujące oznaczenia:

– liczebnością próby losowej,

– średnią arytmetyczną z próby,

– odchyleniem standardowym z próby,

– poziom istotności.

Omawiane testy statystyczne są testami istotności, a więc interesuje nas tylko odrzucenie hipotezy zerowej. W praktyce brak podstaw do odrzucenia nie rozstrzyga o jej prawdziwości.

 

TESTOWANIE HIPOTEZY O ŚREDNIEJ

 

Niech rozważana zbiorowość ma rozkład normalny , gdzie jest średnią, a jest nieznanym odchyleniem standardowym. Wówczas możliwa jest weryfikacja następujących hipotez w oparciu o:

I.        test jednostronny (lewostronny)

1. Postawienie hipotezy zerowej i alternatywnej:

,       ,

gdzie jest hipotetyczną wartością średniej .

2. Wybranie testu statystycznego o postaci

,

gdzie t jest statystyką o rozkładzie t-Studenta i stopniach swobody, przy założeniu prawdziwości hipotezy . Wartość statystyki t oblicza się na podstawie próby losowej i przyjmuje się oznaczenie tej statystyki jako .

3. Wyznaczenie wartości krytycznej na podstawie tablic statystycznych dla rozkładu t-Studenta i zbioru krytycznego (obszar zakreskowany na rysunku),

Weryfikacja hipotezy odbywa się następująco:

·         wartość statystyki obliczonej na podstawie próby losowej leży poza obszarem krytycznym:

Nie ma podstaw do odrzucenia hipotezy zerowej mówiącej, że średnia zbiorowości jest równa wartości .

·         wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że średnia zbiorowości jest mniejsza od wartości .

W kolejnych przypadkach zostaną wyróżnione tylko te elementy, które różnią się od wymienionych w podejściu I.

II.     test dwustronny

   

Wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że średnia zbiorowości jest różna od wartości .

 

III.  test jednostronny (prawostronny)

   

Wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że średnia zbiorowości jest większa od wartości .

Przedział ufności dla średniej

 

przedział ufności dla średniej jest postaci

,

gdzie prawdopodobieństwo nazywamy współczynnikiem ufności.

Interpretacja przedziału ufności:

Z ufnością rzeczywista średnia zbiorowości pokryta jest przedziałem o końcach – lewym oraz prawym .

Uwaga! Dla dużej próby przyjmujemy statystykę o rozkładzie normalnym .

 

 

TESTOWANIE HIPOTEZY O WARIANCJI

 

Niech rozważana zbiorowość ma rozkład normalny , gdzie jest średnią, a jest nieznanym odchyleniem standardowym. Wówczas możliwa jest weryfikacja następujących hipotez w oparciu o:

I.     test jednostronny (lewostronny)

1.    Postawienie hipotezy zerowej i alternatywnej:

,       ,

gdzie jest hipotetyczną wartością wariancji .

2.    Wybranie testu statystycznego o postaci

,

gdzie jest statystyką o rozkładzie chi-kwadrat i stopniach swobody, przy założeniu prawdziwości hipotezy . Wartość statystyki oblicza się na podstawie próby losowej i przyjmuje się oznaczenie tej statystyki jako .

3.    wyznaczenie wartości krytycznej na podstawie tablic statystycznych dla rozkładu chi-kwadrat i zbioru krytycznego (obszar zakreskowany na rysunku),

Weryfikacja hipotezy odbywa się następująco:

·      wartość statystyki obliczonej na podstawie próby losowej leży poza obszarem krytycznym:

Nie ma podstaw do odrzucenia hipotezy zerowej mówiącej, że wariancja zbiorowości jest równa wartości .

·         wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że wariancja zbiorowości jest mniejsza od wartości .

W kolejnych przypadkach zostaną wyróżnione tylko te elementy, które różnią się od wymienionych w podejściu I.

II.  test dwustronny

,       ,

 

 

Wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że wariancja zbiorowości jest różna od wartości .

 

III.    test jednostronny (prawostronny)

,       ,

Wartość statystyki obliczonej leży w obszarze krytycznym:

Odrzucamy hipotezę zerową na korzyść hipotezy alternatywnej mówiącej, że wariancja zbiorowości jest większa od wartości .

 

Przedział ufności dla wariancji

 

przedział ufności dla wariancji jest postaci

,

gdzie prawdopodobieństwo nazywamy współczynnikiem ufności.

Interpretacja przedziału ufności:

Z ufnością rzeczywista wariancja ...

  • zanotowane.pl
  • doc.pisz.pl
  • pdf.pisz.pl
  • kachorra.htw.pl