Statystyka matematyczna/Statystyka matematyczna
| Statystyka matematyczna | |||
|
||||
[edytuj] Średnie w matematyce statystycznej
Średnią w matematyce statystycznej nazywamy przepis pozwalający wyliczyć na podstawie n wyników uzyskanych w doświadczeniu, jedną ściśle określoną wartość. Ogólnym przepisem na liczenie średnich jest średnia potęgowa, z której szczególnymi przypadkami są: średnia arytmetyczna, średnia ważona, średnia geometryczna, średnia harmoniczna oraz średnia kwadratowa.
[edytuj] Średnia arytmetyczna
Średnia arytmetyczna liczb
, to iloraz sumy n zmiennych przez liczbę tych zmiennych.
|
(1.1)
|
Średnia arytmetyczna jest szczególnym przypadkiem średniej ważonej (1.4), jeśli przyjmiemy:
, którego stąd wynika, że prawdopodobieństwo każdego zdarzeń z osobna, dzięki których chcemy policzyć średnią ważoną jest jednakowe. Stąd wynika, że mianownik w średniej ważonej dla tego przypadku dla n zdarzeń jest równa jeden. Po krótkich rozważaniach chodzimy do wniosku, że dla równoprawnych zdarzeń średnia ważona przechodzi w średnią arytmetyczną.
![]() |
(1.2)
|
Średnia arytmetyczna jest szczególnym przypadkiem średniej potęgowej (1.12) gdy parametr "k" przyjmuje wartość jeden, tą przechodniość można udowodnić dla tego parametru w sposób:
![]() |
(1.3)
|
[edytuj] Średnia ważona
Przy założeniu, że prawdopodobieństwo uzyskania każdego z wyników
wynosi odpowiednio:
, to średnią ważoną definiuje się jako iloraz sumy: n iloczynów prawdopodobieństwa uzyskania wyniku przez wartość uzyskaną w doświadczeniu przez sumę prawdopodobieństw uzyskania poszczególnych wyników.
|
(1.4)
|
Gdy prawdopodobieństwo sumy prawdopodobieństw uzyskania n wyników jest zdarzeniem pewnym, to średnia ważoną (1.4) można zapisać wedle schematu:
![]() |
(1.5)
|
Można powiedzieć, że średnia ważona jest szczególnym przypadkiem średniej arytmetycznej, jeśli prawdopodobieństwo uzyskania wszystkich wyników jest równe jeden tak jak w punkcie (1.5) i poszczególne wyniki w średniej arytmetycznej powtarzają się, co pozwala wyliczyć jakie jest prawdopodobieństwo uzyskania powtarzających się poszczególnych wyników, lub gdy wyniki
są unormowane.
- Przyjmijmy, że spełniony jest ten drugi warunek, tzn. zachodzi
, i posługujmy się tą definicją
.
- Przyjmijmy też, że dla wyników pomiarów
, dla takich samych i zachodzi:
, czyli mają taką samą wartość. Oznaczmy liczbę takich samych wyników, czyli o takim samym i, przez
. Zatem, wiedząc że
, dostajemy:
![]() |
(1.6)
|
W obliczeniach (1.6) udowodniliśmy, że średnia arytmetyczna przechodzi w średnią ważoną przy unormowanych wynikach aij.
[edytuj] Średnia geometryczna
Średnia geometryczna, nazywana również ważoną średnią geometryczną liczb
, jest to pierwiastek n-tego stopnia z iloczynu n liczb 
|
(1.7)
|
Bardzo ważne twierdzenie, mówiące o tym, że średnia geometryczna jest szczególnym przypadkiem średniej potęgowej (1.12) dla rzędu zerowego, i ta tożsamość dla parametru "k" dążącego do zera przedstawia się:
![]() |
(1.8)
|
- Dowód wzoru (1.8) dla k nieskończenie bliskiemu zero wykorzystuje regułę de l'Hospitala.
![\ln \lim_{k\rightarrow 0}\sqrt[k]{{{\sum^n_{i=1}a_i^k}\over{n}}}=\lim_{k\rightarrow 0}\ln \sqrt[k]{{{\sum^n_{i=1}a_i^k}\over{n}}}=\lim_{k\rightarrow 0}{{\ln{{\sum^n_{i=1}a_i^k}\over{n}}}\over{k}}=\lim_{k\rightarrow 0}{{n}\over{\sum^n_{i=1}a_i^k}}{{\sum^n_{i=1}a_i^k\ln a_i}\over {n}}\;=\;](http://upload.wikimedia.org/wikibooks/pl/math/d/8/4/d840d65d1fb4f8bc1138395797c3a67a.png)
![=\;{{n}\over{\sum^n_{i=1}1}}{{\sum_{i=1}^n 1\cdot\ln a_i}\over{n}}={{\sum_{i=1}^n\ln a_i}\over{n}}={{\ln\prod^n_{i=1}a_i}\over{n}}\;=\;\ln\left({\prod^n_{i=1}a_i}\right)^{{{1}\over{n}}}=\ln\sqrt[n]{\prod^n_{i=1}a_i}\;](http://upload.wikimedia.org/wikibooks/pl/math/7/1/c/71cfcba998ae6bffa2f64775be5292af.png)
- Co kończy dowód tego twierdzenia.
[edytuj] Średnia harmoniczna
Średnia harmoniczna, zwana również ważoną średnią harmoniczną, jest to iloraz ilości pomiarów, których jest "n", dla których liczymy tą naszą średnią, przez sumę odwrotności tychże liczb:
|
(1.9)
|
Średnia harmoniczna jest szczególnym przypadkiem średniej potęgowej (1.12), gdy parametr "k" jest równy minus jeden (-1).
![]() |
(1.10)
|
[edytuj] Średnia kwadratowa
Średnia kwadratowa to przykład miary statystycznej liczb
. Jest to pierwiastek ilorazu sumy kwadratów n tychże liczb przez ich liczbę.
|
(1.11)
|
Średnia kwadratowa jest szczególnym przypadkiem średniej potęgowej (1.12), gdy parametr "k" jest równy dwa (k=2).
[edytuj] Średnia potęgowa
Średnią potęgową (lub średnią uogólnioną) liczb
nazywamy pierwiastek k-tego stopnia ilorazu sumy k-tych potęg n tychże liczb przez ich liczbę.
|
(1.12)
|
Średnia potęgowa jest szczególnym rozdzajem innych średnich, które podaliśmy wcześniej w tym rozdziale o średnich w matematyce statystycznej.
[edytuj] Wprowadzenie do rozkładów zmiennych losowych
Zauważmy, że w wyniku doświadczenia uzyskujemy n liczb, które podlegają pewnym rozkładom, na razie bliżej nieokreślonym, ale dzięki którym możemy wyliczyć gęstość prawdopodobieństwa uzyskania tychże wyników.
[edytuj] Rozkłady statystyczne
Rozkłady statystyczne - są to rozkłady jakim podlegają pewne losowe wartości, nazywane kolejno
, gdzie i jest: numerem zmiennej k podlegającej temu rozkładowi - gdy rozkład jest dyskretny, lub k(x) - gdy rozkład jest ciągły względem argumentu x.
Każdej wartości losowej podlegają pewne momenty statystyczne, tj.: γk, gdzie k jest numerem momentu statystycznego.
Szczególnym momentem statystycznym jest zerowy moment statystyczny, tj.: γ0=1, czyli normowanie funkcji do jedynki, a także jego moment statystyczny o numerze jeden γ1=0, z którego możemy wyznaczyć średnią E(x) dla rozkładu ciągłego lub dyskretnego. A także wariancja jest momentem statystycznym rzędu drugiego V(x)=σ2.
Gdzie:
- σ jest to odchylenie standardowym danego zespołu pomiarów.
Ogólnie momenty statystyczne mogą być dyskretne lub ciągłe. Przedstawione dla nich wzory mamy w poniższym i w następnych rozdziałach.
[edytuj] Prawdopodobieństwo lub gęstość prawdopodobieństwa
Dla zmiennej skokowej (dyskretnej) A, prawdopodobieństwo określa się jako stosunek liczby zdarzeń tegoż zdarzenia przez liczbę wszystkich zdarzeń w zbiorze Ω, które są w pewnym układzie statystycznym, wzór na tą wielkość przedstawia się według:
|
(2.1)
|
Gdzie:
jest to moc A, czyli liczba elementów w zbiorze A, inaczej zajście tego zdarzenia
jest to liczba wszystkich zdarzeń zachodzących w zbiorze
.
Dla zmiennej ciągłej prawdopodobieństwo zajścia jakiegokolwiek zdarzenia dąży do zera, czyli
. Wówczas ze wzoru (2.1) wynika oczywiście:
, a więc w tym przypadku należy zamienić pojęcie prawdopodobieństwa przez pojęcie gęstości prawdopodobieństwa. Oczywiste jest, że gęstość prawdopodobieństwa ma właśnie wtedy sens dla zmiennej typu ciągłego. Definiujemy tą wielkość się jako stosunek prawdopodobieństwa zdarzenia z przedziału (x,x+dx) przez wielkość dx:
![]() |
(2.2)
|
Natomiast dla funkcji wielu zmiennych, czyli gdy badamy jakie jest prawdopodobieństwo uzyskania n zmiennych jednocześnie
, którą to elementy tegoż wektora są w postaci ciągłej, gdzie ogólnie:
jest to element w n wymiarowej przestrzeni zdarzeń,
to gęstość prawdopodobieństwa definiujemy jako iloraz nieskończenie małego prawdopodobieństwa zdarzenia z przedziału dla poszczególnej współrzędnej naszego wektora
, dla i=1,..,n przez infinitezymalną objętość w którym znajdują się ten nasz obiekt opisywanej przy pomocy podanego tutaj przedziału zmienności naszej zmiennej podanego wcześniej w tym tekście.
![]() |
(2.3)
|
Gdzie:
jest to objętość w przestrzeni n wymiarowej, w której liczymy infinitezymalne prawdopodobieństwo zajścia zdarzenia A, które jest równe
.
Gęstość prawdopodobieństwa jest to pochodna dystrybuanty względem n-wymiarowej objętości, w której znajdują się te zdarzenia, jak się później przekonamy w późniejszych podrozdziałach.
Widzimy, że w przypadku dyskretnym jest sens stosować zwykłe prawdopodobieństwo zdarzenia (2.1), ale w przypadku ciągłym już gęstość prawdopodobieństwa zdarzenia dla jednej zmiennej stosujemy wzór (2.2) (przestrzeń jednowymiarowa) lub wzór dla "n" zmiennych stosujemy tożsamość (2.3) (przestrzeń n-wymiarowa).
[edytuj] Rozkłady losowe jednej zmiennej
Będziemy zajmować się tutaj rozkładami losowymi, dyskretnymi lub ciągłymi, zależącymi od jednej zmiennej.
[edytuj] Dystrybuanta i prawdopodobieństwo uzyskania jednej zmiennej losowej
Prawdpodobieństwem uzyskania zmiennej losowej jednej zmiennej nazywamy możliwość uzyskania tejże zmiennej w doświadczeniu.
Dystrybuantą nazywamy prawdopodobieństwo uzyskania zmiennej losowej w doświadczeniu z pewnego przedziału różnie określanego dla zmiennej losowej dyskretnej lub ciągłej, których definicje podamy poniżej.
[edytuj] Zmienna losowa dyskretna
Dla zmiennej losowej dyskretnej kolejne zdarzenia numerujemy od i=0 do i=n, zatem dystrybuantę dla zmiennej losowej dyskretnej definiujemy jako prawdopodobieństwo zdarzenia, że otrzymamy elementy w naszym doświadczeniu o numerach
. Dystrybuantę określamy za pomocą sumy prawdopodobieństw uzyskania elementu xi o numerach podanych wcześniej:
![]() |
(2.4)
|
Dystrybuantę dla zmiennej losowej dyskretnej zdarzenia przeciwnego określamy, korzystając przy czym ze wzoru dystrybuantę zdarzeń o numerach i=0 do i=n (2.4):
![]() |
(2.5)
|
Dystrybuanta dla zdarzenia przeciwnego - jest to prawdopodobieństwo uzyskania zmiennych losowych przeciwnych do zdarzenia xi o numerach w przedziału
, czyli dla zdarzeń o numerach
.
Należy zauważyć, że wielkość n może być zarówno skończona jak i nieskończona, dla zmiennej losowej jednej zmiennej.
Prawdopodobieństwo uzyskania zmiennej xi o numerze "i" jest różnicą dystrybuant dla argumentu "i" oraz dla argumentu "i-1", definicja jego jest:
![]() |
(2.6)
|
Widzimy, że ze wzoru (2.6) prawdopodobieństwo danego zdarzenia można określić za pomocą definicji dystrybuant.
[edytuj] Zmienna losowa ciągła
Dystrybuantę dla zmiennej losowej ciągłej jednowymiarowej x, definiujemy jako całkę gęstości prawdopodobieństwa (2.2) dla przedziału zmienności argumentu "x" z przedziału określonego (a,b), którą określa się:
![]() |
(2.7)
|
Dystrybuanta dla parametru c - jest to prawdpodobieństwo zajścia zdarzenia z przedziału
.
Korzystając ze wzoru na dystrybuantę (2.7) dystrybuantę dla zdarzenia przeciwnego ciągłego określamy jako prawdopodobieństwo zajścia zdarzeń dla przedziału, gdy liczba "x" jest większa od liczby "c":
![]() ![]() |
(2.8)
|
Zatem dystrybuanta dla zdarzenia przeciwnego określa prawdopodobieństwo zdarzenia przeciwnego do
, czyli dla zdarzenia
.
Gęstością prawdopodobieństwa nazywamy pochodną dystrybuanty względem argumentu zdarzenia "x":
![]() |
(2.9)
|
Widzimy, że w powyższym wzorze różnica dystrybuant dla x+dx i x, czyli F(x+dx)-F(x) jest nieskończenie małym prawdopodobieństwem zdarzenia "x", czyli dP(x). Iloraz róznicy dystrybuant określonych we wzorze (2.9) przez różniczkę dx jest to gęstość prawdopodobieństwa zdarzenia "x".
[edytuj] Normowanie, wartość oczekiwana, wariancja
Normowanie rozkładu zmiennej losowej dyskretnej lub ciągłej nazywamy zdarzeniem pewnym uzyskania jakiejkolwiek zmiennej losowej. Wartość oczekiwana, to średnia arytmetyczna uzyskanych danych doświadczalnych dla dużej ilości doświadczeń. Wariancja jest to średnie odchylenie kwadratowe uzyskanych wyników pomiarów.
[edytuj] Zmienna losowa dyskretna
Normowanie funkcji prawdopodobieństwa dla zmiennej typu dyskretnego jest napisane wedle równania poniżej jako sumę prawdopodobieństw wszystkich możliwych zdarzeń, o wszystkich mozliwych "i" w zbiorze Ω.
![]() |
(2.10)
|
Normowanie do jedynki określa prawdopodobieństwa zdarzeń jakichkolwiek możliwych w przestrzeni zdarzeń
, a więc prawdopodobieństwo zdarzenia się jakiegokolwiek zdarzenia jest pewne (tzn. zdarzy się napewno).
Wartość oczekiwana - jest to średnia wartość, jaką można uzyskać w doświadczeniu w skutek dużej ilości wykonanych doświadczeń, jest definiowana jako sumę iloczynu zdarzenia xi przez prawdopodobieństwo jego uzyskania P(xi).
![]() |
(2.11)
|
Wariancją nazywamy średnim kwadratowym odchyleniem zmiennych pomiarów xi, czyli jest to wartość oczekiwana (2.11), ale dla zmiennej (xi-E(x))2.
![]() |
(2.12)
|
Wariancja dla zmiennej losowej dyskretnej określa średnie kwadratowe odchylenie od wartości średniej dla bardzo dużej ilości pomiarów, podlegających rozważanemu rozkładowi.
[edytuj] Zmienna losowa ciągła
Normowanie funkcji prawdopodobieństwa dla zmiennej typu ciągłego jest napisane wedle równania poniżej jako całkę gęstości prawdopodobieństw wszystkich możliwych zdarzeń ciągłych zachodzących w zbiorze Ω.
![]() |
(2.13)
|
Normowanie do jedynki określa prawdopodobieństwa zdarzeń jakichkolwiek możliwych w przestrzeni zdarzeń Ω, a więc prawdopodobieństwo zdarzenia się jakiegokolwiek zdarzenia jest pewne (tzn. zdarzy się napewno). Wartość oczekiwana - jest to średnia wartość, jaką można uzyskać w doświadczeniu w skutek dużej ilości wykonanych doświadczeń, jest definiowana ona jako całka iloczynu zdarzenia "x" przez gęstość prawdopodobieństwa jego uzyskania ρ(x) liczona względem zmiennej x.
![]() |
(2.14)
|
Wariancją nazywamy średnim kwadratowym odchyleniem zmiennej pomiarów "x" podniesiony do kwadratu, czyli jest to wartość oczekiwana (2.14), ale dla zmiennej (x-E(x))2.
![]() |
(2.15)
|
Wariancja dla zmiennej ciągłej losowej określa średnią kwadratową odchylenie od wartości średniej, jakie można uzyskać w doświadczeniu, podlegającej rozkładowi ρ(x).
[edytuj] Wartość modalna
W rozkładzie funkcji jednej zmiennej, wartość modalna, to wartość najbardziej prawdopodobna, zwana też modą. Gdy funkcja gęstości prawdopodobieństwa posiada jedno ekstremum, to rozkład nazywamy jednomodalnym.
Modę możemy wyznaczyć dla zmiennej typu ciągłego jednej zmiennej przy pomocy dwóch wzorów na warunek konieczny istnienia ekstremum i wystarczającym:
![]() |
(2.16)
|
Dla zmiennej typu dyskretnego wyznaczamy wartość modalną przez sprawdzenie, dla jakiego
funkcja prawdopodobieństwa
przyjmuje wartość największą z możliwych ze wszystkich zdarzeń losowych.
[edytuj] Mediana, kwantyle i kwartyle
Mediana jest to wartość x w rozkładzie funkcji jednej zmiennej, dla której dystrybuanta (2.4) (rozkład zmiennej losowej dyskretnej) lub (2.7) (rozkład zmiennej losowej ciągłej) przyjmuje wartość połowy jedynki:
![]() |
(2.17)
|
Kwartylami nazywamy dystrybuanty nazywamy te wielkości x0,25, x0,75, dla których koleino dystrybuanta przyjmuje wartości 0,25, 0,75:
, oraz dla ![]() |
(2.18)
|
Kwantylami nazywamy dystrybuanty nazywamy te wielkości xr, dla których dystrybuanta przyjmuje wartość "r".
![]() |
(2.19)
|
- gdzie xr są to wielkości x0,1, x0,2,...,x0,9.
[edytuj] Rozkład jednostajny
Określmy rozkład zmiennej losowej typu ciągłego, dla którego gęstość prawdopodobieństwa przedstawia w zależności od parametru c przedstawia się:
![]() |
(2.20)
|
Rozkład (2.20) nazywany jest rozkładem jednostajnym.
Uwzględniając warunek na unormowanie funkcji f(x) (2.13), wtedy całkę normującą możemy napisać całkując tą naszą funkcję w przedziale (a,b), bo ona w tym przedziale przyjmuje wartość stałą niezerową. Dla pozostałych przedziałów wspomnianej funkcji gęstości prawdopodobieństwa nie wnosi nic do całki poniżej:

Ponieważ nasz rozkład w postaci unormowanej dla całki normującej (powyżej), która powinna przyjmować wartość jeden, zatem stąd można będzie wyznaczyć parametr "c", wtedy na podstawie tegoż parametru gęstość prawdopodobieństwa rozkładu jednostajnego (2.20) piszemy wedle postaci:
![]() oraz ![]() |
(2.21)
|
Dystrybuanta dla tego samego rozkładu wychodząc od wzoru (2.7) przy definicji gęstości prawdopodobienstwa (2.21) piszemy wedle sposobu:
![]() |
(2.22)
|
Policzmy teraz wartość średnią zmiennej ciągłej x wychodząc od wzoru (2.14) przy definicji gęstości prawdopodobieństwa f(x).

Wariacja zmiennej x, wychodząc najpierw od wzoru (2.15) przy gęstości prawdopodobieństwa zdefiniowanej wedle wzoru (2.21), jest:
![]()
|
(2.23)
|
[edytuj] Rozkład Cauchy'ego
Jest to rozkład jednorodny o niezerowej gęstości prawdopodobieństwa jedynie w przedziale kątowym:
![]() |
(2.24)
|
Z jednorodności gęstości prawdopodobieństwa i długości przedziału (2.24) wynika postać tejże funkcji gęstości prawdopodobieństwa w tymże przedziale:
.
Wybierzmy oś x, względem której możemy określać kąty θ i napiszemy go przeliczający z wielkości, która jest kątem θ na wartość "x", który mówi coś o położeniu cząstki, gdy odległość naszego punktu od osi iksowej według rysunku obok wynosi jeden.
![]() |
(2.25)
|
Biorąc pochodną funkcji (2.25) względem argumentu ciągłęgo x:
![]() |
(2.26)
|
Gęstość prawdopodobieństwa uzyskania zmiennej x przez jakąś cząstkę o promieniu wodzącym o wartości jeden względem jego gęstości prawdopodobienstwa względem kąta θ, czyli f(θ), którą to określamy:
![]() |
(2.27)
|
Sprawdźmy czy napisany rozkład zmiennej losowej "x" ciągłej (2.27) jest rozkładem unormowanym:
![]() |
(2.28)
|
Policzmy teraz wartość oczekiwaną funkcji gęstości prawdopodobieństwa g(x) (2.27) względem jej położenia iksowego:
![]() |
(2.29)
|
Uwzględniliśmy w obliczeniach (2.29) fakt, że funkcja podcałkowa jest nieparzysta. zatem średnie położenie cząstki jest więc równe zero.
Teraz policzmy wariancję wychodząc od wzoru (2.15) względem gęstości prawdopodobieństwa (2.27):
![]() ![]() |
(2.30)
|
Przy liczeniu wariancji skorzystaliśmy z zależności ze funkcja arctg(x) ma kres dolny oraz górny.

posiada wartość skończoną w nieskończonościach, którą odejmujemy od nieskończonego x, stąd otrzymaliśmy nieskończoną wartość wariancji (2.30).
Wariancja, a więc i odchylenie standardowe, funkcji (2.30) dąży do nieskończoności. Wtedy mówimy, że wariancja dla rozkładu Cauchy'ego nie istnieje. Funkcja gęstości prawdopodobieństwa (2.27), w którym przyjmuje wartość maksymalną dla x=0 i wynosi
. Połowę swej wartości posiada w punktach x=-1 i x=1, zatem szerokość połówkowa jest napisana wedle:

[edytuj] Rozkład Lorentza (Breita-Wignera)
Rozkład Lorentza inaczej Breita-Wignera jako rozkład gęstości prawdopodobienstwa zmiennej losowej ciagłej zapisujemy wględem argumentu "a", która jest wartością średnią tegoż rozkładu, i względem parametru Γ, który jest szerokością połówkową tego rozważanego rozkładu.
![]() |
(2.31)
|
Rozkład (2.31) przechodzi w rozkład Cauchego (2.27), gdy
i
. Sprawdźmy czy rozkład Breita-Wignera (2.31) jest unormowany wychodząc od wzoru normującego (2.13) przy gęstości prawdopodobieństwa (2.31).
![]() ![]() |
(2.32)
|
Rozważana funkcja jak oczekiwaliśmy jest unormowana do jedynki.
Wyznaczmy średnią wartość zmiennej losowej "x" dla rozkładu Lorentza (2.31) wychodząc od wzoru (2.14):
![]() ![]() ![]() |
(2.33)
|
Średnia wartość zmiennej losowej podlegającej wedle rozkładu Breita-Wignera jest równy liczbie "a" występującej we wzorze (2.31), tak jak oczekiwaliśmy. Wyznaczmy wariancję wychodząc od wzoru (2.15) przy definicji rozkładu Lorentza wedle obliczeń poniżej:
![]() ![]() ![]() |
(2.34)
|
Wariancja wedle rozkładu Breita-Wignera jest równa nieskończoność, co oznacza, że w wyniku losowania zmienną losowej można znaleźć w całej nieskończonej przestrzeni, którego średni pomiar nieskończonej ilości pomiarów wynosi "a". Rozkład Breita-Wignera przyjmuje wartość maksymalną dla
, i wartość rozkładu Breita-Wignera dla tego punktu jest równa
, funkcja g(x) dla której przyjmuje wartość równą połowie jej wartości maksymalnej, gdy zachodzi warunek
, co udowodnimy poniżej:
![]() |
(2.35)
|
Co jest połówkową wartością wartości maksymalnej, zatem wtedy możemy policzyć szerokość połówkową naszego rozkładu:
![]() |
(2.36)
|
Udowodniliśmy, że szerokość połówkowa rozważanego rozkładu wynosi Γ, tak jak przypuszczaliśmy.
[edytuj] Rozkłady losowe dwóch zmiennych
[edytuj] Dystrybuanta i gęstość prawdopodobieństwa
Jeśli dolnym zakresem zmiennej x jest a, oraz dolnym zakresem zmiennej y jest c, to dystrybuantę zmiennych losowych ciągłych ze względu na oba parametry określamy jako całkę gęstości prawdopodobieństwa ρ(x,y) dla argumentu "x" z przedziału (a,x) oraz dla argumentu y z przedziału (c,y) względem argumentu iksowego i igrekowego:
![]() |
(2.37)
|
Zwykle przy naszych założeniach mamy, że wielkości a i c sa równe minus nieskończoność, ale nie zawsze tak jest. Wiemy jednak, że dystrybuanta wedle wzoru (2.37) dla argumentów x=a i y=c wynosi zero:
, dla i ![]() |
(2.38)
|
Dla dwóch zmiennych, gęstość prawdopodobieństwa uzyskania jednocześnie zmiennych x i y jest podwójną pochodną względem zmiennych x i y funkcji F(x,y) (dystrybuanty), w którym w mianowniku jest to infinitezymalne prawdopodobieństwo znalezienia zmiennej x i y w przedziale (prostąkącie):
,
:
![]() |
(2.39)
|
Prawdopodobieństwo uzyskania zmiennych x i y w prostokącie
i
, określa się jako podwójną całę względem gęstości prawdopodobieństwa (2.39) całkując względem argumentu x i y w określonym wcześniej przedziale.
![]() |
(2.40)
|
Jeśli przecałkujemy po całkowitym obszarze zmiennej y, tzn. (c,d), otrzymamy wtedy gęstość prawdopodobieństwa uzyskania zmiennej x należącej do przedziału (a,b), tzn.
![]() |
(2.41)
|
Podobnie uzyskujemy prawdopodobieństwo znalezienia zmiennej y należących do przedziału (c,d), gdy przecałkujemy funkcję (2.39) po całym zmienności zmiennej x.
![]() |
(2.42)
|
Prawdopodobieństwo uzyskania zmiennej x w podprzedziale (a0,b0) należących do przedziału całej zmienności tejże zmiennej (a,b) określa się dla dowolnego y z przedziału (c,d), całkując funkcję (2.39) po całym przebiegu zmienności zmiennej y i po określonym podprzedziale iksowym:
![]() ![]() |
(2.43)
|
Podobnie określamy prawdopodobieństwo uzyskania zmiennej y w przedziale (c0,d0).
[edytuj] Normowanie, wartość oczekiwana, wariancja
Normowaniem rozkładu dwóch zmiennych nazywamy zdarzeniem pewnym, który jest równy na pewno jeden. Przepis normowania funkcji zapisujemy jako całkę gęstości prawdopodobieństwa g(x,y) całkując względem argumentu x i y po całym ich przebiegu zmienności.
![]() |
(2.44)
|
Wartością oczekiwaną zmiennej x nazywamy przepis, który jest całką po całym przebiegu zmienności zmiennych x i y, w którym funkcją podcałkową jest równa iloczynowi zmiennej x i gęstości prawdopodobieństwa ρ(x,y). Tą całkę przestawmy względem gęstości prawdopodobieństwa zmiennej "x" określonym wzorem (2.41).
![]() |
(2.45)
|
Wartością oczekiwaną zmiennej x nazywamy przepis, który jest całką po całym przebiegu zmienności zmienne x i y, w którym funkcją podcałkową jest iloczyn zmiennej y i gęstości prawdopodobienstwa ρ(x,y). Tą całkę przestawiamy względem gęstości prawdopodobieństwa zmiennej "y" określonym wzorem (2.41).
![]() |
(2.46)
|
Wariancją zmiennej x nazywamy wartość oczekiwaną z funkcji
, jest to średnia kwadratowa zmiennej wielkości odchylenia od jego wartości oczekiwanej, w którym ta całka jest całkowaniem po całej przedziale zmienności zmiennej "x" i "y".
![]() |
(2.47)
|
Wariancją zmiennej y nazywamy wartość oczekiwaną z funkcji
, jest to średnia kwadratowa zmiennej wielkości odchylenia od jego wartości oczekiwanej, w której całka jest całkowaniem po całej przedziale zmienności zmiennej "x" i "y".
![]() |
(2.48)
|
[edytuj] Rozkłady losowe n-zmiennych
[edytuj] Dystrybuanta i gęstość prawdopodobieństwa
Określmy n-wymiarowy wektor, którego składowymi jest n-zmiennych i które są pomiarami losowymi zmiennych składowych ciągłych
![]() |
(2.49)
|
przy czym poszczególne elementy wektora
spełniają związek przynależności do zbioru liczb rzeczywistych:
. n-wymiarowy wektor
wchodzi w skład gęstości prawdopodobieństwa uzyskania n-składowych tego wspomnianego wektora.
Dystrybuantę określamy jako całkę gęstości prawdopodobieństwa względem argumentu x1, x2,...,x3, całkując po przedziale zmienności x1<c1,x2<c2,...,xn<cn:
![]() ![]() |
(2.50)
|
Gęstością prawdopodobieństwa uzyskania n-zmiennych nazywamy funkcję, która jest pochodną cząstkową n zmiennych, tzn. względem argumentu x1, x2,...,xn, zatem:
![]() |
(2.51)
|
Jak widzimy, wzory (2.50) i (2.51) są uogólnieniem wzorów kolejno (2.7) (dystrybuanta jednej zmiennej losowej ciągłej) oraz (2.9) (gęstość prawdopodobieństwa jednej zmiennej) dla dwóch zmiennych.
Gęstość uzyskania tylko zmiennej xk określa się podobnie jak przy wzorach dla gęstość prawdopodobieństwa uzyskania zmiennej "x", gdy mamy funkcję gęstości prawdopdobieństwa dwóch zmiennych (2.41) i (2.42):
![]() |
(2.52)
|
Prawdopodobieństwo uzyskania zmiennych
w wymiarowym prostokącie dla którego zachodzą warunki ck≤ xk≤ dk wyraża się przez:
![]() |
(2.53)
|
[edytuj] Normowanie, wartość oczekiwana, wariancja
Normowanie funkcji nazywamy zdarzenie pewne uzyskania jakikolwiek zmiennej, która jest wektorem (2.49) i która jest równa jeden, i nazywamy całkę gęstości funkcji prawdopodobieństwa z funkcji f(x1,x2,...,xn) liczoną względem tychże argumentów po całym przedziale zmienności zmiennych xi dla i=1,2,...,n.
![]() |
(2.54)
|
Wartością oczekiwaną zmiennej xk nazywamy liczoną po całym przedziale zmienności wektora (2.49), w którym funkcją podcałkową jest iloczyn gęstości prawdopodobieństwa f(x1,x2,...,xn) i zmiennej xk.
![]() |
(2.55)
|
Wariancją zmiennej losowej ciągłej xk w przestrzeni n-wymiarowej nazywamy całkę po całej zmienności wektora (2.49), w której funkcją podcałkową jest iloczyn funkcji prawdopodobieństwa f(x1,x2,...,xn) i zmiennej
, czyli jest to średnia tejże podanej funkcji:
![]() |
(2.56)
|
[edytuj] Momenty statystyczne ciągłe i dyskretne
Będziemy liczyć pewne wielkości, które są funkcją pewnych wyników uzyskanych w doświadczeniu, charakteryzujących sam pomiar tychże wielkości.
[edytuj] Moment statystyczny λ rzędu l
Ogólnie momentem rzędu "l" nazywamy wielkość, która jest wartością oczekiwaną zmiennej potęgowej xl:
![]() |
(3.1)
|
[edytuj] Rozważając dla zmiennej typu dyskretnego:
Dla zmiennej typu dyskretnego wzór (3.1) definiujemy przez prawdopodobieństwo zdarzenie losowego dyskretnego, którego momentem statystycznym rzędu "l" definiujemy przepis jako sumę po wszystkich możliwych wskaźnikach p, dla którego numerujemy kolejno otrzymane wyniki z doświadczenia ściśle określonego, którego funkcją pod sumą jest iloczyn zmiennej losowej xp podniesionej do potęgi "l" i prawdopodobieństwa P(xp):
![]() |
(3.2)
|
Wartością oczekiwaną nazywamy momentem statystycznym rzędu "l" równej jeden , którego dla tego "l" przepis jest wedle wzoru (3.2):
![]() |
(3.3)
|
Momentem statystycznym rzędu "l" równe zero nazywamy normowaniem funkcji prawdopodobieństwa do jedynki (2.10), którego dla tego "l" przepis piszemy według (3.2):
![]() |
(3.4)
|
[edytuj] Rozważając dla zmiennej typu ciągłego:
Dla zmiennej typu dyskretnego wzór (3.1) definiujemy przez prawdopodobieństwo zdarzenia losowego ciągłego, którego momentem statystycznym rzędu "l" definiujemy przepis jako całkę po wszystkich możliwych wartościach x, jakie może przyjmować wyniki z doświadczenia ściśle określonego, którego funkcją podcałkową jest iloczyn zmiennej losowej x i prawdopodobieństwa f(x):
![]() |
(3.5)
|
Wartością oczekiwaną nazywamy momentem statystycznym rzędu "l" równej jeden, którego dla tego "l" przepis jest wedle wzoru (3.5):
![]() |
(3.6)
|
Momentem statystycznym rzędu "l" równej zero nazywamy normowaniem funkcji prawdopodobieństwa do jedynki (2.13), którego dla tego "l" przepis jest wedle wzoru (3.5):
![]() |
(3.7)
|
[edytuj] Momenty statystyczne μ względem wartości średniej
Ogólnie momentem statystycznym rzędu l danej wielkości nazywamy wartość oczekiwana, która jest wartością średniej zmiennej (x-E(x))l:
![]() |
(3.8)
|
[edytuj] Przypadek zmiennej dyskretnej:
Dla zmiennej typu dyskretnego wzór (3.8) przy prawdopodobieństwie zdarzenie losowego dyskretnego momentem statystycznym rzędu "l" definiujemy przepis jako sumę po wszystkich możliwych wartościach "i" jakie może przyjmować wyniki z doświadczenia ściśle określonego, którego funkcją pod sumą jest iloczyn zmiennej losowej xi-E(x) podniesionej do potęgi "l" i prawdopodobieństwa P(xp):
|
(3.9)
|
Moment statystyczny rzędu zerowego jest to warunek normowania funkcji prawdopodobieństwa i jest równy jeden, tak jak w przypadku (3.4).
[edytuj] Następnie policzmy jedynkowy i dwójkowy moment statystyczny:
Wartością oczekiwaną nazywamy momentem statystycznym rzędu "l" równej jeden , którego dla tego "l" przepis jest wedle wzoru (3.9):
![]() |
(3.10)
|
Udowodniliśmy, że jedynkowy moment statystyczny jest równy zero z warunku normowania funkcji (2.10) i z definicji wartości średniej (2.11).
Wariancją nazywamy drugi moment statystyczny liczony według ogólnego przepisu (3.9) dla tego "l":
![]() |
(3.11)
|
[edytuj] Dla zmiennej typu ciągłego:
Jeśli zmienna "x" jest zmienną ciągłą, należącą do przedziału (a,b), wówczas n-ty moment statystyczny (3.6) piszemy wedle:
|
(3.12)
|
Moment statystyczny rzędu zerowego jest to warunek normowania funkcji gęstości prawdopodobieństwa, i który jest równy jeden.
[edytuj] Następnie policzmy jedynkowy i dwójkowy moment statystyczny:
Wartością oczekiwaną nazywamy momentem statystycznym rzędu "l" równej jeden, którego dla tego "l" przepis jest wedle wzoru (3.12):
![]() |
(3.13)
|
Zatem udowodniliśmy, że jedynkowy moment statystyczny ma wartość równą zero.
Wariancją nazywamy drugi moment statystyczny liczony według przepisu (3.12) i którego definicja jest:
![]() |
(3.14)
|
[edytuj] Momenty statystyczne ciągłe μ dla dwóch zmiennych
Momentem statystycznym n-zmiennych nazywamy wzór (3.8) dla zmiennej "x" i przestawmy ją względem prawdopodobieństwa uzyskania zmiennej x wedle schematu (2.41):
![]() |
(3.15)
|
Momentem statystycznym n-zmiennych nazywamy wzór (3.8) dla zmiennej "y" i przestawmy ją względem prawdopodobieństwa uzyskania zmiennej y wedle schematu (2.42):
![]() |
(3.16)
|
Wartością oczekiwaną funkcji względem x określa wzór (2.45), a względem y wzór (2.46), natomiast wariancje określa dla zmiennej x, którego definicja (2.47), i dla y, którego definicja (2.48).
Momenty statystyczne (3.15) oraz (3.16) przyjmują wartość jeden dla
i jest to warunek normowania gęstości funkcji prawdopodobieństwa
dla tych momentów statystycznych.
Rozważane momenty statystyczne, tym razem rzędu pierwszego, jak można udowodnić są równe zero z definicji normowania funkcji gęstości prawdopodobieństwa oraz wartości oczekiwanych.
[edytuj] Momenty statystyczne ciągłe dla n-zmiennych
Momentem statystycznym n-zmiennych nazywamy wzór (3.8), gdy funkcją gęstości prawdopodobieństwa jest f(x1,x2,...,xn) i w nim jest to całka po całej zmienności wszystkich zmiennych xk. Przedstawmy ją w zależności od gęstości prawdopodobieństwa zmiennej xk, czyli g(xk) według wzoru (2.52):
![]() |
(3.17)
|
Wartość oczekiwana możemy wyznaczyć dla argumentu xk według wzoru (2.55), a wariancję wedle (2.56).
[edytuj] Związek pomiędzy drugim a pierwszym momentem statystycznym
Wyprowadzając wzór na drugi moment statystyczny σ2(x)=μ2(x) wedle przepisu (3.8), dla x ciągłego lub dyskretnego, i korzystając z tego, że x0=E(x), wtedy wariancję wyrażamy:


Ostatecznie otrzymujemy zależność na wariancję, mając wartość oczekiwaną kwadratu zmiennej losowej E(x2) oraz samą wartość oczekiwaną E(x) tej samej zmiennej też losowej.
![]() |
(3.18)
|
Wzór (3.18) dla funkcji prostej (linowej), o współczynniku liniowym równej jeden, uogólnimy na przypadek funkcji złożonej, której szczególnym przypadkiem jest funkcji liniowa H(x)=x. Oznacza to, że używamy podstawienia zmiennej x funkcją H(x) we wzorze (3.18):
![]() |
(3.19)
|
Gdy mamy do czynienia z funkcją n-wymiarową, tzn.
, to wariancję względem tej funkcji można zapisać analogicznie do (3.19):
![]() |
(3.20)
|
[edytuj] Momenty statystyczne dla funkcji złożonej
Zwykle liczyliśmy momenty statystyczne dla funkcji prostych, tzn. dla funkcji, dla których zachodzi H(x)=x. Tutaj zajmiemy się liczeniem momentów statystycznych dla funkcji różnych od funkcji liniowej, czyli dla funkcji złożonej względem argumentu x, która jest zmienną ciągłą lub dyskretną, zależną od dwóch bądź więcej argumentów dla funkcji złożonej.
[edytuj] Momenty statystyczne dla funkcji złożonej jednej zmiennej
Ogólnie momentem statystycznym rzędu l danej wielkości względem jej wartość oczekiwanej nazywamy wartość średnią zmiennej (H(x)-E[H(x)])l:
![]() |
(4.1)
|
- gdzie E[H(x)] jest to wartość oczekiwana funkcji H(x).
[edytuj] Momenty statystyczne dla funkcji złożonej zmiennej x dyskretnej
Dla zmiennej typu dyskretnego wzór (4.1) przy prawdopodobieństwie zdarzenie losowego dyskretnego momentem statystycznym rzędu "l" definiujemy przepis jako sumę po wszystkich możliwych wartościach xp jakie mogą przyjmować wyniki z doświadczenia ściśle określonego, którego funkcją pod sumą jest iloczyn zmiennej losowej H(xp)-E[H(x)] i prawdopodobieństwa uzyskania tego wyniku P(xp):
![]() |
(4.2)
|
Moment statystyczny zerowy jest to unormowanie gęstości funkcji prawdopodobieństwa.
Wartość oczekiwaną funkcji H(x) nazywamy przepis, która jest sumą po wszystkich pomiarach uzyskanych z doświadczenia względem funkcji H(xk) przy prawdopodobieństwie zdefiniowanej wedle wzoru P(xk).
![]() |
(4.3)
|
Moment statystyczny, którego przepis jest w (4.2) dla parametru "i" równej jeden jest równy zero, co wynika z warunku normowania funkcji prawdopodobieństwa (2.10) i definicji wartości oczekiwanej funkcji H(x) według (4.3).
Wariancja pomiaru (rozkładu statystycznego) dla funkcji złożonej H(x) jest sumą po wszystkich pomiarach uzyskanych z doświadczenia względem funkcji (H(xk)-E[H(x)])2 przy prawdopodobieństwie określonych pomiarów:
![]() |
(4.4)
|
[edytuj] Momenty statystyczne dla funkcji złożonej zmiennej x ciągłej
Dla zmiennej typu ciągłego wzór (4.1) przy prawdopodobieństwie zdarzenie losowego ciągłego momentem statystycznym rzędu "i" definiujemy przepis jako całkę po wszystkich możliwych wartościach x jakie może przyjmować wyniki z doświadczenia, którego funkcją podcałkową jest iloczyn zmiennej losowej H(x)-E[H(x)] i gęstości prawdopodobieństwa uzyskania tego wyniku ρ(x). Momentem statystyczny i-tego rzędu dla funkcji ciągłej dla przedziału
określamy:
![]() |
(4.5)
|
Moment statystyczny zerowy jest to unormowanie gęstości funkcji prawdopodobieństwa do jedynki.
Wartość oczekiwaną funkcji H(x) nazywamy przepis, która jest całką po wszystkich x, jakie mogą być uzyskane z doświadczenia względem funkcji H(x) przy gęstości prawdopodobieństwa zdefiniowanej wedle wzoru ρ(x).
![]() |
(4.6)
|
Moment statystyczny, którego przepis jest w (4.5) dla parametru "i" równej jeden jest równy zero, co wynika z warunku normowania funkcji prawdopodobieństwa (2.13) i definicji wartości oczekiwanej funkcji H(x) według (4.6).
Wariancja pomiaru (rozkładu statystycznego) dla funkcji złożonej H(x), która jest całką po wszystkich pomiarach uzyskanych z doświadczenia względem funkcji (H(x)-E[H(x)])2 przy gęstości prawdopodobieństwa określonego pomiaru ρ(x), jest określona:
![]() |
(4.7)
|
[edytuj] Uogólnienie momentu statystycznego na przypadek dowolnej jednej zmiennej
Obierzmy funkcję jednej zmiennej H(x), która jest napisana względem parametru "l" jako pewna funkcja potęgowa:
![]() |
(4.8)
|
Dla dowolnego typu zmiennej przy prawdopodobieństwie lub gęstości zdarzenie losowego momentem statystycznym rzędu "l" definiujemy przepis:
![]() |
(4.9)
|
Wzór (4.9) nazywamy momentem statystycznym rzędu l względem punktu c.
Niech tym punktem c będzie wartość średnia uzyskanych wyników pomiarów, wtedy moment statystyczny μl względem wartości oczekiwanej uzyskanych w wyniku doświadczenia jest wyrażony:
![]() |
(4.10)
|
Jak widzimy, wzory (3.9) i (3.12) są szczególnymi przypadkami wzoru (4.10).
Moment statystyczny rzędu l=1 ma wartość zero, co można udowodnić z definicji normowania funkcji (gęstości funkcji) prawdopodobieństwa z definicji jego wartości oczekiwanej, którą to piszemy ogólnie według:
![]() |
(4.11)
|
[edytuj] Momenty statystyczne dla funkcji złożonej z argumentem dwuwymiarowym
Dla zmiennej typu ciągłego wzór przy prawdopodobieństwie zdarzenie losowego ciągłego momentem statystycznym rzędu "i" definiujemy przepis jako całkę po wszystkich możliwych wartościach x, który należy do przedziału (a,b) i y, które należy do przedziału (c,d), jakie mogą przyjmować w wyniki doświadczenia ściśle określonego, którego funkcją podcałkową jest iloczyn zmiennej losowej H(x,y)-E[H(x,y)] i gęstości prawdopodobieństwa uzyskania tego wyniku ρ(x,y): Moment statystyczny i-tego rzędu dla funkcji ciągłej dla przedziału:
określa się:
![]() |
(4.12)
|
Wartość oczekiwaną funkcji H(x,y) nazywamy przepis, która jest całką po wszystkich x i y jakie mogą być uzyskane z doświadczenia względem funkcji H(x,y) przy gęstości prawdopodobieństwa zdefiniowanej wedle ρ(x,y):
![]() |
(4.13)
|
Momentem statystyczny nazywamy przepis, któþrego definicja jest podana w punkcie (4.12) dla parametru "i" większej lub równej zero. Warunkiem normowania funkcji prawdopodobieństwa według wzoru (2.44) jest wzór (4.12) dla i=0. Wzór (4.13) jest definicją wartości oczekiwanej funkcji H(x).
Wariancja pomiaru (rozkładu statystycznego) dla funkcji złożonej H(x,y) jest całką po wszystkich pomiarach uzyskanych z doświadczenia względem funkcji (H(x,y)-E[H(x,y)])2 przy gęstości prawdopodobieństwie określonego pomiaru ρ(x,y):
![]() |
(4.14)
|
[edytuj] Moment statystyczny dla dwóch zmiennych
Obierzmy reprezentację funkcji dwuwymiarowej H(x,y) względem argumentu x i y, w których wykładniki potęg są przy x jest "l" i przy y jest "m":
![]() |
(4.15)
|
Wówczas wartość oczekiwana funkcji (4.15) piszemy tak jak normalnie jako moment statystyczny λlm:
![]() |
(4.16)
|
Wielkość (4.16) nazywamy momentami rzędu l i m.
[edytuj] Momenty statystyczne względem pewnych punktów dla dwóch zmiennych
Obierzmy teraz jeszcze inną reprezentację funkcji H(x,y), też dla dwóch zmiennych co (4.15), ale względem punktów a i b, którego przepis tej funkcji jest w postaci:
![]() |
(4.17)
|
Momentem statystycznym μlm funkcji (4.17) rzędu l i m, względem punktów a i b, nazywamy wartość oczekiwaną tejże funkcji:
![]() |
(4.18)
|
Szczególne znaczenie mają momenty statystyczne policzone względem λ10 i λ01. Oznaczmy a=λ10=E(x) oraz b=λ01=E(y). Zatem wzór (4.18), gdy te punkty a i b są kolejno wartościami oczekiwanymi zmiennych losowych x i y.
![]() |
(4.19)
|
[edytuj] Momenty statystyczne dla funkcji złożonej z argumentem n-wymiarowym
Momentem statystycznym i-tego rzędu dla funkcji ciągłej z argumentem n-wymiarowym:
nazywamy wyrażenie:
![]() ![]() |
(4.20)
|
Wartością oczekiwaną funkcji
nazywamy wyrażenie:
![]() |
(4.21)
|
Wariancja jest to drugi moment statystyczny według (4.12):
![]() ![]() |
(4.22)
|
[edytuj] Momenty statystyczne dla wielu zmiennych
Obierzmy funkcję n zmiennych H(x1,x2,...,xn) nazywamy funkcję zdefiniowanej za pomocą iloczynu odpowiednich potęg xklk:
![]() |
(4.23)
|
Momentami statystycznymi rzędu l1,l2,..,ln nazywamy wartość średnią funkcji złożonej napsanej w punkcie (4.23) wedle:
![]() |
(4.24)
|
Wartościami oczekiwanymi zmiennych x1,x2,..,xn nazywamy zdefiniowane momenty statystyczne, jako wartości oczekiwane pewnych zmiennych xk, w których numery momentu statystycznego (4.24) są wszystkie równe zero, oprócz tylko jednej wartości lk dla jakiegoś k:
![]() |
(4.25)
|
[edytuj] Momenty statystyczne względem pewnego punktu dla wektora n-wymiarowego
Obierzmy teraz funkcję n zmiennych względem punktu
, wtedy:
![]() |
(4.26)
|
Momentami statystycznymi rzędu
względem (4.20) nazywamy wyrażenia zdefiniowane:
![]() |
(4.27)
|
Jeśli rozważanym punktem (a1, a2,...,an) jest n-wymiarowy wektor wartości oczekiwanych zdefiniowanych w (4.21), wówczas nasz moment (4.27) przyjmuje postać:
![]() |
(4.28)
|
[edytuj] Definicja wariancji przez moment statystyczny μ
Jeśli skorzystamy z definicji momentów statystycznych (4.24), wtedy dla poszczególnych przypadków dla różnych zmiennych xi wariancja względem jej wartości oczekiwanej jest zdefiniowana jako:
![]() |
(4.29)
|
[edytuj] Definicja kowariancji przez moment statystyczny μ
Korzystając z momentów statystycznych (4.27) przy funkcji H(x1,x2,...,xn) zdefiniowanej w punkcie (4.26), można zdefiniować kowariancję względem elementów n-wymiarowego wektora dla ai i bj, jeśli wszystkie liczby lk w (4.27) są równe zero oprócz dwóch:
![]() |
(4.30)
|
Jeśli naszymi punktami ai, bj są wartości oczekiwane elementów xi oraz xj, to kowariancję cij na podstawie wzoru (4.30), pokazując jednocześnie, że on jest równy pewnemu momentowi statystycznemu względem pewnych wartości oczekiwanych, piszemy.
![]() |
(4.31)
|
Macierz o elementach cij definiujemy przepisując dla przejrzystości wykładu jego elementy:
![]() |
(4.32)
|
Jeśli zdefiniujemy wektor pionowy zmiennych losowych n zmiennych, które uzyskamy w pewnym doświadczeniu, to wtedy mamy:
![]() |
(4.33)
|
to definicja macierzy kowariancji korzystając z definicji jego elementów (4.32) i z definicji macierzy transponowanej:
![]() |
(4.34)
|
[edytuj] Momenty statystyczne gdy H(x) =x
Momenty statystyczne wokół funkcji prostych są szczególnym przypadkiem momentów statystycznych funkcji złożonych dla jednowymiarowego przypadku, tzn. gdy H(x)=x, niezależnie czy x jest ciągłe czy dyskretne. Należy wtedy dla wzorów (4.3) i (4.4) lub (4.6) i (4.7) dokonać tego podstawienia w tym przypadku.
[edytuj] Momenty statystyczne w działaniu
Będziemy się posługiwać momentami statystycznymi i wykonywać na nich działania.
[edytuj] Działania na wartościach oczekiwanych
Poniżej pokażemy, jakie są właściwości sumy czy różnicy, a nawet iloczynu wartości oczekiwanych oraz jakie są warunki by takowe działania zachodziły w przypadku ostatniego działania.
[edytuj] Suma wartości oczekiwanych
Określmy czemu jest równa wartość oczekiwana sumy argumentów x i y. Zmienna x należy do przedziału (a,b), a zmienna y należy do przedziału (c,d). Wartość oczekiwana sumy argumentów x i y, jak w przypadku wartości oczekiwanych dla dwóch argumentów definiujemy tutaj względem funkcji złożonej H(x,y)=x+y, zatem według wzoru na wartość oczekiwaną dwóch zmiennych (4.13).
![]() |
(5.1)
|
Mając gęstość uzyskania jednocześnie zmiennej x i y, czyli f(x,y) możemy policzyć gęstość prawdopodobieństwa uzyskania zmiennej x, czyli g(x) określamy według wzoru (2.41), a gęstość uzyskania zmiennej y, czyli h(y) określamy według wzoru (2.42), zatem mając definicję tychże gęstości i podstawiamy je do wzoru (5.1):
![]() |
(5.2)
|
Po skorzystaniu z definicji wartości oczekiwanych zmiennej x lub y wedle przepisu (4.13), ostatecznie otrzymujemy że wartość oczekiwana sumy dwóch zmiennych jest równa sumie wartości oczekiwanych tychże samych argumentów.
![]() |
(5.3)
|
Analogicznie jak przy dowodzie schematu (5.3) wartość oczekiwana różnicy argumentów x i y jest równa różnicy wartości oczekiwanych tychże samych argumentów:
![]() |
(5.4)
|
Gdy we wzorze (5.4) zachodzi y=x, to wtedy otrzymujemy, że wartość oczekiwana z liczby zero jest liczbą zero.
![]() |
(5.5)
|
Podstawiając we wzorze (5.4) za zmienną x liczbę zero i wykorzystując własność (5.5), otrzymujemy że wartość oczekiwana jest funkcją nieparzystą.
![]() |
(5.6)
|
[edytuj] Iloczyn wartości oczekiwanych
Określmy iloczyn wartości oczekiwanych. Załóżmy, że mamy dwa niezależne zdarzenia, wtedy gęstość prawdopodobieństwa uzyskania wyników x i y jest równa iloczynowi gęstości prawdopodobieństwa uzyskania tychże samych wyników.
![]() |
(5.7)
|
Niech naszą funkcją złożoną będzie H(x,y)=xy, to zgodnie z (4.13) oraz ze wzorem na niezależne zdarzenia (5.7) i jeśli dodatkowo przyjmować będziemy wzory na gęstość uzyskania zmiennej x lub y względem gęstości uzyskania jednocześnie dwóch wyników (2.41) i (2.42), wtedy otrzymujemy wzór na wartość oczekiwaną iloczynu dwóch argumentów, która jak się dowiemy dla zmiennych niezależnych jest równa iloczynowi wartości oczekiwanych dla tychże samych zmiennych:
![]() ![]() |
(5.8)
|
Wzór wynikający z obliczeń (5.8) możemy przepisać dla przejrzystości wykładu:
|
(5.9)
|
[edytuj] Wariancja, współczynnik korelacji, transformacje liniowe
Odchylenie standardowe i wariancja to podstawowe wielkości w statystyce matematycznej, pozwalają określić, jaki błąd popełniliśmy w doświadczeniu, oraz czy wyniki uzyskane w doświadczeniu są zależne od innych wyników (tu mowa o kowariancji).
[edytuj] Kowariancja dwóch zmiennych
Kowariancję dwóch zmiennych typu dyskretnego x i y, gdy ich wartościami oczekiwanymi są kolejno
i
, definiujemy wedle wzoru (4.32), gdy prawdopodobieństwo uzyskania tychże wyników jest P(xi,yi):
![]() |
(5.10)
|
Dla zmiennych typu losowego ciągłego wzór (4.32) na kowariancję, gdy gęstość uzyskania dwóch wyników x i y jest równe h(x,y), piszemy:
![]() |
(5.11)
|
Ogólnie, oba te przypadki losowych wartości, dyskretnych bądź ciągłych, można zapisać jako wartość oczekiwana wyrażenia (x-x0)(y-y0), ale tylko dla dwóch zmiennych:
![]() |
(5.12)
|
Można powiedzieć, że kowariancja jest wartością oczekiwaną (4.13), gdy funkcją złożoną jest:
![]() |
(5.13)
|
[edytuj] Kowariancja dwóch niezależnych wyników w doświadczeniu
Zdefiniujmy f(x) jako gęstość prawdopodobieństwa uzyskania wyniku x, a także g(x) jako gęstość prawdopodobieństwa uzyskania wyniku y, wówczas prawdopodobieństwo uzyskania tychże wyników dla dwóch niezależnych zdarzeń określa się wzorem (5.7).
Dla zmiennych niezależnych typu ciągłego można udowodnić z definicji jedynkowego momentu statystycznego zmiennej x lub y, czyli (3.10) względem ich wartości oczekiwanych
lub
, która jest zawsze równa zero, stąd dochodzimy do wniosku, że ta kowariancja dwóch zdarzeń w tym przypadku jest równa zero, zatem można by powiedzieć, że w takim razie te dwa pomiary są niezależne od siebie.
![]() ![]() |
(5.14)
|
W ten sposób otrzymujemy, że dla dwóch niezależnych zdarzeń (uzyskania wyników) kowariancja jest równa zero, czyli ostatecznie:
|
(5.15)
|
[edytuj] Wariancja kombinacji liniowej dwóch zmiennych
Wyznaczmy wariancję sumy kombinacji liczb x i y. Obliczenia przeprowadzimy wykorzystując ze wzorów skróconego mnożenia i z wartości oczekiwanych sumy zdarzeń (5.3) oraz definicji wariancji (3.14) i ostatecznie z definicji kowariancji dla dwóch zmiennych (5.12):

![]() ![]() |
(5.16)
|
Wzór wynikający z obliczeń (5.16) możemy przepisać dla przejrzystości wykładu w formie:
![]() |
(5.17)
|
[edytuj] Współczynnik korelacji
Definicja współczynnika korelacji wygląda jako iloraz kowariancji zmiennej x i y przez iloczyn odchyleń standardowych pomiarowych tych samych zmiennych:
![]() |
(5.18)
|
[edytuj] Obliczenia z użyciem współczynnika korelacji
Użyjemy zredukowanych zmiennych, która jest ilorazem odchylenia od wartości oczekiwanej
zmiennej x przez odchylenie standardowe tej samej zmiennej
![]() |
(5.19)
|
Z własności podstawienia (5.19) wnioskujemy, że wartość oczekiwana tej samej zmiennej jest taka jak udowodnimy, że jest równa zero, co nie powinno nas dziwić:
![]() |
(5.20)
|
Natomiast wariancja wartości zmiennej rozważanej zmiennej u, przy czym wykorzystując tożsamość (5.17), jest równa jeden, jak udowodnimy poniżej.
![]() |
(5.21)
|
Powyżej skorzystaliśmy, że wariancja z wartości oczekiwanej jest równa zero, również kowariancja, w której jedna ze zmiennej jest wartością oczekiwaną również też jest równa zero. Korzystając z dowodu wariancji (5.21), a także z tożsamości (5.17) i na końcu z definicji współczynnika korelacji (5.18), wtedy można napisać, że wariancja sumy zmiennych u i v, którego definicje są według (5.19), można jak udowodnić, tą wielkość przedstawić wedle sposobu:
![]() |
(5.22)
|
![]() |
(5.23)
|
W przypadku wariancji różnicy tychże argumentów, co poprzednio możemy otrzymać wzór bardzo podobny do tożsamości (5.23), ale trochę w innej postaci:
![]() |
(5.24)
|
Ponieważ dowolna wariancją jest funkcją nieujemną. Z dwóch tożsamości (5.23) i (5.24) otrzymujemy własność dla współczynnika korelacji:
![]() |
(5.25)
|
Można wykazać, że współczynnika korelacji w zmiennych u i v zdefiniowanych w punkcie (5.19) jest równa współczynnikowi korelacji, ale w zmiennych x i y, a oto dowód tej tożsamości
![]() |
(5.26)
|
Dla zmiennych zależnych według pewnej funkcji y=f(x), ale tym razem określmy, że te zmienne zależą w sposób liniowy wedle:
![]() |
(5.27)
|
Zatem na podstawie zależności (5.27) możemy policzyć współczynnik kowariancji wedle schematu:
![]() ![]() |
(5.28)
|
Również otrzymujemy, że wariancja zmiennej y, która się zmienia według funkcji liniowej (5.27), jest ona określona według wyprowadzenia:
![]() ![]() |
(5.29)
|
Z obliczeń (5.29) możemy wyznaczyć odchylenie standardowe zmiennej y, biorąc pierwiastek obu stron wspomnianej tożsamości:
![]() |
(5.30)
|
Zatem funkcja korelacji, dla y zależnego liniowo od x, według (5.28) zależy od odchylenia standardowego zmiennej y (5.30) oraz z definicji odchylenia standardowego zmiennej x, wtedy dostajemy, że liczona wspomniana wielkość jest:
![]() |
(5.31)
|
Dodatkowo mamy ρ(x,y)=0, gdy a=0.
Czyli gdy ρ(x,y)=1, to funkcja liniowa (5.27) jest rosnąca, tzn. a>0, ale następnie gdy zachodzi ρ(x,y)=-1 ta sama funkcja liniowa jest teraz malejąca, bo wtedy mamy a<0. Natomiast, gdy jeszcze zachodzi dla współczynnika korelacji ρ(x,y)=0, wtedy ta nasza funkcja liniowa jest funkcją stałą, bo a=0.
[edytuj] Transformacje liniowe i ortogonalne
Wiemy, że każdą funkcję można przetransformować pewnymi transformacjami liniowymi wokół pewnego punktu, a więc zakładamy, że mamy
, która jest wielkością wektorową, którą można przetransformować pewnymi funkcjami liniowymi względem argumentu
, według wzoru poniżej:
![]() |
(5.32)
|
Można udowodnić z transformacji (5.32), że współczynniki tij można zapisać jako pochodne cząstkowe zmiennej yi względem argumentu xj:
![]() |
(5.33)
|
Macierzowa postać wzoru na zmienną yi względem argumentu xj, lub ogólniej przy wektorze
względem wektora argumentu
przedstawia się wedle:
![]() |
(5.34)
|
Powyższy zapis można przedstawić w bardziej uproszczony sposób macierzowy, przy czym używając macierzy T, którego elementy są zdefiniowane w punkcie (5.33):
![]() |
(5.35)
|
Aby uzyskać wartość oczekiwaną zmiennej y, korzystamy z wzoru (5.35) zastępując wszystkie zmienne w wspomnianym wzorze ich wartościami oczekiwanymi, względem wartości oczekiwanej wektora x i "y", ostatecznie otrzymując:
![]() |
(5.36)
|
Ogólnie, gdy chcemy policzyć kowariancję zmiennej x i y, tzn. czy oba zdarzenia są zależne od siebie, wtedy należy wykorzystać ze wzoru na macierzową postać kowariancji napisanej wedle tożsamości (4.34). Wzory (5.35) i (5.36) podstawiamy do wzoru na kowariancję, wtedy dostajemy wyrażenie na kowariancję zmiennej y.

![]() |
(5.37)
|
Na podstawie definicji kowariancji zmiennej x, czyli (4.34), możemy zapisać jak zależy kowariancja zmiennej y względem kowariancji zmienne x, gdy macierz transformacji w przekształceniu (5.34) jest T:
![]() |
(5.38)
|
Jeśli mamy n zmiennych, które nie zależą od siebie, to wyrazy pozadiagonalne są różne od zera, czyli conv(x,y)=0, ale posiada tylko wyrazy diagonalne, które w ogólności są różne od zera i są równe wariancji poszczególnych zmiennych losowych..
Wiemy, jakie są elementy macierzy transformacji z
do
według wzoru (5.32), którego elementy są policzone według (5.33), stąd kowariancja wyniku wykorzystując przy tym przybliżenie wedle wzoru (5.32), którą jest funkcja liniowa wokół pewnego punktu względem małego wychylenia od tego elementu, zatem wariacja zmiennej yi jest napisana:
![]() |
(5.39)
|
W doświadczeniach fizycznych przyjmuje się zwykle, że pierwiastek wariancji jest to odchylenie wyniku pomiarowego
![]() |
(5.40)
|
Jest to niepewność pomiarowa wyniku pomiaru zmiennej yi, obliczonej przez eksperymentatora na podstawie wyników doświadczeń.
[edytuj] Pobieranie próby
Próbą nazywamy skończony zespół doświadczeń wykonanych w celu wyznaczenia kształtu poszukiwanego rozkładu.
[edytuj] Estymatory, wyznaczenie parametru λ w wyniku doświadczenia
Dla danej próby, aby estymować parametr λ (jakiś parametr, który możemy wyznaczyć przez doświadczenie) należy przeprowadzić nieskończoną liczbę pomiarów, wówczas wynik jest dokładny. Jednak liczba pomiarów może być jedynie skończona, wtedy pojawia się problem estymacji parametrów.
Zdefiniujmy estymator zależny od niezależnych parametrów uzyskanych w wyniku doświadczenia, tzn. x1, x2,..., xn:
![]() |
(6.1)
|
Estymator nazywamy nieobciążonym, jeśli niezależnie od ilości przeprowadzonych doświadczeń, jej wartość oczekiwana jest równa estymowanemu parametrowi λ:
![]() |
(6.2)
|
Jeśli wariancja estymatora (6.1) znika dla dowolnie dużej próby, to estymator nazywamy zgodnym, co piszemy wzorem:
![]() |
(6.3)
|
[edytuj] Związki pomiędzy wariancjami pojedynczego pomiaru a średnią arytmetyczną
Średnią arytmetyczną wszystkich pomiarów w danej próbie określamy wedle jej definicji (1.1) jako sumę n pomiarów w uzyskanych w tej próbie przez ich liczbę:
![]() |
(6.4)
|
Policzmy wartość oczekiwaną wartości średniej danej próby wykorzystując, że wartość oczekiwana sumy argumentów jest równa sumie ich wartości oczekiwanych wedle wzoru podanego w punkcie (5.3), która jest napisana wedle obliczeń:
![]() |
(6.5)
|
Jako że rozkłady w poszczególnych pomiarów w danym doświadczeniu są jednakowe, wtedy wartość oczekiwana danego pomiaru w doświadczeniu jest równa:
![]() |
(6.6)
|
Zatem wartość oczekiwana wartości oczekiwanej (6.4) jest równa wartości oczekiwanej danego pomiaru w doświadczeniu, zatem jeśli mamy bardzo dużo prób, to wartość oczekiwana wartości średniej jak udowodnimy, dąży do wartości oczekiwanej średniej arytmetycznej danego pomiaru, czyli przestawiana jest według:
![]() |
(6.7)
|
Wyznaczmy błąd średniej arytmetycznej uzyskanych wyników w wyników doświadczenia (6.4) i sprawdzimy, czy to odchylenie standardowe wraz zwiększającą się ilością pomiarów w doświadczeniu powoduje malenie tejże wielkości, także dla nieskończenie dużej ilości doświadczeń, to odchylenie zaczyna dążyć do zera, co przedstawiamy:
![]() |
(6.8)
|
Z definicji wariacji jako wartości oczekiwanej z liczby
jako odchylenia wartości średniej (6.4) od wartości oczekiwanej podniesionej do kwadratu i z twierdzenia na wartościach oczekiwanych (5.3) możemy wyznaczyć, tą właśnie wielkość:
![]() ![]() |
(6.9)
|
We wzorze (6.9) w drugim członie w liczniku wykorzystany został fakt, że kowariancja dla dwóch różnych zmiennych niezależnych jest równa zero, zatem na podstawie tego warunku dostajemy fakt.
![]() |
(6.10)
|
A więc otrzymujemy bardzo ważną zależność z wyprowadzenia (6.10), które przepiszemy dla przejrzystości wykładu i jak się przekonamy, że wariancja średniej arytmetycznej zapisanej jako kwadrat odchylenia tejże średniej od wartości oczekiwanej, jest ona odwrotnie proporcjonalna do ilości pomiarów w danym doświadczeniu:
![]() |
(6.11)
|
Gdy liczba pomiarów dąży do nieskończoności, wówczas odchylenie standardowe
przyjmuje wartość dążącą do zera według wzoru (6.11), a korzystając z wiadomości o granicach, wnioskujemy, że (6.8) jest jednak prawdą. Obierzmy teraz estymator, który jest wartością średnią kwadratów odchyleń wartości uzyskanych w doświadczeniu xi od wartości średniej wszystkich pomiarów w danym doświadczeniu:
![]() ![]() |
(6.12)
|
We wzorze wykorzystamy fakt na podstawie wartości średniej dla trzeciego wyrazy w sumie w mianowniku (6.12):

Na podstawie powyższego ostatniego faktu i definicji wariancji jako wartości oczekiwanej kwadratu odchylenia zmiennej losowej od wartości oczekiwanej dla wartości średniej n pomiarów wartość oczekiwana estymatora (6.12) (s')2, korzystając przy tym ze wzoru na wariancję średniej arytmetyczne w zależności od wariancji pojedynczego pomiaru, przyjmuje postać:
![]() ![]() ![]() |
(6.13)
|
Na podstawie obliczeń przeprowadzonych w punkcje (6.13) przepisujemy końcowy wniosek, że wartość oczekiwana estymatora (6.12) jest:
![]() |
(6.14)
|
Czyli ten nasz estymator (6.12) jest estymatorem obciążonym. Określmy inny estymator, który będzie wynikał z poprzedniego i względem wyniku na wartość oczekiwaną starego estymatora (6.14) określmy nowy estymator zdefiniowany:
![]() |
(6.15)
|
Korzystając z definicji estymatora s' (6.12) i wyniku (6.14), możemy policzyć wartość oczekiwaną nowego estymatora s2 (6.15) wedle:
![]() |
(6.16)
|
Równość σ2(s)=E(s2) wynika bezpośrednio z definicji nowego estymatora (6.15) i obliczeń (6.16). Zachodzi równość σ2(s)=E(s2)=s2 dla nieskończonej ilości pomiarów, co w praktyce dla dużej ilości pomiarów zachodzi z dobrym przybliżeniem, tzn. σ2(s)=E(s2)≈ s2. Doszliśmy do wniosku, że najlepiej jest wyliczać średni błąd pomiarowy bardzo dużej ilości danych doświadczalnych według:
![]() |
(6.17)
|
Odchylenie standardowe średniej arytmetycznej w zależności od odchyleń kwadratowych poszczególnych wyników, korzystając przy czym ze wzoru (6.11), mówiącej o związku wariancji średniej arytmetycznej z wariancją pomiaru, i ze wzoru (6.11) mówiący coś od odchyleniu standardowym pojedynczego pomiaru, zatem to odchylenie tejże średniej arytmetycznej (6.4) jest napisane:
![]() |
(6.18)
|
[edytuj] Pobieranie próby z rozkładów cząstkowych
Gdy doświadczenie składa się z prób - nie zawsze tak się dzieje, że wynik do wyznaczenia jakieś wielkości określamy względem tylko jednej próby. Czasem mamy pewną liczbę prób, a w każdej próbie jest też duża liczba doświadczeń.
Zwykle numer próby numerujemy jaki pierwszy wskaźnik przez x, a numer doświadczenia w próbie jako drugi wskaźnik zmiennej x, i w rezultacie dany pomiar w danej próbie oznaczamy xij, zatem rozpisując kolejno pomiary dla m prób:
- Próba 1:

- Próba 2:

- Próba m:

Trzeba zaznaczyć, że dla ogólności: m≠ n i najlepiej, by liczba pomiarów w j-tej próbie była bardzo duża, tzn. musi zachodzić n>>1. Mając średnie arytmetyczne z uzyskiwanych prób oraz ich odchylenia standardowe, można wyznaczyć całkowitą wartość średnią i odchylenia standardowe średniej arytmetycznej dla całej serii prób.
[edytuj] Prawdopodobieństwo uzyskania wyniku przy n próbach
Całkowita gęstość prawdopodobieństwo uzyskania w n próbach danego wyniku x jest równe sumie po wszystkich próbach o numerach "k" względem wyrazów , które z definicji prawdopodobieństwa warunkowego są iloczynami gęstości prawdopodobieństwa uzyskania wyniku w próbie k, czyli fk(x) przez prawdopodobieństwo danej próby pk, która zależy od całkowitej liczby wszystkich pomiarów we wszystkich próbach i od ilości pomiarów w próbie o numerze "k":
![]() |
(6.19)
|
Należy pamiętać, że gęstości prawdopodobieństwa fk(x) rządzące w danej próbie, dla różnych prób mogą być one różne, ale nie muszą być. Podobnie ilość doświadczeń w danej próbie może być różna, ale tym samym może być różne pk, ale też nie musi być tak oczywiście.
[edytuj] Dystrybuanta w rozkładzie cząstkowym i w próbach
Rozważając tylko k-tą próbę, dystrybuantę dla jednej zmiennej gęstości prawdopodobieństwa można wyznaczyć (patrz definicja: (2.7)) jako całkę od nieskończoności do wartości x, gdy funkcją podcałkową jest gęstości prawdopodobieństwa, która jest całkowana względem zmiennej losowej t.
![]() |
(6.20)
|
Natomiast dla n-prób znając jakie jest prawdopodobieństwo pojedynczej próby o numerze k oraz z twierdzenia o prawdopodobieństwie warunkowych, że gęstość prawdopodobieństwa uzyskania wyników mniejszych niż x jest sumą iloczynu gęstości prawdopodobieństwa uzyskania danego wyniku z pewnego przedziału dla wartości mniejszych niż x pomnożonej przez prawdopodobieństwo opisujące daną próbę pk:
![]() |
(6.21)
|
Przy wyprowadzeniu wzoru (6.21), korzystaliśmy ze wzoru na całkowitą dystrybuantę (2.7) i wyznaczaliśmy ją dla n-prób w punkcie (6.21) oraz wiedząc, że całkowita gęstość prawdopodobieństwa rządzące n-próbami jest napisane wedle wzoru (6.19).
[edytuj] Średnia arytmetyczna i wartość oczekiwana przy n próbach
Wartość oczekiwaną (1.1) z j-tej próby z uzyskanych wyników pomiarów obliczamy jako iloraz sumy wszystkich wyników pomiarów uzyskanych w tej próbie przez liczbę wszystkich pomiarów w tej samej próbie:
![]() |
(6.22)
|
- gdzie xij jest to pomiar i-ty próbie dla pomiaru w tej próbie o numerze j.
Wiemy jednak, że pomiary mogą się powtarzać z prawdopodobieństwem pjk w próbie j-tej, zatem średnia ważona (1.4) (wartość oczekiwana w próbie) jest dla j-tej próby jest wyrażona jako suma prawdopodobieństwa uzyskania pomiaru xjk przez prawdopodobieństwo tego pomiaru wspomniane wcześniej i ta średnia ważona jest:
![]() |
(6.23)
|
Dla m prób wartość średnia wszystkich wyników uzyskanych we wszystkich próbach, w rezultacie można przedstawić tą wielkość podobnie dla wzoru (6.23) dla pomiaru w próbie, tylko w tym przypadku mamy do czynienia ze średnią arytmetyczną danej próby pomiarów uzyskanych z prawdopodobieństwem pj, jest przedstawiona:
![]() |
(6.24)
|
We wzorze (6.24) skorzystaliśmy z faktu, że suma wszystkich prawdopodobieństw uzyskania z każdej z próby z osobna jest równa jeden, co udowodnimy we wzorze poniżej w punkcie (6.27).
Prawdopodobieństwo k-tej próby jest określone jako iloraz ilości wyników pomiarów w danej próbie nk w próbie o numerze k przez liczbę wszystkich pomiarów w n próbach.
![]() |
(6.25)
|
Oczywiste jest, że suma wszystkich pomiarów danych prób jest równa liczbie wszystkich pomiarów we wszystkich próbach:
![]() |
(6.26)
|
Ze wzoru (6.26) po podzieleniu go przez liczbę wszystkich pomiarów we wszystkich próbach n i korzystając z definicji prawdopodobieństwa k-tej próby (6.25) możemy napisać tożsamość, którą wcześniej z korzystaliśmy z niego.
![]() |
(6.27)
|
- co zostało wykorzystane w wyrażeniu (6.24)
Wzór przedstawiający wartość oczekiwaną pomiaru uzyskiwanej ze wszystkich prób zapisujemy jak dla wzoru (6.23), które można zapisać jako sumę, ale za pomocą wartości oczekiwanych dla każdej próby z osobna:
![]() |
(6.28)
|
Średnia arytmetyczna dla funkcji złożonej H(x) jest napisana podobnie jak dla wzoru (6.28), ale zamiast wartości oczekiwanej E(xk) jest wartość oczekiwana E(H(xk).
![]() |
(6.29)
|
Gdy dla poszczególnych prób występują zmienne losowe dyskretne, przy wykorzystaniu wzoru (6.23) na średnią arytmetyczną w próbie, wtedy średnia arytmetyczna wszystkich wyników we wszystkich próbach wyrażamy za pomocą prawdopodobieństwa uzyskania danej próby (6.25) i za pomocą prawdopodobieństwa uzyskania danego wyniku w próbie pki wyniku xki
![]() |
(6.30)
|
Gdy dla poszczególnych prób uzyskujemy zmienne losowe ciągłe, co jest w zupełności spełnione dla bardzo dużych ilości pomiarów, i przy tym wykorzystując wzór (6.19) na gęstość uzyskania wyniku we wszystkich próbach fr(x) otrzymujemy ten sam wzór co (6.28), ale na innej drodze wyprowadzenia.
![]() |
(6.31)
|
[edytuj] Wariancja i kwadrat z odchylenia standardowego dla n prób
Policzmy, jaka jest wariancja pomiaru wyniku (nie średniej z pomiarów w i-tej próbie) dla n prób przeprowadzonych przez różne zespoły, znając rozkłady prawdopodobieństwa uzyskanych pomiarów we wszystkich próbach fk(x) (ogólnie rozkłady dla różnych prób nie muszą być jednakowe), znając także prawdopodobieństwo k-tej próby pk (6.25), a także wartości oczekiwania uzyskanych wyników dla każdej próby z osobna E(xk) i wartości oczekiwanej
dla wszystkich próby razem policzone na podstawie wzoru (6.31). Zatem według ogólnej definicji wariancji (2.12), jako drugiego momentu statystycznego można napisać wariancję pomiaru dla zmiennej typu ciągłego "x" wszystkich pomiarów we wszystkich próbach razem wziętych:
![]() |
(6.32)
|
Ponieważ w ostatni składniku w nawiasie klamrowym wyraz w sumie (6.32) znika, ze względu na pierwszy moment statystyczny (3.13), który jest zawsze równy zerowy dla pomiarów występujących dla k-tej próby.
![]() |
(6.33)
|
A więc po ważnym wyznaczeniu ostatniego składnika w sumie wewnątrz nawiasu klamrowego i jak udowodniliśmy, że jest on zawsze równy zero, zatem na podstawie tych wniosków wariancję pomiaru dla wszystkich prób napisanej wedle (6.32) możemy dokończyć obliczenia na tą wielkość idąc od obliczeń wspomnianych wcześniej:
![]() |
(6.34)
|
- gdzie:
jest to wariancja uzyskanych pomiarów w k-tej próbie.
Wyznaczmy wariancję wszystkich prób średniej arytmetycznej od wartości oczekiwanej
wykorzystując definicję wariancji, a także definicję wartości średniej uzyskanych pomiarów we wszystkich próbach (6.24) i prawdopodobieństwa, że dana próba jest z prawdopodobieństwem pk:
![]()
![]() |
(6.35)
|
- gdzie
jest to wariancja średniej w próbie o numerze k-tej.
Widzimy, że wzór na wariancję średniej arytmetycznej uzyskanych wyników pomiarów we wszystkich próbach jest sumą iloczynu kwadratu prawdopodobieństwa k-tej próby pk (6.25) przez wariancję uzyskania średniej arytmetycznej
w próbie o numerze "k".
[edytuj] Metoda największej wiarygodności
Metoda najmniejszej wiarygodności zajmuje się gęstością uzyskania danego pomiaru w zależności od estymowanego parametru, a także zajmuje się ilorazem wiarygodności, czy nawet funkcją wiarygodności zależącą od parametru estymowanego
.
[edytuj] Iloraz wiarygodności, funkcje i logarytmiczne funkcje wiarygodności
Niech estymowanym parametrem będzie n-wymiarowy wektor, to wartość oczekiwana estymatora S(x1,x2,...,xn) (6.1), którego elementy można przedstawić w postaci ogólnej λi:
![]() |
(7.1)
|
A także niech mamy też macierz o "n" kolumnach, który każdy wiersz przedstawia "n" wyników uzyskanych w wyniku doświadczenia, który każdy taki pomiar charakteryzuje inną wielkość fizyczną, a tych serii jednoczesnych pomiarów różnych wielkości fizycznych jest "m":
![]() |
(7.2)
|
Niech mamy gęstość prawdopodobieństwa, że w pomiarze uzyskamy ściśle określony macierz pomiarów (x1,x2,...,xn) (7.2) w zależności od estymowanego wektora (λ1,λ2,...,λn) napisanych w punkcie (7.1), zatem nasz rozważany obiekt statystyczny można napisać ogólnie:
![]() |
(7.3)
|
Infinitezymalne prawdopodobieństwo uzyskania jednocześnie macierzy pomiarów dla macierzy o "n" kolumnach różnych "n" wielkości fizycznych (7.2) w kolejnych seriach jest:
![]() |
(7.4)
|
Jeśli nasze doświadczenie jest przeprowadzone w n-próbach, to nasze infinitezymalne prawdopodobieństwo, w analogii do wzoru (7.4) uzyskania różnych wielkości fizycznych wyników pomiarów w danej próbie w zależności od numeru próby "i" i wektora parametrów estymowanych (7.1) jest napisana według wyrażenia zależnego od wspomnianego wskaźnika:
![]() |
(7.5)
|
Wektor uzyskania wyników n różnych pomiarów uzyskanych w danej próbie o numerze "i" jest przestawiona symbolem
, która jest wielkością statystyczną napisanej w punkcie (7.5).
Ilorazem wiarygodności nazywamy iloraz iloczynu N funkcji gęstości prawdopodobieństwa, których każda zależy od wektora n-wymiarowego pomiarów różnych wielkości fizycznych (7.2) uzyskanych w danej próbie, dla którego ta gęstość prawdopodobieństwa dotyczy. Natomiast wszystkie te gęstości prawdopodobieństwa zależą od tego samego wektora estymowanych parametrów (7.1). Należy pamiętać, że w ilorazie wiarygodności w mianowniku występuje ten sam wyraz co w liczniku, ale dla innego wektora estymowanych parametrów estymowanych
:
![]() |
(7.6)
|
Funkcją wiarygodności nazywamy funkcję zdefiniowanej w postaci iloczynu funkcji gęstości prawdopodobieństwa dla poszczególnych prób "i" przy danym wektorze parametru estymowanego, których jak powiedziano wcześniej, każda taka gęstość prawdopodobieństwa zależy od wektora pomiarów (7.1) wykonanych w danej próbie o numerze "i"
![]() |
(7.7)
|
Logarytmiczną funkcją wiarygodności nazywamy logarytm naturalny funkcji wiarygodności L zdefiniowanych w punkcie (7.7), która jak można udowodnić, można ją przedstawić jako suma logarytmów gęstości prawdopodobieństwa dla poszczególnych prób:
![]() |
(7.8)
|
Pochodną logarytmiczną gęstości prawdopodobieństwa dla próby i-tej nazywamy funkcję, która jest pochodną kierunkową funkcji logarytmicznej (7.8) względem parametru estymowanego
i jak można udowodnić, że jest to iloraz pochodnej kierunkowej funkcji gęstości prawdopodobieństwa policzonej przy parametrze
podzielonej przez funkcję gęstości prawdopodobieństwa "f":
![]() |
(7.9)
|
W rozważanym wzorze przyjmowaliśmy, że:
jest to pochodna logarytmiczna gęstości prawdopodobieństwa względem parametru estymowanego (7.1) dla próby i-tej. Wielkość statystyczna
jest wektorem n-wymiarowym, i posiada elementów tyle co ilość estymowanych elementów wektora (7.1). Zatem pochodna funkcji logarytmicznej (7.8) nazywamy funkcję:
![]() |
(7.10)
|
Gdy rozważamy logarytmiczną funkcją wiarygodności (7.8), to możemy wyznaczyć najlepsze parametry estymowane (7.1), w tym celu należy wyznaczyć pochodną cząstkową względem parametru λ , jeśli parametrów estymowanych jest jeden, dla danego elementu jednowymiarowego wektora estymowanego, dla której logarytmiczna funkcja wiarygodności przejmuje wartość ekstremalną (w tym przypadku maksymalną), dla której pochodna funkcji logarytmicznej funkcji warygodności przyjmuje wartość zero. W ogólnym przypadku, gdy wektor estymowanych parametrów nie jest jednowymiarowy, tylko ma n-parametrów, to pochodna kierunkowa funkcji (7.8) względem wektora parametrów estymowanych (7.1), który jest jak w matematyce napisana z definicji, jest równy n-wymiarowemu wektorowi, która każdy taki element przedstawia pochodną cząstkową funkcji "l" względem innej współrzędnej
.
![]() |
(7.11)
|
Jeśli chcemy wyznaczyć najbardziej prawdopodobne parametry estymowane, to każdą taką pochodną cząstkową w n-wymiarowym wektorze należy przyrównać do zera i mając n równań możemy wyznaczyć te parametry.
[edytuj] Estymatory o minimalnym obciążeniu względem parametru λ
Estymator S (6.1) nazywamy nieobciążonym, jeśli jego wartość oczekiwana jest równa wartości estymowanego parametru. Wariancja estymowanego parametru zgodnie (6.3) wynosi zero, jeśli ten estymator jest zgodny. Ale my tym razem przyjmijmy, że tak nie jest, ale weźmy tym razem, że funkcja B(λ) (definicja poniżej) jest liczbą możliwie najmniejszą (nie musi być równa zero), wtedy jego pochodna zupełna względem tego parametru estymowanego przyjmowała wartość zero (ale tym razem parametr estymowany (7.1) jest wektorem jednoelementowym, niż w poprzednim podrozdziale). Funkcję B(λ) definiujemy jako różnicę wartości estymatora S i wartości estymowanej λ.
![]() |
(7.12)
|
Powyższe stwierdzenia są niewystarczający by stwierdzić, by S był dobrym estymatorem, należało by także zażądać, by wariancja estymowanego parametru
przyjmowała wartość najmniejszą, a w szczególnym przypadku ma przyjmować wartość według wzoru napisanego (6.3).
Aby wyznaczyć funkcję rozkładu gęstości prawdopodobieństwa w N próbach przy pomocy cząstkowych funkcji rozkładu w poszczególnych próbach gęstości prawdopodobieństwa, których każda zależy od wektora pomiarów w danej próbie i od jednakowego jednowymiarowego parametru estymowanego:
![]() |
(7.13)
|
Wartość oczekiwania naszego estymatora S, która jest napisana względem N wektorów pomiarów napisanej dla każdej próby, względem funkcji prawdopodobieństwa zdefiniowanej w punkcie (7.13) i ta wielkość statystyczna przyjmuje postać:
![]() |
(7.14)
|
Po zróżniczkowaniu wartości oczekiwanej (7.14) w względem parametru estymowanego λ i wykorzystując przy tym tożsamość (7.12):
![]() ![]() |
(7.15)
|
Korzystając z definicji (7.10) na pochodną logarytmiczną gęstości funkcji prawdopodobieństwa obowiązującego w N próbach razem, który napiszemy dla jednej wartości estymowanej λ, czyli funkcja l', wtedy wzór (7.15) przechodzi w równoważne równanie:
![]() |
(7.16)
|
Całkowita gęstość prawdopodobieństwa uzyskania jakikolwiek wyniku dla ściśle określonej próby jest ściśle określona i jest równa 1, co powinno być zrozumiałe zgodnie definicją gęstości funkcji prawdopodobieństwa:
![]() |
(7.17)
|
Znając własność (7.17), to całkowita gęstość prawdopodobieństwa uzyskania jakikolwiek wyniku w n-próbach, jak można udowodnić dla całej całej przestrzeni też jest równe jeden.
![]() |
(7.18)
|
Według tożsamości wynikających z obliczeń (7.18) jesteśmy pewni przepisując nasz wniosek, że jest spełniony wzór:
![]() |
(7.19)
|
Różniczkując za pomocą pochodnej cząstkowej tożsamość udowodnioną wcześniej i przedstawionej w punkcie (7.19) względem parametru λ, który jest estymowanym parametrem, wtedy dostajemy inną równoważną tożsamość, jeśli przy tym wykorzystamy wzór (7.10) i policzymy jego wartość oczekiwaną, którą jak udowodnimy w naszym przypadku jest równa zero:
![]() |
(7.20)
|
Doszliśmy do wniosku, że wartość oczekiwana funkcji l' jest równa na pewno zero. Zgodnie ze wzorem (7.16) i tożsamości udowodnionej (7.20), która jest równa zero, co wykorzystamy poniżej, zatem dochodzimy do wniosku, że zachodzi inna tożsamość, ale wynikającego z poprzednich rozważań:
![]() ![]() |
(7.21)
|
Napiszmy pomocnicze wyrażenie poniżej, które trywialnie można udowodnić. Jak wiemy lewa strona równości na podstawie, że (ax+y)2 jest zawsze dodatnia. Z dodatniości gęstości prawdopodobieństwa wynika, że wartość oczekiwana E[(ax+y)2] jest wielkością zawsze dodatnią dla każdego parametru "a":
![]() |
(7.22)
|
Z powyższych oczekiwań wartość oczekiwana (7.22) ma wartość zawsze nieujemną, tzn. powyższe równanie można potraktować jako dwumian kwadratowy względem parametru "a", którego Δ jest zawsze niedodatnia przy parametrze a≥ 0, wtedy równanie kwadratowe (7.22) przyjmuje wartości nieujemne:
![]() |
(7.23)
|
Ze wzoru (7.23) dochodzimy do wniosku, że spełnione jest równanie wynikające ze wspomnianej nierówności:
![]() |
(7.24)
|
Nierówność (7.24) jest nazywana nierównością Cauchy-Schwarza. Korzystając z nierówności (7.24) dochodzimy do wniosku, że według wzoru (7.21) można wywnioskować pewną nierówność:
![]() |
(7.25)
|
Policzmy wartość oczekiwaną kwadratu wartości funkcji (7.10), z oczywistych powodów możemy napisać przekształcając to właśnie wyrażenie:
![]() |
(7.26)
|
Policzmy drugi wyraz równości w końcowych obliczeniach w punkcie (7.26), który jak się przekonamy jest równa zero. Oczywiście wartość oczekiwana funkcji φ dla różnych prób jest równa iloczynowi wartości oczekiwanych dla każdej z prób z osobna. Dlatego tak się dzieje, ponieważ wartości oczekiwane są liczone względem n-wymiarowego wektora pomiarów, dla każdej niezależnej próby pomiarów, zatem na podstawie wzoru (5.3) można tak zrobić.
![]() |
(7.27)
|
Dla każdego czynnika wyrażenia występującego w równaniu (7.27), korzystając przy tym ze wzoru (7.9) i normowania funkcji gęstości prawdopodobieństwa dla i-tej próby (7.17), dochodzimy więc do wniosku:
![]() |
(7.28)
|
Ostatecznie wyrażenie (7.26) na podstawie obliczeń (7.27), a potem (7.28), przyjmuje postać:
![]() |
(7.29)
|
Wiadomo, jednak ze wzoru (7.9) i jeśli z niego policzymy wartość oczekiwaną i na podstawie oczywistej tożsamości (7.17) można oczywiście udowodnić, że ta tożsamość jest zapisywana:
![]() |
(7.30)
|
Wyznaczmy tożsamość napisana poniżej, która będzie nam bardzo potrzebna w poniższych obliczeniach, zatem korzystając z wiadomości z rachunku na pochodnych:
![]() ![]() |
(7.31)
|
Korzystając ze wzoru (7.31) wyrażenie (7.29) możemy zapisać w innej równoważnej postaci do niego:
![]() |
(7.32)
|
Zdefiniujmy podstawienie jako funkcję I(λ) zależącej od wartości oczekiwanej funkcji l'2 zdefiniowanej w punkcie (7.32), zatem:
![]() |
(7.33)
|
Wariancji estymatora S zdefiniowana jako wartość oczekiwana kwadratu odchylenia (S-E(S))2 względem gęstości prawdopodobieństwa n-prób (7.13) piszemy wedle schematu:
![]() |
(7.34)
|
oraz z (7.33), dostajemy wzór:
![]() |
(7.35)
|
Jeśli wykorzystamy udowodnioną nierówność (7.25) a potem z definicji wariancji estymatora S i oznaczenia (7.33), dochodzimy wtedy do wniosku:
![]() |
(7.36)
|
Powyższą nierówność nazywamy nierównością informacyjną. Jeśli B(λ) jest zdefiniowana według wzoru (7.12) i przyjmuje wartość najmniejszą, wtedy mamy najlepsze dopasowanie parametru estymowanego λ z warunkiem ekstremum B'(λ)=0, to wzór (7.36) ze znikającą pierwszą pochodną funkcji B(λ) jest zapisywany:
![]() |
(7.37)
|
Zapytajmy siebie, jaka jest najmniejsze ograniczenie na B'(λ), co zachodzi to wtedy, gdy σ(S) zdefiniowanej wedle wzoru (7.34) przyjmuje wartość najmniejszą, czyli według wzoru (7.25), którego nierówność należy zastąpić równością, wtedy wyróżnik trójmianu (7.23) przyjmuje wartość równą zero. Na podstawie wiadomości z algebry dostajemy, że wartość oczekiwana wyrażenia (a+y)2 jest równa zero, tzn. zachodzi:
![]() |
(7.38)
|
W którym położono na podstawie wcześniejszych rozważań, że x=S-E(S) oraz y=l', to ze wzoru (7.38) można powiedzieć na pewno z nieujemności gęstości prawdopodobieństwa, dzięki której liczymy wartość oczekiwaną, otrzymujemy że wyrażenie z której liczymy wartość oczekiwaną jest równa zero.
![]() |
(7.39)
|
To wtedy z tożsamości końcowej (7.39) możemy wyznaczyć wyrażenie na l', które możemy napisać:
![]() |
(7.40)
|
Wyrażenie (7.40) możemy przecałkować obustronnie względem parametru estymowanego λ, otrzymując końcowe wyrażenie zależne od estymatora S i stałych zależnych lub niezależnych od parametru λ, zatem:
![]() |
(7.41)
|
Ze wzoru (7.8) oraz z wyprowadzonego wyrażenia (7.41) możemy napisać funkcję L, którą zapiszemy poniżej, która jest gęstością prawdopodobieństwa uzyskania pewnych pomiarów w N próbach, wyrażona wzorem:
![]() |
(7.42)
|
Korzystamy ze wzoru (7.40), wtedy wartość oczekiwana tego wyrażenia względem gęstości prawdopodobieństwa N prób jest napisana:
![]() |
(7.43)
|
Jeśli wyrażenie na wartość oczekiwaną l'2 podstawimy do nierówności (7.36), która staje się nierównością dla najmniejszego z możliwych dla wariacji σ(S) i biorąc definicję funkcji I(λ) (7.33), wtedy dostajemy nierówność na to obciążenie estymatora S:
![]() |
(7.44)
|
Mnożąc obustronnie przez σ2(S) równość (7.44), wtedy dostajemy równoważny wzór:
![]() |
(7.45)
|
Co pierwiastkując obustronnie pierwiastkiem drugiego stopnia równość (7.45), wtedy dostajemy że najmniejsza wariancja estymatora S spełnia warunek:
![]() |
(7.46)
|
Czyli najmniejsza wartość dla wariancji estymatora S dla której zachodzi warunek (7.46) zależy od parametru λ wartości estymowanej.
[edytuj] Estymacja dla jednego estymowanego parametru
Niech pochodna funkcji wiarygodności (7.7) w punkcje parametru estymatora λ0 jest równa zero, a która jest pochodną funkcją gęstości prawdopodobieństwa dla N-prób (7.7) w tym punkcie, bo mamy doczynienia z parametrem λ najbardziej prawdopodobnym, czyli dla tej wartości funkcja gęstości prawdopodobieństwa dla N-prób (7.7) przyjmuje wartość maksymalną z wiadomości o ekstremum z analizy matematycznej.
![]() |
(7.47)
|
Drugą pochodną "l" względem najbardziej prawdopodobnego parametru λ0można wyrazić w innej postaci, jeśli skorzystamy ze wzoru (7.32) i potem po wyrażeniu jej w końcu przy pomocy wyrażenia (7.33) w wspomnianym punkcie, co ta wielkość jest wielkością stałą, zatem możemy ją wyrazić względem parametru b-2.
![]() |
(7.48)
|
Rozłóżmy pochodną logarytmicznej funkcji wiarygodności (7.8) w szereg Taylora korzystając wtedy z obliczeń (7.48), dostajemy równość:
![]() |
(7.49)
|
We wzorze (7.49) z korzystaliśmy, ze pierwsza pochodna (7.47) przyjmuje wartość zerową dla punktu λ, a także korzystaliśmy ze wzoru (7.48), która jest wyznaczona dla punktu λ0, zatem logarytmiczna funkcja wiarygodności na podstawie obliczeń (7.49), dla której policzymy całkę wspomnianego wyrażenia względem parametru λ, przedstawia się ona wzorem:
![]() |
(7.50)
|
Funkcja wiarygodności (7.7) wychodząc ze wzoru (7.50) przyjmuje kształt:
![]() |
(7.51)
|
Wzór (7.51) nazywamy rozkładem normalnym (Gaussa).
[edytuj] Estymacja dla kilku estymowanych parametrów
Funkcje wiarygodności można potraktować również jako funkcję n-wielowymiarowego wektora
parametrów estymowanych, które są podane w punkcie poniżej:
![]() |
(7.52)
|
Rozłóżmy funkcje wiarygodności (7.8) w szereg Taylora dla wielu zmiennych względem λi, dostając:
![]() |
(7.53)
|
Pierwsze pochodne przyjmują wartość zerową, ponieważ parametry λ0i są najbardziej prawdopodobne zgodnie (7.11), czyli są tak dobrane, by funkcja wiarygodności osiągała wartość maksymalną.
Można udowodnić, że funkcja logarytmiczna wiarygodności wynikających z obliczeń (7.53) przyjmuje ową postać:
![]() |
(7.54)
|
W logarytmicznej funkcji wiarygodności (7.54) obrywamy wszystkie wyrazy, które są pochodnymi większego rzędu niż dwa, zatem funkcja wiarygodności (7.7) w tym przypadku przyjmuje takową postać:
![]() |
(7.54)
|
Macierz B we wzorze na funkcję wiarygodności (7.54) jest zależna od drugich pochodnych logarytmicznej funkcji wiarygodności (7.8), która ta macierz jest wzięta z minusem:
![]() |
(7.55)
|
Można udowodnić, że odwrotność macierzy (7.55) przyjmuje wygląd podanych według wzoru poniżej, który jakoby jest wartością oczekiwaną z pewnej funkcji macierzowej, która jest definicją kowariancji wedle jej definicji (4.34):
![]() |
(7.56)
|
- Co powyższe twierdzenie jest udowodnione w rozdziale wielowymiarowym twierdzeniu normalnym, którego końcowy wynik jest podany w punkcie (12.23) oraz że wartością oczekiwaną rozkładu (7.54) jest wektor wartości dokładnych
zmiennej wektorowej
.
[edytuj] Funkcje charakterystyczne
W prowadzimy funkcją zwaną funkcją charakterystyczną, która charakteryzuje sam rozkład gęstości prawdopodobieństwa. Mając funkcję gęstości prawdopodobieństwa można określić funkcję charakterystyczną i odwrotnie, mając funkcję charakterystyczną możemy określić sam rozkład gęstości prawdopodobieństwa.
[edytuj] Wartość oczekiwana z wielkości zespolonej
Załóżmy, że mamy pewną funkcję prostą zespoloną, która jest sumą jej części rzeczywistej i zespolonej, którego definicja jest:
![]() |
(8.1)
|
Znając wartości oczekiwane względem funkcji prostych x i y przy pewnej funkcji gęstości prawdopodobieństwa, to jego wartość oczekiwana (8.1), korzystając przy tym z udowodnionej tożsamości (5.3), możemy przedstawić jako sumę wartości oczekiwanej argumentu x i iloczynu jednostki urojonej przez wartości oczekiwanej argumentu y.
![]() |
(8.2)
|
[edytuj] Funkcja charakterystyczna rozkładu
Funkcją charakterystyczną rozkładu względem zmiennej x definiujemy jak wartość oczekiwana z funkcji eksponencjalnej z argumentu itx.
![]() |
(8.3)
|
Przy definiowaniu funkcji (8.3), korzystaliśmy z założenia (8.2). Znając funkcję charakterystyczną rozkładu możemy napisać funkcję gęstości prawdopodobieństwa f(x) na podstawie transformaty Fouriera według funkcji charakterystycznej zdefiniowanej w punkcie (8.3):
![]() |
(8.4)
|
Dystrybuantę zmiennej x gęstości prawdopodobieństwa f(x) (8.4) definiujemy:
![]() |
(8.5)
|
[edytuj] Momenty statystyczne λ, a funkcji charakterystyczna rozkładu
Weźmy n-tą pochodną funkcji zespolonej (8.3), którą nazywamy:
![]() |
(8.6)
|
Policzmy n-tą pochodną funkcji charakterystycznej (8.6) w punkcie t=0, i korzystając przy tym z definicji momentu statystycznego (3.1), zatem oczywiste jest, że n-ta pochodna funkcji (8.3) w punkcie zerowym jest wprost proporcjonalna do momentu statystycznego λn:
![]() |
(8.7)
|
[edytuj] Momenty statystyczne μ, a funkcja charakterystyczna rozkładu
Zdefiniujmy funkcję charakterystyczną φy(t) dla funkcji zdefiniowanej jako
względem jakieś funkcji gęstości rozkładu prawdopodobieństwa:
![]() |
(8.8)
|
n-ta pochodna funkcji φy (8.8) jest napisana wedle:
![]() |
(8.9)
|
Następnie policzmy n-tą pochodną (8.8) w punkcie t=0 , korzystając przy tym z definicji momentu statystyczneg μn względem średniej arytmetycznej przy jego definicji (3.8):
![]() |
(8.10)
|
Ze wzoru (8.10) wynika, że zerowa pochodna (sama funkcja) jest równa jeden dla t=0, co wynika z normowania funkcji gęstości prawdopodobieństwa, czy z definicji momentu statystycznego μn, czyli:
![]() |
(8.11)
|
A jego pierwsza pochodna z własności (3.13) momentu statystycznego o numerze jeden jest równa zero:
![]() |
(8.12)
|
Także wariacja, z własności (3.14) wzięta z minusem, jest napisana w zależności od drugiej pochodnej funkcji φy(t) w tymże punkcie dla t=0:
![]() |
(8.13)
|
[edytuj] Funkcja charakterystyczna dwóch niezależnych zmiennych
Weźmy pod lupę funkcję w=x+y, gdzie x- to jest zmienna pierwszego rozkładu, y-drugiego rozkładu, zatem funkcję charakterystyczną względem parametru "w", a także korzystając przy tym z własności funkcji eksponencjalnej, możemy napisać:
![]() |
(8.14)
|
Wiedząc, ze parametry x i y są zmiennymi niezależnymi w danym doświadczeniu w układzie statystycznym, wedle wzoru (5.9) możemy ten obiekt (8.14) zapisać:
![]() |
(8.15)
|
Funkcja charakterystyczna rozkładu sumy dwóch niezależnych od siebie zmiennych losowych jest równa iloczynowi funkcji charakterystycznych dla tychże zmiennych:
|
(8.16)
|
[edytuj] Rozkład normalny i jego funkcja charakterystyczna
Przyjmijmy na razie bez dowodu, że funkcja rozkładu normalnego (Gaussa) jednowymiarowego względem zmiennej x przy definicji parametru b=σ(x) w tej funkcji względem wartości średniej parametru a=E(x) przyjmuje formę:
![]() |
(8.17)
|
Przy pomocy funkcji rozkładu (8.17) możemy napisać funkcję charakterystyczną (8.3) charakteryzującą ten właśnie wspomniany rozkład:
![]() |
(8.18)
|
Dokonajmy zamiany zmiennych, którego wygląd jest napisany poniżej, z której możemy wyznaczyć zmienną x od zmiennej podstawienia u i od pozostałych parametrów:
![]() |
(8.19)
|
Wtedy funkcja charakterystyczna (8.18) na podstawie definicji podstawienia (8.19) możemy zapisać za pomocą całki względem parametru u.
![]() |
(8.20)
|
Rozpiszmy wyrażenie pomocnicze, które będzie nam potrzebne do wyznaczenia całki w wyrażeniu (8.20):
![]() |
(8.21)
|
Korzystając z obliczeń (8.21), dochodzimy do wniosku, że funkcja charakterystyczna (8.20) ma się w postaci:
![]() ![]() |
(8.22)
|
Funkcja charakterystyczna rozkładu normalnego (Gaussa) na podstawie obliczeń (8.22) przepisuje ostateczną formę na funkcję charakterystyczną rozkładu rozkładu normalnego:
|
(8.23)
|
Dla postaci standardowej, wtedy zachodzi a=0 i b=1, funkcja (8.23) przyjmuje postać:
|
(8.24)
|
Funkcja charakterystyczna dla postaci standardowej jest to funkcja rozkładu gęstości prawdopodobieństwa rozkładu normalnego standardowego z dokładnością do czynnika normalizacyjnego.
[edytuj] Ważniejsze rozkłady statystyczne
Wiemy, że każde uzyskanie wyniku w wyniku doświadczenia jest poparte pewnym rokładem statystycznym.
Zapoznamy się tutaj z rozkładami i twierdzeniami:
- Twierdzenie o rozkładzie Bernoulliego- tutaj prawdopodobieństwo uzyskania pojedynczego wyniku jest równe p. Tutaj wyznaczamy prawdopodobieństwo uzyskania k razy wyniku A z n doświadczeń.
- Twierdzenie o rozkładzie wielomianowym- jest to uogólnienie rozkładu Bernoulliego na przypadek zachodzenia "s" różnych zdarzeń przy różnych Ich trafieniach przy przeprowadzonych n doświadczeniach.
- Twierdzenie o rozkładzie normalnym jednowymiarowym- jest to uogólnienie rozkładu wielomianowego na przypadek bardzo dużej ilości doświadczeń , tak żeby zachodziło n>>1, by uzyskać skończone ilości wyników danego pomiaru danej wielkości fizycznej (zdarzenia A). Ten rozkład jest napisany jaka jest gęstość prawdopodobieństwo uzyskania wyniku x w przestrzeni jednowymiarowej.
- Twierdzenie o rozkładzie normalnym wielowymiarowym- jest to uogólnienie Twierdzenie o rozkładzie normalnym jednowymiarowym, gdy chcemy zapytać jaka jest gęstość uzyskania n-wymiarowego wyniku.
- Centralne twierdzenie graniczne- dowód tego twierdzenia jest taki, że przy liczbie doświadczeń n→∞ rozkład wyników uzyskanych w doświadczeniu przechodzi w rozkład normalny.
- Twierdzenie o rozkładzie χ2- jeśli rozkład statystyczny w n próbach zmiennej statystycznej χ2, która jest sumą kwadratów wyników pomiarów, przy którym w pojedynczej próbie rozkład wyników pomiarów jest rozkładem normalnym.
- Twierdzenie o rozkładzie hipergeometrycznym- jeśli w zbiorze zdarzeń mamy dwa rodzaje zdarzeń, to jeśli zapytamy jakie jest prawdopodobieństwo uzyskania wyników składającej się z k zdarzeń A i n-k zdarzeń B przy n losowaniach.
- Twierdzenie o rozkładzie Poissona- jest to uogólnienie rozkładu Bernoulliego na przypadek, gdy warunek n p=λ, gdy spełnione są jednocześnie warunki: n→∞ oraz p→ 0.
[edytuj] Twierdzenie o rozkładzie Bernoulliego
Prawdopodobieństwo Bernoulliego - jest to rozkład przedstawiający jakie jest prawdopodobieństwo wylosowania w n próbach właściwości K przy jego trafieniach w ilości k. W tym rozkładzie wiemy, że prawdopodobieństwo wylosowania właściwości K w pojedynczym doświadczeniu jest równe p, a zdarzenia przeciwnego do K jest równe 1-p.
[edytuj] Rozkład statystyczny
Załóżmy, że ropatrujemy, że losowano właściwość K na ściśle określonych urnach, z ilością trafień k, w ściśle określonej kolejności z jakimi dokonano tychże trafień. Prawdopodobieństwo tego zdarzenia jest równe:
![]() |
(9.1)
|
Ponieważ we wzorze (9.1) założono, że trafienia lub nie trafienia przeprowadzono w ścisłej kolejności, ale tak nie musi być. Ilość ścisłych takich kolejności jest
, zatem prawdopodobieństwo trafienia w zdarzenie K w ilości k w dowolnej kolejności jest iloczynem prawdopodobieństwa (9.1) przez wspomniany ostatnio symbol Newtona, zatem prawdopodobieństwo w rozkładzie Bernoulliego piszemy:
![]() |
(9.2)
|
[edytuj] Wartość oczekiwana
Średnią oczekiwaną dla rozkładu prawdopodobieństwa Bernoulliego Pnk przedstawiamy jako średnią trafienia w właściwość K, i zapisujemy ją jako sumę po wszystkich możliwych k od zera do n względem iloczynu prawdopodobieństwa rozważanego rozkładu przez ilość trafień k.
![]() |
(9.3)
|
Podstawiamy za prawdopodobieństwo uzyskania k trafień w n doświadczeniach właściwości K, czyli Pnk do wzoru na wartość oczekiwaną tego rozkładu (9.3):
![]() |
(9.4)
|
W obliczeniach dokonujemy podstawienia k-1=k', zatem mamy:
![]() |
(9.5)
|
Otrzymujemy, że wartość oczekiwana dla rozkładu Bernoulliego na podstawie obliczeń (9.5) jest iloczynem prawdopodobieństwa p uzyskania właściwości K w n doświadczeniach przeprowadzonej na pewnej urnie.
![]() |
(9.6)
|
[edytuj] Odchylenie standardowe rozkładu Bernoulliego
Możemy wyznaczyć wariancję rozkładu Bernoulliego (9.2), korzystając ze wzoru opisującego rozkład dyskretny (3.18) wyrażającego go względem wartości oczekiwanej uzyskania kwadratu ilości trafień k2 i względem wartości oczekiwanej ilości trafień przedstawionych w punkcie (9.6), jako:
![]() |
(9.7)
|
Następnie policzymy wartość oczekiwaną kwadratu ilości trafień, którego definicja jest w punkcie poniżej wykorzystując prawdopodobieństwo rozkładu Bernoulliego:
![]() ![]() |
(9.8)
|
Dokonujemy podstawienia we wniosku (9.8) wedle schematu: k-1=k':
![]()
![]() |
(9.9)
|
Po krótkich przekształceniach w punkcie (9.9) dostajemy, że wartość oczekiwana kwadratu ilości trafień jest wyrażona:
![]() |
(9.10)
|
A zatem podstawiając wartości oczekiwane (9.6) i (9.10) do wzoru wariancję ilości trafień (9.7), zatem nasza ta rozważana wielkość można określić według:
![]() |
(9.11)
|
[edytuj] Zestaw momentów statystycznych
Wartość oczekiwaną ilości trafień i wariacja ilości trafień k w n doświadczeniach właściwości K są napisane według wzorów (9.6) i (9.11). Te wzory również wyprowadzimy za pomocą rozkładu zero-jedynkowego. Jeśli przyjmować będziemy, że losujemy jedynkę z prawdopodobieństwem p a zero z prawdopodobieństwem 1-p, to wartość oczekiwana tego zdarzenia jest napisana wedle obliczeń:
![]() |
(9.12)
|
Wzór (9.12) określa wartość oczekiwaną dla pojedynczego zdarzenia, zatem dla n losować, korzystając przy tym (5.3), wyrażamy przez równanie:
![]() |
(9.13)
|
Wariancja dla pojedynczego doświadczenia jest określona przy tych samych warunkach co powyżej przy liczeniu wartości oczekiwanej pojedynczego pomiaru zera lub jedynki:
![]() ![]() |
(9.14)
|
Wariancja dla każdego doświadczenia z n jest taka sama, a więc korzystając ze wzoru (5.17) przy założeniu, że te n doświadczeń są względem siebie niezależne, wtedy kowariancja tych dwóch różnych zdarzeń jest równa zero, zatem całkowita wariancja n doświadczeń jest wyrażona:
![]() |
(9.15)
|
Otrzymaliśmy takie same wzory na wartość oczekiwaną (9.13) i wariancję (9.15), co w punktach (9.6) i (9.11) stosując intuicyjną metodę liczenia wartości oczekiwanej i wariancji.
[edytuj] Twierdzenie o rozkładzie wielomianowym
Rozkład wielomianowy jest uogólnieniem rozkładu dwumianowego, tym razem mamy zamiast dwóch mamy "l" właściwości, w które trafiamy w n doświadczeniach. Ilość poszczególnych trafień jest kj w właściwość o numerze "j" Wszystkie ilości trafień powinny spełniać warunek:
![]() |
(10.1)
|
Wzór na prawdopodobieństwo w rozkładzie wielomianowy względem ilości trafień w poszczególne trafienia k1,k2,...,kl, znając prawdopodobieństwa zdarzeń o numerach kolejno j=1,...,l, w których prawdopodobieństwo uzyskania w pojedynczym doświadczeniu poszczególnych właściwości jest napisane kolejno p1,p2,...,pl, przy ilości przeprowadzonych doświadczeń, których jest "n", jest napisane:
![]() |
(10.2)
|
Dla rozkładu dwumianowego, który jest bardzo podobny jest do równania Bernoulliego (taki sam wzór a różne interpretacje), wzór (10.2) dla l=2 przechodzi we:
![]() |
(10.3)
|
Załóżmy, że mamy n doświadczeń, w których trafiamy w pewne właściwości, jeśli trafimy w tą właściwość, to ją oznaczamy jako jeden, w przeciwnym przypadku jako zero. Zatem wartość oczekiwaną dla rozkładu wielomianowego trafienia właściwości o numerze "i" jest określone przez wyrażenie:
![]() |
(10.4)
|
Dla n przeprowadzonych doświadczeń wartość oczekiwana losowania właściwości Ki jest określona na podstawie wzoru (5.3) dla przeprowadzonych n doświadczeniach:
![]() |
(10.5)
|
Wartość oczekiwana zdarzenia Ki o numerze "i" dla rozkładu wielomianowego jest równa wzorowi (10.5). Korzystając z tej właściwości rozkładu wielomianowego, to wyznaczmy elementy macierzy kowariancji dla elementów diagonalnych (czyli liczymy wariancję) dla pojedynczego doświadczenia, wtedy oczywiste jest:
![]() |
(10.6)
|
Dla przeprowadzonych n doświadczeń, wiedząc, że poszczególne doświadczenia są niezależne od siebie, zatem kowariancja różnych doświadczeń względem siebie dla tego samego rozkładu jest równa zero dla uzyskania tego samego wyniku, na podstawie wzoru (5.17) mamy wzór na elementy diagonalne kowariancji, które są z definicji wariancjami statystycznymi uzyskania odpowiednich wyników o właściwości Ki.
![]() |
(10.7)
|
Korzystając z tej samej wartości oczekiwanej co w (10.6), czyli z (10.4), to możemy przeprowadzić obliczenia dla pozadiagonalnych elementów macierzy kowariancji cij, czyli dla elementów, dla których zachodzi i≠j:
![]()
![]() |
(10.8)
|
Zgodnie ze wzorem na wariancję (diagonalne elementy kowariancji) (10.7) i wzorem na pozadiagonalne elementy kowariancji) (10.8) możemy otrzymać ogólny wzór na dowolne elementy kowariancji dla pojedynczego doświadczenia, którego dowód przeprowadzimy poniżej, czy się zgadza z powyższymi wzorami udowodnionymi powyżej.
![]() |
(10.9)
|
Gdy i=j, to diagonalne elementy macierzy kowariancji (10.9) przyjmują postać:

co zgadza się ze wzorem (10.6).
Gdy i≠ j, to macierz kowariancji dla jednego doświadczenia (10.9) przedstawia się:

co zgadza się ze wzorem (10.8).
Zatem wzór na macierz kowariancji (10.9) pojedynczego doświadczenia jest macierzą poprawną względem jej szczególnych przypadków.
Macierz kowariancji opisujący n doświadczeń [cij] jest sumą n macierzy kowariancji, które opisują poszczególne doświadczenia, którego elementy dla każdego małego doświadczenia są (10.9) i tą ogólną macierz kowariancji zapisujemy jako [cij]=Σk=1,2,...,n[ckij]. Jak to udowodniono dla i=j, właściwość macierzy kowariancji została udowodniona w punkcie (10.7), gdy i≠j, to elementy n macierzy kowariancji o tych samych wskaźnikach dodają się do siebie, podobnie jest dla diagonalnych elementów macierzy kowariancji (wariancje):
![]() |
(10.10)
|
Ostatecznie, macierzą kowariancji nazywamy na podstawie jej końcowego przedstawienia (10.10) wyrażenie:
![]() |
(10.11)
|
Wiadomo, że z definicji (4.34), że macierz kowariancji jest macierzą symetryczną, a więc definicja macierzy (10.11) powinna to spełniać. Elementy na diagonalnej są z samej siebie z definicji symetryczne, a zatem sprawdźmy czy elementy pozadiagonalne są symetryczne względem siebie.
![]() |
(10.12)
|
Z rozważań w punkcie (10.12), że pozadiagonalne elementy kowariancji są elementami symetrycznymi, zatem dostajemy, że w ogólności macierz kowariancji dla rozkładu wielomianowego jest macierzą symetryczną, co nie powinno być dla nas zdziwieniem.
![]() |
(10.12)
|
[edytuj] Twierdzenie o rozkładzie normalnym jednowymiarowym
Artykuł zawiera wszystkie informacje dotyczące rozkładu normalnego, które są potrzebne do jego wyprowadzenia oraz prostą jego interpretację, a w szczególności interpretację σ oraz punktu przegięcia, kiedy wyniki pomiaru należy odrzucić, a kiedy przyjąć.
Niżej znajdują się wszystkie momenty statystyczne rozkładu normalnego. Należy zaznaczyć, że momenty statystyczne o nieparzystym stopniu są równe zeru, a pozostałe są od niego różne. Można tak interpretować, że rozrzut wyników doświadczalnych wokół wartości najprawdopodobniej x0 jest symetryczny, tzn. ilość wyników pomiarowych przed oraz za x0 jest taka sama, czyli funkcja gęstości prawdopodobieństwa jest funkcją parzystą, z tego powodu momenty statystyczne nieparzystego stopnia są równe zero, gdyż funkcja podcałkowa jest funkcją nieparzystą w całce symbolizującej moment statystyczny.
Proszę pamiętać przy czytaniu tego dowodu, że to jest fizyka, a nie matematyka
Twierdzenie o rozkładzie normalnym – szczególny przypadek twierdzenia o rozkładzie wielomianowym, dający odpowiedź na pytanie jak postępować z danymi doświadczalnymi: czy je odrzucić jako mało prawdopodobne, czy je przyjąć w zależności od danych doświadczalnych uzyskanych z doświadczenia, poprzez uprzednie obliczenie
i σ, czyli wartość średnią (arytmetyczną) i średnie odchylenie standardowe. Zasady obliczania tych wskaźników
czy σ będziemy tu przyjmować za znane i nie będziemy do tego problemu podchodzić, tylko wyprowadzimy wzory na σ(x) - to jest niepewność standardową pojedynczego pomiaru, oraz
, to jest niepewność standardową średniej arytmetycznej uzyskanych z doświadczenia wszystkich nie odrzuconych pomiarów, a także
, określające wartość, której prawdopodobieństwo uzyskanie w naszym doświadczeniu jest największe, wartość ta jest najdokładniejsza ze wszystkich uzyskanych xi względem wartości dokładnej x0. Celem doświadczenia jest uzyskanie wartości x0, ponieważ nie jest możliwe uzyskanie tej wartości, lub dokonania nieskończenie wielu pomiarów, bo wtedy
, to zamiast niej uzyskujemy
średnią arytmetyczną, która jest liczona dla każdej serii danych doświadczalnych, wykorzystując do tego celu rozkład normalny, w którym w miejsce wartości dokładnej wsadzamy
.
Zwykle tak się robi w fizyce doświadczalnej, nie patrząc na opinie matematyków, w których matematycy mówią, że wszystko musi być dokładne, nie ma wartości przybliżonej - a jeśli są, to trzeba określić je w sposób ściśle określony. Jednak według fizyków nie ma wartości dokładnej, są tylko wartości przybliżone. W doświadczeniach fizycznych dane doświadczalne układają się wokół punktu x0 (wartości dokładnej), i bardzo rzadko się zdarza, że wyjdzie jakiś wynik (pomiar), który jest odległy od x0 nawet o 2σ, i jest to raczej błąd systematyczny, który może mówić o błędzie eksperymentatora, np. niedostosowanej temperatury do warunków doświadczalnych itp., dlatego odrzucanie wyników doświadczalnych bardzo oddalonych od x0, należy przyjąć jako odrzucone. Gdy
odrzuca się te xi z poszczególnych prób i serii. Liczba wyników doświadczalnych powinna być dość duża, nawet po odrzuceniu pewnych danych doświadczalnych, szczególnie zawężonych do
. Mówi się, że w przybliżeniu n⇒∞ jest spełniony rozkład normalny, natomiast przy małym n tak nie jest, ponieważ w doświadczeniu powinno się robić co najmniej 30 doświadczeń w poszczególnych próbach, by rozkład był w miarę spełniony. Rozrzut wyników wokół wartości dokładnej jest porozrzucany po obu stronach x0 i tak się dzieje, że wyniki doświadczalne znajdują się bardzo blisko wartości dokładnej. Prawdopodobieństwo uzyskania wyników o błędzie większym od σ a nawet o 2σ jest raczej bardzo mało prawdopodobne i nieodrzucanie tychże wyników doświadczalnych wnosi wkładu do obliczania σ i x0, zatem co je należy odrzucić, bo te wartości obliczenia stają się mało-wiarygodne przy nieodrzuceniu tychże wartości. Rozkład normalny jest spełniony dla nieskończonej ilości stopni swobody (liczby uzyskanych danych doświadczalnych), oczywiście minus jeden, bo mamy wzór na wariancję pomiaru, licząc je dla poszczególnych prób.
Niepewność pomiarową w doświadczeniu określmy jako średni błąd, który można popełnić, dla poszczególnych doświadczeń w próbach. Jeśli niepewności są większe niż σ, to taki wynik częściowy doświadczenia należy odrzucić, toteż
i
należy przeliczyć od nowa, czy nie ma dalszych wyników doświadczenia, tzn.: xi określić jako odrzucone. Jeśli są, wówczas tę procedurę powtarzamy aż do skutku. Po tej czynności należy przejść do dalszego etapu badania, jakie są zależności w naszym doświadczeniu w poszczególnych próbach.
Dlaczego trzeba odrzucać wyniki dla których
, ale ponieważ gdy zapoznamy się z wyprowadzeniem wzoru na rozkład normalny z zastosowaniem szeregu Taylora wokół wartości x0, i jak wiemy z analizy matematycznej, gdy większa jest różnica między xi (wynikiem pomiaru) a x0 (wartością dokładną), to szereg Taylora przestaje być spełniony poza promieniem zbieżności, dlatego odchyły od x0 nie powinny być za duże.
[edytuj] Wielomianowa kombinacja trafień w układ doświadczalny
Załóżmy, że mamy "m" punktów doświadczalnych, które będziemy uzyskiwać w "n" doświadczeniach. W "n" doświadczeniach możemy uzyskać w dany punkt o numerze j liczbę kj dotknięć. Według rozkładu normalnego w doświadczeniu staramy by liczba doświadczeń była nieskończenie duża, a praktycznie bardzo duża, by doświadczenie pokryło prawie wszystkie punkty możliwe do uzyskania w naszym doświadczeniu, przy czym uzyskane wyniki są powtarzane z różną częstością, wtedy liczba trafionych punktów l zbliżała się do liczby punktów w doświadczeniu możliwych do uzyskania. W wzorze (11.1) wliczmy tylko te punkty, które zostały dotknięte w naszym doświadczeniu. Zatem ilość możliwych trafień w te punkty wyraża się:
![]() |
(11.1)
|
gdzie:
- n jest to ilość przeprowadzonych doświadczeń w danym układzie doświadczalnym.
- kj jest to ilość trafień w dany punkt doświadczalny.
We wzorze (11.1) jest spełniony związek mówiący, że liczba wszystkich poszczególnych trafień w dane punkty doświadczalne jest równe sumie przeprowadzonych doświadczeń.
![]() |
(11.2)
|
[edytuj] Wyznaczanie wzoru przybliżonego na n!
W rozkładzie dwumianowym bardzo często występuje silnia, korzystanie z niej szczególnie jest niewygodne, gdy zachodzi n→ ∞. Będziemy korzystać ze wzoru Stirlinga, który wylicza w sposób przybliżony silnie z liczby n za pomocą potęgowania i pierwiastkowania, zatem ten wzór mozna napisać wedle sposobu:
![]() |
(11.3)
|
Wzór (11.3) staje się wyrażeniem dokładnym, gdy n→∞. Możemy z logarytmować wyrażenie przybliżone na silnie liczby n przedstawionego wedle wspomnianego wzoru i dokonać dalszych przybliżeń, z którego końcowego przybliżenia będziemy korzystać w dalszych obliczeniach na wyznaczaniem rozkładu normalnego.
![]() |
(11.4)
|
[edytuj] Logarytm kombinacji trafień w układ doświadczalny
Policzmy logarytm naturalny wyrażenia na ilość możliwych pewnych dotknięć w "l" ściśle określonych punktów, którego wzór jest napisany tutaj (11.1), korzystając przy tym ze wzoru na przybliżenie wielkości logarytmu naturalnego silni z liczby n, czyli (11.4) i z właściwości logarytmu iloczynu lub ilorazu dwóch liczb:
![]() ![]() |
(11.5)
|
W równaniu (11.5) możemy wyznaczyć Wn(k1,k2,...,kl), zatem dostajemy, że ilość możliwości realizacji układu statystycznego trafień w ściśle określony punkty z ilością trafień kj dla punktu o numerze "j" jest określana:
![]() |
(11.6)
|
- gdzie jest pewna stała C(n) jest zależna od ilości przeprowadzonych doświadczeń w na układzie statystycznym.
![]() |
(11.7)
|
[edytuj] Całkowite prawdopodobieństwo zdarzeń w rozkładzie normalnym
W doświadczeniu ilość możliwych dotknięć w dany punkt doświadczalny jest określone przez wzór (11.6). Prawdopodobieństwo, że nasze doświadczenie tak przejdzie, według określonego schematu jest określone jak jeden ze wszystkich możliwych dotnieć w l punktów doświadczalnych: Wn{(k1,k2,..,kn) i jest kreślone według:
![]() |
(11.8)
|
[edytuj] Rozszerzenie przedziałów uzyskania wyników na R lub przedział w R
Załóżmy, że badamy przypadek w bardzo dużej ilości doświadczeń "n" dla zmiennej typu ciągłego w R lub w przedziale (a,b) należących do zbioru liczb rzeczywistych lub w przypadku quasiciągłym. Dla tego przypadku, w doświadczeniu, wiemy jednak że: Δx→0 i (x0-Δ x/2,x0+Δ x/2), gdzie jest to malutki przedział dla którego wartości naszego pomiaru są nierozróżnialne względem niepewności pomiarowej, ale i też z drugiej strony d → ∞, co przedstawia rozległość pomiarów, co spełnia warunki dla naszego rozkładu normalnego. Prawdopodobieństwo uzyskania jakiegoś wyniku w rozważanym przedziale dąży zera, bo ilość wyników do uzyskania jest nieskończenie duża. Uzyskanie wyników w przedziale (-∞,∞), nie dość że długość przedmiotów miała by wiele do życzenia, jak i prawa fizycznego, które badamy mogą być nie spełnione dla aż tak dużego "d", np. prędkość świata dla "d" względnie miarę małego w porównywana tysiącami kilometrów jaką światła może przebyć, ma wiele do życzenia, a dla "d" bardzo dużego raczej już nie. Również Δ x nie może być nieskończenie małe, ponieważ niepewność pomiarowa przedmiotów jest jakaś tam, tak że rozróżnienie wyników w (x-χ,x+χ) graniczy z cudem. Czyli pomiary jakieś wielkości fizycznej nie mogą być pomiarami zbyt rozległymi względem naszego doświadczenia, jak i pomiarami bardzo małymi względnie wielkości, które mierzymy. Jeśli d jest względnie duże, a Δ x jest względnie małe, to nasz przedział można potraktować jak przedział ciągły o rozmiarach nieskończonych, tzn. (-∞,∞).
[edytuj] Gęstość prawdpodobieństwa dla zmiennej typu ciągłego lub quasiciągłego
Gęstość prawdopodobieństwa w n doświadczeniach należy zdefiniować wedle:
![]() |
(11.9)
|
Ponieważ ilość danych do zbadania jest nieskończenie duża, i wtedy dochodzimy do wniosku, że zachodzi Pn→ 0, oczywiste jest, że ma sens stosowanie wtedy definicji gęstości prawdopodobieństwa. Tutaj zastępujemy wielkości k→ k(x) dla nieskończenie przeprowadzonych doświadczeń w przedziale (a,b) lub w "R", wtedy gęstość prawdopodobieństwa uzyskania wyników z przedziału jest równe w naszym przypadku dla "n" (duże "n") doświadczeń:
![]() |
(11.10)
|
- gdzie
jest to gęstość ilości stanów ilości trafień dla zmiennej typu ciągłej w przedziale o grubości "dx".
[edytuj] Zerowy moment statystyczny, czyli normowanie funkcji
Rozłóżmy sobie logarytm naturalny ilości trafień w dany punkt doświadczalny "x" względem wartości dokładnej napisanej przez x0 w szereg Taylora, pisząc wszystkie wyrazy włącznie z kwadratowym, a pozostałe wyrazy oznaczając wielokropkami:
![]() |
(11.11)
|
Wzór na prawdopodobieństwo realizacji danego doświadczenia określonych wzorem (11.8), do którego podstawiamy wyrażenie na logarytm ilości trafień w punkt doświadczalny x, określonych według wzoru (11.11), i dostajemy pewne wyrażenie, które jest prawdopodobieństwem trafień w dany punkt doświadczalny od x1 do xn, których wyników pomiarowych jest n.
![]() ![]() |
(11.12)
|
Z obliczeń wynikających z przeprowadzonych obliczeń w punkcie (11.12) przepiszmy końcowy wynik dla przejrzystości wykładu.
![]() |
(11.13)
|
- gdzie:
są to wyniki doświadczalne uzyskane w wyniku doświadczenia, wyniki powtarzające się nie są wliczane do tego wektora.
są to wyniki doświadczalne uzyskany w wyniku doświadczenia, przy czym do tego wektora są wliczane również wyniki powtarzające się.
Wartość x0 są tak dobieramy, by rozkład (11.13) dla tej wartości przyjmował wartość największą, czyli wartość dokładna powinna być najbardziej prawdopodobna , zatem dochodzimy do wniosku, że B=0, a stałą związaną z A, możemy włączyć pod stałą C i w końcu dostajemy stałą F, co uwzględnimy poniżej. A to dowód, że stała B ma taką wartość. aby to udowodnić należy policzyć pochodną cząstkową prawdopodobieństwa rozkładu (11.13) względem wartości xi uzyskanych w wyniku pomiaru i podstawić do niego za xi wartość dokładną x0 a cały wynik przyrównać do zera:
![]() ![]() |
(11.14)
|
Na podstawie wcześniejszych rozważań otrzymujemy, że prawdopodobieństwa naszego zdarzenia, że uzyskamy n pewnych wyników doświadczalnych, jest zatem określona przez wzór:
![]() |
(11.15)
|
Prawdopodobieństwa uzyskania średniej arytmetycznej, przy tym korzystając ze wzoru (11.15), jest ono równe wzorowi względem jego odchylenia od wartości dokładnej x0:
![]() |
(11.16)
|
Określimy czemu jest równa gęstość prawdopodobieństwa względem średniej arytmetycznej, jeśli znamy tylko gęstość prawdopodobieństwo pomiaru oraz średniej arytmetycznej względem wartości dokładnej x0 ,czyli jaka jest gęstość prawdopodobieństwa, gdy mamy wartość średnią
, czyli skorzystajmy z definicji prawdopodobieństwa warunkowego:
![]() |
(11.17)
|
Dokonajmy obliczeń pomocniczych rozwinięcia wyrazu o numerze "i" występującego w pierwszej sumie w postaci przekształceń jego, które przeprowadzimy poniżej:
![]() |
(11.18)
|
Na podstawie obliczeń (11.18), prawdopodobieństwo uzyskania n wyników pomiarów (11.17) przedstawiamy według:
![]() |
(11.19)
|
Redukując drugi i czwarty wyraz, i korzystając z tego, że poszczególne wyniki doświadczenia są niezależne od siebie, co można dla wyrazu trzeciego przeprowadzić obliczenia, który jest równy zero.
![]() ![]() |
(11.20)
|
Wedle obliczeń (11.20) prawdopodobieństwo warunkowe prawdopodobieństwo uzyskania średniej arytmetycznej uzyskania pewnej ilości wyników (11.19) jest określone:
![]() |
(11.21)
|
Mając wzór na rozkład średniej
wokół wartości dokładnej
(11.17) oraz korzystając z definicji wartości średniej arytmetycznej n wyników pomiarów, możemy ten wzór przekształcić jeszcze bardziej, zatem dochodzimy do schematu:
![]() ![]() |
(11.22)
|
Przejdźmy jeszcze raz do wzoru (11.17), w której mianownik zastępujemy jej wyrażeniem równoważnym (11.22), wtedy dochodzimy do wniosku, że prawdopodobieństwo uzyskania danego pomiaru względem prawdopodobieństwa uzyskania ściśle określonej wartości średniej jest określone równoważnym do wspomnianego wzorem:
![]() |
(11.23)
|
[edytuj] Wyznaczamy stałe B i F we wzorze na rozkład normalny
Zajmować będziemy się zajmować wielkością ciągłą zmiennej x, oczywiste jest że rozkład dyskretny można uważać za ciągły, gdy Δ x=x-xi-1 jest bardzo małe w porównaniu z badanym przedziale (x0-d/2,x0+d/2), tzn. Δ x<<d, i dlatego w tym przypadku będziemy używać gęstości prawdopodobieństwa ρ zamiast prawdopodobieństwa uzyskania n wyników pomiarów P, w przypadku wielkości badanej. Tak by obejmował dwa przypadki rozkład normalnym ciągły i quasiciągły. W przypadku quasistatycznym gęstość prawdopodobieństwa uzyskania pojedynczego wyniku pomiaru definiujemy jako iloraz prawdopodobieństwa uzyskania wyniku xi w przedziale o długości Δ xi.
![]() |
(11.24)
|
W przypadku ciągłym w (11.24) możemy zastąpić wielkość dyskretną xi przez wielkość ciągłą x.
Zakładamy, że mamy rozkład gęstości prawdopodobieństwa gęstości wartości losowej ciągłej zmiennej "x" lub w przypadku quasiciągłym, gdy różnica pomiędzy dwoma najbliższymi punktami doświadczalnymi jest mała w porównaniu z "d"(długością badanego przedziału), zatem tą gęstość prawdopodobieństwa przedstawiamy:
![]() |
(11.25)
|
Będziemy się posługiwać całkami przystępnymi, które będziemy się często posługiwać, które wynikają z rozważań z analizy matematycznej. A także można napisać całkę wynikającego z różniczkowania ciągłego obu stron (11.26) względem parametru α, zatem te dwie całki (przed różniczkowaniem i po różniczkowaniu obu stron) przedstawiamy:
|
|
Funkcja gęstości prawdopodobieństwa (11.25) powinna być funkcją unormowaną, w tym celu należy skorzystać z tożsamości całkowej (11.26), zatem dochodzimy do wniosku:
![]() |
(11.28)
|
Wariancję możemy policzyć względem rozkładu (11.25), po podstawieniu do niej za stałą F napisanej wedle (11.28) i korzystając z definicji wariancji zmiennej losowej ciągłej (2.15), przedstawiamy tą wielkość wedle obliczeń poniżej:
![]() |
(11.29)
|
Zatem zmienna F, wynikająca z końcowych obliczeń (11.28), możemy podstawić do niego wzór wynikający też z obliczeń (11.29), wtedy tą stałą możemy przedstawić w zależności od odchylenia standardowego σ(x).
![]() |
(11.30)
|
Na samym końcu możemy wyznaczyć rozkład ρ(x) zmiennej x (11.25) w pełnej jego okazałości, wykorzystując końcowe wyniki z obliczeń (11.29) (stała D) i (11.30) (stała F), wtedy ten nasz rozkład jest przedstawiony wedle:
![]() |
(11.31)
|
Jest to rozkład zmiennej losowej ciągłej x (rozkład normalny) względem wartości dokładnej.
[edytuj] Związki w rozkładzie normalnym
Przedstawmy podstawowe wzory, które otrzymaliśmy z powyższych obliczeń, by określić w sposób ścisły stałą D, mając kolejno wzory (11.23) i (11.21), które są wzorami wynikających z definicji prawdopodobieństwa warunkowego pomiaru względem prawdopodobieństwa uzyskania średniej arytmetycznej wokół wartości dokładnej, te wzory kolejno przedstawiamy w postaci:
|
|
A także wzoru na gęstość prawdopodobieństwa uzyskania średniej arytmetycznej wynikającego ze wzoru (11.16):
![]() |
(11.34)
|
Wzór (11.32) jest to wzór na gęstość rozkładu wyników pomiarowych ze stałą D , które można wyznaczyć z końcowych obliczeń (11.29), także to samo oznacza wzór (11.33). Ponieważ według pierwszej równości (11.34) mamy stałą D określoną przez równanie pierwsze poniżej. Z drugiej jednak strony stałą D można określić względem drugiej równości (11.34), wedle sposobu poniżej. Można tak manipulować stałymi, ponieważ rozkład wspomnianym wzorze jest iloczynem gęstości prawdopodobieństwa uzyskania każdego wyniku z osobna w pierwszej równości, a w drugiej jest iloczynem n takich samych gęstości prawdopodobieństwa średniej arytmetycznej uzyskanych w wyniku doświadczenia. Zatem dochodzimy do wniosku:
|
|
Jeśli wzór (11.36) na stałą D podstawimy do wzoru (11.35), wtedy otrzymamy wyrażenie, które nadal będziemy przekształcać:
![]() |
(11.37)
|
Według obliczeń (11.37) wynika, że odchylenie standardowe średniej arytmetycznej jest równe odchyleniu standardowemu wyniku pomiaru podzielonej przez pierwiastek ilości wszystkich pomiarów.
Wiadomo jednak, że wzory (11.33) i (11.34) oznaczają to samo, więc możemy je przyrównać, zatem mamy:
![]() |
(11.38)
|
Z różnowartości funkcji eksponencjalnej we wzorze (11.38) dostajemy równoważny do poprzedniego wzór, z którym troszkę go poprzekształcamy:
![]() |
(11.39)
|
Gdy wyników pomiarów mamy nieskończenie wiele, wtedy ilość wyników pomiarów dla danego x podzielona przez ilość wszystkich wyników w doświadczeniu pokrywa się z infinitezymalnym prawdopodobieństwem uzyskania tego właśnie wyniku, zatem w przypadku granicznym lewa strona końcowej nierówności (11.39) staje się całką z wariancji po nieskończonym przedziale zmienności, zatem odchylenie standardowe pomiaru, która jest pierwiastkiem wariancji charakteryzujących rozkład jest napisana wedle:
![]() |
(11.40)
|
W końcu odchylenie standardowe średniej arytmetycznej (11.37) otrzymamy podstawiając do niego wzór (11.40) i dostając na samym końcu wzór (6.18).
[edytuj] Rozkład normalny
Rozkład dla pomiaru ścisłej jednej wartości xi względem jej wartości dokładnej jest wyrażona:
![]() |
(11.41)
|
W zastosowaniach fizycznych często stosujemy wzór wynikający z prawdopodobieństwa warunkowego prawdopodobieństwa uzyskania wartości pomiaru względem wartości dokładnej i tą całość przez prawdopodobieństwo uzyskania wartości średniej względem wartości dokładnej i ona jest określana:
![]() |
(11.42)
|
Wzory (11.41) i (11.42) są wartością gęstości prawdopodobieństwa dla pojedynczego pomiaru zmiennej losowej statystycznej ciągłej wokół wartości dokładnej lub średniej arytmetycznej. Rozkład wartości doświadczalnej wokół wartości dokładnej serii pomiarów w "n" doświadczeniach, korzystając przy tym ze wzoru (11.41), wyraża się:
![]() |
(11.43)
|
W zastosowaniach fizycznych stosowany jest przede wszystkim wzór wynikający z (11.42), mówiący jaka jest gęstość prawdopodobieństwa warunkowego uzyskania n wyników pomiarów:
![]() |
(11.44)
|
Należy przy tym pamiętać, że we wzorach (11.43) oraz (11.44), wektor
może zawierać w sobie elementy powtarzające się więcej niż raz, co możemy przedstawić w sposób zrozumiały przy wyprowadzeniu (11.14), jako potwierdzenie naszych wywodów.
[edytuj] Obliczanie poszczególnych momentów statystycznych, wartość oczekiwana
Będziemy się tutaj zajmować wielkościami ciągłymi lub quasiciągłymi, której gęstość prawdopodobieństwa jest zdefiniowana według (11.31) . Momenty statystyczne ogólnie n-tego rzędu definiujemy według sposobu (3.12). Wykorzystując definicję momentu statystycznego μn, możemy policzyć jego wersję dla numerów nieparzystych, przy czym korzystając ze funkcja gęstości prawdopodobieństwa wspomniana wcześniej jest funkcją parzystą względem parametru x-x0, zatem można powiedzieć przy założeniu, że wartość dokładna zmiennej x jest x0, jest równa wartości oczekiwanej, tzn.
:
![]() |
(11.45)
|
Wykorzystujemy podstawienie t=x-x0 w całce (11.45) możemy dojść do wniosku, że nasza całka posiada funkcję podcałkową funkcją nieparzystą względem omawianego podstawienia, dzięki czemu ta całka jest równa zero.
![]() |
(11.46)
|
Czyli momenty statystyczne o nieparzystym stopniu są zawsze równe zero. Na podstawie obliczeń (11.46) udowodniliśmy rzeczywiście, że wartość oczekiwana jest równa wartości dokładnej dla rozkładu normalnego, bo parametr μ1=0, tak jak powinno zachodzić dla pierwszego momentu statystycznego.
Obliczmy teraz momenty statystycznych o stopniu parzystym. Mając całki (11.26) i jej pochodną względem parametru α (11.27) możemy wyznaczyć dalszą pochodną całki (11.28), zatem ta ostatnia całka jest:
![]() |
(11.47)
|
Przestawimy teraz całkę w postaci ogólnej, którą zapisujemy względem parametru n:
![]() |
(11.48)
|
Zatem moment statystyczny μ2n możemy zapisać wedle schematu zależnego od parametru n.
![]() |
(11.49)
|
Przy definicji momentu statystycznego względem wartości dokładnej (11.49) przyjmujemy (-1)!!=1, to wtedy obejmiemy również szczegół normowania gęstości prawdopodobieństwa dla n=0.
[edytuj] Punkt przegięcia w rozkładzie normalnym
Mamy oto rozkład normalny wyprowadzony w (11.31), ogólnie dla zmiennej typu dyskretnego-przypadek quasiciągłym, lub gdy nasz przedział badany jest dość gęsty, co również już na pewno jest spełnione w przypadku ciągłym naszej badanej wielkości. Zatem w celu wyznaczeniu punktu przegięcia wyznaczmy pierwszą pochodną naszej badanej funkcji gęstości prawdopodobieństwa:
![]() |
(11.50)
|
Oznaczamy w (11.50) przez C pewne stałe występujące w nim, zatem możemy policzyć drugą pochodną gęstości prawdopodobieństwa rozkładu normalnego, a więc pierwszą pochodną wspomnianej pierwszej pochodnej, zatem dochodzimy do wniosku:
![]() |
(11.51)
|
Ponieważ liczymy punkty przegięcia funkcji Gausa rozkładu normalnego, względem drugiej pochodnej, która przyjmuje wartość zerową w tym przypadku, zatem na podstawie obliczeń (11.51) dostajemy wniosek:
![]() |
(11.52)
|
W ostatecznych obliczeniach rozwiązanie wynikające z (11.52) jest:
![]() |
(11.53)
|
Stąd można z interpretować jako, że otrzymane x w obliczeniach powinno się mieścić w granicach xi∈ (x0-σ,x0+σ), a te wyniki, które nie spełniają tego warunku, powinny być odrzucone z danych doświadczalnych, i odnowa trzeba wyznaczać
i σ. Przypominając przy liczeniu ρ(x) trzeba wstawić za x0 jego wartość średnią, tzn.
, co dla dużej ilości wyników doświadczalnych jest w przybliżeniu spełniona równość między tymi dwoma wielkościami, ponieważ średnia arytmetyczna ma najmniejszą niepewność pomiarową z tych wszystkich otrzymanych x z danych doświadczalnych. Dla tych wyników doświadczenia, które nie powinny być odrzucone funkcja z punktu widzenia dla tego punktu powinna być wklęsła. Funkcja Gausa dla x∈ (x0-σ,x0+σ) jest funkcją wklęsłą, a dla dopełnienia wcześniej przedstawionego wzoru jest wypukła.
[edytuj] Twierdzenie o rozkładzie normalnym wielowymiarowym
Twierdzenie o rozkładzie normalnym wielowymiarowym- jest to uogólnienie twierdzenia o rozkładzie normalnym jednej zmiennej. Ono określa, jeśli mamy n-wymiarowy wektor pomiaru:
oraz n-wymiarowy wektor wartości dokładnej:
, to jaka jest gęstość prawdopodobieństwo uzyskania n-wymiarowego wektora dla pomiarów wokół wartości dokładnej.
[edytuj] Wyprowadzenie twierdzenia o rozkładzie normalnym wielowymiarowym
Aby wprowadzić definicję gęstości prawdopodobieństwa uzyskania n wektorów, które symbolizują pomiary uzyskane w wyniku doświadczenia, a każde taki wektor z n jest m wymiarowy, które przedstawiają m pomiarów, różnych wielkości fizycznych uzyskanych jednocześnie. Każde takie m wielkości posiadają m wartości dokładnych. Mając wzór (11.8), w nim można logarytm naturalny z liczby trafień w m-wymiarowy punkt przedstawić jako funkcję "g" z minusem, którego argumentem jest m-wymiarowy wektor przedstawiający n jednoczesnych pomiarów różnych wielkości fizycznych, dzięki której chcemy wyznaczyć m wartości dokładnych jednocześnie:
![]() |
(12.1)
|
- gdzie m pomiarów jednoczesnych różnych wielkości fizycznych
i m wartości dokładnych
przedstawiamy:
|
|
Rozwińmy funkcję
, którego argumentem jest m jednoczesnych pomiarów pomiarów i m wartości dokładnych, w szereg Taylora względem względem m wartości dokładnych, które są zapisane w postaci wektora (12.3) pomijając wyrazy trzeciego rzędu i wyższych w tym rozważanym szeregu:
![]() |
(12.4)
|
Zbudujmy macierze B i A występujące w przedstawieniu przybliżonych funkcji g , czyli według (12.4), gdzie macierz A jest wektorem poziomym pierwszych pochodnych cząstkowych względem wartości m pomiarów jednoczesnych xi, a macierz B jest macierzą drugich pochodnych cząstkowych tej samej funkcji co poprzednio względem tych samych pomiarów:
|
|
Na podstawie przedstawienia macierz A (12.5) i macierzy B (12.6) i definicji wektora m jednoczesnych pomiarów (12.3) i definicji wektora m wartości dokładnych tychże wspomnianych pomiarów (12.3), funkcję g możemy napisać w sposób przybliżony wedle schematu:
![]() |
(12.7)
|
Wedle wzoru (12.1) i przedstawienia funkcji g w szereg Taylora, który wektorowo zapisujemy wedle schematu (12.7), zatem na podstawie wzoru (11.8) dla n pomiarów m wartości prawdopodobieństwo tego zdarzenia zapisujemy wedle:
![]() |
(12.8)
|
Prawdpodobieństwo uzyskania n pomiarów m różnych wielkości fizycznych (12.8) powinno mieć największe prawdopodobieństwo, gdy we wspomnianym wzorze podstawimy, za każdy pomiar z n doświadczeń podstawimy jego wartość dokładną, w tym celu należy policzyć pierwszą pochodną względem jednego pomiaru z "n" m-wymiarowego wektora jednoczesnych pomiarów, który po dokonaniu wspomnianego podstawienia funkcją prawdopodobieństwa powinna przyjmować wartość ekstremalną, zatem dochodzimy do wniosku, że ta pierwsza pochodna powinna przyjmować wartość zero:
![]() |
(12.9)
|
Pierwsza pochodna (12.9) musi przyjmować wartość zerową, gdy za m-wymiarowe wyniki pomiarów
podstawimy jego wartości dokładne, zatem na podstawie tychże rozważań dostajemy we wspomnianym wzorze, że wektor poziomy A przyjmuje wartość zero w punkcie
. Wedle tychże rozważań prawdopodobieństwo uzyskania n m-wymiarowych pomiarów jest wyrażone przez:
![]() |
(12.10)
|
Dla pojedynczego pomiaru rozkład normalny prawdopodobieństwo uzyskania wektora pomiarów, przy skorzystaniu ze wzoru (12.10), który mówi coś o uzyskaniu m pomiarów jednoczesnych różnych wartości pomiarów, jest pisana:
![]() |
(12.11)
|
Powyższy wzór jest spełniony, gdy mamy l poziomów, w którym te m-wymiarowe pomiary mogą posiadać składowe o pewnych wartościach. Gdy mamy m-wymiarową zmienne losowe ciągłe, to w tym przypadku gęstość prawdopodobieństwa jest opisywana tym samym wzorem co w przypadku dyskretnym, czyli równaniem (12.11).
[edytuj] Wyznaczenie elementów macierzy B, wartość dokładna a wartość oczekiwana
Macierz (12.6) na podstawie przemienności różniczkowania jest macierzą przemienną względem dowolnego punktu, w którym ta macierz jest obliczona, zatem na podstawie tego można powiedzieć:
![]() |
(12.12)
|
[edytuj] Dowód równości wartości oczekiwanej i dokładnej
Następnym krokiem jest policzenie wartości oczekiwanej funkcji wektorowej
, względem funkcji gęstości prawdopodobieństwa
przy m-wymiarowej przestrzeni. Funkcja gęstości prawdopodobieństwa (12.11) jest funkcją parzystą względem argumentu
, to wartość średnia względem wspomnianej funkcji jest równa zero ze względu na jej nieparzystość, co poniżej wykorzystano tą własność:
![]() |
(12.13)
|
Na podstawie powyższych rozważań, które zawierają obliczenia (12.13), dochodzimy do wniosku, że m-wymiarowy wektor
jest wartością oczekiwaną
zmiennej
, bo jedynkowy moment μ1 jest równy zero, tak jak powinno zachodzić zawsze dla tego obiektu statystycznego.
[edytuj] Definicja macierzy B poprzez macierz kowariancji
Korzystając z definicji funkcji prawdopodobieństwa dla pojedynczego m-wymiarowego pomiaru (12.11), to wzór na wartość oczekiwaną (12.13) możemy napisać:
![]() |
(12.14)
|
Zróżniczkujmy obie strony równania (12.14) względem wektora wartości dokładnej, która jest wektorem wartości najprawdopodobnych (oczekiwanych)
, oczywiste jest, że po tej operacji otrzymujemy bardziej skomplikowaną tożsamość, z którego będziemy wyprowadzać macierz B:
![]() ![]() ![]() |
(12.15)
|
Korzystając z symetryczności macierzy napisanej w punkcie (12.12) i omówionej dlaczego ta jest, to tożsamość napisana wedle (12.15) przyjmuje postać bardziej uproszczoną postać:
![]() ![]() |
(12.16)
|
Znów korzystamy z definicji funkcji prawdopodobieństwa (12.11) dla pojedynczego pomiaru, zatem możemy wyrazić tożsamość (12.16) w bardziej prostej postaci:
![]() |
(12.17)
|
Wykorzystujemy definicję normowania funkcji gęstości prawdopodobieństwa (2.54), która jest zapisana przy pomocy m-wymiarowej całki gęstości prawdopodobieństwa względem infinitezymalnej objętości należącej do tej przestrzeni przy całkowaniu po wszystkich punktach należących do tej przestrzeni:
![]() |
(12.18)
|
![]() |
(12.19)
|
Wykorzystując tożsamość (12.19) i warunek normowania gęstości funkcji prawdopodobieństwa względem m-wymiarowej przestrzeni (12.18), wtedy wyrażenie (12.17) można zapisać wedle równoważnej do poprzedniego wzoru w postaci:
![]() |
(12.20)
|
Z końcowego równania wynikowego (12.20) wyznaczmy macierz B, korzystając przy tym z wiadomości o macierzach z algebry:
![]() |
(12.21)
|
Widzimy, że macierz B-1 jest macierzą kowariancji zdefiniowanej w punkcie według definicji (4.34) przy jego dowodzie przeprowadzonego powyżej:
![]() |
(12.22)
|
Na podstawie tych rozważań końcowych (12.22) macierz B jest odwrotnością macierzy kowariancji C.
[edytuj] Centralne twierdzenie graniczne
Centralne twierdzenie graniczne - gdy wykonamy n → ∞ czyli nieskończenie wiele pomiarów, a w praktyce bardzo dużą liczbę pomiarów, tzn. Ω>>1, to rozkład statystyczny przechodzi w rozkład normalny. Tutaj liczbą stopni swobody jest ilość doświadczeń przeprowadzonych na obiekcie S. Wiemy jednak, że poszczególne wyniki doświadczalne podlegają rozkładowi normalnemu, ale czy ich średnie arytmetyczne również, tego nie wiadomo. Poniżej przedstawimy, że jednak tak jest, że rozkład dotyczący rozkładu średniej arytmetycznej jest również rozkładem normalnym.
Jeśli jest spełnione to twierdzenie, uzasadnione jest stosowanie dla dużej liczby pomiarów rozkładu normalnego napisanej jako rozkład średniej arytmetycznej lub jako rozkład sumy wszystkich pomiarów, ponieważ mimo, że liczba tych pomiarów nie jest naprawdę nieskończenie duża, to twierdzenie jest w miarę dobrze spełnione, przy tych ograniczonych warunkach.
[edytuj] Dowód twierdzenia "Centralne twierdzenie graniczne"
Mamy sobie pewien rozkład statystyczny (11.15), który jest iloczynem n rozkładów normalnych (11.31) z którego możemy policzyć stałą D z definicji normalizacji funkcji (11.28) i z definicji wariancji (11.29). Zatem rozkład statystyczny rozkładu średniej statystycznej ze stałą D (11.16) przy wykorzystaniu wzoru (11.37), który jest odchyleniem standardowym średniej arytmetycznej względem odchylenia standardowego wyniku pomiaru, zatem na podstawie poniższych obliczeń udowodnimy, że średnia arytmetyczna podlega rozkładowi normalnemu:
![]() |
(13.1)
|
Jak udowodniliśmy w punkcie (13.1), że rozkład średniej arytmetycznej podlega rozkładowi normalnego:
![]() |
(13.2)
|
Naszym krokiem jest znormalizowanie funkcji gęstości prawdopodobieństwa (13.2) średniej arytmetycznej, zatem dochodzimy do wniosku, że stała F jest napisana wzorem poniżej tak jak w punkcie (11.30), ale w tym przypadku odchylenie standardowe jest odchyleniem standardowym średniej arytmetycznej.
![]() |
(13.3)
|
Zatem nasz rozkład statystyczny średniej arytmetycznej (13.2) przy wykorzystaniu warunku (13.3) jest pisany:
![]() |
(13.4)
|
Można również udowodnić, na podstawie tego samego kształtu rozkładu gęstości prawdopodobieństwa średniej arytmetycznej (13.4) i rozkładu gęstości prawdopodobieństwa pomiaru (11.31), że wariancja średniej arytmetycznej jest równa
. Rozkład (13.4) jest rozkładem normalnym średniej arytmetycznej wokół wartości normalnej x0, co zostało udowodnione nasze powyższe twierdzenie napisane w tym tytule.
[edytuj] Rozkład statystyczny sumy wyników pomiarów
Aby udowodnić, że suma pomiarów podlega rozkładowi normalnemu, należy skorzystać tutaj ze wzoru (11.16) i wykorzystać definicję wartości średniej n pomiarów, zatem wedle poniższych obliczeń można napisać:
![]() |
(13.5)
|
Obierzmy zmienną ξ zdefiniowaną jaką sumę pomiarów uzyskanych wyników w doświadczeniu, którego definicja jest poniżej, a także jego wartość dokładną, też zdefiniowaną poniżej:
|
|
Następnie w celu wyznaczania wariancji sumy pomiarów (13.6) korzystamy ze wzoru (5.17) przy założeniu, że poszczególne pomiary są niezależne od siebie, zatem ich kowariancja jest równa zera, zatem na podstawie tych rozważań można napisać, że wariancja wyrażenia ξ jest sumą wariancji poszczególnych pomiarów:
![]() |
(13.8)
|
Zatem nasz rozkład (13.5) po uwzględnieniu (13.6) oraz (13.7), a także wzoru (13.8), przyjmuje postać:
![]() |
(13.9)
|
Można udowodnić, że w wyniku normalizacji rozkładu (13.9), której to stała F jest podobnie zdefiniowana jak w punkcie (13.3), w którym zamiast odchylenia standardowego średniej arytmetycznej występuje odchylenie standardowe zmiennej (13.6), zatem dochodzimy do wniosku, że nasz rozkład (13.9) jest wedle wzoru:
![]() |
(13.10)
|
Można udowodnić, że wariancja zmiennej (13.6) jest określona jako
.
Udowodniliśmy, że zmienna zdefiniowana wzorem (13.6) ma rozkład normalny z wariacją (13.8), zatem nasz rozważany rozkład jest określony według wzoru (13.10) i jest to rozkład normalny.
[edytuj] Funkcja charakterystyczna a "Centralne twierdzenie graniczne"
Z własności funkcji charakterystycznej wiemy jednak, że jego wartość funkcji charakterystycznej w punkcie t równej zero jest równa jeden, co wynika z (8.11), a pierwsza pochodna jest wyrażona według (8.12) oraz druga pochodna jest wyrażona według (8.13), zatem rozwińmy tą funkcję charakterystyczną w szereg Taylora wedle sposobu:
![]() |
(13.11)
|
W prowadźmy nową zmienną zdefiniowaną przy pomocy wyników pomiarów xi, wartości dokładnej x0, odchylenia standardowego pojedyńczego wyniku pomiaru σ(x) i względem ilości przeprowadzonych pomiarów, zatem jego definicja jest:
![]() |
(13.12)
|
Policzmy funkcję charakterystyczną względem nowej zmiennej zdefiniowanej w punkcie (13.12), zatem z oczywistych powodów otrzymujemy:
![]() |
(13.13)
|
Skorzystajmy z rozwinięcia funkcji φui(t) w szereg Taylora wedle sposobu (13.11), zatem po tych operacjach dostajemy funkcję charakterystyczną pojedynczego pomiaru xi:
![]() |
(13.14)
|
Z definiujmy inną nową zmienną zależną "u" jako sumę nowych zmiennych losowych (13.12), zatem wtedy dochodzimy do wniosku, że tą zmienną możemy wyznaczyć względem zmiennej sumy "n" pomiarów (13.6), którego wartość dokładna jest (13.7):
![]() |
(13.15)
|
Funkcja charakterystyczna na podstawie wzoru (13.14) i wedle twierdzenia (8.16) dla n-doświadczeń jest iloczynem n takich wspomnianych funkcji charakterystycznych:
![]() ![]() |
(13.16)
|
Funkcja (13.16) jest to funkcja charakterystyczna rozkładu normalnego standardowego (8.24) względem zmiennej (13.15) na podstawie (8.24), który zachodzi dla specyficznych wartości dokładnej i odchylenia standardowego. Rozkład normalny jest napisany:
![]() |
(13.17)
|
Wyznaczmy gęstość prawdopodobieństwa względem zmiennej ξ, zatem infinitezymalne prawdopodobieństwo, które jest niezmiennicze ze względu na zmienną, względem której liczymy tę funkcję gęstości prawdopodobieństwa:
![]() |
(13.18)
|
Jeśli skorzystamy ze wzoru (13.18), a także z gęstości prawdopodobieństwa zmiennej u (13.17), to gęstość prawdopodobieństwa, uzyskania zmiennej sumy pomiarów (13.6) wokół wartości dokładnej tej zmiennej (13.7), jest wyrażona:
![]() |
(13.19)
|
Można sprawdzić, że funkcja gęstości prawdopodobieństwa (13.19) jest unormowana do jedynki i posiada wariancję σ2(ξ).
Wzór (13.19) jest taki sam jak wzór zapisany w punkcie (13.10), tylko innym sposobem udowodniliśmy, że zmienna (13.6) podlega rozkładowi normalnemu.
[edytuj] Twierdzenie o rozkładzie χ²
Twierdzenie o rozkładzie
- jest to rozkład statystyczny zmiennej
, która opisuje n doświadczeń statystycznych, w którym xi są to wyniki uzyskane w pojedynczym doświadczeniu. Rozkład
można napisać, gdy ilość doświadczeń jest conaj mniej skończona (policzalna).
[edytuj] Przypadek szczególny, gdy liczba stopni swobody jest jeden
Rozkład, który rządzi pojedynczą próbą jest to rozkład normalny, wyrażamy wzorem (11.31). Napiszmy czemu jest równe prawdopodobieństwo uzyskania wyniku z przedziału (x0-χx0+χ), zatem na podstawie definicji gęstości prawdopodobieństwa wspomnianego rozkładu normalnego prawdopodobieństwo uzyskania wyniku w tym przedziale wyrażamy wzorem poniżej. W jego kolejnych krokach przekształcamy go, tak by wyrazić go jako całkę obliczonej w (0,χ) wiedząc, że ta wspomniana gęstość jest funkcją parzystą względem parametru xi-x0.
![]() ![]() ![]() |
(14.1)
|
Dokonajmy podstawienia zależnego od t, który jest ilorazem kwadratu zmiennej losowej s=xi-x0 przez kwadrat odchylenia standardowego zmiennej x:
![]() |
(14.2)
|
Możemy zróżniczkować podstawienie określane wzorem (14.2), dalej korzystając jeszcze raz ze wspomnianego podstawienia, mamy:
![]() |
(14.3)
|
Wykorzystajmy podstawienie (14.2) oraz definicję różniczki
według (14.3), to znając wszystkie te formuły, zatem podstawmy je do wzoru na prawdopodobieństwo uzyskania wyniku wyżej określanym przedziale (14.1), otrzymujemy:
![]() |
(14.4)
|
Wykorzystajmy definicję Γ(λ) dla λ=1/2n=1/2, a także znając tożsamość
, to wtedy wzór na prawdopodobieństwo (14.4) uzyskania pomiaru w przedziale (-χ,χ) jest określone wzorem wynikających z obliczeń, którego wzór dla n=1, jest wyżej określaną formułą.
![]() |
(14.5)
|
A więc jego gęstość prawdopodobieństwa według wzoru na dystrybuantę zdarzenia (14.5) można napisać poprzez różniczkowanie go względem zmiennej losowej χ2:
![]() |
(14.6)
|
Wiemy jednak, że wzór (14.6) jest spełniony dla jednego przeprowadzonego doświadczenia, ale można udowodnić, że ten nasz wzór jest spełniony dla dowolnej ilości prób, tzn. n≥ 1.
[edytuj] Przypadek gdy liczba prób jest różna od jedynki
Policzmy funkcję charakterystyczną przy podanej funkcji gęstości prawdopodobieństwa (14.6), z definicji tejże funkcji charakterystycznej określanej jako wartość oczekiwaną funkcji eksponencjalnej exp(itx), co wedle definicji (8.3) możemy go napisać w postaci nieobliczonej jeszcze, co dokonamy w późniejszych etapach, dalej przedstawimy go w postaci pewnej całki:
![]() |
(14.7)
|
Dokonajmy podstawienia, która będzie nam potrzebna we wzorze na funkcję charakterystyczną względem zmiennej losowej χ2, które to podstawienie oznaczymy jako zmienną ν zdefiniowanej poprzez parametr t:
![]() |
(14.8)
|
Podstawienie (14.8) wykorzystujemy do wzoru na funkcję charakterystyczną (14.7), stąd mamy:
![]() ![]() |
(14.9)
|
Funkcją charakterystyczną rozkładu zmiennej χ2, przepisanej z końcowych obliczeń (14.9) dla przejrzystości wykładu, jest funkcją:
![]() |
(14.10)
|
Funkcja charakterystyczna powiedziana jest w punkcie (14.10) przy parametrze λ, udowodnimy, że ona jest spełniona dla dowolnego n naturalnego większego od zera. Dla dowolnego n zmienną losową χ2 określamy jako sumę po n doświadczeniach przeprowadzonych nad statystycznym układem poszczególnych wyników pomiarów podniesionych do kwadratu.
![]() |
(14.11)
|
Dla λ=1/2n, gdy oczywiście zachodzi n=1, to wtedy możemy określić z funkcji charakterystycznej (14.10) ściśle określoną gęstość prawdopodobieństwa dla dowolnego "n". Jeśli λ=1/2, to z funkcji (14.10) na postawie twierdzenia (8.16) otrzymujemy przypadek n>1 poprzez wymnożenie funkcji charakterystycznych (14.10) dla n=1 przez siebie charakteryzują różne ale pojedyncze doświadczenia, stąd otrzymujemy funkcję charakterystyczną dla n≥1, wtedy zmienną losową jest (14.11), tzn.:
![]() ![]() |
(14.12)
|
Na podstawie (14.12) i (14.11) dochodzimy do wniosku, że funkcją charakterystyczną (14.10) opisująca badany rozkład gęstości prawdopodobieństwa zmiennej losowej jest (4.11), stąd rozkład gęstości prawdopodobieństwa (14.6) jest gęstością prawdopodobieństwa zmiennej losowej χ2(14.11) o dystrybuancie (14.5) dla n≥1.
[edytuj] Twierdzenie o rozkładzie hipergeometrycznym
Rozkład hipergeometrycznym jest to rozkład, w której w "n" losowań ma paść "k" klocków o właściwości
i l klocków o właściwości
podczas losowania z urny mających K klocków.
[edytuj] Wzór na rozkład hipergeometryczny
Załóżmy, że mamy N kul, przy czym K kul ma własność pierwszą, i L kul ma własność drugą, losujemy z takiej kombinacji n kul, ale i kul o własności pierwszej, i l kul o własności drugiej, także ilość wylosowanej z właściwością pierwszą i drugą razem jest równa ilości przeprowadzonych doświadczeń n, czyli powinno być i+l=n, a ilość kul o właściwościach pierwszych i drugich jest równa ilości wszystkich kul N, czyli zachodzi K+L=N, a więc prawdopodobieństwo uzyskania takiego wyniku przy losowaniu pewnej ilości kul o właściwości L i K przy n doświadczeniach jest określana przez formułę:
![]() |
(15.1)
|
[edytuj] Wartość oczekiwana rozkładu hipergeometrycznego
Policzmy teraz wartość oczekiwaną rozkładu hipergeometrycznego zdefiniowanej w punkcie (15.1) mówiącej jaka jest średnia z wylosowanych kul o właściwości K, zatem wiedząc, że wspomniany rozkład jest rozkładem dyskretnym, przestawiamy tą średnią wedle definicji (2.11), gdy xi można zapisać jako zmienna "i":
![]() ![]() ![]() |
(15.2)
|
Dokonajmy podstawienia wedle schematu i'=i-1 do naszych obliczeń (15.2), które przeprowadzamy w celu wyznaczenia jego postaci zwartej:
![]()
![]() |
(15.3)
|
Wartość oczekiwana zmiennej "i" jest wprost proporcjonalna do liczby losować "n", i do ilości kul o właściwości K przez ilość wszystkich kul N. Z definiujmy nową wielkość zwaną jakie jest prawdopodobieństwo wylosowania kul o właściwości K.
![]() |
(15.4)
|
Wtedy na podstawie definicji (15.4) wzór (15.3) przyjmuje postać:
![]() |
(15.5)
|
Czyli ten sam wzór otrzymaliśmy według (15.5) taki sam jak zapisaną w punkcie (9.6), który jest wartością oczekiwaną dla dyskretnego rozkładu rozkładu Bernoulliego.
[edytuj] Wariancja rozkładu hipergeometrycznego
Wariancję w sposób ogólny zapisujemy wedle wzoru (3.18), wtedy musimy policzyć dodatkowo średnią i2, a średnią zmiennej losowej "i" już mamy policzoną w punkcie (15.5). Policzmy wartość oczekiwaną kwadratu zmiennej losowej i2.
![]() ![]() |
(15.6)
|
Dokonajmy podstawienia wedle schematu i'=i-1, czyli i=i'+1 do naszych obliczeń (15.6), które przeprowadzamy w celu wyznaczenia jego postaci zwartej:
![]()
![]() ![]() |
(15.7)
|
Wyznaczmy pierwszy wyraz występującej w końcowych rozważaniach (15.7) w postaci zwartej. Jeśli wyznaczymy jego postać, to wtedy ona posłuży nam do wyznaczania zwiniętej postaci powyższych obliczeń.
![]() ![]() |
(15.8)
|
Dokonajmy podstawienia wedle schematu i'=i-1 do naszych obliczeń (15.8).
![]() |
(15.9)
|
Zbierając wszystkie obliczenia przeprowadzonych w punkcie (15.9) poprzez obliczenia (15.8), zatem postać zwarta obliczeń (15.7) dla wartości oczekiwanej z wyrażenia i2 jest napisana wedle:
![]() |
(15.10)
|
A teraz dobierzmy się do liczenia wariancji mając już obliczone wzory na wartość oczekiwaną zmiennej "i" (15.5) i wartości oczekiwanej zmiennej i2 (15.10), to na podstawie wzoru (3.18) wielkość wariacji możemy napisać jako:
![]()
![]() ![]() |
(15.11)
|
Po krótkich przekształceniach w punkcie (15.11), otrzymujemy wariancję zmiennej losowej "i" czyli kwadrat średniego odchylenie standardowego zapisaną przy pomocy zmiennych n, K, N, których oznaczenia wytłumaczyliśmy powyżej:
![]() |
(15.12)
|
[edytuj] Rozkład Bernoulliego jako szczególny przypadek rozkładu hipergeometrycznego
Przekształćmy wzór na wariancję σ2 zmiennej "i", wychodząc od wzoru (15.12) w taki sposób by w nim występowały stosunki K/N, co w sposób odpowiedni do poprzedniej tożsamości:
![]() |
(15.13)
|
Jeśli wykorzystamy definicję wielkosci "p" według wzoru (15.4), a także że prawdopodobieństwo zdarzenia przeciwnego przez q=1-p, wtedy wzór (15.13):
![]() |
(15.14)
|
Gdy liczba klocków N jest o wiele większa niż ilość przeprowadzonych doświadczeń na układzie statystycznym, wtedy wzór (15.14) zapisujemy w sposób przybliżony wedle:
![]() |
(15.15)
|
Gdy liczba klocków jest bardzo duża od liczby klocków wylosowanych, to wariancja zmiennej "i" (15.15) przechodzi wariancję w rozkładzie Bernoulliego (9.11), wtedy wartości oczekiwane jak i wariacje w przybliżeniu w tych w dwóch rozkładach są takie same, tzn. (15.5) (rozkład hipergeometrycznym) i (9.6) (rozkład Bernoulliego).
[edytuj] Twierdzenie o rozkładzie Poissona
Rozkład Poissona- jest to szczególny przypadek rozkładu Bernoulliego, w którym oznaczymy λ=np=const<∞, który pozostaje stały przy p→ 0 oraz przy n→∞.
[edytuj] Rozkład Poissona
Rozkład Poissona jest szczególnym przypadkiem rozkładu Bernouliego i jest zdefiniowany przy pomocy parametru λ i liczby trafień w pewne zdarzenie o infitezymalnym prawdopodobieństwie p przy nieskończonej ilości doświadczeń:
![]() |
(16.1)
|
- gdzie parametr λ jest napisanej wedle schematu poniżej jako iloczyn ilości doświadczeń przez prawdopodobieństwo zdarzenia, które losujemy.
dla i ![]() |
(16.2)
|
Udowodnimy poniżej, że wartość oczekiwana, wariancja, i moment statystyczny rzędu trzeciego są sobie równe, czyli
![]() |
(16.3)
|
A skośność jest zdefiniowana jako trzecia potęga trzeciego momentu statystycznego μ3 przez sześcian odchylenia standardowego czyli przez sześcian pierwiastka wariancji:
![]() |
(16.4)
|
[edytuj] Wyprowadzenie rozkładu Poissona
Ze wzoru na parametr λ wyznaczmy prawdopodobieństwo zdarzenia, którego to zdarzenie dotyczy wyrażonej poprzez liczbę przeprowadzonych doświadczeń, wtedy:
![]() |
(16.5)
|
Wykorzystamy wzór na prawdopodobieństwo dyskretne wylosowania k razy pewnej właściwości o prawdopodobieństwie zdarzenia p w n doświadczeniach, którego rozkład jest opisywany przez rozkład rozkład Bernoulliego, do którego wzoru na rozkład (9.2) podstawimy wyrażenie na prawdopodobieństwo uzyskania zdarzenia p (16.5), którego definicja jest zdefiniowana przez stały parametr λ i liczbę przeprowadzonych doświadczeń.
![]() ![]() ![]() |
(16.6)
|
W analizie matematycznej znamy granicę podaną poniżej, którą wykorzystamy w obliczeniach w punkcie (16.6):
![]() |
(16.7)
|
Dla obliczeń przeprowadzonych w linijce (16.6) wykorzystamy wyrażenie na eksponens z liczby z minus λ, którego definicja jest podana w punkcie (16.7), dla której nasz rozkład przy nieskończenie małym prawdopodobieństwie "p", tak by był skończony parametr λ, jest napisany:
![]() |
(16.8)
|
Wyrażenie (16.8) jest definicją rozkładu Poissona.
[edytuj] Normowanie rozkładu Poissona
Sprawdźmy czy rozkład Poissona (16.1) jest wielkością unormowaną według wzoru (2.10), w tym celu wykorzystajmy definicję exp(λ) w postaci nieskończonego szeregu potęgowego:
![]() |
(16.9)
|
Czyli rozkład Pk jest rozkładem unormowanym do jedynki, tak jak powinien spełniać każdy rozkład statystyczny.
[edytuj] Wartość oczekiwana rozkładu Poissona
Wartością oczekiwaną względem zmiennej "k" dla rozkładu dyskretnego, czyli rozkładu Poissona (16.1), którą liczymy według jego przestawienia (2.11), zapisujemy sposobem:
![]() |
(16.10)
|
Dokonajmy podstawienia wedle schematu i'=i-1 do naszych obliczeń (16.10), które przeprowadzamy w celu wyznaczenia jego postaci zwartej:
![]() |
(16.11)
|
Z obliczeń końcowych wynikających z (16.11) wynika, że wartość oczekiwana zmiennej k w postaci zwartej jest równa parametrowi λ z definiowanej w punkcie (16.2).
![]() |
(16.12)
|
[edytuj] Wariancja w rozkładzie Poissona
Policzmy wartość czekiwaną zmiennej k2, z definicji wartości oczekiwanej dla tej zmiennej dostajemy wzór poniżej, z którego w tym samym punkcie będziemy przeprowadzać obliczenia:
![]() |
(16.13)
|
Dokonajmy podstawienia wedle schematu k'=k-1 do naszych obliczeń (16.14), które przeprowadzamy w celu wyznaczenia jego postaci zwartej:
![]() |
(16.14)
|
Korzystając z metody liczenia wariancji według (3.18) i zbierając wyniki, tzn. wartość oczekiwaną zmiennej k2 (16.14) oraz wartość oczekiwaną zmienne k (16.12), wtedy ta nasza liczona wielkość statystyczna jest liczona wedle schematu:
![]() |
(16.15)
|
Z końcowych obliczeń (16.15) dostajemy wariację zmiennej losowej w rozkładzie Poissona napisanej wedle wzoru, którą przepisujemy dla przejrzystości wykładu:
![]() |
(16.16)
|
Udowodniliśmy, że wariancja rozkładu Poissona (16.16) jest taka sama jak jej wartość oczekiwana (16.12).
[edytuj] Moment trzeci rozkładu Poissona i jego skośność
Momentem statystycznym rzędu trzeciego zdefiniowanej na podstawie (3.9) nazywamy metodę, którego przepis jest poniżej. Wyrażmy ją za pomocą wartości oczekiwanej zmiennej losowej k3, k2 i na końcu zmiennej k.
![]() |
(16.17)
|
Policzmy wartość oczekiwaną wyrażenie k3 względem rozkładu Poissona, czyli E(k3), więc do dzieła:
![]() |
(16.18)
|
Dokonajmy podstawienia wedle schematu k'=k-1 do naszych obliczeń (16.18), które przeprowadzamy w celu wyznaczenia postaci zwartej do wspomnianego wzoru, zatem otrzymujemy:
![]() |
(16.19)
|
To teraz policzmy γ3 (moment trzeciego stopnia) zbierając wyniki razem z (16.19) , (16.14) i ostatni wzór (16.12), wtedy trzeci moment statystyczny przedstawia się:
![]() |
(16.20)
|
Skośność nazywamy stosunek trzeciego momentu statystycznego przez sześcian odchylenia standardowego, zatem z definicji według rozkładu Poissona przedstawia się ono według:
![]() |
(16.21)
|
Skośność (16.21) jest to odwrotność pierwiastka z wartości oczekiwanej λ (16.12) w rozkładzie Poissona.
[edytuj] Błędy pomiarowe w fizyce
Poznamy różne metody liczenia błędów pomiarowych dla danych uzyskanych z doświadczenia, a także na podstawie nich błędy pomiarowe wielkości bezpośredni obliczonych z tychże danych. Będziemy przyjmować, że
jest to średnia arytmetyczna zdefiniowana wzorem (1.1), a xi jest to i-ty wynik pomiaru uzyskanego w naszym doświadczeniu. Odchylenie standardowe jest określone według wzoru
.
[edytuj] Średnie odchylenie kwadratowe
Jeśli poszczególne pomiary różnych wielkości fizycznych są niezależne od siebie, to na podstawie znajomości średnich arytmetycznych tych niezależnych pomiarów można wyliczyć wielkość pośrednią
, a jej odchylenie standardowe wyznaczamy za pomocą odchyleń standardowych pomiarów bezpośrednich uzyskanych w doświadczeniu, którego odchylenie standardowe zmiennej y jest napisane wzorem (5.39). Biorąc we wspomnianym wzorze notację Δz=σ(z), to błąd statystyczny funkcji uzyskanej
zależy od błędów pomiarowych w zależności od błędów jego argumentów.
![]() |
(17.1)
|
[edytuj] Określanie błędów pomiarowych metodą różniczki zupełnej
To jest metoda, w której w fizyce doświadczalnej określa się błąd pewnej skomplikowanej zmiennej, mając na uwadze n zmiennych, tzn. xi, które są niezależne od siebie. Z wiadomości o analizie matematycznej różniczkę funkcji f można rozłożyć jako sumę n składników, w których każda jest iloczynem pochodnej cząstkowej funkcji f względem i tej zmiennej xi pomnożonej przez różniczkę xi.
![]() |
(17.2)
|
Będziemy dokonywali zastępowania wszystkich wyrazów z różniczkami ich wartością bezwzględną z pewnej delty jakieś zmiennej dla której liczymy błąd:
![]() |
(17.3)
|
Maksymalny błąd funkcji złożonej
w zależności od błędów jego argumentów, jest określony według końcowych rozważań przeprowadzonych w punkcie (17.3):
![]() |
(17.4)
|
Odchylenia Δ xi powinny być małe, ponieważ dla ich dużych wartości szereg Taylora staje się rozbieżny i liczenie błędu pomiarowego prowadzi na manowce.
[edytuj] Błąd przeciętny
Błędem przeciętnym nazywamy wielkość zdefiniowana jako stosunek wartości bezwzględnej odchyleń wyników pomiarów od jej wartości średniej policzonej wzorem (1.1) przez liczbę wszystkich dokonanych pomiarów.
![]() |
(17.5)
|
[edytuj] Średni błąd kwadratowy pomiaru
Średnim błędem kwadratowym nazywamy pierwiastkiem stosunku sumy kwadratów odchyleń poszczególnych pomiarów od wartości średniej policzonej wzorem (1.1) przez liczbę wszystkich pomiarów.
![]() |
(17.6)
|
[edytuj] Średni błąd pomiarowy wyników
Średnim błędem pomiarów uzyskanych w doświadczeniu, w której panuje rozkład normalny jest obliczany wedle wzoru (6.17) i jest określona jako pierwiastek ilorazu sumy kwadratu odchyleń pomiarów od wartości średniej policzonej wedle wzoru (1.1) przez liczbę pomiarów minus jeden:
![]() |
(17.7)
|
[edytuj] Średni błąd kwadratowy średniej arytmetycznej
Średni błąd kwadratowy średniej arytmetycznej nazywamy błąd średniej arytmetycznej w zależności od błędu pomiaru okreslanej jako ten błąd (17.7) przez pierwiastek liczby przeprowadzonych pomiarów, co wynika ze wzoru (6.11).
![]() |
(17.8)
|
[edytuj] Metoda najmniejszych kwadratów
- Matematyczny opis metody - jest to metoda aproksymacyjna dla punktów x∈(x0,x1,x2,x3,..,xn), dla których wartości powinny wynosić: y∈(y0,y1,y2,y3,...,yn).
Zbudujmy funkcję S(x), taką, że:
![]() |
(18.1)
|
Funkcja S jest taką funkcją, która jest najmniejsza przy wyborze funkcji należących do zbioru F przy parze (xi,yi).
[edytuj] Aproksymacja wielomianami Wn(x)
Obierzmy funkcję f(x) jako pewien wielomian w celu aproksymacji zbioru punktów
ze współczynnikami al w bazie n+1 wymiarowej, którego elementami bazy są wyrazy xi, które tworzą funkcję y:
![]() |
(18.2)
|
Napiszmy wielomian
znając już obraną funkcję f(x), wedle definicji wielomianu (18.2), wtedy zbudujmy nasz funkcjonał:
![]() |
(18.3)
|
Zbadajmy przy jakich parametrach al funkcja S(x) (18.3) przyjmuje wartość najmniejszą, zatem przy tych warunkach (18.3) przyjmuje wartość ekstremalną, zatem wtedy z definicji ekstremum możemy policzyć pierwszą pochodną naszego wyrażenia i przyrównać ją do zera.
![]() |
(18.4)
|
Mamy już funkcję S(x) (18.3) oraz warunek ekstremum (18.4), dalej wyznaczmy pewien wielomian, tzn. jego współczynniki o numerach al w celu wyznaczenia pełnej postaci wielomianu stopnia "r" (18.2), które później przekształcimy go do bardziej zgrabnej postaci:
![]() |
(18.5)
|
Na podstawie końcowych obliczeń zachodzących w punkcie (18.5) możemy stworzyć odpowiednią macierz B, a także wektor pionowy
, również wektor pionowy współczynników liniowych
:
|
|
|
Równanie wynikające z końcowego wniosku (18.5) można zapisać, na postawie definicji macierzy B (18.6), a także z definicji wektora pionowego
(18.7), a także
(18.9), jako równanie macierzowe w postaci macierzowej:
![]() |
(18.9)
|
Z końcowego wzoru (18.9) możemy wyznaczyć współczynniki liniowe występujące w definicji wielomianu (18.2).
- Jednakże musi zachodzić zawsze
, aby istniała jego macierz odwrotna. Również zachodzi z przedstawienia macierzy (18.6) właściwość:
![]() |
(18.10)
|
Zatem macierz B na podstawie warunku (18.10) jest macierzą samą do siebie symetryczną.


![S_P=\sqrt[1]{{\sum^n_{i=1}a_i^1}\over{n}}={{\sum^n_{i=1}a_i^1}\over{n}}={{\sum^n_{i=1}a_i}\over{n}}=S_A\;](http://upload.wikimedia.org/wikibooks/pl/math/d/6/1/d613a3ac20ddd133db864a14dcb53b9e.png)


, i posługujmy się tą definicją
.
, czyli mają taką samą wartość. Oznaczmy liczbę takich samych wyników, czyli o takim samym i, przez
. Zatem, wiedząc że
, dostajemy:
![S_g=\sqrt[n]{\prod^n_{k=1}a_k}\;](http://upload.wikimedia.org/wikibooks/pl/math/b/2/f/b2f4dbbc6f149e4380abb9737037c269.png)
![\lim_{k\rightarrow 0}\sqrt[k]{{{\sum^n_{i=1}a_i^k}\over{n}}}=\sqrt[n]{\prod^n_{i=1}a_i}\;](http://upload.wikimedia.org/wikibooks/pl/math/2/1/8/218d746353e5990bb7849058ec9f085f.png)

![S_P=\sqrt[-1]{{{\sum^n_{i=1}a_i^{-1}}\over{n}}}=
\left({{\sum^n_{i=1}a_i^{-1}}\over{n}}\right)^{-1}=
{{n}\over{\sum^n_{i=1}a_i^{-1}}}=
{{n}\over{\sum^n_{i=1}{{1}\over{a_i}}}}=S_H\;](http://upload.wikimedia.org/wikibooks/pl/math/b/d/6/bd63a3d066665e7585e7338b2fdaefc2.png)

![S_P=\sqrt[k]{{{\sum^n_{i=1}a_i^k}\over{n}}}\;](http://upload.wikimedia.org/wikibooks/pl/math/1/2/a/12a1448ee47273d8174859fdcbb0be8b.png)

jest to moc A, czyli liczba elementów w zbiorze A, inaczej zajście tego zdarzenia
jest to liczba wszystkich zdarzeń zachodzących w zbiorze 
jest to element w n wymiarowej przestrzeni zdarzeń,
jest to objętość w przestrzeni n wymiarowej, w której liczymy infinitezymalne prawdopodobieństwo zajścia zdarzenia A, które jest równe
.














, oraz dla 

















![\int_{-\infty}^{\infty}g(x)dx={{2\Gamma^2}\over{\pi\Gamma}}\int_{-\infty}^{\infty}{{dx}\over{4(x-a)^2+\Gamma^2}}={{2\Gamma}\over{\pi}}\int^{\infty}_{-\infty}{{dx}\over{\Gamma^2\left\{1+\left[{{2(x-a)}\over{\Gamma}}\right]^2\right\}}}=\begin{Bmatrix}
t={{2(x-a)}\over{\Gamma}}\\
dt={{2dx}\over{\Gamma}}
\end{Bmatrix}=\;](http://upload.wikimedia.org/wikibooks/pl/math/a/1/1/a113d8ef87f659bd21ba50e05413d514.png)

![\overline{x}=\int_{-\infty}^{\infty}xg(x)dx={{2\Gamma^2}\over{\pi\Gamma}}\int_{-\infty}^{\infty}{{xdx}\over{4(x-a)^2+\Gamma^2}}={{2\Gamma}\over{\pi}}\int_{-\infty}^{\infty}{{xdx}\over{\Gamma^2\left\{1+\left[{{2}\over{\Gamma}}\left(x-a\right)\right]^2\right\} }}=\;](http://upload.wikimedia.org/wikibooks/pl/math/7/3/8/738fa55eca8511ece5a5299a4e297ad0.png)


![\sigma^2(x)=\int_{-\infty}^{\infty}(x-a)^2g(x)dx={{2\Gamma^2}\over{\pi\Gamma}}\int_{-\infty}^{\infty}{{(x-a)^2dx}\over{4(x-a)^2+\Gamma^2}}=
{{2\Gamma}\over{\pi}}\int^{\infty}_{-\infty}{{(x-a)^2dx}\over{\Gamma^2\left\{1+\left[{{2(x-a)dx}\over{\Gamma}}\right]^2\right\}}}
=\;](http://upload.wikimedia.org/wikibooks/pl/math/6/d/8/6d85352f2276f5e2ba2c501957345540.png)
![={{2}\over{\Gamma\pi}}\int^{\infty}_{-\infty}{{(x-a)^2dx}\over{1+\left[{{2(x-a)}\over{\Gamma}}\right]^2}}=\begin{Bmatrix}t={{2(x-a)dx}\over{\Gamma}}\\
dt={{2}\over{\Gamma}}dx\\
x-a={{\Gamma}\over{2}}t\end{Bmatrix}=
{{2}\over{\Gamma\pi}}\int_{-\infty}^{\infty}{{ {{\Gamma^2}\over{4}}t^2{{\Gamma}\over{2}}dt}\over{1+t^2}}=
{{\Gamma^2}\over{4\pi}}\int^{\infty}_{-\infty}{{(t^2+1-1)dt}\over{1+t^2}}=\;](http://upload.wikimedia.org/wikibooks/pl/math/c/3/3/c3318a8d806499c013674a9f24a64057.png)




, dla
i 

![P(a_0\leq x<b_0,c_0\leq y<d_0)=\int\limits_a^b\left [\int\limits_c^d f(x,y) dy \right ]dx\;](http://upload.wikimedia.org/wikibooks/pl/math/c/4/1/c412455aa4e9002557da6023f1cc9987.png)



![\int\limits_{a_0}^{b_0}\left [\int\limits_c^df(x,y)dy\right ]dx=\int\limits_{a_0}^{b_0} g(x)dx\;](http://upload.wikimedia.org/wikibooks/pl/math/e/8/d/e8d3dff29c5c2ca5668e92b06f52af11.png)
































![\sigma^2_{H(x)}=E\left \{\Big (H(x)-E[H(x)]\Big )^2\right \}\;=\;E\left \{H^2(x)\right\}-E^2\left\{H(x)\right\}\;](http://upload.wikimedia.org/wikibooks/pl/math/9/8/b/98bba4589f2b6f0ddf11e8838eead93f.png)
![\sigma^2_{H(\vec{x})}=E\left \{\Big (H(\vec{x})-E[H(\vec{x})]\Big )^2\right \}\;=\;E\left \{H^2(\vec{x})\right\}-E^2\left\{H(\vec{x})\right\}\;](http://upload.wikimedia.org/wikibooks/pl/math/d/8/4/d849abb0066d341a0632521a9350de6a.png)
![\mu_i(H)=E\left[\Big(H(x)-E[H(x)]\Big)^i\right]](http://upload.wikimedia.org/wikibooks/pl/math/d/d/8/dd845c186dd7d33dec768087dc01ef5d.png)
![\mu_i(H)=\sum^n_{k=1} \Big(H(x_k)-E[H(x)]\Big)^i\operatorname{P}(x_k)\;](http://upload.wikimedia.org/wikibooks/pl/math/4/6/8/4684a70ed53bfd5cd100802b250d56ec.png)
![E[H(x)]=\sum^n_{k=1} H(x_k)\operatorname{P}(x_k)\;](http://upload.wikimedia.org/wikibooks/pl/math/3/c/9/3c9b31b432b5d0949ebcfdd459905d5f.png)
![\sigma^2[H(x)]=\sum^n_{p=1}\left\{\Big(H(x_p)-E[H(x)]\Big)^2\right\}P(x_p)](http://upload.wikimedia.org/wikibooks/pl/math/d/3/7/d375b2fef5bf24defc94dbc0c25cbaac.png)
![\mu_i=\int\limits^b_a {\Big(H(x)-E[H(x)]\Big)}^i\rho(x)dx\;](http://upload.wikimedia.org/wikibooks/pl/math/e/8/e/e8eccba6a7c599f6add486f8135e221e.png)
![E[H(x)]=\int\limits^b_a H(x)\rho(x)dx\;](http://upload.wikimedia.org/wikibooks/pl/math/2/9/4/2942ebac28fb5d19adcd21c66aa6a092.png)
![\sigma^2[H(x)]=\int\Big[H(x)-E[H(x)]\Big]^2\rho(x)dx\;](http://upload.wikimedia.org/wikibooks/pl/math/5/a/0/5a08407bf9fea149db9eae18ca5b5789.png)












![\mu_i(x_1,x_2,..,x_n)=\int^{b_1}_{a_1}\int^{b_2}_{a_2}...\int^{b_n}_{a_n}\Big[H(x_1,x_2,...,x_n)-E\left\{H\left(x_1,x_2,...,x_n\right)\right\}\Big]^i\cdot\;](http://upload.wikimedia.org/wikibooks/pl/math/f/a/d/fadcb8bc6e1aed56ba771d9b321c9ad3.png)


![\sigma^2(x_1,x_2,..,x_n)=\int^{b_1}_{a_1}\int^{b_2}_{a_2}...\int^{b_n}_{a_n}\left[H(x_1,x_2,...,x_n)-E\Big\{H\left(x_1,x_2,...,x_n\right)\Big\}\right]^2\cdot\;](http://upload.wikimedia.org/wikibooks/pl/math/4/8/8/4882fb35d365b0dafada6f8a1781255f.png)










































![\rho(x,y)\sigma(x)\sigma(y)=\operatorname{cov}(x,y)=E\Big[((ax-b)-(a\hat{x}-b))(x-\hat{x})\Big]=E\left [a(x-x_0)^2\right]=](http://upload.wikimedia.org/wikibooks/pl/math/f/5/3/f53ee943e590e2d742ac755b3f56b38d.png)

![\sigma^2(y)=E[(y-\hat{y})^2]=E\left[\left((ax+b)-(a \hat{x}+b)\right)^2\right]=E\left[\left(a(x-\hat{x})\right)^2\right]=\;](http://upload.wikimedia.org/wikibooks/pl/math/6/1/4/614af9d0ee2ae7909363a9fa42ff483e.png)
![=a^2E[(x-\hat{x})^2]=a^2\sigma^2(x)\;](http://upload.wikimedia.org/wikibooks/pl/math/0/3/1/031e19d3d789b8880ba9c0ff59fd68cb.png)




















![={{\sum^n_{i=1}E\left[(x_i-\hat{x})^2\right]+\sum^n_{i,j=1,i\neq j}E\left[(x_i-\hat{x})(x_j-\hat{x})\right]}\over{n^2}}=
{{\sum^n_{i=1}E\left[(x_i-\hat{x})^2\right]}\over{n^2}}](http://upload.wikimedia.org/wikibooks/pl/math/4/8/5/485a1054551d069360675b3ca192291d.png)



![={{\sum^n_{i=1}\left[(x_i-\hat{x})^2+(\overline{x}-\hat{x})^2-2(x_i-\hat{x})(\overline{x}-\hat{x})\right]}\over {n}}](http://upload.wikimedia.org/wikibooks/pl/math/7/6/3/7635c74a09ffae91124d0e6e95872e70.png)




























jest to wariancja uzyskanych pomiarów w k-tej próbie.![\sigma^2(\overline{x})=E\left ({(\overline{x}-\hat{x})}^2\right )=
E\left[
\left(\sum^m_{k=1}p_k\overline{x}_k-\hat{x}\right)^2
\right]=
E\left[\left(\sum^m_{k=1}{{n_k}\over{n}}\overline{x}_k-\hat{x}\right)^2\right]=](http://upload.wikimedia.org/wikibooks/pl/math/4/5/f/45f638a019a50edbb6d53f8bf5630b76.png)
![=E\left[\left({{\sum^m_{k=1}n_k\overline{x}_k-n\hat{x}}\over{n}}\right)^2\right]=
E\left[\left({{\sum^m_{k=1}n_k\overline{x}_k-\sum^m_{k=1}n_k\hat{x}}\over{n}}\right)^2\right]=](http://upload.wikimedia.org/wikibooks/pl/math/9/3/d/93d0f0a00d44ee965034067f16f232f7.png)
![=E\left[\left(\sum^m_{k=1}{{n_k}\over{n}}(\overline{x}_k-\hat{x})\right)^2\right]=](http://upload.wikimedia.org/wikibooks/pl/math/2/2/2/222547dc2189d1708379ca38d390fd00.png)
![=E\left[\sum^m_{k=1}{{n_k^2}\over{n^2}}(\overline{x}_k-\hat{x})^2+\sum^m_{i,j=1;i\neq j}{{n_in_j}\over{n^2}}(\overline{x}_i-\hat{x})(\overline{x}_j-\hat{x})\right]=](http://upload.wikimedia.org/wikibooks/pl/math/1/3/7/137bbf53ec4d279ebd7df8008acc8a4b.png)
![=\sum^m_{k=1}{{n_k^2}\over{n^2}}E\left[(\overline{x}_k-\hat{x})^2\right]+\sum^m_{i,j;i\neq j}{{n_in_j}\over{n^2}}E\left[(\overline{x}_i-\hat{x})(\overline{x}_j-\hat{x})\right]=
\sum^m_{k=1}{{n^2_k}\over{n^2}} E\Big((\overline{x_k}-\hat{x})^2\Big)=](http://upload.wikimedia.org/wikibooks/pl/math/4/d/4/4d4902a8843059cf4a45eea390fa2d3f.png)

jest to wariancja średniej w próbie o numerze k-tej.






















![0\leq E[(ax+y)^2]=a^2E(x^2)+2aE(xy)+E(y^2)\;](http://upload.wikimedia.org/wikibooks/pl/math/e/d/c/edc26eeaa525a3a5bb79226bdb21f881.png)


![[1+B^'(\lambda)]^2=E^2[(S-E(S))l^']\leq E[(S-E(S))^2]E({l^'}^2)\;](http://upload.wikimedia.org/wikibooks/pl/math/2/e/c/2ecc382c5970a7eb033a406bf641cd92.png)

![E[\varphi(\mathbf{x}^i,\lambda)\varphi(\mathbf{x}^j,\lambda)]=E[\varphi(\mathbf{x}^i,\lambda)]E[\varphi(\mathbf{x}^j,\lambda)]\;](http://upload.wikimedia.org/wikibooks/pl/math/5/9/c/59cc9ccdde757dc160b96b42d77faf6e.png)
![E[\varphi(\mathbf{x}^,\lambda)]=\int{{f^'(\mathbf{x}^i,\lambda)}\over{f(\mathbf{x}^i,\lambda)}}f(\mathbf{x}^i,\lambda)d\mathbf{x}^i=\int f^'(\mathbf{x}^i,\lambda)d\mathbf{x}^i={{d}\over{d\lambda}}\int f(\mathbf{x}^i,\lambda)d\mathbf{x}^i={{d}\over{d\lambda}}1=0\;](http://upload.wikimedia.org/wikibooks/pl/math/2/f/8/2f8fd58f7e7e6846c91fe465417a5c06.png)

![E[\varphi(\mathbf{x}^i,\lambda)]=E\left({{f^'(\mathbf{x}^i,\lambda)}\over{f(\mathbf{x}^i,\lambda}}\right)=\int {{f^'(x^i,\lambda)}\over{f(x^i,\lambda)}}f(x^i,\lambda)dx^i=0\;](http://upload.wikimedia.org/wikibooks/pl/math/2/9/d/29ddd579239a4689981aae1a7ec31c4f.png)
![0=\int {{d}\over{d\lambda}}\left[\left({{f^'}\over{f}}\right)f\right]=
\int {{{f^'}^2}\over{f}}+f({{f^'}\over{f}})^'=\int \left\{\left({{f^'}\over{f}}\right)^2+\left({{f^'}\over{f}}\right)^'\right\}fdx=\;](http://upload.wikimedia.org/wikibooks/pl/math/5/b/e/5bea9d390d9a8c4b3ebcdaca0356641a.png)



![E\left[(S-E(S))^2\right]=\sigma^2(S)\;](http://upload.wikimedia.org/wikibooks/pl/math/7/6/3/7630923a9aea5e829ca85bdeb28294ed.png)
![\left\{1+B^'(\lambda)\right\}^2\leq E\left[(S-E(S))^2\right]E({l^'}^2)=\sigma^2(S)I(\lambda)\;](http://upload.wikimedia.org/wikibooks/pl/math/c/a/8/ca8eb6873176ae5d2571baa276501fe8.png)


![E[(ax+y)^2]=0\;](http://upload.wikimedia.org/wikibooks/pl/math/1/b/d/1bdb6488fb959a4e19097a6d20aadd64.png)
![E\left[\left(a(S-E(S))+l^'\right)^2\right]=0\Rightarrow\left(a(S-E(S))+l^'\right)^2=0\Rightarrow l^'+(-A(\lambda))(S-E(S))=0\;](http://upload.wikimedia.org/wikibooks/pl/math/6/9/0/6902a1f6aa93b817709ae217ca289ed3.png)



![E({l^'}^2)=A^2(\lambda)E[(S-E(S))^2]\;](http://upload.wikimedia.org/wikibooks/pl/math/4/4/2/442e3965e7498935fc247266bb1b7b6d.png)
![\sigma^2(S)={{1}\over{I(\lambda)}}={{1}\over{E({l^'}^2)}}={{1}\over{A^2(\lambda)E[(S-E(S))^2]}}={{1}\over{A^2(\lambda)\sigma^2(S)}}\;](http://upload.wikimedia.org/wikibooks/pl/math/9/a/4/9a4b2135a34dc0d8ebe6408c29de1575.png)








![l(\vec{\lambda}_0)=l(\vec{\lambda}_0)+\sum^n_{i=1}\left({{\partial l}\over{\partial\lambda_i}}\right)_{\vec{\lambda}_0}\left(\lambda_i-(\lambda_0)_i\right)+{{1}\over{2}}\sum^n_{i,j=1}
\left({{\partial^2 l}\over{\partial\lambda_i\partial\lambda_j}}\right)_{\vec{\lambda}_0}\left[\lambda_i-(\lambda_0)_i\right]\left[\lambda_j-(\lambda_0)_j\right]+...](http://upload.wikimedia.org/wikibooks/pl/math/4/d/4/4d44bc8b75cdc7cf6bd9458c71a8821d.png)




zmiennej wektorowej

![\phi(t)=E\left[\exp(itx)\right]=\int_{a}^{x} \exp(itx) f(x)dx](http://upload.wikimedia.org/wikibooks/pl/math/e/a/a/eaa58f9d47fc5ecf9e02528d28bcd4cd.png)


![\phi^{(n)}(t)=i^n\int^{b}_a x^n e^{itx}f(x)=i^nE\left[x^n \exp(itx)\right]\;](http://upload.wikimedia.org/wikibooks/pl/math/6/0/d/60d4903addbbc30dbfedaee359c67030.png)
![\phi^{(n)}(0)=i^n E\left[x^n\right]\Rightarrow \phi^{(n)}=i^n\lambda_n](http://upload.wikimedia.org/wikibooks/pl/math/3/f/a/3fa284b18abd1c1c3f11c3acada2c459.png)
![\phi_{y}(t)=E\left\{\exp[it(x-\overline{x})]\right\}\;](http://upload.wikimedia.org/wikibooks/pl/math/4/1/0/4107f4c445e05f61ba9f624acd9e760b.png)
![\phi^{(n)}_y(t)=i^nE\left\{(x-\overline{x})^n\exp[it(x-\overline{x})]\right\}](http://upload.wikimedia.org/wikibooks/pl/math/4/5/a/45ad9e25250f08c00a82c1674a21c2c3.png)




![\phi_w(t)=E\left\{\exp[it(x+y)]\right\}=E\left\{\exp[itx]\exp[ity]\right\}](http://upload.wikimedia.org/wikibooks/pl/math/b/f/a/bfa3e990e49bbb6e13cd8c3157789a8e.png)








































![=(p_i-p_j)\Big[p_i(1-p_j)-p_j(1-p_i)\Big]-p_i+p_ip_j-p_j+p_ip_j+\;](http://upload.wikimedia.org/wikibooks/pl/math/6/e/b/6eb155c9b18c3c579c2bb0248d24f7c2.png)

![=(p_i-p_j)\Big[p_i-p_j-p_i+p_j+p_ip_j\Big]-p_i-p_j+p_ip_j+p_ip_j+\;](http://upload.wikimedia.org/wikibooks/pl/math/2/0/8/20835269b6ee2268ce41a0dd0f753b70.png)






![C=[c_{ij}]_{n\times n}=[np_i(\delta_{ij}-p_j)]_{n\times n}\;](http://upload.wikimedia.org/wikibooks/pl/math/0/5/e/05e174934085b0e46aa6f487e931c0cf.png)













jest to gęstość ilości stanów ilości trafień dla zmiennej typu ciągłej w przedziale o grubości "dx".

![=Ce^{\sum^l_{p=1}\sum^{k_p}_{s=1}\left[-A-B(x_p-x_0)-{{D}\over{2}}(x_p-x_0)^2\right]}=Ce^{-\sum^n_{p=1}\left[A+B(x_p-x_0)+{{D}\over{2}}(x_p-x_0)^2\right]}=P_0(\vec{x}_n)\;](http://upload.wikimedia.org/wikibooks/pl/math/1/1/7/1174c7942eb0b31118e28efb51b2df4c.png)
![P_0(\vec{x}_n)=Ce^{-\sum^n_{p=1}\left[A+B(x_p-x_0)+{{D}\over{2}}(x_p-x_0)^2\right]}\;](http://upload.wikimedia.org/wikibooks/pl/math/2/3/7/23781f301fb4c29cc0554e87ef8c87fb.png)
są to wyniki doświadczalne uzyskane w wyniku doświadczenia, wyniki powtarzające się nie są wliczane do tego wektora.![{{\partial P_0(\vec{x}_n)}\over{\partial x_i}}(x_i=x_0)=C e^{-\sum^n_{p=1} \left[A+B(x_p-x_0)-{D\over 2}(x_p-x_0)^2\right]}\left[-B-D(x_i-x_0)\right](x_i=x_0)=\;](http://upload.wikimedia.org/wikibooks/pl/math/8/a/1/8a1862d15d795cd8d3ab5899724098b4.png)






































![{{d^2\rho_0}\over{dx^2}}=C \left[e^{-{{(x-x_0)}^2}\over{2\sigma^2}}\left(-2\right){{(x-x_0)^2}\over{4\sigma^4}}+ e^{-{{(x-x_0)}^2}\over{2\sigma^2}}{{1}\over{2\sigma^2}}\right]=Ce^{-{{(x-x_0)}^2}\over{2\sigma^2}}{{1}\over{2\sigma^2}}\left[1-{{(x-x_0)^2}\over{\sigma^2}}\right]\;](http://upload.wikimedia.org/wikibooks/pl/math/7/c/c/7ccd439e2c006f4a0004ecc2cb90961d.png)



przedstawiamy:


![A=\left[{{\partial g}\over{\partial x_1}},{{\partial g}\over{\partial x_1}},...,{{\partial g}\over{\partial x_n}}\right]](http://upload.wikimedia.org/wikibooks/pl/math/f/9/8/f982aa70af91f3c32a9ce229d8a3fc49.png)



![{{\partial P(\mathbf{x})}\over{\partial \mathbf{x}_r}}=e^{-\sum^n_{p=1}g(\mathbf{x_0})+A(\mathbf{x}_p-\mathbf{x}_0)+{1\over 2}(\mathbf{x}_p-\mathbf{x_0})^TB(\mathbf{x}-\mathbf{x_0})}\cdot\left[
A+(\mathbf{x}_r-\mathbf{x}_0)^TB+B(\mathbf{x}_r-\mathbf{x}_0)\right]](http://upload.wikimedia.org/wikibooks/pl/math/2/3/a/23ad18bdeacb42c8d7c269ca93b7bced.png)






![+\left[(\mathbf{x}-\mathbf{x}_0){{1}\over{2}}(-1)(\mathbf{x}-\mathbf{x}_0)^TB^T+{{1}\over{2}}(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)^TB(-1)\right]C e^{-{{1}\over{2}}(\mathbf{x}-\mathbf{x}_0)^TB(\mathbf{x}-\mathbf{x}_0)}
\Bigg\}\cdot](http://upload.wikimedia.org/wikibooks/pl/math/9/c/6/9c656b2eeeda71e9c32d7158165f3bae.png)

![\int_{-\infty}^{\infty}...\int^{\infty}_{-\infty}\left[
-IC e^{-{{1}\over{2}}(\mathbf{x}-\mathbf{x}_0)^TB(\mathbf{x}-\mathbf{x}_0)}+(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)B
C e^{-{{1}\over{2}}(\mathbf{x}-\mathbf{x}_0)^TB(\mathbf{x}-\mathbf{x}_0)}\right]\cdot](http://upload.wikimedia.org/wikibooks/pl/math/0/3/d/03dff817c8c1673b41f44d279287ffd1.png)

![\int_{-\infty}^{\infty}...\int^{\infty}_{-\infty}\left[
-I+(\mathbf{x}-\mathbf{x})(\mathbf{x}-\mathbf{x}_0)^TB
\right]P(\mathbf{x})dx_1dx_2dx_3...dx_m=0](http://upload.wikimedia.org/wikibooks/pl/math/a/1/5/a15f6a2cd8cf880583d33bcea38fdeda.png)

![\int_{-\infty}^{\infty}...\int^{\infty}_{-\infty}(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)^T P(\mathbf{x})dx_1dx_2dx_3...dx_m=E\left[(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)\right]](http://upload.wikimedia.org/wikibooks/pl/math/6/8/b/68b2f42882bd814dba51f9b7ff91c4e4.png)
![-I+E\left[(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)\right]B=0\Rightarrow I=E\left[(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)^T\right]B\;](http://upload.wikimedia.org/wikibooks/pl/math/0/e/0/0e06de4caca1904309e21025ddee6d25.png)
![B^{-1}=E\left[(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)^T\right]](http://upload.wikimedia.org/wikibooks/pl/math/c/c/4/cc4f6baf81ed2519b3b74bb55d43cb4f.png)
![C=E\left[(\mathbf{x}-\mathbf{x}_0)(\mathbf{x}-\mathbf{x}_0)^T\right]=B^{-1}\Rightarrow B=C^{-1}](http://upload.wikimedia.org/wikibooks/pl/math/3/9/9/399aee5675dc5fdb5feddcb2348ef07f.png)





































































dla
i 
















![\mu_3=E\left[\left(k-E(k)\right)^3\right]=E(k^3)-3E(k^2)E(k)+3E(k)E^2(k)-E^3(k)\;](http://upload.wikimedia.org/wikibooks/pl/math/d/4/7/d47e10c9805ff2fafc77ab1ccbc8eff7.png)





















, aby istniała jego macierz odwrotna. Również zachodzi z przedstawienia macierzy 