Qurik
Rozwiązane

Na czym polega metoda mniejszych kwadratów? Jaka jest podstawowa, konieczna wiedza, by móc niej skorzystać?
Jak skorzystać z niej przy wyznaczaniu współczynnika na wykresie w fizyce?



Odpowiedź :

Metoda najmniejszych kwadratów ściśle wiąże się z zagadnieniem aproksymacji.

Załóżmy, że mamy zbiór danych eksperymentalnych

[tex]\{\vec{r}_i,w_i\}[/tex]

(można to łatwo uogólnić na wiele wymiarów, stąd w moim zapisie pojawia się wektor współrzędnych r_i oraz wartość w_i)

Jeżeli teraz chcemy opisać eksperymentalną zależność pewną funkcją

[tex]f(\vec{r})[/tex]

której znamy postać analityczną (np. prosta, trójmian kwadratowy itd), to musimy to zrobić tak, aby ta nasza funkcja najlepiej przybliżała zależność eksperymentalną, czyli, aby wykres f(r) przebiegał możliwie najbliżej wszystkich punktów eksperymentalnych.

Jedną z metod, która pozwala na taką sztukę jest minimalizacja kwadratu odległości:

[tex]\sum_{i=1}^N(w_i-f(\vec{r}_i))^2[/tex]

gdzie sumowanie odbywa się po wszystkich punktach eksperymentalnych. Matematycy zakończyliby w tym miejscu, ale fizyka chce opisywać prawdziwa przypadki, a nie tylko taki wyimaginowane, więc bierze się pod uwagę niepewność pomiarową (punkty mogą mieć różną wagę - dokładnie zmierzony punkt, trzeba dokładnie odwzorować, a taki z dużą niepewnością, można potraktować mniej poważnie)

[tex]\chi^2=\sum_{i=1}^N\frac{(w_i-f(\vec{r}_i))^2}{\sigma_i^2}[/tex]

powyższe wyrażenie odpowiada właśnie aproksymacji opartej o metodę najmniejszych kwadratów.

Nie powiedziałem jednak jasno, gdzie tu jest miejsce na swobodę. Znamy postać analityczną funkcji f, ale w ogólności zależy ona od parametrów. Przykładowo, wiem, że jest to wielomian stopnia n:

[tex]f(x)=a_0+a_1x+a_2x^2+\ldots a_nx^n[/tex]

ale nie znam n+1 współczynników i właśnie w oparciu o metodą najmniejszych kwadratów szukam tych n+1 współczynników takich, że funkcja f najlepiej opisuje zmienność zaobserwowaną w eksperymencie.

W tym celu powinniśmy poszukać minimum wyrażenie chi-kwadrat

[tex]\frac{d\chi^2}{da_j}=-\sum_{i=1}^N\frac{2(w_i-f(x_i))}{\sigma_i^2}\frac{df(x_i)}{da_j}=0[/tex]

w moim przypadku

[tex]\frac{df(x_i)}{da_j}=x^j[/tex]

w ten sposób możemy napisać n+1 równań (dla każdego współczynnika a_j), które następnie należy rozwiązać - problem jest dobrze postawiony i ma jednoznaczne rozwiązanie.

Takie równania dla prostej jest powszechnie dostępne w każdym poradniku metod numerycznych.

Słowa komentarza wymaga jednak małe oszustwo, którego się tu dopuściłem. Aby użycie metody najmn. kwadratów było uzasadnione, musimy mieć przynajmniej 3 punkty pomiarowe na każdy współczynnik, czyli N>(n+1)/3. Kolejna sprawa,  metodą najmniejszych kwadratów można stosować dla dowolnej funkcji f, ale jeśli występujące tam współczynniki nie pojawiają się liniowo (i nie da się zastosować takiego przekształcenia, aby mieć kombinację liniową współczynników), to jest duża szansa, że nic nie uda się zrobić. Na przykład współczynnika B w funkcji A*sin(B*x) nie uda nam się tak wyznaczyć i trzeba korzystać z numerycznej minimalizacji wyrażenia.

pozdrawiam