Методът на най-малко квадратчета е едно от най-важните приложения в сближаването на функциите. Идеята е да се намери крива такава, че при зададен набор от подредени двойки тази функция най-добре приближава данните. Функцията може да бъде линия, квадратна крива, кубика и т.н.
Идеята на метода се състои в минимизиране на сумата от квадрати на разликите в ординатата (Y компонент), между точките, генерирани от избраната функция, и точките, принадлежащи към набора от данни.
Метод на най-малко квадратчета
Преди да дадем метода, първо трябва да сме наясно какво означава „по-добър подход“. Да предположим, че търсим линия y = b + mx, която най-добре представлява набор от n точки, а именно {(x1, y1), (x2, y2)…, (xn, yn)}.
Както е показано на предходната фигура, ако променливите x и y са свързани по реда y = b + mx, тогава за x = x1 съответната стойност на y ще бъде b + mx1. Тази стойност обаче е различна от истинската стойност на y, която е y = y1.
Не забравяйте, че в равнината разстоянието между две точки се дава по следната формула:
Имайки това предвид, за да определим начина за избор на линията y = b + mx, който най-добре приближава дадените данни, изглежда логично да се използва като критерий селекцията на линията, която свежда до минимум сумата от квадратите на разстоянията между точките и правият.
Тъй като разстоянието между точките (x1, y1) и (x1, b + mx1) е y1- (b + mx1), проблемът ни се свежда до намирането на числа m и b, така че следната сума е минимална:
Линията, която отговаря на това условие, е известна като «сближаване на линията с най-малко квадратчета към точките (x1, y1), (x2, y2),…, (xn, yn)».
След като проблемът е получен, остава само да се избере метод за намиране на най-малкото приближение на квадратите. Ако точките (x1, y1), (x2, y2),…, (xn, yn) всички са на линията y = mx + b, ще имаме, че са collinear y:
В този израз:
И накрая, ако точките не са колинеарни, тогава y-Au = 0 и проблемът може да бъде преведен в намиране на вектор u, такъв, че евклидовата норма е минимална.
Намирането на минимизиращия вектор u не е толкова трудно, колкото може би си мислите. Тъй като A е nx2 матрица и u е 2 × 1 матрица, имаме, че векторът Au е вектор в R n и принадлежи на изображението на A, което е подпространство на R n с размер, не по-голям от два.
Ще приемем, че n = 3, за да покажем коя процедура да следваме. Ако n = 3, изображението на A ще бъде равнина или линия през началото.
Нека v е минимизиращият вектор. На фигурата наблюдаваме, че y-Au е сведено до минимум, когато е ортогонално спрямо изображението на А. Тоест, ако v е минимизиращият вектор, тогава се случва, че:
Тогава можем да изразим горното по този начин:
Това може да се случи само ако:
Накрая, решавайки за v, имаме:
Това е възможно, тъй като A t A е обратим, стига n точки, дадени като данни, не са collinear.
Сега, ако вместо да търсим линия, ние искахме да намерим парабола (чийто израз ще бъде във формата y = a + bx + cx 2), което би било по-добро приближение към n точки от данни, процедурата ще бъде както е описано по-долу.
Ако n точки от данни бяха в тази парабола, ще имаме:
Тогава:
По подобен начин можем да напишем y = Au. Ако всички точки не са в параболата, имаме, че y-Au е различен от нула за всеки вектор u и проблемът ни е отново: намерете вектор u в R3 такъв, че неговата норма --y-Au-- е възможно най-малка., Повтаряйки предишната процедура, можем да стигнем до това, че търсеният вектор е:
Решени упражнения
Упражнение 1
Намерете линията, която най-добре отговаря на точките (1,4), (-2,5), (3, -1) и (4,1).
Решение
Ние трябва да:
Тогава:
Следователно заключаваме, че линията, която най-добре отговаря на точките, се дава от:
Упражнение 2
Да предположим, че предмет е спуснат от височина 200 m. Когато падне, се предприемат следните стъпки:
Знаем, че височината на споменатия обект след изтичане на време t се дава от:
Ако искаме да получим стойността на g, можем да намерим парабола, която е по-добро приближение към петте точки, дадени в таблицата, и по този начин ще имаме, че коефициентът, който придружава t 2, ще бъде разумно приближение до (-1/2) g, ако измерванията са точни.
Ние трябва да:
И по-късно:
Така че точките от данни се напасват от следния квадратичен израз:
Така че, трябва да:
Това е стойност, която е разумно близка до правилната, която е g = 9,81 m / s 2. За да се получи по-точно приближение на g, би било необходимо да се започне от по-прецизни наблюдения.
За какво е?
В проблемите, които се срещат в естествените или социалните науки, е удобно да се напишат връзките, които съществуват между различни променливи, чрез някакъв математически израз.
Например в икономиката можем да свържем разходите (C), доходите (I) и печалбите (U) с помощта на проста формула:
Във физиката можем да свържем ускорението, причинено от гравитацията, времето на падане на обекта и височината на обекта по закон:
В предишния израз s o е началната височина на споменатия обект, а v o е неговата начална скорост.
Намирането на формули като тези не е лесна задача; обикновено дежурният специалист е да работи с много данни и многократно да извършва няколко експеримента (за да провери дали получените резултати са постоянни), за да намери връзки между различните данни.
Честият начин за постигане на това е да се представят получените в равнина данни като точки и да се търси непрекъсната функция, която оптимално приближава тези точки.
Един от начините за намиране на функцията, която "най-добре приближава" дадените данни е чрез метода на най-малко квадратчета.
В допълнение, както видяхме и при упражнението, благодарение на този метод можем да получим доста близки приближения до физическите константи.
Препратки
- Линейна алгебра на Чарлз У Къртис. Springer-Velarg
- Кай Лай Чунг. Елементарна теория за вероятността със стохастични процеси. Springer-Verlag New York Inc
- Richar L Burden & J.Douglas Faires. Числен анализ (7ed). Томпсън Обучение.
- Стенли I. Гросман. Приложения на линейна алгебра. MCGRAW-HILL / INTERAMERICANA DE MEXICO
- Стенли I. Гросман. Линейна алгебра. MCGRAW-HILL / INTERAMERICANA DE MEXICO