Метод наименьших квадратов квадратичное приближение. Аппроксимация опытных данных. Метод наименьших квадратов

22.09.2019

Которое находит самое широкое применение в различных областях науки и практической деятельности. Это может быть физика, химия, биология, экономика, социология, психология и так далее, так далее. Волею судьбы мне часто приходится иметь дело с экономикой, и поэтому сегодня я оформлю вам путёвку в удивительную страну под названием Эконометрика =) …Как это не хотите?! Там очень хорошо – нужно только решиться! …Но вот то, что вы, наверное, определённо хотите – так это научиться решать задачи методом наименьших квадратов . И особо прилежные читатели научатся решать их не только безошибочно, но ещё и ОЧЕНЬ БЫСТРО;-) Но сначала общая постановка задачи + сопутствующий пример:

Пусть в некоторой предметной области исследуются показатели , которые имеют количественное выражение. При этом есть все основания полагать, что показатель зависит от показателя . Это полагание может быть как научной гипотезой, так и основываться на элементарном здравом смысле. Оставим, однако, науку в сторонке и исследуем более аппетитные области – а именно, продовольственные магазины. Обозначим через:

– торговую площадь продовольственного магазина, кв.м.,
– годовой товарооборот продовольственного магазина, млн. руб.

Совершенно понятно, что чем больше площадь магазина, тем в большинстве случаев будет больше его товарооборот.

Предположим, что после проведения наблюдений/опытов/подсчётов/танцев с бубном в нашем распоряжении оказываются числовые данные:

С гастрономами, думаю, всё понятно: – это площадь 1-го магазина, – его годовой товарооборот, – площадь 2-го магазина, – его годовой товарооборот и т.д. Кстати, совсем не обязательно иметь доступ к секретным материалам – довольно точную оценку товарооборота можно получить средствами математической статистики . Впрочем, не отвлекаемся, курс коммерческого шпионажа – он уже платный =)

Табличные данные также можно записать в виде точек и изобразить в привычной для нас декартовой системе .

Ответим на важный вопрос: сколько точек нужно для качественного исследования?

Чем больше, тем лучше. Минимально допустимый набор состоит из 5-6 точек. Кроме того, при небольшом количестве данных в выборку нельзя включать «аномальные» результаты. Так, например, небольшой элитный магазин может выручать на порядки больше «своих коллег», искажая тем самым общую закономерность, которую и требуется найти!

Если совсем просто – нам нужно подобрать функцию , график которой проходит как можно ближе к точкам . Такую функцию называют аппроксимирующей (аппроксимация – приближение) или теоретической функцией . Вообще говоря, тут сразу появляется очевидный «претендент» – многочлен высокой степени, график которого проходит через ВСЕ точки. Но этот вариант сложен, а зачастую и просто некорректен (т.к. график будет всё время «петлять» и плохо отражать главную тенденцию) .

Таким образом, разыскиваемая функция должна быть достаточно простА и в то же время отражать зависимость адекватно. Как вы догадываетесь, один из методов нахождения таких функций и называется методом наименьших квадратов . Сначала разберём его суть в общем виде. Пусть некоторая функция приближает экспериментальные данные :

Как оценить точность данного приближения? Вычислим и разности (отклонения) между экспериментальными и функциональными значениями (изучаем чертёж) . Первая мысль, которая приходит в голову – это оценить, насколько великА сумма , но проблема состоит в том, что разности могут быть и отрицательны (например, ) и отклонения в результате такого суммирования будут взаимоуничтожаться. Поэтому в качестве оценки точности приближения напрашивается принять сумму модулей отклонений:

или в свёрнутом виде: (вдруг кто не знает: – это значок суммы, а – вспомогательная переменная-«счётчик», которая принимает значения от 1 до ) .

Приближая экспериментальные точки различными функциями, мы будем получать разные значения , и очевидно, где эта сумма меньше – та функция и точнее.

Такой метод существует и называется он методом наименьших модулей . Однако на практике получил гораздо бОльшее распространение метод наименьших квадратов , в котором возможные отрицательные значения ликвидируются не модулем, а возведением отклонений в квадрат:

, после чего усилия направлены на подбор такой функции , чтобы сумма квадратов отклонений была как можно меньше. Собственно, отсюда и название метода.

И сейчас мы возвращаемся к другому важному моменту: как отмечалось выше, подбираемая функция должна быть достаточно простА – но ведь и таких функций тоже немало: линейная , гиперболическая , экспоненциальная , логарифмическая , квадратичная и т.д. И, конечно же, тут сразу бы хотелось «сократить поле деятельности». Какой класс функций выбрать для исследования? Примитивный, но эффективный приём:

– Проще всего изобразить точки на чертеже и проанализировать их расположение. Если они имеют тенденцию располагаться по прямой, то следует искать уравнение прямой с оптимальными значениями и . Иными словами, задача состоит в нахождении ТАКИХ коэффициентов – чтобы сумма квадратов отклонений была наименьшей.

Если же точки расположены, например, по гиперболе , то заведомо понятно, что линейная функция будет давать плохое приближение. В этом случае ищем наиболее «выгодные» коэффициенты для уравнения гиперболы – те, которые дают минимальную сумму квадратов .

А теперь обратите внимание, что в обоих случаях речь идёт о функции двух переменных , аргументами которой являются параметры разыскиваемых зависимостей :

И по существу нам требуется решить стандартную задачу – найти минимум функции двух переменных .

Вспомним про наш пример: предположим, что «магазинные» точки имеют тенденцию располагаться по прямой линии и есть все основания полагать наличие линейной зависимости товарооборота от торговой площади. Найдём ТАКИЕ коэффициенты «а» и «бэ», чтобы сумма квадратов отклонений была наименьшей. Всё как обычно – сначала частные производные 1-го порядка . Согласно правилу линейности дифференцировать можно прямо под значком суммы:

Если хотите использовать данную информацию для реферата или курсовика – буду очень благодарен за поставленную ссылку в списке источников, такие подробные выкладки найдёте мало где:

Составим стандартную систему:

Сокращаем каждое уравнение на «двойку» и, кроме того, «разваливаем» суммы:

Примечание : самостоятельно проанализируйте, почему «а» и «бэ» можно вынести за значок суммы. Кстати, формально это можно проделать и с суммой

Перепишем систему в «прикладном» виде:

после чего начинает прорисовываться алгоритм решения нашей задачи:

Координаты точек мы знаем? Знаем. Суммы найти можем? Легко. Составляем простейшую систему двух линейных уравнений с двумя неизвестными («а» и «бэ»). Систему решаем, например, методом Крамера , в результате чего получаем стационарную точку . Проверяя достаточное условие экстремума , можно убедиться, что в данной точке функция достигает именно минимума . Проверка сопряжена с дополнительными выкладками и поэтому оставим её за кадром (при необходимости недостающий кадр можно посмотреть ) . Делаем окончательный вывод:

Функция наилучшим образом (по крайне мере, по сравнению с любой другой линейной функцией) приближает экспериментальные точки . Грубо говоря, её график проходит максимально близко к этим точкам. В традициях эконометрики полученную аппроксимирующую функцию также называют уравнением пАрной линейной регрессии .

Рассматриваемая задача имеет большое практическое значение. В ситуации с нашим примером, уравнение позволяет прогнозировать, какой товарооборот («игрек») будет у магазина при том или ином значении торговой площади (том или ином значении «икс») . Да, полученный прогноз будет лишь прогнозом, но во многих случаях он окажется достаточно точным.

Я разберу всего лишь одну задачу с «реальными» числами, поскольку никаких трудностей в ней нет – все вычисления на уровне школьной программы 7-8 класса. В 95 процентов случаев вам будет предложено отыскать как раз линейную функцию, но в самом конце статьи я покажу, что ничуть не сложнее отыскать уравнения оптимальной гиперболы, экспоненты и некоторых других функций.

По сути, осталось раздать обещанные плюшки – чтобы вы научились решать такие примеры не только безошибочно, но ещё и быстро. Внимательно изучаем стандарт:

Задача

В результате исследования взаимосвязи двух показателей, получены следующие пары чисел:

Методом наименьших квадратов найти линейную функцию, которая наилучшим образом приближает эмпирические (опытные) данные. Сделать чертеж, на котором в декартовой прямоугольной системе координат построить экспериментальные точки и график аппроксимирующей функции . Найти сумму квадратов отклонений между эмпирическими и теоретическими значениями. Выяснить, будет ли функция лучше (с точки зрения метода наименьших квадратов) приближать экспериментальные точки.

Заметьте, что «иксовые» значения – натуральные, и это имеет характерный содержательный смысл, о котором я расскажу чуть позже; но они, разумеется, могут быть и дробными. Кроме того, в зависимости от содержания той или иной задачи как «иксовые», так и «игрековые» значения полностью или частично могут быть отрицательными. Ну а у нас дана «безликая» задача, и мы начинаем её решение :

Коэффициенты оптимальной функции найдём как решение системы:

В целях более компактной записи переменную-«счётчик» можно опустить, поскольку и так понятно, что суммирование осуществляется от 1 до .

Расчёт нужных сумм удобнее оформить в табличном виде:

Вычисления можно провести на микрокалькуляторе, но гораздо лучше использовать Эксель – и быстрее, и без ошибок; смотрим короткий видеоролик:

Таким образом, получаем следующую систему :

Тут можно умножить второе уравнение на 3 и из 1-го уравнения почленно вычесть 2-е . Но это везение – на практике системы чаще не подарочны, и в таких случаях спасает метод Крамера :
, значит, система имеет единственное решение.

Выполним проверку. Понимаю, что не хочется, но зачем же пропускать ошибки там, где их можно стопроцентно не пропустить? Подставим найденное решение в левую часть каждого уравнения системы:

Получены правые части соответствующих уравнений, значит, система решена правильно.

Таким образом, искомая аппроксимирующая функция: – из всех линейных функций экспериментальные данные наилучшим образом приближает именно она.

В отличие от прямой зависимости товарооборота магазина от его площади, найденная зависимость является обратной (принцип «чем больше – тем меньше») , и этот факт сразу выявляется по отрицательному угловому коэффициенту . Функция сообщает нам о том, что с увеличение некоего показателя на 1 единицу значение зависимого показателя уменьшается в среднем на 0,65 единиц. Как говорится, чем выше цена на гречку, тем меньше её продано.

Для построения графика аппроксимирующей функции найдём два её значения:

и выполним чертёж:

Построенная прямая называется линией тренда (а именно – линией линейного тренда, т.е. в общем случае тренд – это не обязательно прямая линия) . Всем знакомо выражение «быть в тренде», и, думаю, что этот термин не нуждается в дополнительных комментариях.

Вычислим сумму квадратов отклонений между эмпирическими и теоретическими значениями. Геометрически – это сумма квадратов длин «малиновых» отрезков (два из которых настолько малы, что их даже не видно) .

Вычисления сведём в таблицу:

Их можно опять же провести вручную, на всякий случай приведу пример для 1-й точки:

но намного эффективнее поступить уже известным образом:

Еще раз повторим: в чём смысл полученного результата? Из всех линейных функций у функции показатель является наименьшим, то есть в своём семействе это наилучшее приближение. И здесь, кстати, не случаен заключительный вопрос задачи: а вдруг предложенная экспоненциальная функция будет лучше приближать экспериментальные точки?

Найдем соответствующую сумму квадратов отклонений – чтобы различать, я обозначу их буквой «эпсилон». Техника точно такая же:

И снова на всякий пожарный вычисления для 1-й точки:

В Экселе пользуемся стандартной функцией EXP (синтаксис можно посмотреть в экселевской Справке) .

Вывод : , значит, экспоненциальная функция приближает экспериментальные точки хуже, чем прямая .

Но тут следует отметить, что «хуже» – это ещё не значит , что плохо. Сейчас построил график этой экспоненциальной функции – и он тоже проходит близко к точкам – да так, что без аналитического исследования и сказать трудно, какая функция точнее.

На этом решение закончено, и я возвращаюсь к вопросу о натуральных значениях аргумента. В различных исследованиях, как правило, экономических или социологических, натуральными «иксами» нумеруют месяцы, годы или иные равные временнЫе промежутки. Рассмотрим, например, такую задачу.

Аппроксимация (от латинского "approximate" -"приближаться")- приближенное выражение каких-либо математических объектов (например, чисел или функций) через другие более простые, более удобные в пользовании или просто более известные. В научных исследованиях аппроксимация применяется для описания, анализа, обобщения и дальнейшего использования эмпирических результатов.

Как известно, между величинами может существовать точная (функциональная) связь, когда одному значению аргумента соответствует одно определенное значение.

При выборе аппроксимации следует исходить из конкретной задачи исследования. Обычно, чем более простое уравнение используется для аппроксимации, тем более приблизительно получаемое описание зависимости. Поэтому важно считывать, насколько существенны и чем обусловлены отклонения конкретных значений от получаемого тренда. При описании зависимости эмпирически определенных значений можно добиться и гораздо большей точности, используя какое-либо более сложное, многопараметрическое уравнение. Однако нет никакого смысла стремиться с максимальной точностью передать случайные отклонения величин в конкретных рядах эмпирических данных. Выбирая метод аппроксимации, исследователь всегда идет на компромисс: решает, в какой степени в данном случае целесообразно и уместно «пожертвовать» деталями и, соответственно, насколько обобщенно следует выразить зависимость сопоставляемых переменных. Наряду с выявлением закономерностей замаскированных случайными отклонениями эмпирических данных от общей закономерности, аппроксимация позволяет также решать много других важных задач: формализовать найденную зависимость; найти неизвестные значения зависимой переменной путем интерполяции или, если это допустимо, экстраполяции.

Целью данной курсовой работы является изучение теоретических основ аппроксимации табулированной функции методом наименьших квадратов, и, применяя теоретические знания, нахождение аппроксимирующих полиномов. Нахождение аппроксимирующих полиномов в рамках данной курсовой работы следует путем написания программы на языке Pascal, реализующую разработанный алгоритм нахождения коэффициентов аппроксимирующего полинома, а также решить эту же задачу средствами MathCad.

В данной курсовой работе программа на языке Pascal разработана в оболочке PascalABC версия 1.0 beta. Решение задачи в среде MathCad производили в Mathcad версия 14.0.0.163.

Постановка задачи

В данной курсовой работе необходимо выполнить следующее:

1. Разработать алгоритм нахождения коэффициентов трёх аппроксимирующих полиномов (многочленов) вида

для табулированной функции y=f(x):

для степени полиномов n=2, 4, 5.

2. Построить блок-схему алгоритма.

3. Создать программу на языке Pascal, реализующую разработанный алгоритм.

5. Построить графики 3-х полученных приближающих функций в одной системе координат. На графике должны содержаться и исходные точки (х i , y i ) .

6. Решить задачу средствами MathCAD.

Результаты решения задачи с помощью созданной программы на языке Pascal и в среде MathCAD нужно представить в виде построенных с помощью найденных коэффициентов трёх полиномов; таблицы, содержащей полученные с помощью найденных полиномов значения функции в точках хi и среднеквадратичных отклонений.

Построение эмпирических формул методом наименьших квадратов

Очень часто, особенно при анализе эмпирических данных возникает необходимость найти в явном виде функциональную зависимость между величинами x и y , которые получены в результате измерений.

При аналитическом исследовании взаимосвязи между двумя величинами x и y производят ряд наблюдений и в результате получается таблица значений:

x			¼		¼
y			¼		¼

Эта таблица обычно получается как итог каких-либо экспериментов, в которых

АППРОКСИМАЦИЯ ФУНКЦИИ МЕТОДОМ НАИМЕНЬШИХ

КВАДРАТОВ

1. Цель работы

2. Методические указания

2.2 Постановка задачи

2.3 Методика выбора аппроксимирующей функции

2.4 Общая методика решения

2.5 Методика решения нормальных уравнений

2.7 Методика вычисления обратной матрицы

3. Ручной счет

3.1 Исходные данные

3.2 Система нормальных уравнений

3.3 Решение систем методом обратной матрицы

4. Схема алгоритмов

5. Текст программы

6. Результаты машинного расчета

1. Цель работы

Настоящая курсовая работа является завершающим разделом дисциплины «Вычислительная математика и программирование» и требует от студента в процессе ее выполнения решения следующих задач:

а) практического освоения типовых вычислительных методов прикладной информатики; б) совершенствования навыков разработки алгоритмов и построения программ на языке высокого уровня.

Практическое выполнение курсовой работы предполагает решение типовых инженерных задач обработки данных с использованием методов матричной алгебры, решения систем линейных алгебраических уравнений численного интегрирования. Навыки, приобретаемые в процессе выполнения курсовой работы, являются основой для использования вычислительных методов прикладной математики и техники программирования в процессе изучения всех последующих дисциплин при выполнении курсовых и дипломных проектов.

2. Методические указания

2.2 Постановка задачи

При изучении зависимостей между величинами важной задачей является приближенное представление (аппроксимация) этих зависимостей с помощью известных функций или их комбинаций, подобранных надлежащим образом. Подход к такой задаче и конкретный метод её решения определяются выбором используемого критерия качества приближения и формой представления исходных данных.

2.3 Методика выбора аппроксимирующей функции

Аппроксимирующую функцию выбирают из некоторого семейства функций, для которого задан вид функции, но остаются неопределенными (и подлежат определению) её параметры т.е.

Определение аппроксимирующей функции φ разделяется на два основных этапа:

Подбор подходящего вида функции ;

Нахождение ее параметров в соответствии с критерием МНК.

Подбор вида функции представляет собой сложную задачу, решаемую методом проб и последовательных приближений. Исходные данные, представленные в графической форме (семейства точек или кривые), сопоставляется с семейством графиков ряда типовых функций, используемых обычно для целей аппроксимации. Некоторые типы функций , используемых в курсовой работе, приведены в таблице 1.

Более подробные сведения о поведении функций, которые могут быть использованы в задачах аппроксимации, можно найти в справочной литературе. В большинстве заданий курсовой работы вид аппроксимирующей функции задан.

2.4 Общая методика решения

После того как выбран вид аппроксимирующей функции (или эта функция задана) и, следовательно, определена функциональная зависимость (1), необходимо найти в соответствии с требованиями МНК значения параметров С 1 , С 2 , …, С m . Как уже указывалось, параметры должны быть определены таком образом, чтобы значение критерия в каждой из рассматриваемых задач было наименьшим по сравнению с его значением при других возможных значениях параметров.

Для решения задачи подставим выражение (1) в соответствующее из выражений и проведем необходимые операции суммирования или интегрирования (в зависимости от вида I). В результате величина I, именуемая в дальнейшем критерием аппроксимации, представляется функцией искомых параметров

Последующее сводиться к отысканию минимума этой функции переменных С k ; определение значений С k =C k * , к=1,m, соответствующих этому элементу I, и является целью решаемой задачи.

Типы функций Таблица 1

Вид функции	Название функции
Y=C 1 +C 2 ·x	Линейная
Y=C 1 +C 2 ·x+C 3 ·x 2	Квадратичная (параболическая)
Y=	Рациональная(полином n -й степени)
Y=C 1 +C 2 ·	Обратно пропорциональная
Y=C 1 +C 2 ·	Степенная дробно-рациональная
Y=	Дробно-рациональная(первой степени)
Y=C 1 +C 2 ·X C3	Степенная
Y=C 1 +C 2 ·a C3 · x	Показательная
Y=C 1 +C 2 ·log a x	Логарифмическая
Y=C 1 +C 2 ·X n (0	Иррациональная, алгебраическая
Y=C 1 ·sinx+C 2 cosx	Тригонометрические функции (и обратные к ним)

Возможны следующие два подхода к решению этой задачи: использование известных условий минимума функции нескольких переменных или непосредственное отыскание точки минимума функции каким – либо из численных методов.

Для реализации первого из указанных подходов воспользуемся необходимым условием минимума функции (1) нескольких переменных, в соответствии с которыми в точке минимума должны быть равны нулю частные производные этой функции по всем ее аргументам

Полученные m равенств следует рассматривать как систему уравнений относительно искомых С 1 , С 2 ,…, С m . При произвольном виде функциональной зависимости (1) уравнения (3) оказывается нелинейным относительно величин C k и их решение требует применение приближенных численных методов.

Использование равенства (3) дают, лишь необходимые, но недостаточные условия минимума (2). Поэтому требуется уточнить, обеспечивают ли найденные значения C k * именно минимум функции . В общем случае такое уточнение выходит за рамки данной курсовой работы, и предлагаемые для курсовой работы задания подобраны так, что найденное решение системы (3) отвечает именно минимуму I. Однако, поскольку величина I неотрицательна (как сумма квадратов) и нижняя её граница есть 0 (I=0), то, если существует решение системы (3) единственно, оно отвечает именно минимуму I.

При представлении аппроксимирующей функции общим выражением (1) соответствующие нормальным уравнениям (3) оказываются нелинейными относительно искомых С к. их решение может быть сопряжено со значительными трудностями. В таких случаях предпочтительным являются непосредственный поиск минимума функции в области возможных значений ее аргументов С к, не связанный с использованием соотношений (3). Общая идея подобного поиска сводиться к изменению значений аргументов С к и вычислению на каждом шаге соответствующего значения функции I до минимального или достаточно близко к нему.

2.5 Методика решения нормальных уравнений

Один из возможных способов минимизации критерия аппроксимации (2) предполагает решение системы нормальных уравнений (3). При выборе в качестве аппроксимирующей функции линейной функции искомых параметров нормальные уравнения представляют собой систему линейных алгебраических уравнений.

Систему n линейных уравнений общего вида:

(4) можно записать посредством матричных обозначений в следующем виде: А·Х=В,

; ; (5)

квадратная матрица А называется матрицей системы , а вектора Х и В соответственно вектором-столбцом неизвестных систем и вектором-столбцом ее свободных членов .

В матричном виде исходную систему n линейных уравнений можно записать и так:

Решение системы линейных уравнений сводиться к отысканию значений элементов вектора-столбца (х i), называемых корнями системы. Чтобы эта система имела единственное решение, входящее в нее n уравнение должно быть линейно независимым. Необходимым и достаточным условием этого является неравенство нулю определителя системы, т.е. Δ=detA≠0.

Алгоритм решения системы линейных уравнений подразделяется на прямые и итерационные. На практике никакой метод не может быть бесконечным. Для получения точного решения итерационные методы требуют бесконечного числа арифметических операций. практически это число приходиться брать конечным и поэтому решение в принципе имеет некоторую ошибку, даже если пренебречь ошибками округлений, сопровождающими большинство вычислений. Что же касается прямых методов, то они даже при конечном числе операций могут в принципе дать точное решение, если оно существует.

Прямые и конечные методы позволяют найти решение системы уравнений за конечное число шагов. Это решение будет точным, если все промежутки вычисления проводятся с ограниченной точностью.

2.7 Методика вычисления обратной матрицы

Один из методов решения системы линейных уравнений (4), записываем в матричной форме А·Х=В, связан с использованием обратной матрицы А -1 . В этом случае решение системы уравнений получается в виде

где А -1 –матрица, определяемая следующим образом.

Пусть А –квадратная матрица размером n х n с ненулевым определителем detA≠0. Тогда существует обратная матрица R=A -1 , определяемая условием A·R=E,

где Е –единичная матрица, все элементы главной диагонали которой равны I, а элементы вне этой диагонали -0, Е=, где Е i –вектор-столбец. Матрица К –квадратная матрица размером n х n.

где Rj –вектор-столбец.

Рассмотрим ее первый столбец R=(r 11 , r 21 ,…, r n 1) T , где Т –означает транспонирование. Нетрудно проверить, что произведение A·R равно первому столбцу E 1 =(1, 0, …, 0) Т единичной матрицы Е, т.е. вектор R 1 можно рассмотреть как решение системы линейных уравнений A·R 1 =E 1. Аналогично m –й столбец матрицы R , Rm, 1≤ m ≤ n, представляет собой решение уравнения A·Rm=Em, где Em=(0, …, 1, 0) T m –й столбец единичной матрицы Е.

Таким образом, обратная матрица R представляет собой набор из решений n систем линейных уравнений

A·Rm=Em , 1≤ m ≤ n.

Для решения этих систем можно применять любые методы, разработанные для решения алгебраических уравнений. Однако метод Гаусса дает возможность решать все эти n систем одновременно, а независимо друг от друга. Действительно, все эти системы уравнений отличаются только правой частью, а все преобразования, которые проводятся в процессе прямого хода метода Гаусса, полностью определяются элементами матрицы коэффициентов (матрицы А). Следовательно, в схемах алгоритмов изменению подлежат только блоки, связанные с преобразованием вектора В. В нашем случае одновременно будут преобразовываться n векторов Em, 1≤ m ≤ n. Результатом решения также будет не один вектор, а n векторов Rm, 1≤ m ≤ n.

3. Ручной счет

3.1 Исходные данные

Xi	0,3	0,5	0,7	0,9	1,1
Yi	1,2	0,7	0,3	-0,3	-1,4

3.2 Система нормальных уравнений

3.3 Решение систем методом обратной матрицы

аппроксимация квадрат функция линейный уравнение

5 3,5 2,6 0,5 5 3,5 2,6 0,5

3,5 2,85 2,43 -0,89 0 0,4 0,61 -1,24

2,56 2,43 2,44 -1,86 0 0,638 1,109 -2,116

0 0,4 0,61 -1,24

0 0 0,136 -0,138

Результаты расчета:

С 1 =1,71; С 2 =-1,552; С 3 =-1,015;

Аппроксимирующая функция:

4 . Текст программы

mass=arrayof real;

mass1=array of real;

mass2=array of real;

X,Y,E,y1,delta: mass;

big,r,sum,temp,maxD,Q:real;

i,j,k,l,num: byte;

Procedure VVOD(var E: mass);

For i:=1 to 5 do

Function FI(i ,k: integer): real;

if i=1 then FI:=1;

if i=2 then FI:=Sin(x[k]);

if i=3 then FI:=Cos(x[k]);

Procedure PEREST(i:integer;var a:mass1;var b:mass2);

for l:= i to 3 do

if abs(a) > big then

big:=a; writeln (big:6:4);

writeln("Перестановкауравнений");

if num<>i then

for j:=i to 3 do

a:=a;

writeln("Введите значения Х");

writeln("__________________");

writeln("‚Введите значения Y");

writeln("___________________");

For i:=1 to 3 do

For j:=1 to 3 do

For k:=1 to 5 do

begin A:= A+FI(i,k)*FI(j,k); write(a:7:5); end;

writeln("________________________");

writeln("МатрицаКоэффициентовAi,j");

For i:=1 to 3 do

For j:=1 to 3 do

write (A:5:2, " ");

For i:=1 to 3 do

For j:=1 to 5 do

B[i]:=B[i]+Y[j]*FI(i,j);

writeln("__________________________");

writeln(‘Матрица Коэффициентов Bi ");

For i:=1 to 3 do

write(B[i]:5:2, " ");

for i:=1 to 2 do

for k:=i+1 to 3 do

Q:=a/a; writeln("g=",Q);

for j:=i+1 to 3 do

a:=a-Q*a; writeln("a=",a);

b[k]:=b[k]-Q*b[i]; writeln("b=",b[k]);

x1[n]:=b[n]/a;

for i:=2 downto 1 do

for j:=i+1 to 3 do

sum:=sum-a*x1[j];

x1[i]:=sum/a;

writeln("__________________________");

writeln ("Значение коэффициентов ");

writeln("_________________________");

for i:=1 to 3 do

writeln(" C",i,"=",x1[i]);

for i:=1 to 5 do

y1[i]:= x1[k]*FI(k,i) + x1*FI(k+1,i) + x1*FI(k+2,i);

delta[i]:=abs (y[i]-y1[i]);

writeln (y1[i]);

for i:=1 to 3 do

write (x1[i]:7:3);

for i:=1 to 5 do

if delta[i]>maxD then maxD:=delta;

writeln ("max Delta= ", maxD:5:3);

5 . Результаты машинного расчета

С 1 =1,511; С 2 =-1,237; С 3 =-1,11;

Вывод

В процессе выполнения курсовой работы я практически освоил типовые вычислительные методы прикладной математики, совершенствовал навыки разработки алгоритмов и построения программ на языках высокого уровня. Получил навыки, являющиеся основой для использования вычислительных методов прикладной математики и техники программирования в процессе изучения всех последующих дисциплин при выполнении курсовых и дипломных проектов.

КУРСОВАЯ РАБОТА

Аппроксимация функции методом наименьших квадратов

Введение

эмпирический mathcad аппроксимация

Целью курсовой работы является углубление знаний по информатике, развитие и закрепление навыков работы с табличным процессором Microsoft Excel и MathCAD. Применение их для решения задач с помощью ЭВМ из предметной области, связанной с исследованиями.

В каждом задании формулируются условия задачи, исходные данные, форма выдачи результатов, указываются основные математические зависимости для решения задачи Контрольный расчет позволяет убедиться в правильности работы программы.

Понятие аппроксимация представляет собой приближенное выражение каких-либо математических объектов (например, чисел или функций) через другие более простые, более удобные в использовании или просто более известные. В научных исследованиях аппроксимация применяется для описания, анализа, обобщения и дальнейшего использования эмпирических результатов.

Как известно, между величинами может существовать точная (функциональная) связь, когда одному значению аргумента соответствует одно определенное значение, и менее точная (корреляционная) связь, когда одному конкретному значению аргумента соответствует приближенное значение или некоторое множество значений функции, в той или иной степени близких друг к другу. При ведении научных исследований, обработке результатов наблюдения или эксперимента обычно приходиться сталкиваться со вторым вариантом. При изучении количественных зависимостей различных показателей, значения которых определяются эмпирически, как правило, имеется некоторая их вариабельность. Частично она задается неоднородностью самих изучаемых объектов неживой и, особенно, живой природы, частично обуславливается погрешностью наблюдения и количественной обработке материалов. Последнюю составляющую не всегда удается исключить полностью, можно лишь минимизировать ее тщательным выбором адекватного метода исследования и аккуратностью работы.

Специалисты в области автоматизации технологических процессов и производств имеют дело с большим объёмом экспериментальных данных, для обработки которых используется компьютер. Исходные данные и полученные результаты вычислений могут быть представлены в табличной форме, используя табличные процессоры (электронные таблицы) и, в частности, Excel. Курсовая работа по информатике позволяет студенту закрепить и развить навыки работы с помощью базовых компьютерных технологий при решении задач в сфере профессиональной деятельности.- система компьютерной алгебры из класса систем автоматизированного проектирования, ориентированная на подготовку интерактивных документов с вычислениями и визуальным сопровождением, отличается легкостью использования и применения для коллективной работы.

1. Общие сведения

Очень часто, особенно при анализе эмпирических данных возникает необходимость найти в явном виде функциональную зависимость между величинами x и у , которые получены в результате измерений.

xx 1 x 1 x i X n уy 1 y 1 y i Y n

Эта таблица обычно получается как итог каких-либо экспериментов, в которых x, (независимая величина) задается экспериментатором, а у, получается в результате опыта. Поэтому эти значения у, будем называть эмпирическими или опытными значениями.

Между величинами x и y существует функциональная зависимость, но ее аналитический вид обычно неизвестен, поэтому возникает практически важная задача - найти эмпирическую формулу

y = f(x; a1, a2,…, am), (1)

(где a 1 , a 2 ,…, a m - параметры), значения которой при x = x, возможно мало отличались бы от опытных значений у, (i = 1,2,…, п) .

Обычно указывают класс функций (например, множество линейных, степенных, показательных и т.п.) из которого выбирается функция f (x) , и далее определяются наилучшие значения параметров.

Если в эмпирическую формулу (1) подставить исходные x, то получим теоретические значения

Y T i = f (x i ; a1, a2……a m ) , где i = 1,2,…, n .

Разности y i T - у i , называются отклонениями и представляют собой расстояния по вертикали от точек M i до графика эмпирической функции.

Согласно методу наименьших квадратов наилучшими коэффициентами a 1 , a 2 ,…, a m считаются те, для которых сумма квадратов отклонений найденной эмпирической функции от заданных значений функции

будет минимальной.

Поясним геометрический смысл метода наименьших квадратов.

Каждая пара чисел (x i , y i ) из исходной таблицы определяет точку M i на плоскости XOY. Используя формулу (1) при различных значениях коэффициентов a 1 , a 2 ,…, a m можно построить ряд кривых, которые являются графиками функции (1). Задача состоит в определении коэффициентов a 1 , a 2 ,…, a m таким образом, чтобы сумма квадратов расстояний по вертикали от точек M i (x i , y i ) до графика функции (1) была наименьшей (рис. 1).

Построение эмпирической формулы состоит из двух этапов: выяснение общего вида этой формулы и определение ее наилучших параметров.

Если неизвестен характер зависимости между данными величинами x и y , то вид эмпирической зависимости является произвольным. Предпочтение отдается простым формулам, обладающим хорошей точностью. Удачный выбор эмпирической формулы в значительной мере зависит от знаний исследователя в предметной области, используя которые он может указать класс функций из теоретических соображений. Большое значение имеет изображение полученных данных в декартовых или в специальных системах координат (полулогарифмической, логарифмической и т.д.). По положению точек можно примерно угадать общий вид зависимости путем установления сходства между построенным графиком и образцами известных кривых.

Определение наилучших коэффициентов a 1 , a 2,…, a m входящих в эмпирическую формулу производят хорошо известным аналитическими методами.

Для того, чтобы найти набор коэффициентовa a 1 , a 2 …..a m , которые доставляют минимум функции S, определяемой формулой (2), используем необходимое условие экстремума функции нескольких переменных - равенство нулю частных производных.

В результате получим нормальную систему для определения коэффициентов a i (i = 1,2,…, m) :

Таким образом, нахождение коэффициентов a i сводится к решению системы (3). Эта система упрощается, если эмпирическая формула (1) линейна относительно параметров a i , тогда система (3) - будет линейной.

1.1 Линейная зависимость

Конкретный вид системы (3) зависит от того, из какого класса эмпирических формул мы ищем зависимость (1). В случае линейной зависимости y = a 1 + a 2 x система (3) примет вид:

Эта линейная система может быть решена любым известным методом (методом Гаусса, простых итераций, формулами Крамера).

1.2 Квадратичная зависимость

В случае квадратичной зависимости y = a 1 + a 2 x + a 3x2 система (3) примет вид:

1.3 Экспоненциальная зависимость

В ряде случаев в качестве эмпирической формулы берут функцию в которую неопределенные коэффициенты входят нелинейно. При этом иногда задачу удается линеаризовать т.е. свести к линейной. К числу таких зависимостей относится экспоненциальная зависимость

y = a 1 * e a2x (6)

где a1 иa2, неопределенные коффициенты.

Линеаризация достигается путем логарифмирования равенства (6), после чего получаем соотношение

ln y = ln a1 + a2x(7)

Обозначим ln у и ln a x соответственно через t и c , тогда зависимость (6) может быть записана в виде t = a 1 + a 2 х , что позволяет применить формулы (4) с заменой a 1 на c и у i на t i

1.4 Элементы теории корреляции

График восстановленной функциональной зависимости у(х) по результатам измерений (хi , у i ), i = 1,2, K , n называется кривой регрессии. Для проверки согласия построенной кривой регрессии с результатами эксперимента обычно вводят следующие числовые характеристики: коэффициент корреляции (линейная зависимость), корреляционное отношение и коэффициент детерминированности. При этом результаты обычно группируют и представляют в форме корреляционной таблицы. В каждой клетке этой таблицы приводятся численности n iJ - тех пар (х, у) , компоненты которых попадают в соответствующие интервалы группировки по каждой переменной. Предполагая длины интервалов группировки (по каждой переменной) равными между собой, выбирают центры хi (соответственно у i ) этих интервалов и числа n iJ - в качестве основы для расчетов.

Коэффициент корреляции является мерой линейной связи между зависимыми случайными величинами: он показывает, насколько хорошо в среднем может быть представлена одна из величин в виде линейной функции от другой.

Коэффициент корреляции вычисляется по формуле:

где, и - среднее арифметическое значение соответственно х и у .

Коэффициент корреляции между случайными величинами по абсолютной величине не превосходит 1. Чем ближе |р| к 1, тем теснее линейная связь между х и у.

В случае нелинейной корреляционной связи условные средние значения располагаются около кривой линии. В этом случае в качестве характеристики силы связи рекомендуется использовать корреляционное отношение, интерпретация которого не зависит от вида исследуемой зависимости.

Корреляционное отношение вычисляется по формуле:

где n i = , n f = , а числитель характеризует рассеяние условных средних у, около безусловного среднего y .

Всегда. Равенство = 0 соответствует некоррелированным случайным величинам; = 1 тогда и только тогда, когда имеется точная функциональная связь междуy и x. В случае линейной зависимости y от x корреляционное отношение совпадает с квадратом коэффициента корреляции. Величина - ? 2 используется в качестве индикатора отклонения регрессии от линейной.

Корреляционное отношение является мерой корреляционной связи y с x в какой угодно форме, но не может дать представления о степени приближенности эмпирических данных к специальной форме. Чтобы выяснить насколько точно построенная кривая отражает эмпирические данные вводится еще одна характеристика - коэффициент детерминированности.

Для его описания рассмотрим следующие величины. - полная сумма квадратов, где среднее значение.

Можно доказать следующее равенство

Первое слагаемое равно Sост = и называется остаточной суммой квадратов. Оно характеризует отклонение экспериментальных от теоритических.

Второе слагаемое равно Sрегр = 2 и называется регрессионной суммой квадратов и оно характеризует разброс данных.

Очевидно, что справедливо следующее равенство Sполн = Sост + Sрегр.

Коэффициент детерминированности определяется по формуле:

Чем меньше остаточная сумма квадратов по сравнению с общей суммой квадратов, тем больше значение коэффициента детерминированности r 2 , который показывает, насколько хорошо уравнение, полученное с помощью регрессионного анализа, объясняет взаимосвязи между переменными. Если он равен 1, то имеет место полная корреляция с моделью, т.е. нет различия между фактическим и оценочным значениями y. В противоположном случае, если коэффициент детерминированности равен 0, то уравнение регрессии неудачно для предсказания значений y

Коэффициент детерминированности всегда не превосходит корреляционное отношение. В случае когда выполняется равенство r 2 = то можно считать, что построенная эмпирическая формула наиболее точно отражает эмпирические данные.

2. Постановка задачи

1. Используя метод наименьших квадратов функцию, заданную таблично, аппроксимировать

а) многочленом первой степени;

б) многочленом второй степени;

в) экспоненциальной зависимостью.

Для каждой зависимости вычислить коэффициент детерминированности.

Вычислить коэффициент корреляции (только в случае а).

Для каждой зависимости построить линию тренда.

Используя функцию ЛИНЕЙН вычислить числовые характеристики зависимости от.

Сравнить свои вычисления с результатами, полученными при помощи функции ЛИНЕЙН.

Сделать вывод, какая из полученных формул наилучшим образом аппроксимирует функцию.

Написать программу на одном из языков программирования и сравнить результаты счета с полученными выше.

3. Исходные данные

Функция задана рисунком 1.

4. Расчет аппроксимаций в табличном процессоре Excel

Для проведения расчетов целесообразно воспользоваться табличным процессором Microsoft Excel. И данные расположить как показано на рисунке 2.

Для этого заносим:

·в ячейки A6:A30 заносим значения xi.

·в ячейки B6:B30 заносим значения уi.

·в ячейку C6 вводим формулу =А6^2.

·в ячейки C7:C30 эта формула копируется.

·в ячейку D6 вводим формулу =А6*В6.

·в ячейки D7:D30 эта формула копируется.

·в ячейку F6 вводим формулу =А6^4.

·в ячейки F7:F30 эта формула копируется.

·в ячейку G6 вводим формулу =А6^2*В6.

·в ячейки G7:G30 эта формула копируется.

·в ячейку H6 вводим формулу =LN(B6).

·в ячейки H7:H30 эта формула копируется.

·в ячейку I6 вводим формулу =A6*LN(B6).

·в ячейки I7:I30 эта формула копируется. Последующие шаги делаем с помощью автосуммирования

·в ячейку А33 вводим формулу =СУММ (А6:А30).

·в ячейку B33 вводим формулу =СУММ (В6:В30).

·в ячейку C33 вводим формулу =СУММ (С6:С30).

·в ячейку D33 вводим формулу =СУММ (D6:D30).

·в ячейку E33 вводим формулу =СУММ (E6:E30).

·в ячейку F33 вводим формулу =СУММ (F6:F30).

·в ячейку G33 вводим формулу =СУММ (G6:G30).

·в ячейку H33 вводим формулу =СУММ (H6:H30).

·в ячейку I33 вводим формулу =СУММ (I6:I30).

Аппроксимируем функцию y = f (x) линейной функцией y = a 1 + a 2x. Для определения коэффициентов a1 и a2 воспользуемся системой (4). Используя итоговые суммы таблицы 2, расположенные в ячейках A33, B33, C33 и D33, запишем систему (4) в виде

решив которую, получим a1 = -24,7164 и a2 = 11,63183

Таким образом, линейная аппроксимация имеет вид y= -24,7164 + 11,63183х (12)

Решение системы (11) проводили, пользуясь средствами Microsoft Excel. Результаты представлены на рисунке 3:

В таблице в ячейках A38:B39 записана формула {=МОБР (A35:B36)}. В ячейках E38:E39 записана формула {=МУМНОЖ (A38:B39, C35:C36)}.

Далее аппроксимируем функцию y = f (x) квадратичной функцией y = a 1 + a 2 x + a 3 x 2. Для определения коэффициентов a1, a2 и a3 воспользуемся системой (5). Используя итоговые суммы таблицы 2, расположенные в ячейках A33, B33, C33, D33, E33, F33 и G33 запишем систему (5) в виде:

Решив которую, получим a1 = 1,580946, a2 = -0,60819 и a3 = 0,954171 (14)

Таким образом, квадратичная аппроксимация имеет вид:

у = 1,580946 -0,60819х +0,954171 х 2

Решение системы (13) проводили, пользуясь средствами Microsoft Excel. Результаты представлены на рисунке 4.

В таблице в ячейках A46:C48 записана формула {=МОБР (A41:C43)}. В ячейках F46:F48 записана формула {=МУМНОЖ (A41:C43, D46:D48)}.

Теперь аппроксимируем функцию y = f (х) экспоненциальной функцией y = a 1 e a2x . Для определения коэффициентов a 1 и a 2 прологарифмируем значения y i и используя итоговые суммы таблицы 2, расположенные в ячейках A26, C26, H26 и I26 получим систему:

где с = ln(a 1 ).

Решив систему (10) найдем с = 0,506435, a2 = 0.409819.

После потенцирования получим a1 = 1,659365.

Таким образом, экспоненциальная аппроксимация имеет вид y = 1,659365*e 0,4098194x

Решение системы (15) проводили, пользуясь средствами Microsoft Excel. Результаты представлены на рисунке 5.

В таблице в ячейках A55:B56 записана формула {=МОБР (A51:B52)}. В ячейках E54:E56 записана формула {=МУМНОЖ (A51:B52, С51:С52)}. В ячейке E56 записана формула =EXP(E54).

Вычислим среднее арифметическое x и у по формулам:

Результаты расчета x и y средствами Microsoft Excel представлены на рисунке 6.

В ячейке B58 записана формула =A33/25. В ячейке B59 записана формула =B33/25.

Таблица 2

Поясним как таблица на рисунке 7 составляется.

Ячейки A6:A33 и B6:B33 уже заполнены (см. рис. 2).

·в ячейку J6 вводим формулу =(A6-$B$58)*(B6-$B$59).

·в ячейки J7:J30 эта формула копируется.

·в ячейку K6 вводим формулу =(А6-$В$58)^2.

·в ячейки K7:K30 эта формула копируется.

·в ячейку L6 вводим формулу =(В1-$В$59)^2.

·в ячейки L7:L30 эта формула копируется.

·в ячейку M6 вводим формулу =($Е$38+$Е$39*А6-В6)^2.

·в ячейки M7:M30 эта формула копируется.

·в ячейку N6 вводим формулу =($F$46 +$F$47*A6 +$F$48*A6 Л6-В6)^2.

·в ячейки N7:N30 эта формула копируется.

·в ячейку O6 вводим формулу =($Е$56*ЕХР ($Е$55*А6) - В6)^2.

·в ячейки O7:O30 эта формула копируется.

Последующие шаги делаем с помощью автосуммирования.

·в ячейку J33 вводим формулу =CYMM (J6:J30).

·в ячейку K33 вводим формулу =СУММ (К6:К30).

·в ячейку L33 вводим формулу =CYMM (L6:L30).

·в ячейку M33 вводим формулу =СУММ (М6:М30).

·в ячейку N33 вводим формулу =СУММ (N6:N30).

·в ячейку O33 вводим формулу =СУММ (06:030).

Теперь проведем расчеты коэффициента корреляции по формуле (8) (только для линейной аппроксимации) и коэффициента детерминированности по формуле (10). Результаты расчетов средствами Microsoft Ехcеl представлены на рисунке 7.

В таблице 8 в ячейке B61 записана формула =J33/(K33*L33^(1/2). В ячейке B62 записана формула =1 - M33/L33. В ячейке B63 записана формула =1 - N33/L33. В ячейке B64 записана формула =1 - O33/L33.

Анализ результатов расчетов показывает, что квадратичная аппроксимация наилучшим образом описывает экспериментальные данные.

4.1 Построение графиков в Excel

Выделим ячейки A1:A25, после этого обратимся к мастеру диаграмм. Выберем точечный график. После того как диаграмма будет построена, щелкнем правой кнопкой мышки на линии графика и выберем добавить линию тренда (соответственно линейную, экспоненциальную, степенную и полиномиальную второй степени).

График линейной аппроксимации

График квадратичной аппроксимации

График экспоненциальной аппроксимации.

5. Аппроксимация функции с помощью MathCAD

Аппроксимация данных с учетом их статистических параметров относится к задачам регрессии. Они обычно возникают при обработке экспериментальных данных, полученных в результате измерений процессов или физических явлений, статистических по своей природе (как, например, измерения в радиометрии и ядерной геофизике), или на высоком уровне помех (шумов). Задачей регрессионного анализа является подбор математических формул, наилучшим образом описывающих экспериментальные данные.

.1 Линейная регрессия

Линейная регрессия в системе Mathcad выполняется по векторам аргумента Х и отсчетов Y функциями:

intercept (x, y) - вычисляет параметр а 1 , смещение линии регрессии по вертикали (см. рис.)

slope (x, y) - вычисляет параметр a 2 , угловой коэффициент линии регрессии (см. рис.)

y(x) = a1+a2*x

Функция corr (у, y(x)) вычисляет коэффициент корреляции Пирсона. Чем он ближе к 1, тем точнее обрабатываемые данные соответствуют линейной зависимости (см. рис.)

.2 Полиноминальная регрессия

Одномерная полиномиальная регрессия с произвольной степенью n полинома и с произвольными координатами отсчетов в Mathcad выполняется функциями:

regress (х, у, n) - вычисляет вектор S, в составе которого находятся коэффициенты ai полинома n -й степени;

Значения коэффициентов ai могут быть извлечены из вектора S функцией submatrix (S, 3, length(S) - 1, 0, 0).

Полученные значения коэффициентов используем в уравнении регрессии

y(x) = a1+a2*x+a3*x 2 (см. рис.)

.3 Нелинейная регрессия

Для простых типовых формул аппроксимации предусмотрен ряд функций нелинейной регрессии, в которых параметры функций подбираются программой Mathcad.

К их числу относится функция expfit (x, y, s), которая возвращает вектор, содержащий коэффициенты a1, a2 и a3 экспоненциальной функции

y(x) = a1 ^exp (a2 x) + a3. В вектор S вводятся начальные значения коэффициентов a1, a2 и a3 первого приближения.

Заключение

Анализ результатов расчетов показывает, что линейная аппроксимация наилучшим образом описывает экспериментальные данные.

Результаты полученные с помощью программы MathCAD полностью совпадают со значениями полученными с помощью Excel. Это говорит о верности вычислений.

Список используемой литературы

Информатика: Учебник / Под ред. проф. Н.В. Макаровой. М.: Финансы и статистика 2007
Информатика: Практикум по технологии работы на компьютере / Под. Ред. проф. Н.В. Макаровой. М Финансы и статистика, 2011.
Н.С. Пискунов. Дифференциальное и интегральное исчисление, 2010.
Информатика, Аппроксимация методом наименьших квадратов, методические указания, Санкт-Петербург, 2009.

Репетиторство

Нужна помощь по изучению какой-либы темы?

Наши специалисты проконсультируют или окажут репетиторские услуги по интересующей вас тематике.
Отправь заявку с указанием темы прямо сейчас, чтобы узнать о возможности получения консультации.

Постановка задачи аппроксимации по МНК. Условия наилучшего приближения.

Если набор экспериментальных данных получен со значительной погрешностью, то интерполяция не только не требуется, но и нежелательна! Здесь требуется построить кривую, которая воспроизводила бы график исходной экспериментальной закономерности, т.е. была бы максимально близка к экспериментальным точкам, но в то же время была бы нечувствительна к случайным отклонениям измеряемой величины.

Введем непрерывную функцию φ(x) для аппроксимации дискретной зависимости f(x i ) , i = 0…n . Будем считать, что φ(x) построена по условию наилучшего квадратичного приближения , если

. (1)

Весу ρ для i -й точки придают смысл точности измерения данного значения: чем больше ρ , тем ближе аппроксимирующая кривая «притягивается» к данной точке. В дальнейшем будем по умолчанию полагать ρ = 1 для всех точек.

Рассмотрим случай линейной аппроксимации :

φ(x) = c 0 φ 0 (x) + c 1 φ 1 (x) + … + c m φ m (x) , (2)

где φ 0 …φ m – произвольные базисные функции , c 0 …c m – неизвестные коэффициенты, m < n . Если число коэффициентов аппроксимации взять равным числу узлов, то среднеквадратичная аппроксимация совпадет с интерполяцией Лагранжа, при этом, если не учитывать вычислительную погрешность, Q = 0.

Если известна экспериментальная (исходная) погрешность данных ξ , то выбор числа коэффициентов, то есть величины m , определяется условием:

Иными словами, если , число коэффициентов аппроксимации недостаточно для правильного воспроизведения графика экспериментальной зависимости. Если , многие коэффициенты в (2) не будут иметь физического смысла.

Для решения задачи линейной аппроксимации в общем случае следует найти условия минимума суммы квадратов отклонений для (2). Задачу на поиск минимума можно свести к задаче поиска корня системы уравнений , k = 0…m . (4) .

Подстановка (2) в (1), а затем расчет (4) приведет в итоге к следующей системе линейных алгебраических уравнений:

Далее следует решить полученную СЛАУ относительно коэффициентов c 0 …c m . Для решения СЛАУ обычно составляется расширенная матрица коэффициентов, которую называют матрицей Грама , элементами которой являются скалярные произведения базисных функций и столбец свободных коэффициентов:

где , , j = 0…m, k = 0…m .

После того как с помощью, например, метода Гаусса найдены коэффициенты c 0 …c m , можно построить аппроксимирующую кривую или вычислить координаты заданной точки. Таким образом, задача аппроксимации решена.

Аппроксимация каноническим полиномом.

Выберем базисные функции в виде последовательности степеней аргумента x:

φ 0 (x) = x 0 = 1; φ 1 (x) = x 1 = x ; φ m (x) = x m , m < n .

Расширенная матрица Грама для степенного базиса будет выглядеть следующим образом:

Особенность вычислений такой матрицы (для уменьшения количества выполняемых действий) состоит в том, что необходимо сосчитать только элементы первой строки и двух последних столбцов: остальные элементы заполняются сдвигом предшествующей строки (за исключением двух последних столбцов) на одну позицию влево. В некоторых языках программирования, где отсутствует быстрая процедура возведения в степень, пригодится алгоритм расчета матрицы Грама, представленный далее.

Выбор базисных функций в виде степеней x не является оптимальным с точки зрения достижения наименьшей погрешности. Это является следствием неортогональности выбранных базисных функций. Свойство ортогональности заключается в том, что для каждого типа полинома существует отрезок [x 0 , x n ], на котором обращаются в нуль скалярные произведения полиномов разного порядка:

, j ≠ k, ρ – некоторая весовая функция.

Если бы базисные функции были ортогональны, то все недиагональные элементы матрицы Грама были бы близки к нулю, что увеличило бы точность вычислений, в противном случае при определитель матрицы Грама очень быстро стремится к нулю, т.е. система становится плохо обусловленной.

Аппроксимация ортогональными классическими полиномами.

Представленные ниже полиномы, относящиеся ко многочленам Якоби , обладают свойством ортогональности в изложенном выше смысле. То есть, для достижения высокой точности вычислений рекомендуется выбирать базисные функции для аппроксимации в виде этих полиномов.