МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ...

МИНИСТЕРСТВО НАУКИ И ВЫСШЕГО ОБРАЗОВАНИЯ РОССИЙСКОЙ ФЕДЕРАЦИИ

федеральное государственное бюджетное образовательное учреждение высшего образования

«УЛЬЯНОВСКИЙ ГОСУДАРСТВЕННЫЙ ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ»

А. В. Чихранов, В. В. Демидов

МАТЕМАТИЧЕСКИЕ МЕТОДЫ

ОБРАБОТКИ

ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Учебно-методическое пособие

Ульяновск УлГТУ

2019

2

УДК 303.722/.724(075.8) ББК 22.1я73 Ч 71

Рецензент – доктор техн. наук, доцент кафедры «Технология машиностроения» УлГТУ Унянин А. Н.

Рекомендовано научно-методической комиссией машиностроительного факультета в качестве

учебно-методического пособия к практическим занятиям

Чихранов, А. В.

Ч 71 Математические методы обработки экспериментальных данных : учебно-методическое пособие к практическим занятиям /

А. В. Чихранов, В. В. Демидов. Ульяновск : УлГТУ, 2019. 111 с. Учебно-методическое пособие предназначено для студентов высших

учебных заведений, обучающихся по направлению подготовки 15.04.05 – Конструкторско-технологическое обеспечение машиностроительных производств (магистерские программы «Станочные и инструментальные системы машиностроительных производств», «Технология машино-строения», «Конструкторско-технологическое обеспечение операций механической обработки») при изучении дисциплины «Математические методы обработки экспериментальных данных». В учебно-методическом пособии изложена методика математической обработки данных, полученных при проведении экспериментов в ходе выполнения различных исследований.

Учебно-методическое пособие подготовлено на кафедре «Металлорежущие станки и инструменты».

УДК 303.722/.724(075.8)

ББК 22.1я73

© Чихранов А. В., Демидов В. В., 2019 © Оформление. УлГТУ, 2019

3

СОДЕРЖАНИЕ

Введение ................................................................................................................ 4

Практическая работа № 1. Оценка показателей качества измерений

по результатам экспериментов ........................................................................... 5

Практическая работа № 2. Статистическая проверка гипотез ....................... 15

Практическая работа № 3. Корреляционный анализ ....................................... 27

Практическая работа № 4. Уравнение регрессии.

Метод наименьших квадратов. Однофакторная модель ................................. 40

Практическая работа № 5. Регрессионные однофакторные

нелинейные модели ............................................................................................. 47

Практическая работа № 6. Регрессионные многофакторные

линейные модели ................................................................................................. 60

Практическая работа № 7. Полный факторный эксперимент ........................ 74

Практическая работа № 8. Поиск оптимального решения ............................. 86

Примерные задания для выполнения практических работ ............................. 94

БИБЛИОГРАФИЧЕСКИЙ СПИСОК .............................................................. 110

4

«В каждой естественной науке заключено столько истины,

сколько в ней математики»

Иммануил Кант

Введение

Научное познание – это вид и уровень познания, направленный на

производство истинных знаний о действительности, открытие

объективных законов на основе обобщения реальных фактов. Одним из

методов научного познания является процесс моделирования, т.е.

замещения реального объекта наблюдения математической моделью –

набором функциональных математических зависимостей, в достаточной

мере описывающих поведение объекта при изучении влияния на него

различных факторов. Сложность описания какого-либо объекта

исследования с помощью такой математической модели зачастую связана

с влиянием на объект достаточно большого количества случайных

факторов. Их влияние изучается в ходе выполнения эксперимента. В связи

с этим возникает необходимость применения математико-статистических

методов для обработки полученных экспериментальных данных.

Современный уровень эксперимента характеризуется большим

количеством информации. При этом зачастую даже первоначальное

изучение экспериментальных данных, не говоря уже об анализе,

невозможно без использования специальных программных продуктов.

Появление табличных процессоров позволило значительно

расширить применение статистических методов обработки информации.

Развитие программного обеспечения привело к созданию большого

количества прикладных пакетов по статистической обработке, одним из

которых является табличный процессор Microsoft Excel. Поэтому

основной целью данных методических указаний является изложение

(в форме практических работ) численных методик решения основных

задач, возникающих в ходе обработки экспериментальных данных.

5

Практическая работа № 1.

Оценка показателей качества измерений

по результатам экспериментов

Цель работы: изучение показателей качества измерений и

определение закона распределения случайной величины.

Общие сведения

Обработка экспериментальных данных базируется на применении

так называемого выборочного метода.

Выборкой называют ту часть данных, которая получена из общей

(генеральной) совокупности, по отношению к которой на основании

данных выборки делают соответствующие выводы. При этом генеральная

совокупность подразумевает однородную совокупность данных, по

которой делаются выводы при принятии решения на основании

результатов анализа выборки.

Если выборка достаточно хорошо представляет соответствующие

характеристики генеральной совокупности, то такую выборку называют

представительной, или репрезентативной.

Выборочные данные являются случайными, так как невозможно

предсказать точные их значения до проведения измерений. Поэтому

измеряемую величину обычно называют случайной величиной.

Изменение фиксируемых значений случайной величины может быть

дискретным или непрерывным. Это имеет принципиальное значение, так

как распределение дискретных и непрерывных величин описывается

различными законами. Для дискретного распределения обычно

используют гипергеометрический, биноминальный или пуассоновский

6

законы. Для описания непрерывной величины могут быть использованы

закон нормального распределения (Гаусса) или закон Вейбулла.

Дискретным изменением случайной величины называют такое, при

котором рядом лежащие значения в ранжированном ряду отличаются одно

от другого на некоторую конечную (дискретную) величину (обычно целое

число). Примером такого изменения случайной величины может быть

число дефектных изделий в выборках, которые берутся при исследовании

технологического процесса. Непрерывным изменением случайной

величины называют такое, при котором рядом лежащие его значения в

ранжированном ряду отличаются одно от другого на сколь угодно малую

величину. Примером такого изменения случайной величины может быть

величина периода стойкости режущего инструмента.

Статистический материал удобно представлять числовыми

значениями, которые до некоторой степени отражают существенные

характеристики статистического ряда – характеристики положения и

рассеивания случайной величины.

К основным описательным характеристикам относятся:

- среднее арифметическое значение;

- максимальное и минимальное значения;

- размах;

- медиана;

- мода;

- выборочная дисперсия;

- стандартное отклонение (среднеквадратичное отклонение);

- коэффициент вариации.

Важнейшей характеристикой положения случайной величины 𝑥

является среднее арифметическое значение измеряемой величины для 𝑛

измерений:

7

�̅� = 1𝑛 𝑥 . (1.1)

При анализе и контроле пользуются также другими

характеристиками положения, в частности медианой и модой случайной

величины.

Медиана – это значение случайной величины, которое делит

упорядоченный ряд на две равные по объему группы. При нечетном числе

измерений, т.е. при 𝑛 = 2𝑖 + 1, значение параметра для случая 𝑖 + 1 будет

медианным. При четном числе измерений (𝑛 = 2𝑖) медианой является

среднее арифметическое двух значений, расположенных в середине ряда.

Модой случайной величины называется ее значение, которое

наиболее часто встречается в выборке.

Для отображения рассеивания в математической статистике

применяют ряд характеристик. Самой простой из них является размах 𝑅:

𝑅 = 𝑥 − 𝑥 . (1.2)

В качестве меры рассеивания используют выборочную дисперсию:

𝑆 = 1𝑛 − 1 (𝑥 − �̅�) . (1.3)

Вместо выборочной дисперсии 𝑆 часто применяют выборочное

стандартное отклонение 𝑆 (среднеквадратичное отклонение).

При проведении измерений случайной величины важно установить

величину доверительного интервала по данному числу измерений.

Доверительный интервал нужен для установления границ приближенного

8

оценивания случайного параметра, случайный характер которого

обусловлен рядом неучтенных факторов, влияющих на его значение.

Доверительный интервал гарантирует присутствие случайной величины в

оцениваемом интервале с заданной надежностью, или доверительной

вероятностью. В этом случае доверительный интервал запишется в виде:

�̅� − 𝜀 ≤ 𝑥 ≤ �̅� + 𝜀. (1.4)

Точность накрытия 𝜀 определяется по формуле:

𝜀 = 𝑡𝑆√𝑛 , (1.5)

где 𝑡 – коэффициент (параметр распределения) Стьюдента, определяемый

для уровня значимости 𝛼 и числа степеней свободы 𝑓 = (𝑛 − 1).

Величину, характеризующую точность метода измерений, называют

коэффициентом вариации:

𝜈 = 𝑆�̅�. (1.6)

Важным этапом обработки экспериментальных данных является

определение закона распределения исследуемой случайной величины по

выборочным данным.

Для построения интервального вариационного ряда количество

интервалов разбиения определяют по формуле Стерджесса:

𝑘 ≈ 1 + log 𝑛. (1.7)

9

Полученное значение 𝑘 округляется до целого значения.

Длина частичных интервалов определяется по формуле, а

полученное значение при необходимости округляется до некоторого

числа:

ℎ = 𝑅𝑘. (1.8)

Для построения графического представления интервального

вариационного ряда (гистограммы) используют зависимость

распределения частот 𝑛 в каждом интервале разбиения.

Гистограммой называется ступенчатая фигура, для построения ко-

торой по оси абсцисс откладывают отрезки, изображающие интервалы

варьирования измеренной величины, и на этих отрезках, как на ос-

нованиях, строят прямоугольники с высотами, равными частотам

соответствующих интервалов. На рис. 1 показан пример такой

гистограммы.

Построенная гистограмма позволяет сделать предположение о виде

распределения случайной величины: равномерном, показательном,

нормальном и т.д. На практике чаще всего встречается закон

распределения Гаусса (закон нормального распределения).

В аналитическом виде этот закон выражается уравнением Гаусса для

плотности вероятности при данном значении 𝑥:

𝑓(𝑥) = 1𝑆√2𝜋 𝑒 ( ) . (1.9)

10

Рис. 1.1. Гистограмма и кривая нормального распределения

теоретических частот

Значение теоретической частоты для каждого интервала можно

определить по формуле:

𝑛т = ℎ ∙ 𝑛 ∙ 𝑓(𝑥 ) , (1.10)

где 𝑥 – среднее значение величины на i-ом интервале.

На рис. 1.1 показана кривая нормального распределения

теоретических частот.

Для проверки соответствия распределения измеренных величин

нормальному закону можно использовать критерий Пирсона, который для

предполагаемого закона распределения сопоставляет выборочные 𝑛 и

теоретические 𝑛т частоты по всем интервалам группировки:

𝜒 = (𝑛 − 𝑛т )𝑛т . (1.11)

11

Наблюдаемую величину 𝜒 сравнивают со значением, которое

определяют по таблице критических точек 𝜒 -распределения. Для этого

задаются уровнем значимости α и числом степеней свободы 𝑟 = 𝑘 − 1.

Если 𝜒 < 𝜒кр, то выбранное распределение генеральной совокупности не

противоречит данным наблюдений.

С целью автоматизации вычислений, связанных с обработкой

экспериментальных данных, возможно применение приложения Microsoft

Excel, которое предлагает широкий спектр возможностей по

статистической обработке и графической визуализации полученных

результатов. В табл. 1.1 представлен набор встроенных статистических

функций с их кратким описанием, которые используются в данной работе.

Таблица 1.1. Некоторые статистические функции Microsoft Excel

Номер Функция Описание

1 2 3 1 СЧЕТ Функция СЧЁТ подсчитывает количество

ячеек, содержащих числа, и количество чисел

в списке аргументов. Функция используется

для получения количества числовых ячеек в

диапазонах или массивах ячеек

2 МИН Возвращает наименьшее значение в списке

аргументов

3 МАКС Возвращает наибольшее значение в списке

аргументов

4 СРЗНАЧ Возвращает среднее значение (среднее

арифметическое) аргументов

5 МЕДИАНА Возвращает медиану (число, которое является

серединой множества чисел) заданных чисел

12

Окончание табл. 1.1

1 2 3 6 МОДА Возвращает наиболее часто встречающееся

или повторяющееся значение в массиве или

интервале данных

7 ДИСП Определяет выборочную дисперсию для

диапазона или массива ячеек

8 СТАНДОТКЛОН Определяет стандартное (среднеквадратичное)

отклонение для диапазона или массива ячеек

9 СТЬЮДРАСПОБР Возвращает t-значение распределения

Стьюдента как функцию вероятности и числа

степеней свободы

10 ЧАСТОТА Вычисляет накопленную частоту появления

значений в интервале значений и возвращает

массив чисел. Поскольку данная функция

возвращает массив, она должна задаваться в

качестве формулы массива.

11 НОРМРАСП Возвращает нормальную функцию

распределения для указанного среднего и

стандартного отклонения.

12 ХИ2ОБР Возвращает значение, обратное

односторонней вероятности распределения

Пирсона хи-квадрат. Данная функция

позволяет сравнить наблюдаемые результаты

с ожидаемыми, чтобы определить, была ли

верна исходная гипотеза.

13

Содержание работы

Работа выполняется на персональном компьютере с использованием

приложения Microsoft Excel.

1. Оценка качества измерений выполняется с расчетом следующих

показателей:

- среднего арифметического значения;

- максимального и минимального значений;

- размаха;

- медианы;

- моды;

- выборочной дисперсии;

- стандартного отклонения.

2. Определение закона распределения исследуемой величины по

выборочным данным производится в следующей последовательности:

- расчет количества интервалов разбиения;

- расчет для каждого интервала частоты появления значений;

- построение гистограммы распределения;

- расчет значения теоретических частот по средним значениям

величин для каждого i-ого интервала;

- построение кривой нормального распределения теоретических

частот;

- расчет величины критерия Пирсона 𝜒 ;

- определение критического значения критерия Пирсона 𝜒кр;

- сравнение расчетного значения критерия Пирсона с критическим.

14

Задание для самостоятельного выполнения работы

1. Ознакомиться с методикой и содержанием работы.

2. Провести расчеты показателей качества измерений согласно

выданному заданию.

3. Провести расчет характеристик распределения исследуемой

величины по выборочным данным. Построить гистограмму распределения

и кривую нормального распределения. Рассчитать величину критерия

Пирсона и сравнить ее с критическим значением. Сделать вывод о

соответствии распределения измеренных величин нормальному закону.

Контрольные вопросы

1. Перечислите описательные характеристики положения и

рассеивания случайной величины и объясните их математический смысл.

2. Дайте объяснение доверительному интервалу случайной

величины.

3. Поясните построение гистограммы распределения случайной

величины. Ее назначение.

4. Поясните порядок проверки соответствия распределения

случайных величин закону распределения.

15


Статистическая проверка гипотез

Цель работы: изучение критериев оценки статистических гипотез.


Статистическая гипотеза – предположение относительно

статистических параметров генеральной совокупности или закона

распределения случайных величин, проверяемое на основе выборочных

данных.

Основная проверяемая гипотеза (нулевая гипотеза) обычно

обозначается 𝐻 . Одновременно формулируется альтернативная, или

конкурирующая, гипотеза 𝐻 . Например, если проверяется равенство

среднего арифметического генеральной совокупности некоторому

значению 𝜇 , нулевая гипотеза 𝐻 : �̅� = 𝜇 , альтернативная гипотеза 𝐻 : �̅� ≠ 𝜇 .

Критерием статистической гипотезы называют правило,

позволяющее принять или отвергнуть гипотезу на основании выборки из

генеральной совокупности. Принимая или отклоняя гипотезу 𝐻 , можно

допустить ошибки двух видов.

Ошибка первого рода состоит в том, что гипотеза 𝐻 отвергается, в

то время как в действительности она верна, ошибка второго рода –

гипотеза 𝐻 принимается, в то время как верна гипотеза 𝐻 .

Вероятность ошибки первого рода обозначается 𝛼. Ее часто

называют уровнем значимости критерия гипотезы. Вероятность ошибки

второго рода обозначается 𝛽.

16

Вероятность 1 − 𝛽 принятия гипотезы 𝐻 , когда она верна,

называется мощностью критерия гипотезы 𝐻 относительно

альтернативной гипотезы 𝐻 .

Очевидно, что при проверке гипотезы 𝐻 относительно

альтернативной гипотезы 𝐻 лучшим является тот критерий, который

обеспечивает наибольшую мощность при том же самом уровне

значимости 𝛼.

Если вид распределения или функция распределения выборки нам

заданы, то в этом случае задача оценки различий двух групп независимых

наблюдений может решаться с использованием параметрических

критериев статистики: либо критерия Стьюдента (𝑡), если сравнение

выборок ведется по средним значениям, либо с использованием критерия

Фишера (𝐹), если сравнение выборок ведется по их дисперсиям.

В некоторых случаях используются критерии Кохрена (G) и Аббе (A).

Применение критерия Стьюдента.

1. Проверка гипотезы о равенстве среднего арифметического

значения заданному значению.

Пусть сформулирована нулевая гипотеза 𝐻 : �̅� = 𝜇 и

альтернативная гипотеза 𝐻 : �̅� ≠ 𝜇 .

Выборка наблюдений объемом 𝑛 для проверки нулевой гипотезы

осуществляется из генеральной совокупности значений случайной

величины, распределенных по нормальному закону.

Оценкой математического ожидания по выборке будет среднее

арифметическое �̅�, рассчитываемое по формуле (1.1), а оценкой дисперсии

– величина 𝑆 , определяемая по формуле (1.3).

Для проверки нулевой гипотезы вычисляется наблюдаемое

значение критерия Стьюдента:

17

𝑡н = |�̅� − 𝜇 |√𝑛𝑆 . (2.1)

Полученное наблюдаемое значение критерия Стьюдента

сравнивается с критическим, определяемым для выбранной доверительной

вероятности 𝑃 = 1 − 𝛼 и заданного объема выборки 𝑛 (числа степеней

свободы 𝑓 = (𝑛 − 1)) из таблицы критических значений критерия

Стьюдента. При 𝑡н < 𝑡 можно считать, что данные выборки

не противоречат нулевой гипотезе 𝐻 . Если 𝑡н > 𝑡, то гипотеза отвергается.

2. Проверка гипотезы о равенстве средних арифметических

значений.

Пусть выборки наблюдений объемами 𝑛 и 𝑛 берутся из двух

генеральных совокупностей с нормальным распределением.

Необходимо проверить гипотезу 𝐻 о равенстве средних

арифметических значений �̅� = �̅� .

В случае несвязанных независимых выборок наблюдаемое значение

критерия Стьюдента рассчитывается по формуле:

𝑡н = |�̅� − �̅� |𝑆о 1𝑛 + 1𝑛 , (2.2)

где объединенная оценка дисперсии генеральных совокупностей 𝑆

рассчитывается как:

𝑆о = (𝑛 − 1)𝑆 + (𝑛 − 1)𝑆𝑛 + 𝑛 − 2 . (2.3)

18

Критическое значение критерия определяется для данной

доверительной вероятности 𝑃 = 1 − 𝛼 и заданного объема выборки 𝑛 = 𝑛 + 𝑛 (числа степеней свободы 𝑓 = (𝑛 + 𝑛 − 2)).

При 𝑡н < 𝑡 нулевая гипотеза 𝐻 принимается. Если 𝑡н > 𝑡, то

гипотеза отвергается.

Рассмотренные формулы (2.2) и (2.3) приемлемы для случая, когда 𝑛 < 20 и 𝑛 < 20. В случае, когда объем выборок превышает эти

значения, то критерий 𝑡н вычисляется по формуле:

𝑡н = |�̅� − �̅� |𝑆𝑛 + 𝑆𝑛 . (2.4)

3. Оценка существенности различия коэффициентов вариации.

Для оценки существенности различия коэффициентов вариации

используется t-критерий Стьюдента, который подсчитывается по формуле:

𝑡н = |𝜈 − 𝜈 |𝜈2𝑛 + 𝜈2𝑛 . (2.5)

При 𝑡н > 3 различие коэффициентов вариации полагают значимым.

Применение критерия Фишера и критерия Кохрена.

4. Проверка гипотезы о равенстве (однородности) дисперсий.

При обработке экспериментальных данных часто требуется выяснить

вопрос об однородности выборочных дисперсий, т.е. их равенстве

дисперсии генеральной совокупности. Если сравниваемые дисперсии

однородны, то можно делать вывод о равенстве случайных ошибок в двух

19

выборках или об одинаковой воспроизводимости измерений в них. Метод

сравнения двух дисперсий используется для сопоставления случайных

ошибок двух методов измерения, средств измерения, исследователей,

лабораторий.

Пусть для двух независимых выборок из нормальной генеральной

совокупности с объемами 𝑛 и 𝑛 вычислены оценки выборочных

дисперсий 𝑆 и 𝑆 согласно формуле (1.3).

Требуется проверить нулевую гипотезу 𝐻 : 𝑆 = 𝑆 относительно

альтернативной гипотезы 𝐻 : 𝑆 > 𝑆 .

Проверка проводится при помощи критерия Фишера 𝐹.

Наблюдаемое значение критерия

𝐹н = 𝑆𝑆 𝑆 > 𝑆𝐹н = 𝑆𝑆 𝑆 < 𝑆 (2.6)

сравнивается с критическим 𝐹, которое определяется из таблицы

критических значений критерия Фишера для выбранных доверительной

вероятности 𝑃 = 1 − 𝛼 и 𝑛 и 𝑛 . Если 𝐹н < 𝐹, то выборочные данные

не противоречат нулевой гипотезе.

При анализе выборочных данных могут выдвигаться гипотезы об

однородности дисперсий в нескольких выборках.

В этом случае можно использовать критерий Кохрена.

𝐺н = 𝑆∑ 𝑆 , (2.7)

20

где 𝑆 – максимальная оценка дисперсии среди 𝑚 сравниваемых

дисперсий (все 𝑚 выборок имеют одинаковый объем 𝑛).

Критическое значение критерия определяется из таблицы

критических значений критерия Кохрена в зависимости от принятых

доверительной вероятности 𝑃 = 1 − 𝛼, объема выборок 𝑛 и их числа 𝑚.

Применение критерия Аббе.

5. Проверка гипотезы о стохастической независимости элементов

выборки.

Основное требование при проведении выборочного исследования –

это случайность попадания элементов генеральной совокупности

в выборку. Поэтому перед тем как приступить к статистической обработке

результатов наблюдений, необходимо убедиться в том, что элементы

выборки образуют случайную последовательность, являются

стохастически независимыми (альтернативами здесь могут быть

пристрастный выбор, зависимость результатов наблюдения от порядкового

номера наблюдения, например по мере роста порядкового номера

наблюдения среднее исследуемого распределения испытывает какие-либо

смещения монотонного или циклического характера, и т.д.). Существует

ряд критериев для проверки наличия или отсутствия неслучайной

(систематической) и зависящей от времени составляющей (тренда). При

нормальном распределении элементов выборки наиболее мощным

критерием оценки является критерий квадратов последовательных

разностей (критерий стохастической независимости Аббе).

Критерий применяется для обнаружения изменяющейся во времени

систематической составляющей и состоит в следующем. Выборочную

дисперсию результатов наблюдений можно оценить двумя способами:

- обычным (по формуле (1.3));

- вычислением суммы квадратов последовательных (в порядке

проведения измерений) разностей:

21

𝑄 = 12(𝑛 − 1) (𝑥 − 𝑥 ) . (2.8)

Если в процессе измерений происходило смещение центра

группирования результатов наблюдений (т.е. имел место тренд), то

дисперсия дает преувеличенную оценку рассеяния результатов

наблюдений. В то же время изменения центра группирования весьма мало

сказываются на значениях последовательных разностей (𝑥 − 𝑥 ).

Критерием для обнаружения систематических смещений центра

группирования результатов наблюдений является отношение:

𝐴н = 𝑄𝑆 . (2.9)

Полученное расчетное значение сравнивается с критическим 𝐴, которое

определяется из таблицы критических значений критерия Аббе для

выбранных доверительной вероятности 𝛼 и 𝑛. Если 𝐴н > 𝐴, то

принимается гипотеза об отсутствии тренда.

Для нахождения критических значений критерия Аббе при 7 < 𝑛 < 60 можно воспользоваться регрессионными зависимостями:

𝐴 , = −4,5024 ∙ 10 𝑛 + 8,8641 ∙ 10 𝑛 − − 7,0892 ∙ 10 𝑛 + 3,0653 ∙ 10 𝑛 − 1,5862 ∙ 10

(2.10)𝐴 , = −8,6981 ∙ 10 𝑛 + 1,5222 ∙ 10 𝑛 − −1,039 ∙ 10 𝑛 + 3,6396 ∙ 10 𝑛 + 0,1007 𝐴 , = −1,1424 ∙ 10 𝑛 + 1,8834 ∙ 10 𝑛 −−1,1798 ∙ 10 𝑛 + 3,637 ∙ 10 𝑛 + 0,2641.

22

Таблица 2.1. Критические значения критерия Аббе

𝑛 𝛼 𝑛

𝛼

0,999 0,99 0,95 0,999 0,99 0,95

4 0,2949 0,3128 0,3902 33 0,5027 0,6141 0,7216

5 0,2080 0,2690 0,4102 34 0,5090 0,6193 0,7256

6 0,1817 0,2808 0,4451 35 0,5150 0,6242 0,7292

7 0,1848 0,3070 0,4680 36 0,5208 0,6290 0,7328

8 0,2018 0,3314 0,4912 37 0,5265 0,6337 0,7363

9 0,2210 0,3544 0,5121 38 0,5319 0,6381 0,7396

10 0,2408 0,3759 0,5311 39 0,5373 0,6425 0,7429

11 0,2598 0,3957 0,5482 40 0,5425 0,6467 0,7461

12 0,2778 0,4140 0,5638 41 0,5475 0,6508 0,7491

13 0,2949 0,4309 0,5778 42 0,5524 0,6548 0,7521

14 0,3112 0,4466 0,5908 43 0,5571 0,6587 0,7550

15 0,3266 0,4611 0,6027 44 0,5616 0,6622 0,7576

16 0,3413 0,4746 0,6137 45 0,5660 0,6659 0,7603

17 0,3552 0,4872 0,6237 46 0,5701 0,6693 0,7628

18 0,3684 0,4989 0,6330 47 0,5743 0,6727 0,7653

19 0,3809 0,5100 0,6417 48 0,5781 0,6757 0,7676

20 0,3926 0,5203 0,6498 49 0,5817 0,6787 0,7698

21 0,4037 0,5301 0,6574 50 0,5853 0,6814 0,7718

22 0,4142 0,5393 0,6645 51 0,5887 0,6842 0,7739

23 0,4241 0,5479 0,6713 52 0,5922 0,6869 0,7759

24 0,4334 0,5562 0,6776 53 0,5955 0,6896 0,7779

25 0,4423 0,5639 0,6836 54 0,5989 0,6924 0,7799

26 0,4509 0,5713 0,6893 55 0,6020 0,6949 0,7817

27 0,4591 0,5784 0,6946 56 0,6051 0,6974 0,7836

28 0,4670 0,5850 0,6996 57 0,6083 0,6999 0,7853

29 0,4748 0,5915 0,7046 58 0,6114 0,7024 0,7872

30 0,4822 0,5975 0,7091 59 0,6145 0,7049 0,7891

31 0,4895 0,6034 0,7136 60 0,6174 0,7071 0,7906

32 0,4963 0,6089 0,7177

23

Приложение Microsoft Excel дает возможность использовать

статистические критерии для оценки гипотез. В табл. 2.2 представлен

набор встроенных статистических функций с их кратким описанием,

которые используются в данной работе.

В Microsoft Excel отсутствует встроенная функция для расчета

критического значения критерия Кохрена. Но известно, что распределение

Кохрена можно аппроксимировать распределением Фишера. При этом

распределения связаны соотношением:

𝐺 = 𝐹РАСПОБР(𝑝𝑓 ; 𝑚; (𝑛 − 2)𝑚)𝐹РАСПОБР 𝑝𝑓 ; 𝑚; (𝑛 − 2)𝑚 + 𝑛 − 2 , (2.11)

где 𝑓 – число степеней свободы 𝑚 выборок (𝑓 = 𝑛 − 1).

Таблица 2.2. Некоторые статистические функции Microsoft Excel


1 2 3

1 СЛУЧМЕЖДУ Возвращает случайное целое число,

находящееся в диапазоне между двумя

заданными числами. При каждом

вычислении листа возвращается новое

случайное целое число. (Применение

функции удобно для случайного выбора 𝑛

значений из генеральной совокупности).

24


1 2 3 2 FРАСП Возвращает F-распределение вероятности

(распределение Фишера). Эта функция

позволяет определить, имеют ли два множества

данных различные степени разброса

результатов. 𝐹РАСП(𝑥; 𝑓 ; 𝑓 ) 𝑥 – значение, для которого вычисляется

функция; 𝑓 – число степеней свободы дисперсии

числителя; 𝑓 – число степеней свободы

дисперсии знаменателя.

Т.е. функция показывает предельное значение

вероятности 𝑃, для которого дисперсии двух

выборок однородны.

3 FРАСПОБР Возвращает значение обратное F-

распределению вероятностей (распределению

Фишера). Если 𝑃 = 𝐹РАСП(𝑥; . . . ), то 𝐹РАСПОБР(𝑃; . . . ) = 𝑥.

F-распределение может использоваться в F-

тесте, который сравнивает степени разброса

двух множеств данных. 𝐹РАСПОБР(𝑝; 𝑓 ; 𝑓 ) 𝑝 – вероятность, связанная с F-распределением;𝑓 – число степеней свободы дисперсии

числителя; 𝑓 – число степеней свободы

дисперсии знаменателя.

25




Оценка статистических гипотез проводится с использованием

критериев Стьюдента, Фишера, Кохрена, Аббе. При этом возможна оценка

следующих гипотез:

- определение равенства среднего арифметического значения

заданному значению;

- сравнение средних арифметических значений двух разных выборок;

- определение существенности различия коэффициентов вариации

для двух выборок;

- определение однородности дисперсий для двух выборок и для

нескольких выборок одновременно;

- определение стохастической независимости элементов выборки.



2. Выдвинуть статистические гипотезы для проверки

экспериментальных данных согласно выданному заданию.

3. Провести расчеты критериальных показателей. Для расчетов

произвести случайную выборку экспериментальных данных из

генеральных совокупностей в количестве 30 значений при использовании

критериев Стьюдента и Аббе и 10 значений при использовании критериев

Фишера и Кохрена.

4. Сделать вывод о подтверждении выдвинутых статистических

гипотез.

26


1. Перечислите возможные статистические задачи, которые

решаются при исследовании технологических процессов.

2. Объясните, что принимается в качестве статистической гипотезы

при исследованиях.

3. Поясните, с чем связано возникновение ошибок при принятии

статистических гипотез.

4. Дайте объяснение, каким образом осуществляется подбор

критерия для решения задач анализа технологических процессов.

5. Объясните, каким образом сравниваются статистические

характеристики случайных величин.

6. Поясните примерами возможность использования критериев

Стьюдента, Фишера, Кохрена и Аббе в исследовании технологических

процессов.

27


Корреляционный анализ

Цель работы: изучение основ корреляционного анализа и

определение коэффициента корреляции.


В математическом анализе зависимость между двумя величинами

выражается понятием функции 𝑦 = 𝑓(𝑥), где каждому допустимому

значению одной переменной соответствует одно и только одно значение

другой переменной. Такая зависимость носит название функциональной;

она обнаруживается с помощью строгих логических доказательств и не

нуждается в опытной проверке.

Между случайными величинами, как правило, может существовать

лишь связь особого рода, при которой с изменением одной величины

меняется распределение другой, – такая связь называется стохастической.

Изменение случайной величины 𝑦, соответствующее изменению

величины 𝑥, разбивается при этом на две компоненты: стохастическую

(связанную с зависимостью 𝑦 от 𝑥) и случайную (связанную с влиянием

«собственных» случайных факторов величин 𝑥 и 𝑦). Если первая

компонента отсутствует, то величины 𝑦 и 𝑥 независимы. Если же

стохастическая компонента не равна нулю, то между 𝑦 и 𝑥 есть

стохастическая связь. При этом соотношение между стохастической и

случайной компонентами определяет тесноту (силу) связи (понятие,

лишенное смысла, для функциональной зависимости). Наконец, отсутствие

второй компоненты дает функциональную зависимость. Выявление

стохастической связи и оценка ее силы представляют важную и трудную

28

задачу математической статистики. Такие статистические зависимости

изучаются теорией корреляции, являющейся одним из важных разделов

математической статистики. Отыскание формы зависимости является

первой основной задачей теории корреляции. Второй задачей является

определение тесноты корреляционной связи между рассматриваемыми

переменными.

Сам термин «корреляция» был введен в науку выдающимся

английским естествоиспытателем Френсисом Гальтоном в 1886 году.

Однако математический аппарат корреляционного анализа разработал его

ученик Карл Пирсон.

Основная задача корреляционного анализа – выявление значимости

связи между значениями различных случайных величин. Мера

зависимости между величинами характеризуется коэффициентом кор-

реляции или корреляционными отношениями.

Наиболее часто корреляционный анализ проводится для выявления

тесноты связи двух переменных. В этом случае для проведения

корреляционного анализа удобно начать с построения поля корреляции –

двумерной диаграммы поля разброса исследуемых переменных (рис. 1).

Анализ данной диаграммы начинают с формирования общего

представления распределения совокупности исследуемых данных, затем

проводится анализ на наличие выбросов (далеко отстоящих точек),

которые скорее всего связаны либо с ошибками сбора данных, либо с

изменениями условий работы. После анализа появления таких точек их

можно исключить из диаграммы. После этого на поле корреляции

распределение скорее всего будет соответствовать одному из типовых.

Если точки корреляционного поля образуют эллипс, главная

диагональ которого имеет положительный угол наклона, то имеет место

положительная корреляция (рис. 1, а). Если точки корреляционного поля

29

образуют эллипс, главная диагональ которого имеет отрицательный угол

наклона, то имеет место отрицательная корреляция (рис. 1, б). Если

расположение точек по внешнему виду напоминает одну из нелинейных

функций, то говорят, что наблюдается криволинейная (нелинейная)

корреляция. Если же в расположении точек нет какой-либо

закономерности, то говорят, что в этом случае наблюдается нулевая

корреляция.

а

б

в

г

Рис. 3.1. Поле корреляции: а – положительная линейная; б – отрицательная линейная;

в – нелинейная; г – нулевая

После визуального анализа распределения переходят к анализу,

основанному на расчете корреляционных параметров.

30

Для определения тесноты связи между исследуемыми величинами в

случае линейной корреляционной связи используют величину

коэффициента корреляции.

Выборочный коэффициент корреляции определяется по формуле:

𝑟 = 𝑛𝑛 − 1 𝑥𝑦 − �̅� ∙ 𝑦𝑆 ∙ 𝑆 . (3.1)

Очень часто используют видоизмененные формулы для вычисления

выборочного коэффициента корреляции:

𝑟 = ∑(𝑥 − �̅�) ∙ (𝑦 − 𝑦)∑(𝑥 − �̅�) ∙ ∑(𝑦 − 𝑦) . (3.2)

Выборочный коэффициент корреляции в данном случае выражен

только с помощью отклонений от средних арифметических значений, так

что все вычисления становятся однотипными. Когда производится расчет

корреляционного уравнения, выборочный коэффициент корреляции

удобно рассчитывать по следующей формуле:

𝑟 = 𝑛 ∑ 𝑥 𝑦 − ∑ 𝑥 ∑ 𝑦𝑛 ∑ 𝑥 − (∑ 𝑥 ) 𝑛 ∑ 𝑦 − (∑ 𝑦 ) . (3.3)

Выборочный коэффициент корреляции изменяется на отрезке [−1; 1], т.е. 𝑟 ≤ 1. Если 𝑟 = ±1, то корреляционная зависимость

становится функциональной. В случае 𝑟 > 0 говорят о положительной

корреляции величин 𝑥 и 𝑦, в случае 𝑟 < 0 – об отрицательной

31

корреляции. Если 𝑟 = 0, то линейная связь между признаками 𝑥 и 𝑦

отсутствует, но может существовать криволинейная корреляционная связь

или нелинейная функциональная.

Для получения выводов о количественной оценке тесноты линейной

корреляционной связи используют шкалу Чеддока (табл. 3.1).

Величина 𝑟 называется коэффициентом детерминации (для

линейной связи), который показывает, какую долю дисперсии величины 𝑦

можно объяснить зависимостью 𝑦 от 𝑥 (оставшаяся часть дисперсии 𝑆

характеризует степень разброса значений признака 𝑦 в зависимости от

прочих, кроме 𝑥, факторов).

Таблица 3.1. Шкала Чеддока

Теснота связи Величина 𝑟

положительная отрицательная

Линейной связи нет 0…0,2 -0,2…0

Слабая 0,2…0,5 -0,5…-0,2

Средняя 0,5…0,75 -0,75…-0,5

Сильная 0,75…0,95 -0,95…-0,75

Функциональная 0,95…1 -1…-0,95

Значимость выборочного коэффициента корреляции проверяют по

критерию Стьюдента. По опытным данным вычисляют расчетный

коэффициент Стьюдента:

𝑡н = 𝑟 𝑓1 − 𝑟 . (3.4)

32

Расчетный коэффициент Стьюдента сравнивают с табличным 𝑡,

определяемым для доверительной вероятности 𝛼 и числа степеней свободы 𝑓 = (𝑛 − 2). Если 𝑡н < 𝑡, то коэффициент корреляции 𝑟 незначимый (мало

отличается от нуля) и признаки 𝑥 и 𝑦 некоррелированы. Если 𝑡н < 𝑡, то

приходят к выводу о наличии линейной корреляционной связи.

Используя выборочный коэффициент корреляции, кроме того, легко

рассчитать параметры линейной зависимости 𝑦 = 𝑓(𝑥):

𝑦 = 𝑏 + 𝑏 𝑥, (3.5)

где коэффициенты уравнения определяются по формулам:

𝑏 = 𝑟 𝑆𝑆𝑏 = 𝑦 − 𝑏 ∙ �̅�. (3.6)

Для оценки линейной связи одного из признаков со всеми

остальными (факторами) используется множественный (совокупный)

коэффициент корреляции.

В отличие от парной корреляции, где рассматривается взаимосвязь

двух переменных, в множественном корреляционном анализе исследуют

взаимосвязи многих показателей. При этом могут исследоваться две

задачи:

- влияние на один какой-либо показатель совокупности факторов;

- анализ взаимосвязи двух каких-либо факторов при исключении

влияния на них других факторов.

Множественный корреляционный анализ основывается на

определении парной корреляции для каждой пары из 𝑚 случайных

33

величин. Из полученных парных коэффициентов корреляции составляется

корреляционная матрица:

𝐾 = 1 𝑟 … 𝑟𝑟 1 … 𝑟… … 1 …𝑟 𝑟 … 1 . (3.7)

Для измерения интенсивности совместного влияния всех факторов

на изучаемый признак используется коэффициент множественной

корреляции, который рассчитывается на основе следующего соотношения:

𝑅 = 1 − 𝐷𝐷 , (3.8)

где 𝐷 – определитель полной матрицы корреляции; 𝐷 – минор элемента

матрицы, находящегося на пересечении -ой строки и 𝑖-го столбца.

Границы изменения коэффициента множественной корреляции

от 0 до 1. Чем ближе его значение к единице, тем теснее связь

изучаемого признака со всем набором факторов.

Часто для пояснения, какие факторы влияют на исследуемый

признак, используется следующее обозначение коэффициента

множественной корреляции: первым индексом записывается исследуемый

признак, а далее через запятую факторы, влияющие на него (например,

запись 𝑅 , означает, что исследуется влияние закодированных второго и

третьего признаков на первый).

Для случая трех признаков 𝑥 , 𝑥 и 𝑥 множественный коэффициент

корреляции после преобразования формулы (3.8) оценивается по

формулам:

34

𝑅 , = 𝑟 + 𝑟 − 2𝑟 𝑟 𝑟1 − 𝑟 ,𝑅 , = 𝑟 + 𝑟 − 2𝑟 𝑟 𝑟1 − 𝑟 ,𝑅 , = 𝑟 + 𝑟 − 2𝑟 𝑟 𝑟1 − 𝑟 .

(3.9)

Значимость коэффициента множественной корреляции определяется

при помощи критерия Фишера. Наблюдаемое значение критерия Фишера

для выборки из 𝑛 значений и 𝑚 случайных величин определяется по

формуле:

𝐹н = 𝑅1 − 𝑅 𝑛 − 𝑚𝑚 − 1. (3.10)

Полученное значение 𝐹н необходимо сравнить с критическим 𝐹,

которое определяется для доверительной вероятности 𝑃 = 1 − 𝛼 и числа

степеней свободы 𝑓 = 𝑚 − 1 и 𝑓 = 𝑛 − 𝑚.

Если 𝐹н > 𝐹, то 𝑅 статистически значим. В противном случае

(𝐹н ≤ 𝐹) – статистически незначим.

Кроме коэффициента множественной корреляции, весьма полезным

в сфере исследований являются частные (чистые, парциальные)

коэффициенты корреляции, оценивающие степень связи одного

признака с одним фактором при исключении влияния всех прочих

факторов. Частные коэффициенты корреляции позволяют выявить

«чистую» зависимость признака от одного из факторов и установить,

каково было бы влияние этого фактора на величину признака при условии,

35

что влияние других (другого) факторов на этот признак исключается.

Частные коэффициенты могут быть разных порядков. Порядок

коэффициента корреляции определяется числом факторов, влияние

которых исключается.

В обозначении частного коэффициента корреляции первыми

индексами записываются исследуемые случайные величины, между

которыми определяется теснота связи, а далее через запятую факторы,

влияние которых исключается при корреляционном анализе.

Расчет частных коэффициентов корреляции может осуществляться

на основе вычисления алгебраических дополнений для элементов

корреляционной матрицы:

𝑟 , … = − 𝐷𝐷 ∙ 𝐷 , (3.11)

где 𝐷 , 𝐷 , 𝐷 – алгебраические дополнения соответственно к элементам 𝑟 , 𝑟 , 𝑟 корреляционной матрицы.

Пределы изменения частных коэффициентов корреляции и их

интерпретаций такие же, как и у парных коэффициентов корреляции.

Для случая трех признаков 𝑥 , 𝑥 и 𝑥 частные коэффициенты

корреляции оцениваются по формулам:

𝑟 , = 𝑟 − 𝑟 ∙ 𝑟(1 − 𝑟 ) ∙ (1 − 𝑟 ) ,𝑟 , = 𝑟 − 𝑟 ∙ 𝑟(1 − 𝑟 ) ∙ (1 − 𝑟 ) ,𝑟 , = 𝑟 − 𝑟 ∙ 𝑟(1 − 𝑟 ) ∙ (1 − 𝑟 ) . (3.12)

36

Значимость частных коэффициентов корреляции проверяют по

критерию Стьюдента по формуле:

𝑡н = |𝑟| 𝑓√1 − 𝑟 , (3.13)

где 𝑓 = (𝑛 − 2 − 𝑙) – число степеней свободы (𝑙 – число факторов, влияние

которых исключается).

Если 𝑡н > 𝑡 для доверительной вероятности 𝛼 и числа степеней

свободы 𝑓 = (𝑛 − 2 − 𝑙), то частный коэффициент корреляции

статистически значим. В противном случае (𝑡н < 𝑡) – статистически

незначим.

Для выявления «чистой» зависимости между признаками и влияния

на них исключаемых факторов необходимо сравнить частные и

соответствующие парные коэффициенты корреляции. Расчет парных и

частных коэффициентов корреляции и их последующее сравнение может

привести к одному из следующих выводов:

- если парный коэффициент корреляции больше частного

коэффициента, то исключенные факторы искажают взаимосвязь между

исследуемыми признаками в сторону ее увеличения;

- если парный коэффициент корреляции меньше частного

коэффициента, то исключенные факторы искажают взаимосвязь между

исследуемыми признаками в сторону ее уменьшения;

- если парный и частный коэффициенты корреляции приблизительно

равны между собой, то исключенные факторы практически не искажают

взаимосвязь между рассматриваемыми признаками.

37

Для расчета характеристик корреляции в приложении Microsoft Excel

возможно применение специальных встроенных функций, представленных

в табл. 3.2.

Таблица 3.2. Функции линейной регрессии Microsoft Excel


1 КОРРЕЛ Возвращает коэффициент корреляции между

интервалами ячеек «массив1» и «массив2».




1. Проведение корреляционного анализа между двумя случайными

величинами осуществляется в следующей последовательности:

- построение поля корреляции;

- определение типа связи между исследуемыми случайными

величинами;

- расчет средних значений случайных величин, их выборочных

дисперсий и стандартных отклонений;

- вычисление выборочного коэффициента корреляции и определение

его значимости;

- определение тесноты связи между исследуемыми случайными

величинами;

- расчет коэффициентов зависимости между величинами.

Расчет показателей осуществляется по формулам (3.1) – (3.6).

2. Проведение корреляционного анализа между несколькими

случайными величинами осуществляется в следующем порядке:

38

- определение выборочных коэффициентов корреляции для каждой

пары исследуемых случайных величин и определение их значимости;

- составление корреляционной матрицы;

- вычисление множественного коэффициента корреляции и его

значимости;

- определение частных коэффициентов корреляции и их значимости;

- сравнение парных и частных коэффициентов корреляции.

Расчет показателей осуществляется по формулам (3.1) – (3.4), (3.7) –

(3.13).



2. Согласно выданному заданию построить поле корреляции и

определить тип корреляции между случайными значениями исследуемых

величин. Провести расчет средних значений случайных величин, их

выборочные дисперсии и выборочный коэффициент корреляции.

Проверить значимость коэффициента выборочной корреляции, используя

критерий Стьюдента. Определить тесноту корреляционной связи по шкале

Чеддока. Рассчитать коэффициенты математической зависимости между

исследуемыми величинами.

3. Для проведения множественного корреляционного анализа для

данной выборки рассчитать выборочные коэффициенты корреляции между

тремя случайными величинами и определить тесноту связи между каждой

из пар случайных величин. На основе расчета выборочных коэффициентов

корреляции составить корреляционную матрицу и определить значение

множественного коэффициента корреляции влияния рассматриваемых

39

факторов на изучаемый признак. Используя критерий Фишера, определить

значимость множественного коэффициента корреляции.

Вычислить частные коэффициенты корреляции и определить их

значимость. На основе сравнения парных и частных коэффициентов

корреляции сделать выводы о влиянии исключенных факторов на

искажение взаимосвязи между исследуемыми признаками.


1. Дайте определение корреляционному анализу, приведите примеры

его применения в научных исследованиях.

2. Назовите и дайте определение видам связи между случайными

величинами.

3. Назовите основные задачи корреляционного анализа.

4. Приведите алгоритм проведения корреляционного анализа.

5. Поясните термин «поле корреляции».

6. Поясните порядок определения выборочного коэффициента

корреляции и его значимости.

7. Дайте объяснение термину «теснота корреляционной связи».

8. Поясните последовательность определения коэффициентов

линейной зависимости на основе корреляционных показателей.

9. Дайте определение задачам множественного корреляционного

анализа.

10. Поясните порядок определения множественного коэффициента

корреляции и его значимости.

11. Назначение частных коэффициентов корреляции в

множественном корреляционном анализе.

40


Уравнение регрессии. Метод наименьших квадратов.

Однофакторная модель

Цель работы: изучение метода наименьших квадратов и получение

уравнения регрессии линейной однофакторной модели.


Регрессионный анализ – статистический метод исследования

влияния одной или нескольких независимых переменных на зависимую

переменную. Целью регрессионного анализа является получение

математической зависимости между зависимой переменной и одной

(парный регрессионный анализ) или несколькими (множественный)

независимыми переменными. Независимые переменные называют также

факторными, объясняющими, определяющими, регрессорами и

предикторами. Зависимую переменную иногда называют определяемой,

объясняемой, «откликом». Чрезвычайно широкое распространение

регрессионного анализа в эмпирических исследованиях связано не только

с тем, что это удобный инструмент тестирования гипотез. Регрессия,

особенно множественная, является эффективным методом моделирования

и прогнозирования.

Среди методов регрессионного анализа наибольшее распространение

получил метод наименьших квадратов (МНК), который был разработан

Лежандром и Гауссом. Суть метода удобно рассматривать на примере

линейной модели, уравнение которой можно записать как:

𝑦 = 𝑏 + 𝑏 𝑥. (4.1)

41

Для нахождения уравнения необходимо вычислить коэффициенты 𝑏 , 𝑏 .

Если бы все экспериментальные (𝑥 , 𝑦 ) точки лежали строго на пря-

мой линии, то для каждой из них было бы справедливо равенство:

𝑦 − 𝑏 − 𝑏 𝑥 = 0, (4.2)

где 𝑖 = 1, 2, … , 𝑛 – номер уровня.

На практике это равенство нарушается и вместо него приходится

записать:

𝑦 − 𝑏 − 𝑏 𝑥 = 𝜉 , (4.3)

где 𝜉 – разность между экспериментальным и вычисленным по уравнению

регрессии значениями 𝑦 на i-ом уровне. Эту величину иногда называют

невязкой.

Невязка возникает по двум причинам: из-за ошибки эксперимента и

из-за непригодности модели. Причем эти причины смешаны и нельзя, не

получив дополнительной информации, сказать, какая из них преобладает.

Если постулировать, что модель пригодна, то тогда невязка будет

порождаться только ошибкой опыта.

Необходимо найти такие коэффициенты регрессии, при которых

невязки будут минимальны. Это требование можно записать по-разному.

В зависимости от этого получаются разные оценки коэффициентов. Для

МНК это требование имеет вид:

𝑈 = 𝜉 = 𝑚𝑖𝑛. (4.4)

42

Возможен и метод наименьших кубов и метод наименьших модулей,

но они обладают меньшей точностью при более сложных вычислениях.

Условие МНК – это удачный компромисс.

Так как число уровней больше, чем число неизвестных

коэффициентов, то система, состоящая из 𝑛 линейных уравнений (4.3),

оказывается переопределенной и часто противоречивой (т.е. она может

иметь бесконечно много решений или может не иметь решений).

Переопределенность возникает, когда число уравнений больше числа

неизвестных; противоречивость – когда некоторые из уравнений

несовместимы друг с другом. Только если все экспериментальные точки

лежат на прямой, то система становится определенной и имеет

единственное решение. МНК обладает тем замечательным свойством, что

он делает определенной любую произвольную систему уравнений. Он де-

лает число уравнений равным числу неизвестных коэффициентов.

Для линейной модели, согласно (4.1), необходимо определить два

коэффициента 𝑏 и 𝑏 и, следовательно, решить систему двух уравнений.

Уравнение (4.4) можно записать в следующем виде:

𝑈 = (𝑦 − 𝑏 − 𝑏 𝑥 ) = 𝑚𝑖𝑛. (4.5)

Из курса математики следует, что минимум некоторой функции,

если он существует, достигается при одновременном равенстве нулю

частных производных по всем неизвестным, т.е.:

𝜕𝑈𝜕𝑏 = 0, 𝜕𝑈𝜕𝑏 = 0. (4.6)

После подстановки (4.5) в (4.6) получаем:

43

𝜕 ∑ (𝑦 − 𝑏 − 𝑏 𝑥 )𝜕𝑏 = −2 (𝑦 − 𝑏 − 𝑏 𝑥 ) = 0,𝜕 ∑ (𝑦 − 𝑏 − 𝑏 𝑥 )𝜕𝑏 = −2 (𝑦 − 𝑏 − 𝑏 𝑥 )𝑥 = 0. (4.7)

Раскрыв скобки и преобразовав, можно получить следующие

выражения для коэффициентов 𝑏 и 𝑏 :

𝑏 = ∑ 𝑦 ∑ 𝑥 − ∑ 𝑦 𝑥 ∑ 𝑥𝑛 ∑ 𝑥 − ∑ 𝑥 ,𝑏 = 𝑛 ∑ 𝑦 𝑥 − ∑ 𝑦 ∑ 𝑥𝑛 ∑ 𝑥 − ∑ 𝑥 . (4.8)

Для линейной зависимости в приложении Microsoft Excel возможно

нахождение коэффициентов регрессии с использованием специальных

встроенных функций, представленных в табл. 4.1.

Таблица 4.1. Функции линейной регрессии Microsoft Excel


1 2 3 1 НАКЛОН Возвращает наклон линии линейной регрессии

для точек данных в аргументах «известные

значения y» и «известные значения x». Наклон

определяется как частное от деления

расстояния по вертикали на расстояние по

горизонтали между двумя любыми точками

прямой. Уравнение наклона прямой имеет вид: 𝑏 = ∑ (𝑥 − �̅�)(𝑥 − 𝑦)∑ (𝑥 − �̅�) .

44


1 2 3 2 ОТРЕЗОК Вычисляет точку пересечения линии с осью

ординат Оy, используя значения аргументов

«известные значения x» и «известные значения

y». Точка пересечения находится на оптималь-

ной линии регрессии, проведенной через точки,

заданные значениями в аргументах «известные

значения x» и «известные значения y».

Функция ОТРЕЗОК используется, когда нужно

определить значение зависимой переменной

при нулевом значении независимой

переменной, т.е. определить в уравнении

линейной регрессии значение 𝑏 .

В качестве примера на рис. 4.1 показан график линейной

регрессионной зависимости, полученной МНК.

Рис. 4.1. График уравнения регрессии линейной однофакторной модели

45




Расчеты сумм, необходимых для определения коэффициентов

регрессии, заносятся в табл. 4.2:

Таблица 4.2. Результаты промежуточных вычислений 𝑛 𝑥 𝑦 𝑥 𝑦 𝑥

1

2

…

𝑥 = 𝑦 = 𝑥 = 𝑦 𝑥 =

Расчет коэффициентов уравнения регрессии линейной

однофакторной модели осуществляется по формулам (4.8).

С помощью функций «НАКЛОН» и «ОТРЕЗОК» определяются

коэффициенты уравнения регрессии. Полученные данные сравниваются

с результатами расчетов по формулам (4.8).



2. Согласно выданному заданию провести расчет коэффициентов

уравнения регрессии линейной однофакторной модели методом МНК и с

помощью встроенных функций приложения Microsoft Excel.

46

3. По результатам вычислений коэффициентов линейной регрессии

построить график зависимости с указанием экспериментальных точек и

рассчитанной с помощью МНК прямой.


1. Дайте определение регрессионному анализу, приведите примеры

его применения в научных исследованиях.

2. Дайте объяснение парному и множественному регрессионному

анализу.

3. Объясните суть метода наименьших квадратов.

4. Поясните назначение встроенных функций приложения Microsoft

Excel, позволяющих вычислить коэффициенты линейной регрессионной

зависимости.

47


Регрессионные однофакторные нелинейные модели


уравнений регрессии нелинейных однофакторных моделей.


Линейные регрессионные модели обладают тем свойством, что они

линейны по переменным (переменные входят в модель в первой степени) и

линейны по параметрам (параметры выступают в качестве

коэффициентов при переменных). Однако большинство зависимостей

между случайными величинами носят нелинейный характер. Многие

зависимости не являются линейными по своей сути, поэтому

использование для их изучения линейных моделей может привести к

неадекватным результатам.

С помощью математических преобразований возможно расширение

диапазона функций регрессии, путем линеаризации некоторых

нелинейных функций.

Для того чтобы свести нелинейную модель к линейной, обычно с

помощью некоторых преобразований переменных нелинейную модель

представляют в виде линейного соотношения между преобразованными

переменными, оценивают коэффициенты этого соотношения и затем с

помощью обратного преобразования находят оценки параметров исходной

нелинейной модели.

В табл. 5.1 представлены некоторые функциональные зависимости,

которые можно привести к линейным.

48

Таблица 5.1. Приведение некоторых нелинейных функций

к линейному виду 𝑦 = 𝑏∗ + 𝑏∗𝑥

Номер Нелинейная

зависимость

Преобразование 𝑥 → 𝑥∗, 𝑦 → 𝑦∗

Коэффициенты

регрессии 𝑏 и 𝑏

1 логарифмическая 𝑦 = 𝑏 + 𝑏 ln 𝑥

𝑥∗ = ln 𝑥𝑦∗ = 𝑦 𝑏 = 𝑏∗𝑏 = 𝑏∗

2

гиперболическая 𝑦 = 𝑏 + 𝑏𝑥

𝑥∗ = 1𝑥𝑦∗ = 𝑦 𝑏 = 𝑏∗𝑏 = 𝑏∗

3

гиперболическая 𝑦 = 1𝑏 + 𝑏 𝑥

𝑥∗ = 𝑥𝑦∗ = 1𝑦 𝑏 = 𝑏∗𝑏 = 𝑏∗

4 степенная 𝑦 = 𝑏 𝑥

𝑥∗ = ln 𝑥 𝑏∗ = 𝑏𝑦∗ = ln 𝑦 𝑏∗ = ln 𝑏 𝑏 = 𝑒 ∗𝑏 = 𝑏∗

5 степенная 𝑦 = 𝑏 + 𝑏 𝑥

𝑥∗ = 𝑥𝑦∗ = 𝑦 𝑏 = 𝑒 ∗𝑏 = 𝑏∗

6 показательная 𝑦 = 𝑏 𝑏

𝑥∗ = 𝑥 𝑏∗ = ln 𝑏𝑦∗ = ln 𝑦 𝑏∗ = ln 𝑏 𝑏 = 𝑒 ∗𝑏 = 𝑒 ∗

7 экспоненциальная 𝑦 = 𝑏 𝑒

𝑥∗ = 𝑥 𝑏∗ = 𝑏𝑦∗ = ln 𝑦 𝑏∗ = ln 𝑏 𝑏 = 𝑒 ∗𝑏 = 𝑏∗

К группе регрессионных моделей, линейных по параметрам, в

первую очередь следует отнести полиноминальные модели различных

порядков. Для них возможно использование метода наименьших

квадратов. Так для полинома второй степени (квадратичной модели) вида

𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 (5.1)

49

применение МНК позволяет записать следующую систему нормальных

уравнений:

⎩⎪⎪⎪⎨⎪⎪⎪⎧ 𝑦 = 𝑛𝑏 + 𝑏 𝑥 + 𝑏 𝑥

𝑦 𝑥 = 𝑏 𝑥 + 𝑏 𝑥 + 𝑏 𝑥𝑦 𝑥 = 𝑏 𝑥 + 𝑏 𝑥 + 𝑏 𝑥 .

(5.2)

Решение данной системы позволяет найти коэффициенты

регрессионного уравнения (5.1) 𝑏 , 𝑏 , 𝑏 . Аналогичное решение задачи

возможно и для полиномов более высоких порядков.

Для оценки качества нелинейной зависимости используют величину

индекса корреляции, рассчитываемого по формуле:

𝑖 = 𝑄𝑄 = 1 − 𝑄𝑄 , (5.3)

где 𝑄 – объясненная (факторная) сумма квадратов (мера разброса

значений линии регрессии 𝑦 относительно средней величины 𝑦); 𝑄 –

остаточная сумма квадратов (мера разброса точек 𝑦 относительно линии

регрессии 𝑦 ); 𝑄 – полная сумма квадратов (мера общего рассеивания

переменной 𝑦 относительно средней величины 𝑦) (𝑄 = 𝑄 + 𝑄 ).

Величины 𝑄, 𝑄 и 𝑄 определяются соответственно по формулам:

50

𝑄 = (𝑦 − 𝑦) ,𝑄 = (𝑦 − 𝑦) ,𝑄 = (𝑦 − 𝑦 ) .

(5.4)

Квадрат индекса корреляции называется индексом детерминации 𝑅 . Величина 𝑅 показывает, какая часть (доля) вариации зависимой

переменной обусловлена вариацией объясняющей переменной и

изменяется в диапазоне 0 ≤ 𝑅 ≤ 1. Для получения выводов о

количественной оценке тесноты нелинейной корреляционной связи

используют шкалу Чеддока (табл. 3.1).

Чем ближе 𝑅 к 1, тем лучше регрессия аппроксимирует

эмпирические данные. Если 𝑅 = 1, то эмпирические точки (𝑥 ; 𝑦 ) лежат

на линии регрессии (𝑄 = 0), и между переменными 𝑦 и 𝑥 существует

нелинейная функциональная зависимость. Если 𝑅 = 0 (𝑄 = 0), то

вариации 𝑦 полностью обусловлены воздействием неучтенных в

уравнении регрессии переменных, и линия регрессии параллельна оси

абсцисс.

В случае парной линейной регрессии имеет место важное тождество:

𝑅 = 𝑟 . (5.5)

Значимость индекса детерминации определяется при помощи

критерия Фишера. Наблюдаемое значение критерия Фишера для выборки

из 𝑛 значений для двух случайных величин (𝑚 = 2) определяется по

формуле (3.10), приведенной к виду:

51

𝐹н = 𝑅 (𝑛 − 2)1 − 𝑅 . (5.6)



степеней свободы соответственно 𝑓 = 1 и 𝑓 = 𝑛 − 2. Если 𝐹н > 𝐹, то 𝑅

статистически значим. В противном случае (𝐹н ≤ 𝐹) – статистически

незначим.

Построение и анализ линейной и нелинейных регрессионных

моделей возможно с использованием пакета Microsoft Excel.

Наиболее простой вариант связан с использованием команды

«Добавить линию тренда». Эта команда позволяет построить следующие

регрессионные модели:

- линейную: 𝑦 = 𝑏 + 𝑏 𝑥;

- полиноминальную: 𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥 (𝑘 ≤ 6);

- логарифмическую: 𝑦 = 𝑏 + 𝑏 ln 𝑥;

- степенную: 𝑦 = 𝑏 𝑥 ;

- экспоненциальную: 𝑦 = 𝑏 𝑒 .

Для построения одной из перечисленных регрессий необходимо

выполнить следующий алгоритм:

- в выбранном листе Microsoft Excel ввести по столбцам исходные

данные {𝑥 ; 𝑦 }, 𝑖 = 1,2, … , 𝑛 и построить график в декартовой системе

координат (рис. 5.1);

- установить курсор на построенном графике, сделать щелчок

правой кнопкой мыши и в появившемся контекстном меню выполнить

команду «Добавить линию тренда» (рис. 5.1);

52

Рис. 5.1. Построение графика функции по исходным данным

- в появившемся диалоговом окне «Формат линии тренда» (рис. 5.2)

активизировать закладку «Параметры линии тренда» и выбрать нужное

уравнение регрессии;

- включить необходимые опции: «показывать уравнение на

диаграмме» (на диаграмме будет показано выбранное уравнение

регрессии с вычисленными коэффициентами), «поместить на диаграмму

величину достоверности аппроксимации (R^2)» (на диаграмме будет

показано значение индекса детерминации 𝑅 );

- для возможности экстраполяции (прогнозирования) функции вне

пределов исходных значений {𝑥 ; 𝑦 } необходимо задать значения длины

интервалов (периодов) вперед и/или назад.

Результат вышеописанных действий приведен на рис. 5.3.

Индекс детерминации 𝑅 характеризует близость построенной

регрессии к исходным данным, которые содержат также и случайную

составляющую. Применение более сложных математических моделей в

регрессионном анализе позволяет достичь значений индекса детерминации

53

𝑅 близких или равных единице. Но сложные модели часто содержат в

уравнении как независимую переменную 𝑥, так и случайную

составляющую, что снижает точность его использования в анализе и

прогнозе. При выборе уравнения регрессии следует учитывать не только

величину 𝑅 , но и «сложность» регрессионного уравнения, определяемое

качеством коэффициентов уравнения. Взаимный учет этих двух

характеристик уравнения реализован в приведенном индексе

детерминации (для линейной регрессии – приведенный коэффициент

детерминации):

Рис. 5.2. Выбор уравнения регрессии

54

Рис. 5.3. Результаты регрессионного анализа

𝑅 = 1 − (𝑛 − 1)(𝑛 − 𝑚) (1 − 𝑅 ). (5.7)

где 𝑚 – количество коэффициентов регрессионного уравнения.

При увеличении количества коэффициентов 𝑚 значение

приведенного индекса детерминации 𝑅 уменьшается. При одинаковом

количестве коэффициентов в сравниваемых уравнениях регрессии выбор

наилучшего уравнения можно определить по индексу детерминации 𝑅 .

Другим вариантом выполнения регрессионного анализа в Microsoft

Excel является применение команды «Поиск решения». В Microsoft Excel

по умолчанию этот сервис отсутствует, поэтому его необходимо

установить дополнительно с использованием следующего пути: кнопка

«Office» → «Параметры Excel» → «Надстройки» → «Поиск решения».

По окончании процедуры команда «Поиск решения» будет находиться во

вкладке «Данные».

55

Команда «Поиск решения» используется для вычисления параметров

(коэффициентов), при которых некоторый функционал, зависящий от этих

параметров, достигает минимального или максимального значения.

Наиболее важным преимуществом этой команды по сравнению с

вышерассмотренной командой «Добавить линию тренда» является

возможность решать задачи условной оптимизации, т.е. задачи с поиском

минимума или максимума функционала с учетом наложения

дополнительных ограничений (линейных или нелинейных) на значения

искомых параметров.

Для построения регрессионной модели необходимо выполнить

следующий алгоритм (ниже приведен пример на основе данных рис. 5.1):

- в выбранном листе Microsoft Excel ввести по столбцам исходные

данные {𝑥 ; 𝑦 }, 𝑖 = 1,2, … , 𝑛 (рис. 5.4);

- задать функцию для регрессионной модели (в примере выбрана

функция вида 𝑦 = 𝑏 √𝑥, после преобразований которой ее можно

привести к виду 𝑦 = 𝑏 𝑥 , где 𝑏 = 0,25) и ввести начальные

произвольные значения коэффициентов регрессии (𝑏 , 𝑏 ) (рис. 5.4);

- по исходным данным 𝑥 вычислить значения 𝑦 и квадраты разности (𝑦 − 𝑦) (рис. 5.4);

- ввести в ячейку функционал (𝐹 = ∑(𝑦 − 𝑦) ) (рис. 5.4);

Рис. 5.4. Подготовка исходных данных для реализации команды «Поиск решения»

56

- во вкладке «Данные» выбрать команду «Поиск решения» и в

диалоговом окне выполнить следующие действия (рис. 5.5):

Рис. 5.5. Диалоговое окно команды «Поиск решения» и

«Результаты поиска решения»

- в поле ввода «Установить целевую ячейку» задать ячейку

функционала;

- включить опцию «минимальному значению», что будет

соответствовать минимизации функционала при поиске решения;

- в поле ввода «Изменяя ячейки» задать ячейки со значениями

коэффициентов регрессии 𝑏 , 𝑏 ;

- ввести необходимые «Ограничения» (например, 𝑏 = 0,25);

- «выполнить» поиск решения;

57

- в диалоговом окне «Результаты поиска решения» выбрать

опцию «Сохранить найденное решение»;

- после выполнения операций оптимизации в ячейках появляются

значения коэффициентов, обеспечивающих минимальное значение

функционала 𝐹 = ∑(𝑦 − 𝑦) (рис. 5.6).

Рис. 5.6. Результаты выполнения команды «Поиск решения» и

их графическое представление в сравнении с исходными данными

Полученные результаты необходимо оценить с помощью индекса

детерминации.

58




Для различных нелинейных моделей поэтапно выполняется

регрессионный анализ с выбором уравнения регрессии при отсутствии

ограничений и с наложением ограничений при задании функциональной

зависимости.

Выбор математической модели осуществляется путем сравнения

нескольких уравнений регрессии при определении максимального

значения индекса детерминации (индекса корреляции) или приведенного

индекса детерминации.



2. Согласно выданному заданию построить поле корреляции

(диаграмму рассеяния), определить подходящие нелинейные зависимости

и, используя операцию линеаризации, методом наименьших квадратов

провести расчет коэффициентов уравнения регрессии для одной из числа

выбранных нелинейной однофакторной модели.

3. С помощью встроенных функций команды «Добавить линию

тренда» приложения Microsoft Excel методом МНК получить

математические модели регрессионных зависимостей, доступных для этой

команды. Построить графики этих моделей. Оценить их соответствие

исходным данным по сравнению рассчитанного индекса детерминации.

Оценить значимость индекса детерминации. Используя приведенный

59

индекс детерминации, выбрать математическую регрессионную модель,

в наибольшей степени соответствующую исходным данным.

4. С помощью команды «Поиск решения» определить матема-

тическую зависимость для нелинейной регрессии с ограничениями.

Определить индекс детерминации и оценить его значимость.


1. Дайте объяснение процессу линеаризации математических

моделей в регрессионном анализе.

2. Дайте определение показателям оценки качества нелинейных

зависимостей.

3. Обоснуйте применение приведенного индекса детерминации в

выборе оптимальной регрессионной зависимости.

4. Объясните алгоритм использования команды «Добавить линию

тренда».

5. Назовите отличия в регрессионном анализе, выполняемом

командой «Поиск решения», по сравнению с командой «Добавить линию

тренда».

6. Поясните на примерах, в каких случаях целесообразнее

использовать команду «Добавить линию тренда», а в каких – «Поиск

решения».

60


Регрессионные многофакторные линейные модели


уравнений регрессии линейных и приводящихся к ним многофакторных

моделей.


Множественная регрессия является обобщением парной регрессии.

Она используется для описания зависимости между объясняемой

(зависимой) переменой 𝑦 и объясняющими (независимыми) переменными 𝑥 , 𝑥 , …, 𝑥 :

𝑦 = 𝑓(𝑥 , 𝑥 , … , 𝑥 ). (6.1)

Для построения уравнения множественной регрессии чаще

используются следующие функции:

- линейная:

𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥 ; (6.2)

- степенная:

𝑦 = 𝑏 𝑥 𝑥 ∙ … ∙ 𝑥 ; (6.3)

- экспоненциальная:

61

𝑦 = 𝑒 ⋯ ; (6.4)

- гиперболическая: 𝑦 = 1𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥 . (6.5)

Можно использовать и любые другие функции, которые приводятся

к линейному виду (6.2).

Для определения параметров 𝑏 , 𝑏 , …, 𝑏 уравнения

множественной регрессии применяют метод наименьших квадратов

(МНК). Для линейных и нелинейных уравнений, приводимых к линейным,

строится следующая система нормальных уравнений:

⎩⎪⎪⎪⎨⎪⎪⎪⎧ 𝑦 = 𝑛𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥

𝑦 𝑥 = 𝑏 𝑥 + 𝑏 𝑥 + 𝑏 𝑥 𝑥 + ⋯ + 𝑏 𝑥 𝑥… … … … … … …𝑦 𝑥 = 𝑏 𝑥 + 𝑏 𝑥 𝑥 + 𝑏 𝑥 𝑥 + ⋯ + 𝑏 𝑥. (6.6)

Решение этой системы линейных уравнений позволяет получить

оценки параметров регрессии 𝑏 , 𝑏 , …, 𝑏 .

Для оценки качества полученной регрессионной модели используют

величину индекса корреляции (индекса детерминации), рассчитываемой по

формуле (5.3). Значимость индекса детерминации определяется при

помощи критерия Фишера по формуле (3.10). Полученное значение 𝐹н

необходимо сравнить с критическим 𝐹, которое определяется для

62

доверительной вероятности 𝑃 = 1 − 𝛼 и числа степеней свободы 𝑓 = 𝑚 − 1 и 𝑓 = 𝑛 − 𝑚.

Решение систем линейных алгебраических уравнений возможно с

применением методов линейной алгебры: методом Гаусса, матричным

методом и по формулам Крамера. Для нахождения определителей матриц,

обратной матрицы и умножения матриц возможно использование

встроенных функций приложения Microsoft Excel, представленных

в табл. 6.1.

Таблица 6.1. Функции линейной алгебры Microsoft Excel


1 2 3 1 МОПРЕД Возвращает определитель матрицы (матрица

хранится в массиве).

Массив – числовой массив с равным

количеством строк и столбцов. Массив может

быть задан как интервал ячеек, например

A1:C3, как массив констант, как имя для

интервала или массива.

2 ТРАНСП Функция возвращает вертикальный диапазон

ячеек в виде горизонтального и наоборот. Эту

функцию необходимо вводить как формулу

массива в диапазон, который имеет столько же

строк и столбцов, сколько столбцов и строк

имеет аргумент массив. Функция ТРАНСП

используется для изменения ориентации

массива или диапазона на листе с

вертикальной на горизонтальную и наоборот.

63


1 2 3 3 МОБР Возвращает обратную матрицу для матрицы,

хранящейся в массиве (Массив – числовой

массив с равным количеством строк и

столбцов):

МОБР(массив)

4 МУМНОЖ Возвращает произведение матриц (матрицы

хранятся в массивах). Результатом является

массив с таким же числом строк, что и

«массив1», и с таким же числом столбцов, что

и «массив2»:

МУМНОЖ(массив1; массив2)

Для корректной работы функции «ТРАНСП» необходимо правильно

выполнять следующую последовательность действий:

- ввести массив данных 𝑚 × 𝑛 (𝑚 – число строк; 𝑛 – число

столбцов);

- на пустом месте листа Microsoft Excel выделить ячейки из 𝑛 строк и 𝑚 столбцов;

- нажать клавишу «=» и ввести формулу «ТРАНСП»;

- в ячейку «Массив» диалогового окна «Аргументы функции» ввести

диапазон ячеек массива данных 𝑚 × 𝑛;

- одновременно нажать клавиши «Ctrl», «Shift» и «Enter»;

- в выделенных ячейках появятся транспонированные значения

исходного массива данных.

Для корректной работы функции «МОБР» необходимо правильно

выполнять следующую последовательность действий:

64

- ввести массив данных 𝑛 × 𝑛 (число строк равно числу столбцов);

- на пустом месте листа Microsoft Excel выделить ячейки из 𝑛 строк и 𝑛 столбцов;

- нажать клавишу «=» и ввести формулу «МОБР»;

- в ячейку «Массив» диалогового окна «Аргументы функции» ввести

диапазон ячеек массива данных 𝑛 × 𝑛;


- в выделенных ячейках появятся значения обратной матрицы.

Для корректной работы функции «МУМНОЖ» необходимо

правильно выполнять следующую последовательность действий:

- ввести массив данных 𝑚 × 𝑘 первой матрицы (𝑚 – число строк; 𝑘 – число столбцов) и массив данных 𝑘 × 𝑛 второй матрицы (𝑘 – число

строк; 𝑛 – число столбцов);

- на пустом месте листа Microsoft Excel выделить ячейки из 𝑚 строк

и 𝑛 столбцов;

- нажать клавишу «=» и ввести формулу «МУМНОЖ»;

- в ячейку «Массив1» диалогового окна «Аргументы функции»

ввести диапазон ячеек массива данных 𝑚 × 𝑘,в ячейку «Массив2» –

диапазон ячеек массива данных 𝑘 × 𝑛;


- в выделенных ячейках появятся результаты значений умножения

матриц между собой.

Для выполнения регрессионного анализа в Microsoft Excel возможно

применение команды «Анализ данных». В Microsoft Excel по умолчанию

этот сервис отсутствует, поэтому его необходимо установить

дополнительно с использованием следующего пути: кнопка «Office» →

«Параметры Excel» → «Надстройки» → «Анализ данных». По окончании

65

процедуры команда «Анализ данных» будет находиться во вкладке

«Данные».

Среди прочих возможностей эта команда позволяет использовать

инструмент анализа «Регрессия» (рис. 6.1), который осуществляет

вычисление коэффициентов линейной множественной регрессии,

построение доверительных интервалов и проверку значимости уравнения

регрессии.

Рис. 6.1. Диалоговое окно команды «Анализ данных»

После вызова инструмента анализа «Регрессия» на экране появляется

диалоговое окно (рис. 6.2), в котором задаются следующие параметры:

– Входные данные:

– Входной интервал Y (вводится диапазон адресов ячеек,

содержащих значения 𝑦 и составляющих один столбец);

– Входной интервал X (вводится диапазон адресов ячеек,

содержащих значения независимых переменных 𝑥 , 𝑥 , …, 𝑥 ,

каждая из которых содержится только в одном столбце (количество

переменных 𝑚 – не более 16));

66

– Метки (опция включается, если первая строка во входном

диапазоне содержит заголовок, и в этом случае автоматически будут

созданы стандартные названия);

– Уровень надежности (при включении этой опции задается

величина надежности 𝑦 при построении доверительных интервалов);

– Константа-ноль (включение этой опции дает возможность задать

строгое равенство 𝑏 = 0);

– Параметры вывода:

– Выходной интервал (при включении опции указывается

адрес левой верхней ячейки выходного диапазона, в котором будут

находиться результаты вычислений инструмента анализа

«Регрессия»);

– Новый рабочий лист (включение опции открывает новый

лист, в который, начиная с ячейки А1, вставляются результаты

работы инструмента анализа «Регрессия»);

– Новая рабочая книга (при включении этой опции

открывается новая книга, на первом листе которой, начиная с ячейки

А1, вставляются результаты работы инструмента анализа

«Регрессия»);

– Остатки (включение опции вычисляет столбец, содержащий

невязки 𝑦 − 𝑦 , 𝑖 = 1,2, … , 𝑛);

– Стандартизованные остатки (при включении опции вычисляется

столбец, содержащий стандартизованные остатки);

– График остатков (включение опции выводит точечные графики

невязки 𝑦 − 𝑦 , 𝑖 = 1,2, … , 𝑛 в зависимости от значений переменных 𝑥 , 𝑗 = 1,2, … , 𝑚. Количество графиков равно количеству переменных 𝑚);

– График подбора (опция осуществляет вывод точечных графиков,

предсказанных по построенной регрессии значений 𝑦 от значений

67

переменных 𝑥 , 𝑗 = 1,2, … , 𝑚. Количество графиков равно количеству

переменных 𝑚).

Рис. 6.2. Диалоговое окно инструмента анализа «Регрессия»

На рис. 6.3 в качестве примера приведены исходные данные и

результаты работы инструмента анализа «Регрессия» для модели вида 𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 . Рассчитанные показатели «регрессионной

статистики» включают:

‒ «Множественный R» ‒ коэффициент множественной корреляции,

рассчитанный по формуле (3.8);

‒ «R-квадрат» – коэффициент детерминации 𝑅 ;

‒ «Нормированный R-квадрат» – приведенный коэффициент

детерминации 𝑅 , рассчитанный по формуле (5.7);

‒ «Стандартная ошибка» – выборочное стандартное отклонение 𝑆

(среднеквадратичное отклонение), рассчитанное по формуле (1.3);

‒ «Наблюдения» – число наблюдений 𝑛.

68

Рис. 6.3. Диалоговое окно инструмента анализа «Регрессия»

69

Показатели «дисперсионного анализа» включают:

‒ Столбец «df» ‒ число степеней свободы (для строки «Регрессия»

показатель равен 𝑓 = 𝑚 − 1, для строки «Остаток» он равен 𝑓 = 𝑛 − 𝑚,

для строки «Итого» – 𝑓 = 𝑓 + 𝑓 = 𝑛 − 1);

‒ Столбец «SS» – сумма квадратов отклонений, рассчитанная по

формуле (5.4) (для строки «Регрессия» показатель равен величине 𝑄 , для

строки «Остаток» ‒ равен величине 𝑄 , для строки «Итого» – величине 𝑄 = 𝑄 + 𝑄 );

‒ Столбец «MS» – дисперсии, вычисленные по формуле 𝑀𝑆 = , т.

е. дисперсия, вычисленная на одну степень свободы;

‒ Столбец «F» – критическое значение критерия Фишера 𝐹, которое

определяется для доверительной вероятности 𝑃 = 1 − 𝛼 и числа степеней

свободы соответственно 𝑓 = 1 и 𝑓 = 𝑛 − 2;

‒ Столбец «Значимость F» – значение уровня значимости,

соответствующее вычисленной величине критического значения критерия

Фишера. Если вычисленное значение меньше уровня значимости α, то

построенная регрессия является значимой;

‒ Столбец «Коэффициенты» – рассчитанные коэффициенты

уравнения регрессии 𝑏 , 𝑏 и 𝑏 ;

‒ Столбец «Стандартная ошибка» – выборочное стандартное

отклонение 𝑆 (среднеквадратичное отклонение) для каждого из

коэффициентов регрессии 𝑏 , 𝑏 и 𝑏 соответственно;

‒ Столбец «t-статистика» – значения коэффициентов Стьюдента (t-

статистик) для каждого из коэффициентов регрессии 𝑏 , 𝑏 и 𝑏

соответственно;

‒ Столбец «P-значение» – вероятности случайных событий 𝑃(𝑡(𝑛 −𝑚) ≥ 𝑡н), где 𝑡(𝑛 − 𝑚) ‒ случайная величина, подчиняющаяся

распределению Стьюдента с (𝑛 − 𝑚) степенями свободы. Если эта

70

вероятность меньше уровня значимости 𝛼, то принимается гипотеза о

значимости соответствующего коэффициента регрессии;

‒ Столбцы «Нижние 95%» и «Верхние 95%» – нижние и верхние

интервалы значений оцениваемых коэффициентов уравнения регрессии

соответственно.

Показатели таблицы «вывод остатка» включают:

‒ Столбец «Наблюдение» – номера наблюдений;

– Столбец «Предсказанное y» – значения 𝑦 , вычисленные по

рассчитанному уравнению регрессии;

– Столбец «Остатки» – значения разности исходных и вычисленных

данных (невязки) (𝑦 − 𝑦 ).

Также инструмент анализа «Регрессия» позволяет графически

вывести данные по значениям остатков для каждой переменной в

отдельности.

В Microsoft Excel возможно построение трехмерных графиков для

удобства визуализации полученных данных. Для его построения

необходимо создать матрицу исходных данных, вычисленных по

полученному уравнению регрессии (рис. 6.4). В качестве столбцов

матрицы следует ввести значения независимой переменной 𝑥 , строк –

значения независимой переменной 𝑥 . На пересечении строк и столбцов

(в ячейках матрицы) по регрессионной зависимости рассчитываются

значения зависимой переменной 𝑦. Для правильного построения

диаграммы значения шага для каждой из переменных должно быть

постоянным. После выделения ячеек со значениями зависимой переменной

выбор диаграммы осуществляется с использованием следующего пути:

«Вставка» → «Диаграммы» → «Поверхность». Для изменения значений

осей координат 𝑥 и 𝑥 во вкладке «Выбор источника данных» задать

71

значения 𝑥 в ячейке «Подписи горизонтальной оси (категории)» и 𝑥 во

вкладке «Элементы легенды (ряды)».

Рис. 6.4. Графическое трехмерное построение регрессионной двухфакторной модели

вида 𝑦 = −3,15 + 0,075𝑥 + 0,19667𝑥

72

Для лучшей визуализации на полученной диаграмме различными

цветами выделяются изолинии (линии уровня), соответствующие

диапазонам, заданным в легенде.




Для исходных данных (линейной зависимости) получить

регрессионную многофакторную модель путем реализации метода

наименьших квадратов. Оценить качество коэффициентов полученной

математической модели и ее адекватность.



2. Согласно заданию, полученному к практической работе № 3, для

нахождения коэффициентов 𝑏 , 𝑏 и 𝑏 линейной зависимости вида 𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 методом наименьших квадратов составить систему

линейных уравнений и решить ее. Оценить качество полученной

регрессионной модели.

3. С помощью инструмента анализа «Регрессия» команды «Анализ

данных» приложения Microsoft Excel методом МНК получить

математическую модель множественной линейной регрессии, оценить ее

качество и значимость по показателям регрессионной статистики и

дисперсионного анализа.

4. По результатам расчетов построить трехмерный график

регрессионной двухфакторной модели.

73


1. Дайте объяснение процессу линеаризации многофакторных

математических моделей при проведении регрессионного анализа.

2. Объясните применение метода наименьших квадратов для

получения многофакторных регрессионных моделей.

3. Обоснуйте возможность применения приложения Microsoft Excel

для решения систем линейных алгебраических уравнений.

4. Назовите критерии оценки качества полученных математических

моделей.

5. Объясните алгоритм использования инструмента анализа

«Регрессия» команды «Анализ данных».

5. Назовите и дайте объяснение показателям оценки качества по

расчетным данным регрессионной статистики и дисперсионного анализа.

6. Поясните алгоритм построения графиков двухфакторных

математических моделей.

74


Полный факторный эксперимент

Цель работы: изучение планирования эксперимента и возможностей

реализации полного факторного эксперимента для многофакторных

моделей.


Метод наименьших квадратов является эффективным и простым

средством реализации парного и множественного регрессионного анализа.

При построении регрессионной модели для получения качественных

результатов необходимо проводить планирование эксперимента –

процедуру выбора числа и условий проведения опытов, необходимых и

достаточных для решения поставленной задачи с требуемой точностью.

При планировании эксперимента существенно следующее:

– стремление к минимизации общего числа опытов;

– одновременное варьирование всеми переменными, опреде-

ляющими процесс по специальным правилам – алгоритмам;

– использование математического аппарата формализующего многие

действия экспериментатора;

– выбор четкой стратегии, позволяющей принимать обоснованные

решения после каждой серии экспериментов.

Одним из простых и эффективных методов реализации этих условий

является полный факторный эксперимент (ПФЭ).

ПФЭ называется эксперимент, реализующий все возможные

неповторяющиеся комбинации опытов 𝑚 независимых управляемых

факторов, каждый из которых варьируется на 𝑝 уровнях. Общее число

75

опытов 𝑁 при реализации всех комбинаций факторов выражаются

следующей зависимостью:

𝑁 = 𝑝 . (7.1)

В модели вида 𝑦 = 𝑓(𝑧 , 𝑧 , … , 𝑧 ) функционально связаны

изучаемый параметр 𝑦 со значениями факторов 𝑧 , 𝑧 , …, 𝑧 , лежащими в

интервале между верхним и нижним уровнями. Наиболее простыми

моделями являются алгебраические полиномы.

Для обработки данных и дальнейшего определения коэффициентов

уравнения регрессии факторы приводят к одному масштабу. Это

достигается путем кодирования переменных. Обозначив нижний уровень

фактора 𝑧 через 𝑧 , а верхний уровень – через 𝑧 (т.е. 𝑧 ∈𝑧 ; 𝑧 , 𝑖 = 1,2, … , 𝑛), новые кодированные переменные 𝑥 будут

определяться через 𝑧 по формуле:

𝑥 = 𝑧 − 𝑧𝜆 , (7.2)

где 𝑧 – центр плана; 𝜆 – интервал варьирования, которые определяются

по формулам:

𝑧 = 𝑧 + 𝑧2 ,𝜆 = 𝑧 − 𝑧2 . (7.3)

Наиболее часто в ПФЭ используются планы первого порядка вида 2 , которым соответствует линейная модель вида:

76

𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥 . (7.4)

При изучении влияния парных взаимодействий различных факторов

на исследуемый параметр уравнение регрессии записывается в виде:

𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + ⋯ + 𝑏 𝑥 + 𝑏 , 𝑥 𝑥 + ⋯ + 𝑏 , 𝑥 𝑥 (7.5)

или:

𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 , 𝑥 𝑥,, . (7.6)

Если надо учесть другие взаимодействия, то число слагаемых

увеличивают.

Планы второго порядка вида 3 используют реже, третьего и более

высоких порядков – значительно реже, так как это приводит к

стремительному увеличению числа опытов без повышения качества

полученных регрессионных моделей.

Ниже приведено рассмотрение ПФЭ с планами первого порядка вида 2 (табл. 7.1). В безразмерной (кодированной) системе координат верхний

уровень – «+1», нижний уровень – «–1», координаты центра равны нулю и

совпадают с началом координат (в планах первого порядка часто вместо

кодированных значений «+1» и «–1» записывают просто знаки «+» и «–»).

Далее матрицу дополняют (если это требует вид выбранного уравнения

регрессии) столбцами знаков «+» и «–», соответствующих уровням, на

которых будут находиться взаимодействия факторов 𝑥 𝑥 , 𝑥 𝑥 , 𝑥 𝑥 .

Знаки этих столбцов получают с помощью исходной матрицы

77

планирования путем перемножения соответствующих кодированных

значений столбцов независимых переменных. Возможны и более сложные

взаимодействия, что отражается в введении новых столбцов в матрицу

планирования, соответствующих им. Для оценки свободного члена 𝑏

матрицу планирования расширяют путем добавления соответствующей

«фиктивной переменной» – единичного столбца 𝑥 .

Таблица 7.1. Полный факторный эксперимент первого порядка вида 2

Номер

опыта

Факторы

в натуральном

масштабе

Кодированные

факторы

Результаты измерений

(𝑘 = 1,2, … , 𝑁) 𝑧 𝑧 𝑧 𝑥 𝑥 𝑥 𝑦 , 𝑦 , … , 𝑦 𝑦

1 𝑧 𝑧 𝑧 –1 –1 –1 𝑦 , 𝑦 , … , 𝑦 𝑦

2 𝑧 𝑧 𝑧 +1 –1 –1 𝑦 , 𝑦 , … , 𝑦 𝑦

3 𝑧 𝑧 𝑧 –1 +1 –1 𝑦 , 𝑦 , … , 𝑦 𝑦

4 𝑧 𝑧 𝑧 +1 +1 –1 𝑦 , 𝑦 , … , 𝑦 𝑦

5 𝑧 𝑧 𝑧 –1 –1 +1 𝑦 , 𝑦 , … , 𝑦 𝑦

6 𝑧 𝑧 𝑧 +1 –1 +1 𝑦 , 𝑦 , … , 𝑦 𝑦

7 𝑧 𝑧 𝑧 –1 +1 +1 𝑦 , 𝑦 , … , 𝑦 𝑦

8 𝑧 𝑧 𝑧 +1 +1 +1 𝑦 , 𝑦 , … , 𝑦 𝑦

Для построчных результатов измерений 𝑦 , 𝑦 , … , 𝑦 𝑘 = 1,2, … , 𝑁

рассчитывают средние арифметические значения 𝑦 , выборочные

дисперсии 𝑆 , которые проверяют на однородность с использованием

критерия Кохрена, рассчитанного по формуле (2.7). Если выполняется

условие 𝐺н < 𝐺, то с выбранным уровнем статистической значимости все

построчные дисперсии признаются однородными. В противном случае

78

следует отвергнуть гипотезу об однородности построчных дисперсий, что

является нарушением одной из главных предпосылок регрессионного

анализа – дальнейшая статистическая обработка результатов не имеет

смысла.

Таблица 7.2. Расширенная матрица планирования ПФЭ первого порядка

для получения линейной регрессионной модели вида 𝑦 = 𝑏 + 𝑏 𝑥 + 𝑏 𝑥 + 𝑏 𝑥 + 𝑏 , 𝑥 𝑥 + 𝑏 , 𝑥 𝑥 + +𝑏 , 𝑥 𝑥 + 𝑏 , , 𝑥 𝑥 𝑥

Номер

опыта 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑥 𝑦

1 +1 –1 –1 –1 +1 +1 +1 –1 𝑦

2 +1 +1 –1 –1 –1 –1 +1 +1 𝑦

3 +1 –1 +1 –1 –1 +1 –1 +1 𝑦

4 +1 +1 +1 –1 +1 –1 –1 –1 𝑦

5 +1 –1 –1 +1 +1 –1 –1 +1 𝑦

6 +1 +1 –1 +1 –1 +1 –1 –1 𝑦

7 +1 –1 +1 +1 –1 –1 +1 –1 𝑦

8 +1 +1 +1 +1 +1 +1 +1 +1 𝑦

Матрицы планирования обладают следующими свойствами.

1. Симметричность относительно центра эксперимента:

алгебраическая сумма элементов вектор-столбца каждого фактора равна

нулю, или:

𝑥 , = 0 𝑗 = 1,2, … , 𝑚. (7.7)

79

2. Условие нормировки – сумма квадратов элементов каждого

столбца равна количеству опытов 𝑁, или:

𝑥 , = 𝑁 𝑗 = 1,2, … , 𝑚. (7.8)

3. Свойство ортогональности – равенство нулю скалярных

произведений всех вектор-столбцов (сумма почленных произведений

любых двух вектор-столбцов матрицы равна нулю):

𝑥 , 𝑥 , = 0 𝑗, 𝑢 = 1,2, … , 𝑚, 𝑗 ≠ 𝑢. (7.9)

4. Ротатабельность, т.е. точки в матрице планирования подбираются

так, чтобы точность предсказаний значений параметра оптимизации 𝑦 была одинакова на равных расстояниях от центра эксперимента и не

зависела от направления.

Коэффициенты уравнения регрессии определяются по методу

наименьших квадратов, поэтому необходимо отметить, что

экспериментальные данные должны быть однородными и

распределенными по нормальному закону.

Любой коэффициент уравнения регрессии определяется скалярным

произведением столбца 𝑦 на соответствующий столбец кодированной

переменной, отнесенным к числу опытов в матрице планирования 𝑁:

𝑏 = 1𝑁 𝑥 𝑦 𝑗 = 0,1,2, … , 𝑚. (7.10)

80

Эффекты взаимодействия определяются аналогично линейным

эффектам. Согласно данным расширенной матрицы планирования

(таблица 7.2) коэффициенты уравнения определяются следующим

образом:

𝑏 , = 1𝑁 (𝑥 𝑥 ) 𝑦 ,𝑏 , = 1𝑁 (𝑥 𝑥 ) 𝑦 ,𝑏 , = 1𝑁 (𝑥 𝑥 ) 𝑦 ,

𝑏 , , = 1𝑁 (𝑥 𝑥 𝑥 ) 𝑦 . (7.11)

Найденные таким образом коэффициенты регрессии необходимо

оценить на статистическую значимость. Для проверки значимости

коэффициентов регрессии необходимо провести дополнительные

параллельные опыты для определения дисперсии воспроизводимости.

Поскольку матрица полного факторного эксперимента является

диагональной матрицей, то коэффициенты регрессии некоррелированы

между собой, следовательно, значимость для каждого коэффициента в

отдельности можно проверять по критерию Стьюдента. При этом

исключение из уравнения регрессии незначимого коэффициента не

скажется на остальных коэффициентах. Величины коэффициентов

уравнения регрессии характеризуют вклад каждого фактора в величину 𝑦.

Для нахождения ошибки эксперимента – дисперсии

воспроизводимости 𝑆 – проводится серия параллельных опытов в какой-

либо точке плана (чаще всего в центре планирования):

81

𝑆 = 1𝑁 − 1 (𝑦 − 𝑦 ) , (7.12)

где 𝑁 – число параллельных опытов; 𝑦 – среднее арифметическое

значение серии параллельных опытов.

Среднеквадратичное отклонение коэффициентов уравнения

регрессии определяется по формуле:

𝑆коэф = 𝑆𝑁 . (7.13)

Наблюдаемое значение коэффициента Стьюдента определяется по

формуле:

𝑡 = 𝑏𝑆коэф. (7.14)

Полученное наблюдаемое значение критерия Стьюдента

сравнивается с критическим, определяемым для выбранной доверительной

вероятности 𝑃 = 1 − 𝛼 и объема выборки 𝑁 (числа степеней свободы 𝑓 = (𝑁 − 1)) из таблицы критических значений критерия Стьюдента. При 𝑡 > 𝑡 можно считать, что коэффициент уравнения значим. Если 𝑡 < 𝑡, то

принимают 𝑏 = 0.

Проверка на адекватность полученного уравнения регрессии со

значимыми коэффициентами осуществляется с помощью критерия

Фишера. Наблюдаемое значение критерия Фишера определяется по

формуле:

82

𝐹н = 𝑆ост𝑆 , (7.15)

где 𝑆ост – остаточная дисперсия (дисперсия адекватности), рассчитываемая

по формуле:

𝑆 = 1𝑁 − 𝐿 (𝑦 − 𝑦 ) , (7.16)

где 𝐿 – число значимых коэффициентов в уравнении регрессии; 𝑦 –

значение изучаемого параметра, вычисленное по уравнению регрессии со

значимыми коэффициентами для серии параллельных опытов.



степеней свободы 𝑓 = 𝑁 − 𝐿 и 𝑓 = 𝑁 − 1.

Для получения математической модели в натуральных переменных 𝑧 , 𝑧 , …, 𝑧 в уравнение регрессии вместо 𝑥 , 𝑥 , …, 𝑥 необходимо

подставить их выражения из формулы (7.2). При переходе к натуральным

переменным коэффициенты уравнения изменяются, и в этом случае

пропадает возможность интерпретации влияния факторов по величинам и

знакам коэффициентов. Однако, если уравнение адекватно, то с его

помощью можно определять значения исследуемой величины, не проводя

эксперимента и придавая факторам значения, которые должны лежать

между нижним и верхним уровнем.

Реализацию ПФЭ в приложении Microsoft Excel удобно проводить с

построения матрицы, аналогичной представленной в таблице 7.1. После

кодирования независимых переменных данные удобно представить в виде

расширенной матрицы планирования, аналогичной таблице 7.2. Для

83

нахождения скалярного произведения вектор-столбцов расширенной

матрицы планирования возможно использование встроенных функций

приложения Microsoft Excel, представленных в табл. 7.3.

Таблица 7.3. Функции Microsoft Excel


1 СУММПРОИЗВ Перемножает соответствующие элементы

заданных массивов и возвращает сумму

произведений (Аргументы, которые являются

массивами, должны иметь одинаковые

размерности).

2 СУММКВРАЗН Возвращает сумму квадратов разностей

соответствующих значений в двух массивах

Другим вариантом выполнения расчетов регрессионного анализа в

Microsoft Excel является применение команды «Поиск решения»,

рассмотренной в практической работе № 5.




Для многофакторной модели реализовать ПФЭ: определить

функциональную зависимость, составить матрицу планирования и

рассчитать коэффициенты регрессии. Проверить значимость

коэффициентов регрессии и адекватность полученной модели.

84



2. Провести планирование эксперимента: выбрать порядок плана,

определить количество необходимых опытов при реализации полного

факторного эксперимента.

При реализации ПФЭ для зависимости 𝑦 = 𝑓(𝑧 , 𝑧 , … , 𝑧 ) составить

матрицу планирования, определив для каждой независимой переменной

(фактора) верхнюю и нижнюю границы и интервал варьирования.

Определить взаимодействия факторов и наличие свободного члена 𝑏 ,

составить матрицу планирования.

Используя скалярное произведение вектор-столбцов матрицы,

рассчитать коэффициенты уравнения регрессии.

3. Используя рекомендации практической работы №5, найти

значения коэффициентов уравнения регрессии с применением команды

«Поиск решения» приложения Microsoft Excel. Сравнить результаты с

полученными ранее.

4. По результатам дополнительных экспериментальных данных

оценить значимость коэффициентов регрессии с использованием критерия

Стьюдента.

Исключив из уравнения регрессии незначимые коэффициенты,

проверить его на адекватность с помощью критерия Фишера.

5. Получить окончательное уравнение регрессии, преобразовав

кодированные факторы в натуральные переменные.

85


1. Дайте объяснение процедуре планирования эксперимента,

назовите ее преимущества по сравнению с другими методами проведения

эксперимента.

2. Назовите условия реализации полного факторного эксперимента.

3. Назовите, какие планы используются в ПФЭ, как определяется

количество необходимых опытов.

4. Объясните, в каких целях применяется кодирование независимых

переменных (факторов).

5. Объясните алгоритм формирования матрицы планирования, какие

столбцы и строки вводятся при ее составлении.

6. Назовите свойства матрицы планирования.

7. Дайте формулировку правилу определения коэффициентов

уравнения регрессии.

8. Объясните алгоритм использования команды «Поиск решения»

приложения Microsoft Excel при определении коэффициентов регрессии.

9. Поясните алгоритм исключения незначимых коэффициентов в

уравнении регрессии.

10. Поясните порядок определения адекватности полученной

регрессионной модели.

11. Поясните алгоритм перехода от кодированных факторов к

натуральным переменным при получении окончательного уравнения

регрессии. Преимущества и недостатки такого перехода.

86


Поиск оптимального решения

Цель работы: изучение математических методов нахождения

оптимального решения для многофакторных моделей.


В большинстве случаев получение математической регрессионной

модели требует дальнейшего ее изучения с целью оптимизации функции.

Оптимизация – целенаправленная деятельность, заключающаяся в

получении наилучших результатов при соответствующих условиях.

Поиски оптимальных решений привели к созданию специальных

математических методов. В качестве инструмента решения

оптимизационных задач используется математическое программирование.

Математическое программирование представляет собой раздел

математики, занимающийся изучением экстремальных задач и разработкой

методов их решения.

В общем виде математическая постановка экстремальной задачи

состоит в определении наибольшего или наименьшего значения целевой

функции 𝑦 = 𝑓(𝑧 , 𝑧 , … , 𝑧 ) при ограничениях 𝑔 (𝑧 , 𝑧 , … , 𝑧 ) ≤ 𝑐 𝑖 = 1,2, … , 𝑘, где 𝑔 – заданные функции, а 𝑐 – некоторые действительные

числа.

В зависимости от свойств целевой функции и ограничений

математическое программирование можно рассматривать как ряд

самостоятельных дисциплин, занимающихся изучением и разработкой

методов решения определенных классов задач. Прежде всего, задачи

математического программирования делятся на задачи линейного и

87

нелинейного программирования. При этом если все функции (целевая и

ограничения) линейные, то соответствующая задача является задачей

линейного программирования. Если же хотя бы одна из указанных

функций нелинейная, то соответствующая задача является задачей

нелинейного программирования.

Для экспериментальных исследований чаще всего математическая

регрессионная модель является функцией двух или трех переменных:

𝑦 = 𝑓(𝑧 , 𝑧 ),𝑦 = 𝑓(𝑧 , 𝑧 , 𝑧 ). (8.1)

Нахождение максимального или минимального значений функции

многих переменных сводится к определению градиента функции, который

в точках экстремума должен быть равен нулю. Такое необходимое условие

записывается в виде равенства нулю всех частных производных функции в

точке экстремума:

- для функции двух переменных с координатами 𝑀 𝑧 , 𝑧 :

𝜕𝑦𝜕𝑧 = 𝜕𝜕𝑧 𝑓(𝑀 ) = 0 𝑖 = 1,2, (8.2)

- для функции трех переменных с координатами 𝑀 𝑧 , 𝑧 , 𝑧 :

𝜕𝑦𝜕𝑧 = 𝜕𝜕𝑧 𝑓(𝑀 ) = 0 𝑖 = 1,2,3. (8.3)

Наличие первых частных производных, каждая из которых равна

нулю, не является достаточным для определения экстремума функции.

Дальнейшее исследование требует наличия для функции нескольких

88

переменных вторых частных производных, объединенных в матрицу

Гессе. Вычисление определителей матрицы дает возможность определить

наличие максимального или минимального значения функции в точке

экстремума (проверка квадратичной формы полного дифференциала 2-го

порядка на знакоопределенность методом Сильвестра).

Для функции двух переменных такое исследование проводится по

следующему алгоритму:

- определяются частные производные второго порядка, из которых

составляется матрица Гессе вида:

𝐺 = ⎝⎜⎛ 𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 ) ⎠⎟

⎞. (8.4)

В зависимости от значений определителя этой матрицы функция

двух переменных в точке с координатами 𝑀 𝑧 , 𝑧 может:

- иметь максимум, если определитель матрицы 𝐺 положителен при

условии 𝑓(𝑀 ) < 0;

- иметь минимум, если определитель матрицы 𝐺 положителен при

условии 𝑓(𝑀 ) > 0.

В случае, когда определитель отрицателен, экстремум отсутствует.

Если он равен нулю, то необходимо провести дополнительные

исследования.

Для функции трех переменных сначала определяются частные

производные второго порядка, из которых строится матрица Гессе вида:

89

𝐺 =⎝⎜⎜⎜⎛

𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 ) ⎠⎟⎟⎟⎞. (8.5)

Далее вычисляются угловые миноры вида:

∆ = 𝜕𝜕𝑧 𝑓(𝑀 ),∆ = 𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 ) ,

∆ =𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 )𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝜕𝑧 𝑓(𝑀 ) 𝜕𝜕𝑧 𝑓(𝑀 )

. (8.6)

Если ∆ > 0, ∆ > 0, ∆ > 0, то функция 𝑦 = 𝑓(𝑧 , 𝑧 , 𝑧 ) достигает

минимума в точке 𝑀 𝑧 , 𝑧 , 𝑧 .

Если ∆ < 0, ∆ > 0, ∆ < 0, то функция 𝑦 = 𝑓(𝑧 , 𝑧 , 𝑧 ) достигает

максимума в точке 𝑀 𝑧 , 𝑧 , 𝑧 .

В других случаях при обязательном условии ∆ ≠ 0, точка 𝑀 𝑧 , 𝑧 , 𝑧 является седловой, но не экстремальной. В случае ∆ = 0

требуется проведение дополнительных исследований.

90

Область функции, в которой находится оптимальное решение,

представляет собой некоторую поверхность в многомерном пространстве –

поверхность отклика. Данную поверхность для случая функции двух

переменных можно представить графически. Наиболее удобно изображать

ее в виде изолиний – множества точек с одинаковым значением целевой

функции 𝑦 = 𝑓(𝑧 , 𝑧 ). Для построения линий уровня необходимо

выразить одну переменную через другую переменную и целевую

функцию, например: 𝑧 = 𝐹(𝑦, 𝑧 ). Затем задаваясь значениями функции,

необходимо провести сканирование по второй переменной, рассчитывая

при этом первую. По полученным точкам можно построить линию уровня.

Затем необходимо изменить значение функции и вновь повторить

процедуру. Операция повторяется столько раз, сколько необходимо

провести линий уровня. В случае неявно заданного уравнения линии

уровня необходимо использовать более сложные методы для графического

отображения функции.

Очень часто бывают случаи, когда максимум или минимум функции

отсутствуют вообще или отсутствуют в области, лежащей в интервале

между верхним и нижним уровнями исследуемых факторов. В этом случае

поиск оптимального значения функции следует проводить на границах

области исследуемой функции, состоящих из участков, для которых

выполняется условие:

𝑧 = 𝑧 или 𝑧 = 𝑧 . (8.7)

Помимо данных методов существует достаточно большое

количество методов, включающих пошаговый поиск оптимального

значения целевой функции. К ним следует отнести методы Гаусса-Зейделя,

Хука-Дживса, симплексные алгоритмы, градиентные методы. Результат

91

этих методов зависит от величины шага и количества итераций. Данные

методы нашли широкое применение при использовании специальных

программных продуктов.

В Microsoft Excel нахождение минимального или максимального

значений в исследуемой области возможно с помощью применения

команды «Поиск решения», рассмотренной в практической работе № 5.

При этом в качестве функционала для нахождения максимального или

минимального значения следует ввести исследуемую регрессионную

зависимость, а изменяемыми ячейками являются ячейки, содержащие

значения переменных факторов 𝑧 .




Для математической многофакторной модели найти оптимальное

решение, принадлежащее области исследования независимых факторов, с

получением точного аналитического решения и методами математического

программирования. Сравнить полученные результаты.



2. Для математической многофакторной модели аналитическими

методами найти оптимальное решение, принадлежащее области

исследования независимых факторов:

92

– определить градиент функции нескольких переменных (выражения

для соответствующих частных производных) и найти значения

независимых переменных, отвечающих необходимому условию

существования экстремума функции;

– определить частные производные второго порядка, из которых

составить матрицу Гессе;

– рассчитать определитель этой матрицы и соответствующие

угловые миноры, по значениям которых определить характер проверяемой

на экстремум точки.

В случае необходимости (экстремум либо отсутствует, либо не

принадлежит исследуемой области) провести дополнительные

исследования по границам области с целью определения наибольшего или

наименьшего значений функции нескольких переменных.

3. Используя графический редактор приложения Microsoft Excel

построить поверхность отклика для функции вида 𝑦 = 𝑓(𝑧 , 𝑧 ) в виде

изолиний (линий уровня) и решить задачу нахождения оптимального

значения целевой функции графически.

4. Используя рекомендации практической работы №5 для

применения команды «Поиск решения» приложения Microsoft Excel, найти

значения независимых факторов, соответствующих оптимальному

решению. Сравнить результаты с полученными ранее.


1. Дайте объяснение процедуре оптимизации функции.

2. Объясните особенности решения линейных и нелинейных задач

математического программирования.

93

3. Объясните алгоритм аналитического исследования функции

нескольких переменных с целью нахождения оптимального решения.

4. Назовите необходимые и достаточные условия существования

экстремума функции нескольких переменных.

5. Поясните порядок нахождения оптимального решения функции

двух переменных графическим методом.

6. Объясните алгоритм использования команды «Поиск решения»

приложения Microsoft Excel при определении оптимального решения.

94

Примерные задания для выполнения практических работ

Задание к практической работе № 1

На предприятии проведены измерения периода стойкости резцов с

СМП при обработке заготовок на пяти токарных станках (табл. П1).

Провести оценку качества измерений и проверить соответствие

распределения измеренной величины нормальному закону распределения.

Таблица П1. Период стойкости Т токарных резцов с СМП

Токарный станок №1

Номер измерения 1 2 3 4 5 6 7 8 9 10

Т, мин 45 44 46 45 48 47 48 43 49 41

Номер измерения 11 12 13 14 15 16 17 18 19 20

Т, мин 40 43 48 49 47 48 52 51 49 45

Номер измерения 21 22 23 24 25 26 27 28 29 30

Т, мин 45 46 47 47 45 45 46 42 50 44


Номер измерения 1 2 3 4 5 6 7 8 9 10

Т, мин 42 44 45 44 45 48 45 45 44 50

Номер измерения 11 12 13 14 15 16 17 18 19 20

Т, мин 40 45 44 41 46 43 49 45 46 44

Номер измерения 21 22 23 24 25 26 27 28 29 30

Т, мин 46 48 47 43 43 48 48 52 47 44


Номер измерения 1 2 3 4 5 6 7 8 9 10

Т, мин 41 43 45 43 44 47 44 44 42 48

Номер измерения 11 12 13 14 15 16 17 18 19 20

Т, мин 44 43 44 40 45 49 48 45 47 43

Номер измерения 21 22 23 24 25 26 27 28 29 30

Т, мин 45 46 46 42 43 47 44 52 46 43

95

Окончание табл. П1.


Номер измерения 1 2 3 4 5 6 7 8 9 10

Т, мин 40 43 45 46 48 52 44 49 46 49

Номер измерения 11 12 13 14 15 16 17 18 19 20

Т, мин 44 43 47 44 40 44 50 46 47 46

Номер измерения 21 22 23 24 25 26 27 28 29 30

Т, мин 45 46 47 42 48 47 47 52 46 47


Номер измерения 1 2 3 4 5 6 7 8 9 10

Т, мин 42 49 46 44 50 46 49 50 42 43

Номер измерения 11 12 13 14 15 16 17 18 19 20

Т, мин 47 46 45 46 47 42 46 51 44 48

Номер измерения 21 22 23 24 25 26 27 28 29 30

Т, мин 47 51 48 40 47 45 48 44 43 52


По данным предыдущей задачи определить:

- значительно ли отличается средняя стойкость резцов с СМП от

нормативного 𝑇н=45 мин;

- существенно ли влияние токарного станка на среднюю стойкость

резцов с СМП. Используя критерий Стьюдента, произвести сравнение по

величинам средних значений и коэффициента вариации периода стойкости

режущего инструмента. Сравнить попарно влияние станков на

однородность дисперсий, применив критерий Фишера (из серии измерений

взять случайную выборку из 10 значений). Сравнить все станки на наличие

влияния на среднюю стойкость резцов с СМП, применив критерий

Кохрена (использовать предыдущую выборку);

96

- наличие систематической составляющей погрешности измерений

стойкости резцов с СМП, используя критерий Аббе.


1. На предприятии проведены исследования процесса изнашивания

твердосплавных пластин при точении заготовок из стали 30ХГСА (режимы

резания: скорость резания 𝑉 = 160 м/мин, подача 𝑆 = 0,3 мм/об, глубина

резания 𝑡 = 0,5 мм). Результаты испытаний приведены в табл. П2. Для

экспериментальных данных определить вид корреляционной связи и

основные характеристики: коэффициент корреляции, тесноту его

корреляционной связи, значимость выборочного коэффициента

корреляции при доверительной вероятности 𝛼 = 0,95.

Таблица П2. Результаты исследований износа токарных резцов с СМП

по задней поверхности ℎз в зависимости от времени работы 𝜏, мм

Номер

резца

Время работы 𝜏, мин

5 10 15 20 25 30 35 40

1 0,182 0,205 0,226 0,251 0,283 0,308 0,326 0,348

2 0,191 0,212 0,236 0,259 0,277 0,302 0,324 0,339

3 0,196 0,219 0,246 0,268 0,291 0,316 0,338 0,356

4 0,171 0,202 0,251 0,281 0,296 0,319 0,343 0,358

5 0,185 0,213 0,244 0,255 0,279 0,297 0,320 0,341

2. При исследовании влияния геометрических характеристик

токарного проходного резца (влияния главного и вспомогательного углов в

плане 𝜑 и 𝜑 ) на шероховатость обработанной поверхности 𝑅𝑎 получены

следующие результаты (табл. П3). Определить парные выборочные

97

коэффициенты корреляции и множественный коэффициент корреляции

для исследуемых случайных величин.

Таблица П3. Результаты исследований влияния углов в плане 𝜑 и 𝜑

на шероховатость обработанной поверхности 𝑅𝑎, мкм

Главный угол в

плане 𝜑, град

Вспомогательный угол в плане 𝜑 , град

5 10 15 25 30

1 2 3 4 5 6 Резец 1

30 2,6 3,0 3,4 4,2 4,6

45 3,2 3,6 4,0 4,8 5,2

60 3,8 4,4 4,8 5,6 5,8

75 4,4 5,0 5,4 6,0 6,6

90 5,0 5,4 5,8 6,6 7,0

Резец 2

30 2,8 3,4 3,7 4,6 5,0

45 3,4 3,4 3,8 5,0 5,3

60 3,9 4,0 4,7 5,7 5,8

75 4,6 4,9 5,2 6,2 6,6

90 5,3 5,3 5,7 6,7 7,3

Резец 3

30 2,4 3,1 3,6 4,5 4,9

45 3,2 3,4 3,9 5,1 5,3

60 3,8 3,8 4,5 5,5 5,9

75 4,3 4,4 4,9 6,0 6,5

90 5,2 5,5 5,9 7,1 7,5

98


1 2 3 4 5 6 Резец 4

30 2,5 3,2 3,7 4,3 5,1

45 3,4 4,1 4,5 5,3 6,0

60 3,7 4,2 4,9 5,7 6,1

75 4,7 5,0 5,6 6,5 7,0

90 5,3 5,5 6,1 7,3 7,4

Резец 5

30 2,7 3,1 3,6 4,5 5,1

45 3,3 3,5 4,0 4,9 5,7

60 3,9 4,0 4,5 5,5 6,2

75 4,6 4,7 5,3 6,3 6,8

90 5,4 5,7 6,0 7,2 7,8


По результатам исследования процесса изнашивания токарных

резцов с СМП по задней поверхности ℎз (табл. П2) на участке

установившегося износа в зависимости от времени работы 𝜏 рассчитать

коэффициенты линейной регрессии и получить уравнение регрессии вида ℎз = 𝑓(𝐿), где 𝐿 – путь резания. Определить величину интенсивности

износа по формуле: 𝐼 = ∆ з∆ .


1. Проведены исследования по влиянию режимов резания – скорости

резания 𝑉, м/мин (𝑛, мин-1) и продольной подачи 𝑆, мм/об – на

шероховатость обработанной поверхности.

99

Подобрать вид и построить регрессионные зависимости 𝑅𝑎 = 𝑓(𝑉), 𝑅𝑎 = 𝑓(𝑆).

2. Влияние состава покрытия на распределение контактных

температур на передней поверхности режущего инструмента из твердого

сплава МК8 представлено в таблице П5.

Подобрать вид и построить регрессионную зависимость 𝑇 = 𝑓(𝑥),

где 𝑥 – координата (расстояние от режущей кромки вдоль передней

поверхности по длине контакта стружки с передней поверхностью 𝐶 ).

Таблица П4. Результаты исследований влияния режимов резания

на шероховатость обработанной поверхности 𝑅𝑎, мкм

Резец 1 𝐷 = 100 мм, 𝑆 = 0,3 мм/об 𝑛, мин-1 63 125 200 315 400 500 𝑅𝑎, мкм 6,2 4,2 2,9 1,7 1,5 1,2 𝐷 = 100 мм, 𝑛 = 315 мин-1 𝑆, мм/об 0,097 0,12 0,15 0,195 0,23 0,30 0,43 𝑅𝑎, мкм 1,5 1,6 1,9 2,3 3,4 4,8 8,8


100





101

Таблица П5. Результаты исследований распределения температуры

на передней поверхности режущего инструмента 𝑇, °C

от относительной координаты 𝑥 𝐶

Покры-

тие

𝐶 ,

мм

𝑥𝐶

0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0𝑇𝑖𝑁 0,447 237 620 783 916 1040 1108 1066 938 792 694 648𝑇𝑖𝐴𝑙𝑁 0,497 250 660 828 959 1076 1135 1100 981 840 747 706𝑇𝑖𝑍𝑟𝑁 0,508 280 688 854 984 1101 1159 1121 1001 858 763 721𝑇𝑖𝑆𝑖𝑁 0,492 258 656 818 945 1060 1116 1080 962 821 729 688𝑇𝑖𝐶𝑟𝑁 0,527 310 714 878 1007 1123 1180 1142 1021 878 783 740

3. Известно, что влияние температуры на протекание пластической

деформации с течением времени выражается формулой:

𝜀 = 𝐵𝜏 ,

где 𝐵 = 𝑓(𝜎, 𝑇) – коэффициент, зависящий от действующих напряжений 𝜎

и температуры 𝑇; 𝜏 – время; 𝑚 – показатель степени, приблизительно

равный 1 3⁄ .

В результате испытаний была замерена величина опускания

режущей кромки ℎпл резцов из твердого сплава МК8 с износостойкими

покрытиями при продольном точении заготовок из стали 30ХГСА в

зависимости от времени работы (табл. П6). Предположив, что вид

зависимости будет похожим на уравнение, описывающее пластическую

деформацию 𝜀, построить регрессионную зависимость ℎпл = 𝑓(𝜏).

102

Таблица П6. Результаты исследований величины опускания

режущей кромки ℎпл, мкм резцов из твердого сплава МК8 с

износостойкими покрытиями при продольном точении заготовок из стали

30ХГСА

Покрытие 𝜏, мин

1 2 3 5 10 15 𝑇𝑖𝑁 1,6 2,1 2,4 2,9 4,0 4,8 𝑇𝑖𝐴𝑙𝑁 1,2 1,5 1,8 2,2 2,9 3,6 𝑇𝑖𝑍𝑟𝑁 1,3 1,6 1,9 2,4 3,2 3,9 𝑇𝑖𝑆𝑖𝑁 1,1 1,4 1,7 2,0 2,7 3,3 𝑇𝑖𝐶𝑟𝑁 1,5 1,9 2,2 2,7 3,6 4,3

Задание к практической к работе № 6

По результатам исследования влияния углов в плане 𝜑 и 𝜑

на шероховатость обработанной поверхности 𝑅𝑎 (табл. П3) рассчитать

коэффициенты линейной двухфакторной регрессии и получить уравнение

регрессии. Оценить качество коэффициентов полученной математической

модели и ее адекватность.


1. При точении стали различных марок исследовали влияние

режимов резания – скорости резания 𝑉, м/мин, продольной подачи 𝑆,

мм/об и глубины резания 𝑡, мм – на величины составляющих силы резания 𝑃 , 𝑃 , 𝑃 , Н (табл. П7). Известно, что зависимость силы резания от

режимов резания хорошо описывается формулой:

𝑃 = 𝐶 𝑡 𝑆 𝑉 ,

103

где 𝐶 – коэффициент; 𝑥, 𝑦, 𝑛 – показатели степеней.

Используя процесс линеаризации степенной зависимости с помощью

полного факторного эксперимента методом наименьших квадратов,

рассчитать коэффициенты регрессионных зависимостей 𝑃 = 𝑓(𝑡, 𝑆, 𝑉), 𝑃 = 𝑓(𝑡, 𝑆, 𝑉) и 𝑃 = 𝑓(𝑡, 𝑆, 𝑉), проверить значимость

коэффициентов регрессии и адекватность полученной математической

модели.

Таблица П7. Результаты измерения составляющих силы резания

(серии из 𝑘 = 5 измерений) при точении стальных заготовок 𝑉,

м/мин

𝑆,

мм/об

𝑡,

мм

𝑃 ,

Н

𝑃 ,

Н

𝑃 ,

Н

1 2 3 4 5 6 Обрабатываемый материал – сталь 45

120 0,15 0,5 173; 171; 176;

176; 170

95; 91; 96;

96; 95

97; 99; 96;

97; 96

120 0,15 1,0 346; 342; 353;

351; 339

190; 192; 188;

189; 190

182; 184; 179;

183; 182

120 0,30 0,5 291; 288; 297;

295; 285

134; 136; 133;

134; 135

147; 150; 145;

149; 147

120 0,30 1,0 582; 576; 593;

591; 570

268; 271; 266;

267; 269

275; 279; 277;

276; 272

180 0,15 0,5 163; 161; 166;

160; 165

81; 81; 80;

80; 82

86; 87; 87;

86; 85

180 0,15 1,0 326; 322; 330;

319; 332

161; 160; 163;

162; 161

161; 161; 163;

162; 159

104

Продолжение табл. П7.

1 2 3 4 5 6

180 0,30 0,5 274; 279; 278;

268; 271

114; 115; 113;

114; 115

131; 132; 130;

131; 131

180 0,30 1,0 547; 542; 556;

552; 544

228; 231; 226;

227; 229

244; 247; 242;

245; 244

150 0,23 0,75 346; 342; 353;

351; 339

161; 160; 163;

160; 162

172; 169; 167;

171; 170

Обрабатываемый материал – сталь 40Х

100 0,15 0,5 172; 170; 174;

174; 176

99; 100; 98;

99; 100

99; 101; 98;

100; 99

100 0,15 1,0 343; 340; 345;

349; 339

198; 200; 196;

197; 199

185; 188; 183;

187; 185

100 0,30 0,5 289; 286; 292;

293; 288

140; 141; 139;

139; 141

151; 153; 148;

152; 151

100 0,30 1,0 578; 572; 589;

586; 574

280; 283; 277;

278; 280

281; 285; 277;

283; 281

160 0,15 0,5 160; 158; 163;

162; 158

82; 83; 81;

82; 83

86; 87; 85;

87; 86

160 0,15 1,0 320; 317; 326;

325; 318

164; 166; 162;

163; 165

161; 163; 159;

162; 161

160 0,30 0,5 269; 266; 274;

273; 264

116; 117; 115;

115; 117

131; 133; 129;

132; 131

160 0,30 1,0 538; 533; 549;

546; 529

232; 234; 230;

231; 232

244; 247; 241;

246; 244

130 0,23 0,75 341; 338; 348;

346; 334

166; 167; 164;

165; 166

171; 173; 168;

172; 171

105


1 2 3 4 5 6 Обрабатываемый материал – сталь 38Х2МЮА

120 0,15 0,5 159; 158; 162;

162; 158

107; 108; 106;

106; 108

110; 111; 108;

110; 111

120 0,15 1,0 319; 315; 325;

323; 316

213; 215; 211;

212; 214

205; 208; 202;

206; 205

120 0,30 0,5 268; 265; 273;

272; 266

151; 152; 149;

150; 152

166; 169; 164;

168; 166

120 0,30 1,0 536; 530; 547;

544; 529

302; 305; 299;

300; 302

310; 315; 306;

313; 310

170 0,15 0,5 150; 149; 153;

152; 147

93; 94; 92;

93; 94

100; 98; 101;

100; 100

170 0,15 1,0 300; 297; 306;

305; 294

187; 189; 185;

187; 186

186; 188; 183;

187; 186

170 0,30 0,5 253; 250; 258;

256; 247

132; 131; 133;

131; 133

151; 149; 153;

151; 150

170 0,30 1,0 505; 500; 515;

513; 495

264; 267; 262;

263; 264

282; 286; 278;

284; 282

145 0,23 0,75 319; 316; 325;

324; 318

184; 186; 182;

185; 183

194; 197; 191;

195; 194

Обрабатываемый материал – сталь 30ХГСА

120 0,15 0,5 194; 192; 198;

197; 195

106; 107; 105;

106; 107

111; 113; 110;

112; 111

120 0,15 1,0 388; 384; 396;

394; 388

213; 215; 210;

212; 213

207; 210; 205;

209; 207

120 0,30 0,5 326; 323; 333;

331; 322

150; 152; 149;

150; 151

169; 171; 166;

170; 169

106


1 2 3 4 5 6

120 0,30 1,0 652; 646; 665;

662; 639

301; 304; 298;

299; 301

314; 319; 310;

317; 314

180 0,15 0,5 182; 181; 186;

185; 179

90; 91; 89;

90; 91

98; 100; 97;

98; 99

180 0,15 1,0 365; 361; 372;

370; 358

181; 183; 179;

182; 180

184; 186; 181;

185; 184

180 0,30 0,5 307; 304; 313;

312; 310

128; 129; 127;

127; 129

149; 151; 147;

185; 184

180 0,30 1,0 614; 608; 626;

623; 612

256; 258; 253;

254; 257

278; 282; 275;

280; 278

150 0,23 0,75 388; 384; 390;

390; 387

181; 182; 179;

180; 181

194; 196; 191;

195; 194

Обрабатываемый материал – сталь 50

100 0,15 0,5 191; 189; 195;

194; 187

130; 131; 129;

129; 131

138; 140; 136;

139; 138

100 0,15 1,0 382; 379; 385;

388; 379

260; 263; 258;

259; 260

258; 261; 254;

260; 258

100 0,30 0,5 322; 318; 325;

326; 315

184; 186; 182;

183; 185

202; 205; 199;

204; 202

100 0,30 1,0 643; 637; 650;

653; 638

368; 372; 364;

366; 368

377; 383; 372;

380; 377

180 0,15 0,5 176; 179; 174;

179; 173

106; 107; 105;

106; 109

119; 120; 117;

119; 119

180 0,15 1,0 352; 349; 359;

357; 345

212; 214; 210;

211; 212

221; 224; 218;

223; 221

107


1 2 3 4 5 6

180 0,30 0,5 296; 293; 302;

301; 297

150; 151; 148;

149; 150

174; 171; 175;

174; 176

180 0,30 1,0 586; 604; 601;

592; 595

299; 302; 296;

298; 299

324; 328; 319;

326; 324

140 0,23 0,75 377; 373; 385;

383; 372

215; 217; 213;

214; 215

231; 234; 227;

232; 231

2. В табл. П8 представлены результаты измерения микротвердости

многоэлементных износостойких ионно-плазменных покрытий в

зависимости от содержания легирующих элементов. С использованием

полного факторного эксперимента методом наименьших квадратов

получить регрессионные зависимости микротвердости покрытий от

содержания легирующих элементов, оценить значимость коэффициентов

регрессии и адекватность модели.

Таблица П8. Результаты измерения микротвердости многоэлементных

износостойких ионно-плазменных покрытий состава 𝑇𝑖𝑀𝑒 𝑀𝑒 𝑁

Содержание

легирующего

элемента, % мас.

Микро-

твердость 𝐻 ,

ГПа

Содержание

легирующего

элемента, % мас.

Микро-

твердость 𝐻 , ГПа 𝑀𝑒 𝑀𝑒 𝑀𝑒 𝑀𝑒

1 2 3 4 5 6 𝑇𝑖𝑍𝑟𝐶𝑟𝑁

4,6 1,4 36,5 23 1,4 38,2

4,6 6,4 41,1 23 6,4 42,3

4,6 11,4 42,5 23 11,4 43,5

13,8 1,4 40,4 13,8 6,4 44,5

108


1 2 3 4 5 6 13,8 6,4 44,7 13,8 6,4 44,8

13,8 11,4 45,3 13,8 6,4 44,7

13,8 6,4 44,8 𝑇𝑖𝑍𝑟𝑆𝑖𝑁

4,8 0,25 35,8 23,2 0,85 37,5

4,8 0,25 40,5 23,2 0,85 41,4

4,8 0,25 41,3 23,2 0,85 42,2

14,0 0,55 41,3 14,0 0,55 43,6

14,0 0,55 43,8 14,0 0,55 43,6

14,0 0,55 44,3 14,0 0,55 43,7

14,0 0,55 43,6 𝑇𝑖𝑍𝑟𝐹𝑒𝑁

4,8 0,3 35,4 23,2 0,3 36,8

4,8 0,6 38,5 23,2 0,6 38,8

4,8 0,9 38,2 23,2 0,9 38,7

14,0 0,3 40,2 14,0 0,6 41,5

14,0 0,6 41,7 14,0 0,6 41,6

14,0 0,9 41,9 14,0 0,6 41,5

14,0 0,6 41,6 𝑇𝑖𝐴𝑙𝑆𝑖𝑁

7,0 0,25 37,4 23,0 0,25 39,6

7,0 0,55 40,5 23,0 0,55 41,8

7,0 0,85 40,7 23,0 0,85 42,1

15,0 0,25 42,4 15,0 0,55 45,3

15,0 0,55 45,4 15,0 0,55 45,5

15,0 0,85 45,8 15,0 0,55 45,5

15,0 0,55 45,4

109


1 2 3 4 5 6 𝑇𝑖𝐴𝑙𝐶𝑟𝑁

7,0 1,5 36,8 22,0 1,5 39,1

7,0 6,0 41,1 22,0 6,0 41,8

7,0 10,5 40,8 22,0 10,5 41,8

14,5 1,5 41,3 14,5 6,0 46,2

14,5 6,0 46,5 14,5 6,0 46,3

14,5 10,5 45,6 14,5 6,0 46,3

14,5 6,0 46,4


По данным предыдущей задачи найти оптимальный химический

состав износостойкого ионно-плазменного покрытия, который

обеспечивает максимальное значение микротвердости.

110

БИБЛИОГРАФИЧЕСКИЙ СПИСОК

1. Хацкевич, Г.А. Теория вероятностей и математическая статистика

[Электронный ресурс] : учебник / Г.А. Хацкевич, М.А. Маталыцкий. –

Электрон. дан. – Минск : Вышэйшая школа, 2017. – 591 с. – Режим

доступа: https://e.lanbook.com/book/97306.

2. Лагутин, М.Б. Наглядная математическая статистика

[Электронный ресурс] : учебное пособие / М.Б. Лагутин. – Электрон. дан. –

Москва : Лаборатория знаний, 2015. – 475 с. – Режим доступа:

https://e.lanbook.com/book/70706.

3. Трухан, А.А. Теория вероятностей в инженерных приложениях

[Электронный ресурс] : учебное пособие / А.А. Трухан, Г.С. Кудряшев. –

Электрон. дан. – Санкт-Петербург : Лань, 2015. – 368 с. – Режим доступа:

https://e.lanbook.com/book/56613.

4. Кобзарь, А.И. Прикладная математическая статистика. Для

инженеров и научных работников [Электронный ресурс] : учебное пособие

/ А.И. Кобзарь. – Электрон. дан. – Москва : Физматлит, 2012. – 816 с. –

Режим доступа: https://e.lanbook.com/book/59747.

5. Штерензон, В.А. Моделирование технологических процессов

[Электронный ресурс] : конспект лекций / В.А. Штерензон. – Екатеринбург

: Изд-во Рос. гос. проф.-пед. ун-та, 2010. – 66 с. – Режим доступа:

http://window.edu.ru/resource/532/79532

6. Мухачёв, В.А. Планирование и обработка результатов

эксперимента : учебное пособие. – Томск: Томский государственный

университет систем управления и радиоэлектроники, 2007. – 118 с.

7. Воскобойников, Ю.Е. Математическая статистика с примерами в

Excel [Электронный ресурс] : учебное пособие / Ю.Е. Воскобойников,

111

Е.И. Тимошенко. – Новосибирск: Изд.НГАСУ, 2006. – 154 с. – Режим

доступа: http://window.edu.ru/resource/305/63305

8. Болыпев, Л.H. Таблицы математической статистики /

Л.H. Болыпев, Н.В. Смирнов. – М.: Наука. Главная редакция физико-

математическом литературы, 1983. – 410 с.

9. Буре, В.М. Методы прикладной статистики в R и Excel

[Электронный ресурс] : учебное пособие / В.М. Буре, Е.М. Парилина,

А.А. Седаков. – Электрон. дан. – Санкт-Петербург : Лань, 2018. – 152 с. –

Режим доступа: https://e.lanbook.com/book/104938.

10. Данченков, И.В. Математическая статистика: проверка гипотезы

о виде закона распределения [Электронный ресурс] : учебное пособие /

И.В. Данченков, В.А. Карасев. – Электрон. дан. – Москва : МИСИС,

2017. – 54 с. – Режим доступа: https://e.lanbook.com/book/108068.

11. Роганов, В.Р. Обработка экспериментальных данных

[Электронный ресурс] : учебное пособие / В.Р. Роганов, С.М. Роганова,

М.Е. Новосельцева. – Пенза: Пенз. гос. ун-т, 2007. – 171 с. – Режим

доступа: http://window.edu.ru/resource/987/36987

12. Третьяк, Л.Н. Основы теории и практики обработки

экспериментальных данных : учебное пособие для бакалавриата и

магистратуры / Л.Н. Третьяк, А.Л. Воробьев ; под общ. ред. Л.Н. Третьяк. –

2-е изд., испр. и доп. – М : Юрайт, 2018. – 217 с. – (Серия: Университеты

России).

13. Шадрина, Н.И. Решение задач оптимизации в Microsoft Excel

2010: учеб. пособие / Н.И. Шадрина, Н.Д. Берман ; науч. ред.

Э. М. Вихтенко. – Хабаровск : Изд-во Тихоокеан. гос. ун-та, 2016. – 101 с.

112

Учебное издание

ЧИХРАНОВ Алексей Валерьевич ДЕМИДОВ Валерий Васильевич

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ ЭКСПЕРИМЕНТАЛЬНЫХ ДАННЫХ

Учебно-методическое пособие к практическим занятиям

Редактор А. В. Ганина

Подписано в печать 17.09.2019. Формат 60×84/16. Усл. печ. л. 6,51. Тираж 30 экз. Заказ 860. ЭИ № 1340.

Ульяновский государственный технический университет

432027, г. Ульяновск, ул. Сев. Венец, д. 32 ИПК «Венец» УлГТУ, 432027, г. Ульяновск, ул. Сев. Венец, д. 32

МАТЕМАТИЧЕСКИЕ МЕТОДЫ ОБРАБОТКИ...

Documents