Написание контрольных, курсовых, дипломных работ, выполнение задач, тестов, бизнес-планов
Главная \ Методические указания \ Методические указания и информация \ Побудова лінійної регресійної моделі для програмного забезпечення

Побудова лінійної регресійної моделі для програмного забезпечення

Лабораторна робота №1

Побудова лінійної регресійної моделі для програмного забезпечення

 

1.1.         Мета роботи – освоїти методи аналізу даних та побудувати лінійну регресійну модель для різних версій програмного забезпечення.

 

1.2.         Теоретичні відомості.

Лінійна регресійна модель є найбільш  розповсюдженим способом виявлення залежностей чи закономірностей між змінними в моделі. Моделювання дозволяє показати величину цієї залежності у вигляді коефіцієнтів. Завдяки цьому стає можливим зробити безпосередній прогноз чи здійснювати планування, спираючись на ці прогнози. Також завдяки регресійному аналізу можна корегувати чинники, які впливають на кінцевий результат, а отримувана модель дозволяє виявити пріоритетні фактори впливу.

Загальний вигляд моделі лінійної регресії:

Y=a0+a1x1+...+akxk

де      a0 ak— параметри (коефіцієнти) регресії,

x1 xk —фактори впливу,

k — кількість факторів моделі.

 

1.3.         Вихідні дані

 

Розглянемо у якості вхідних даних до побудови регресійної моделі наступні параметри роботи програмного забезпечення: 1) параметр, що визначає обсяг пам’яті для зберігання індексі; 2) параметр, що визначає обсяг кеш пам’яті; 3) параметр, що визначає обсяг оперативної пам’яті. Результуючий параметр  Y – час генерації. На рис.1 наведено таблицю з вихідними даними.

 

Рис.1. Вихідні дані для побудови регресійної моделі.

Для побудови адекватних лінійних моделей бажано, щоб вихідні дані не мали занадто сильних перепадів, в інакшому випадку необхідно проводити попереднє згладжування.

1.4.         Побудова моделі

 

Параметри лінійної регресивної моделі можна розрахувати методом найменших квадратів, проте доцільно використати вбудовані можливості Excel.

В Excel є надбудова Пакет анализа, для його активації необхідно активувати  вкладку Файл, у меню, яке відкриється, вибрати пункт Параметры.  

Далі у вікні, яке відкриється, вибрати пункт Надстройки, у вкладці знизуу списку вибрати Надстройки Excel, та натиснути кнопку Перейти.

 

Рис.2

 

У вікні, яке з’явиться, вибрати Пакет анализа  та  Поиск решения.

 

 

Рис.3

Після активації надбудови вона буде доступною у вкладці головного меню Excel  Данные, кнопка Анализ данных.

В активному вікні інструменті Анализ данных із списку опцій потрібно вибрати пункт Регрессия:

 

 

Рис.4

Далі у вікні, яке відкриється, вказуємо інтервали для обчислення параметрів регресійної моделі, для параметру Y та усіх факторів впливу x1x3.

Після цього на новому листі з’являться результати регресійного аналізу.

 

Рис.5. Результати регресійного аналізу

  R2 =0,9942  - коефіцієнт детермінації, вказує на те, що на 99,42%  розрахункові параметри моделі пояснюють залежність і зміну параметра, який досліджується - Y від досліджуваних факторів. Він є показником якості моделі.

Коефіцієнти моделі:
a0 = - коефіцієнт, який показує,  яким буде параметр виходу Y в разі, якщо усі використані в моделі фактори будут дорівнювати 0 (тобто залежність від інших неописаних в моделі факторів);
a1 = - коефіцієнт, який показує вагомість впливу фактору x1 на Y;
a2 = - коефіцієнт, який показує вагомість впливу фактору x2 на Y;
a3 = - коефіцієнт, який показує вагомість впливу фактору x3 на Y.

Тоді лінійна регресійна модель має вигляд:

Y = 22,5131  - 0,1406x1 - 0,0849x2 + 2,3008x3

1.5.         Побудова прогнозу

 

Модель будується не лише для того, щоб вивчити залежності параметру, що вивчається, від факторів впливу, а й для того, щоб зробити прогноз наступного релізу програмного забезпечення.

Для виконання прогнозу достатньо  підставити значення факторів впливу в отримане рівняння моделі.

 

Рис.6. Додавання стовпця з прогнозом на наступний реліз програмного забезпечення

 

Фактичні значення та розрахункові значення згідно моделі відображено у вигляді графіків з метою візуалізації похибки моделі. Таким чином, щоб здійснити прогноз за моделлю, необхідно щоб були  відомі  усі фактори. Якщо йдеться про часовий ряд та відповідно про прогноз на майбутнє (на наступний місяць або рік, наприклад), то не завжди можливо дізнатись, які  будуть фактори впливу саме в майбутньому. В таких випадках необхідно виконувати ще й прогноз для факторів впливу – для цього можна використати авторегресійну модель (авторегресійна модель – це модель, в якій факторами впливу є власне сам об’єкт дослідження та час, при цьому моделюється залежність показника від того, яким він був у минулому).

 

1.6.Завдання для виконання на лабораторній роботі.

 

1) підготувати вихідні дані у табличному процесорі Excel. Вибрати варіанти завдань за номером в журналі:

 

Варіант 1,5,9,13,17,21

 

Y

x1

x2

x3

альфа

1,56799

29,2700

5,89

4,99

бета

1,96781

22,1800

5,56

4,83

релиз 1

1,87883

20,3600

4,56

4,78

релиз 2

1,56005

19,1030

3,49

3,93

релиз 4

1,16787

19,5600

3,14

3,59

релиз 5

0,86789

19,0700

2,98

2,56

релиз 6

0,79801

18,1100

2,97

2,30

релиз 7

0,56700

17,9100

2,43

2,11

 

 

Варіант 2,6,10,14,18,22

 

Y

x1

x2

x3

Альфа

4,90799

20,7800

25,43

2,99

Бета

4,80981

16,9300

22,16

2,98

релиз 1

3,99910

15,9900

18,56

2,78

релиз 2

3,76780

14,5700

17,99

2,74

релиз 4

3,68800

13,2900

17,04

2,67

релиз 5

3,54910

12,9800

16,78

2,54

релиз 6

3,39560

12,7800

15,67

2,49

релиз 7

3,24840

10,9900

14,43

2,31

 

 

Варіант 3,7,11,15,19,23

 

Y

x1

x2

x3

альфа

9,56799

6,3300

15,03

1,01

бета

9,53001

6,2800

12,96

0,99

релиз 1

8,96799

6,2000

12,86

0,89

релиз 2

8,96743

6,1000

12,09

0,84

релиз 4

8,96597

6,0801

11,94

0,79

релиз 5

8,85017

6,0700

11,78

0,79

релиз 6

8,84799

6,0011

11,67

0,79

релиз 7

8,83974

5,9900

11,44

0,75

 

 

 

 

Варіант 4,8,12,16,20,24

 

Y

x1

x2

x3

альфа

10,34000

7,3300

20,33

2,44

бета

9,99764

7,2800

20,16

2,41

релиз 1

9,96780

7,2600

18,99

1,49

релиз 2

9,80085

7,1800

17,99

1,34

релиз 4

9,70877

7,1300

17,35

1,27

релиз 5

9,69999

6,1000

17,02

1,17

релиз 6

9,65431

6,0001

17,00

1,19

релиз 7

8,99789

6,0001

16,98

1,11

2) виконати усі етапи побудови лінійної регресійної моделі;

3) проаналізувати отриману модель та виконати прогноз на параметри фінального реліза програмного забезпечення;

4)  побудувати діаграму для візуального порівняння отриманого прогнозу з фактичним рівнянням регресії;

5) оформити звіт по роботі та захистити лабораторну роботу.

 

Оформлений звіт у форматі  .doc  та файл   .xls  необхідно помістити в архів 

За наступним шаблоном:

Прізвище_lab1.zip

Наприклад: Petrenko_lab1.zip

 

та надіслати за адресою     gtgm@ukr.net