"Чистая"
и прикладная математика

ПАРНАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ, КОРРЕЛЯЦИЯ

Линейная зависимость

Корреляционнная зависимость. Коэффициент корреляции

Уравнение линейной регрессии

Линейная зависимость

Если заранее известно, что зависимость между факториальным признаком x и результативным признаком y должна быть линейной, выражающейся в виде уравнения типа  , задача сводится к нахождению по некоторой группе точек наилучшей прямой, называемой прямой парной линейной регрессии. Следует найти такие значения коэффициентов a и b , чтобы сумма квадратов отклонений была наименьшей:

.

Если через и обозначить средние значения признаков X  и Y,то полученная с помощью метода наименьших квадратов функция регрессии удовлетворяет следующим условиям:

  • прямая парной линейной регрессии проходит через точку ;
  • среднее значение отклонений равна нулю: ;
  • значения  и  не связаны: .

Корреляционная зависимость. Коэффициент корреляции

Тесноту линейной зависимости характеризует коэффициент парной линейной корреляции. Коэффициент корреляции рассчитывается следующим образом:

.                   (12)

Для более предметного изложения следует заметить, что здесь идёт речь о коэффициенте корреляции Пирсона. Существуют и другие виды коэффициентов корреляции, например, коэффициент корреляции Спирмена, коэффициент корреляции Кендалла и другие. Но коэффициент корреляции Пирсона применяется в большинстве случаев, поскольку чаще всего предполагается, что распределение переменных нормальное или несущественно отличается от нормального. Именно такое распределение является условием применения коэффициента корреляции Пирсона.

Значения коэффициента корреляции находится в пределах от -1 до 1.

Ниже приведена таблица значений коэффициента корреляции и соответствующих им характеристик тесноты связи между переменными.

Значение коэффициента корреляции

Линейная зависимость

-1

функциональная отрицательная

0

не существует

1

функциональная положительная

слабая

средней тесноты

тесная

 


Пример 1. В таблице – данные о валовом внутреннем продукте (ВВП) и частным потреблением (в средних ценах 1995 года), в условных единицах. Найти коэффициент корреляции между этими величинами.

Квартал, год

ВВП

Частное потребление

I, 1995

652,870

357,191

II, 1995

601,893

356,533

III, 1995

590,792

376,951

IV, 1995

593,667

379,866

I, 1996

580,435

385,749

II, 1996

612,063

392,194

III, 1996

620,847

417,342

IV, 1996

614,360

426,991

I, 1997

609,708

394,661

II, 1997

664,246

416,367

III, 1997

682,696

428,103

IV, 1997

680,104

464,410

I, 1998

667,513

412,133

II, 1998

704,317

450,606

III, 1998

698,793

469,775

IV, 1998

668,498

477,421

I, 1999

663,786

415,650

II, 1999

703,213

477,013

III, 1999

707,238

498,525

IV, 1999

694,329

510,171

I, 2000

704,055

447,272

II, 2000

738,637

504,100

III, 2000

753,565

522,277

IV, 2000

754,459

533,585

Решение. Результативным признаком Y является частное потребление, а факториальным признаком X – валовой внутренний продукт.

Для расчёта коэффициента корреляции создадим рабочую таблицу:

 

X

Y

XY

I, 1995

562,870

357,191

201052,098

316822,637

127585,410

II, 1995

601,893

356,533

214594,717

362275,183

127115,780

...

...

...

...

...

...

III, 2000

753,565

522,277

393569,668

567860,209

272773,265

IV, 2000

754,459

533,585

402568,006

569208,383

284712,952

Всего

15872,084

10514,886

7015990,600

10569153,153

4670555,076

Используя первоначальные данные и производя расчёты, находим коэффициент корреляции:


 

Пройти тест по теме Теория вероятностей и математическая статистика

Уравнение парной линейной регрессии

Условие метода наименьших квадратов выполняется, если значения коэффициентов равны:

,                         (13)  

.                                  (14)

 


Пример 2. Найти уравнение парной линейной регрессии зависимости между валовым внутренним продуктом (ВВП) и частным потреблением на основе данных примера 1.

Решение. Используем рассчитанные в решении примера 1 суммы:

Используя эти суммы, вычислим коэффициенты:

Таким образом получили уравнение прямой парной линейной регрессии:

Нет времени вникать в решение? Можно заказать работу!

Пройти тест по теме Теория вероятностей и математическая статистика

К началу страницы