mnl tutorial mr2 spss

12
Логистична регресия с SPSS Логистична регресия Логистичната регресия е метод за анализ на зависимости между една зависима категорийна променлива и една или повече независими променливи, независимо от равнището на тяхното скалиране. В зависимост от броя на категориите на зависимата променлива разграничаваме дихотомна (при две категории например купувач/некупувач и др.) и политомна (при повече от две категории например избор на марка А, В или С и др.) логистична регресия. В маркетинговите изследвания логистичната регресия се използва: да се определи дали независимите променливи обясняват значителна част от вариацията в зависимата променлива; да се определи каква част от вариацията в зависимата променлива може да бъде обяснена от независимите променливи; да се класифицират новопоявили се обекти към априори формирани групи (категориите на зависимата променлива) при конкретни стойности на независимите променливи; да се анализират различията между априори формираните групи; да се оценят ефектите на взаимодействие между включените в модела фактори; да се определи специфичният принос на отделен предиктор или група от предиктори за обясняването на вариацията в зависимата променлива, като останалите независими променливи са поставени под контрол. В маркетинга логистичната регресия най-често се използва като алтернатива на дискриминантния анализ при решаване на класификационни проблеми. За разлика от дискриминантния анализ обаче логистичната регресия не поставя толкова строги изисквания към равнището на скалиране на предикторите. Чрез нея може да се изследва влиянието върху дадена категорийна променлива на различни фактори и ковариати. Логистичната регресия не поставя изискване и за нормалност на разпределението и хомоскедастичност на зависимата променлива за всяко равнище на независимите променливи. Логистичната регресия има много допирни точки и с регресионния анализ, но за разлика от него не поставя изискването за метричност на независимите променливи. При логистичната регресия не се поставят изисквания и за нормалност на разпределението на грешките, за нормалност на разпределението на зависимата променлива, за константност на вариацията. Основна постановка на казуса Разполагате с данни за избора на марки маргарин, предлагани във верига от три супермаркета. На излизане от търговските обекти респондентите са били помолени да оценят 10 продуктови атрибута (подходящ за размазване, цена, трайност, дял на ненаситените мастни киселини, подходящ за печене и пържене, вкус, съдържание на калории, дял на животински мазнини, съдържание на витамини, натурален продукт). Оценката на продуктовите атрибути се извършва въз основа на 7-степенни Ликертови скали. В резултат на предварително проведен клъстерен анализ включените в изследването марки са обособени в три еднородни групи. Марките, съставляващи отделните групи, са както следва: © Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания 1

Upload: marusyasmokova

Post on 19-Jan-2016

83 views

Category:

Documents


0 download

DESCRIPTION

logistic regression

TRANSCRIPT

Page 1: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Логистична регресия

Логистичната регресия е метод за анализ на зависимости между една зависима категорийна променлива и една или повече независими променливи, независимо от равнището на тяхното скалиране. В зависимост от броя на категориите на зависимата променлива разграничаваме дихотомна (при две категории – например купувач/некупувач и др.) и политомна (при повече от две категории – например избор на марка А, В или С и др.) логистична регресия. В маркетинговите изследвания логистичната регресия се използва:

• да се определи дали независимите променливи обясняват значителна част от вариацията в зависимата променлива;

• да се определи каква част от вариацията в зависимата променлива може да бъде обяснена от независимите променливи;

• да се класифицират новопоявили се обекти към априори формирани групи (категориите на зависимата променлива) при конкретни стойности на независимите променливи;

• да се анализират различията между априори формираните групи; • да се оценят ефектите на взаимодействие между включените в модела

фактори; • да се определи специфичният принос на отделен предиктор или група от

предиктори за обясняването на вариацията в зависимата променлива, като останалите независими променливи са поставени под контрол.

В маркетинга логистичната регресия най-често се използва като алтернатива на дискриминантния анализ при решаване на класификационни проблеми. За разлика от дискриминантния анализ обаче логистичната регресия не поставя толкова строги изисквания към равнището на скалиране на предикторите. Чрез нея може да се изследва влиянието върху дадена категорийна променлива на различни фактори и ковариати. Логистичната регресия не поставя изискване и за нормалност на разпределението и хомоскедастичност на зависимата променлива за всяко равнище на независимите променливи. Логистичната регресия има много допирни точки и с регресионния анализ, но за разлика от него не поставя изискването за метричност на независимите променливи. При логистичната регресия не се поставят изисквания и за нормалност на разпределението на грешките, за нормалност на разпределението на зависимата променлива, за константност на вариацията. Основна постановка на казуса

Разполагате с данни за избора на марки маргарин, предлагани във верига от три супермаркета. На излизане от търговските обекти респондентите са били помолени да оценят 10 продуктови атрибута (подходящ за размазване, цена, трайност, дял на ненаситените мастни киселини, подходящ за печене и пържене, вкус, съдържание на калории, дял на животински мазнини, съдържание на витамини, натурален продукт). Оценката на продуктовите атрибути се извършва въз основа на 7-степенни Ликертови скали.

В резултат на предварително проведен клъстерен анализ включените в изследването марки са обособени в три еднородни групи. Марките, съставляващи отделните групи, са както следва:

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

1

Page 2: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Група 1 Olineza (8), Flora (7)

Група 2 ARO (1), Remia (2), Rama (3), Serina (9), Bella (11), Ana (10)

Група 3 Tommy (4), Kaliakra (5), Linko (6)

Вашите задачи са:

• Да създадете нова променлива (Group), която характеризира трите хомогенни групи от марки.

• Да проверите до колко са спазени изискванията на логис-тичната регресия.

• Да параметризирате модела и да коментирате резултатите. • Да оцените резултатите от класификацията.

1. Проверка на основните допускания при логистичната регресия Преди същинския анализ е необходимо, изхождайки от старата категорийна променлива Brand, да се създаде нова променлива, която има само три категорийни равнища (изискване по условие!). Тази задача може да бъде реализирана по познатия ви вече начин, а именно – чрез използване възможностите на функция Recode. За да създадете нова променлива, която да ползва като основа значенията на вече съществуваща променлива, следва да изпълните следния команден ред: Transform Recode into Different Variables… В заредения диалогов прозорец Recode into Different Variables трябва да зададете името и етикета на новата променлива, след което да натиснете бутона Change. На следващ етап е необходимо да посочите кодовете, което ще ползва новосъздадената променлива Group. За тази цел кликнете върху бутон Old and New Values…

Зарежда се диалогов прозорец Recode into Different Variables: Old and New Values, в който трябва да посочите на съществуващ вече стар код (използван от променливата Brand) какъв нов код ще съответства (който ще се използва от новата променлива Group). Важно е да се отбележи, че на всички стари кодове

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

2

Page 3: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

трябва да им се присвои нов, независимо от това дали се дублират или не. В случая стара променлива е с код 2 и новата променлива е с код 2, но това изрично трябва да се посочи, противно новата променлива ще има липсваща стойност срещу код 2. Като приключи кодирането се избира бутон Continue.

При спазване на указаната процедура ще се създаде нова променлива Group, която ще има три категории – група 1, група 2 и група 3. В последващия анализ в качеството на зависима променлива ще се използва новосъздадената променлива Group, вместо променливата Brand. Подобно на регресионния анализ, едно от условията за приложението на логистичната регресия е независимите променливи да не корелират помежду си, т.е. условие за неналичие на мултиколинеарност. За да проверите доколко това условие е спазено, изпълнете следния команден ред:

Analyze Regression Linear… В диалогов прозорец Linear Regression посочете като зависима променливата група от марки, а като независими променливи – целия списък от 10 продуктови атрибута.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

3

Page 4: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Кликнете върху бутон Statistics и изберете Collinearity diagnostics.

По този начин в аутпута на SPSS ще се докладват VIF критериите за всеки от изучаваните атрибути.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

4

Page 5: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Coefficientsa

1,757 ,342 5,145 ,000

-,098 ,045 -,238 -2,199 ,031 ,558 1,793

,081 ,037 ,201 2,213 ,030 ,791 1,265-,055 ,055 -,098 -,996 ,322 ,672 1,489

-,008 ,040 -,016 -,186 ,853 ,890 1,123

-,024 ,039 -,060 -,625 ,534 ,701 1,426

,000 ,058 ,000 ,003 ,998 ,438 2,281

,090 ,039 ,211 2,315 ,023 ,781 1,280

,029 ,025 ,120 1,179 ,242 ,625 1,599

-,112 ,052 -,232 -2,178 ,032 ,571 1,751

,185 ,047 ,414 3,928 ,000 ,586 1,707

(Constant)Подходящ заразмазванеЦенаТрайностДял ненаситенимастни киселиниПодходящ запечене и пърженеВкусСъдържание накалорииДял животинскимазниниСъдържание навитаминиНатурален продукт

Model1

B Std. Error

UnstandardizedCoefficients

Beta

StandardizedCoefficients

t Sig. Tolerance VIFCollinearity Statistics

Dependent Variable: Група от маркиa.

Непосредственият извод, който може да се направи, е, че:

Не съществува проблем с мултиколинеарността и при всяка от изучаваните променливи VIF критерия е в разумни граници (VIF < 5).

2. Политомна логистична регресия

За да извършите политомен логистичен анализ, е необходимо да изпълните следния команден ред: Analyze Regression Multinomial Logistic…

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

5

Page 6: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Подобно на множествената линейна регресия, при политомната логистична регресия следва да посочите зависимата променлива (в случая категорийната променлива група от марки) и независимите променливи (в случая са 10-те продуктови атрибута, измерени по силна скала).

След като дефинирането типа на променливите, кликнете върху бутона Statistics…, за да изберете конкретни компоненти на аутпут файла.

SPSS генерира аутпут файл, в началото на който се извежда съобщение, което засяга тестовете, свързани с качеството на апроксимация. Отбелязано е, че 66,7 % от клетките имат честота 0. Този процент би могъл да се използва като индикатор за евентуални проблеми, тъй като едно от изискванията на

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

6

Page 7: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

логистичната регресия е да се осигури голяма извадка с оглед по-висока валидност на резултатите.

Warnings

There are 178 (66,7%) cells (i.e., dependent variable levels by subpopulations) withzero frequencies.

Непосредственият извод, който може да се направи, е, че:

Валидността на резултатите може да се постави под съмнение, тъй като процентът на клетките с нулева честота е твърде висок.

В аутпут файла се докладва информация за фактическия брой респонденти, избрали всяка от групите марки. В конкретния пример, от 92 валидни случаи 20,7 % от респондентите са избрали марки от група 1 пред марки от групи 2 и 3.

Case Processing Summary

19 20,7%51 55,4%22 23,9%92 100,0%35

12789a

Group 1Group 2Group 3

Група отмарки

ValidMissingTotalSubpopulation

NMarginal

Percentage

The dependent variable has only one value observedin 89 (100,0%) subpopulations.

a.

Непосредственият извод, който може да се направи, е, че:

Най-предпочитани са марки от група 2, тъй като повече от половината респонденти (55,4 %) са ги предпочели пред марки от група 1 и 3.

Следващата част от аутпута е посветен на показатели, свързани с качеството на модела. В таблицата Model Fitting Information се съдържа емпиричната стойност на теста на коефициента на правдоподобност (LR test) или хи квадрат тест за модела като цяло. Последният представлява тест за значимостта на разликата между LL-стойност за модела на изследователя (модел с всички независими променливи) и LL-стойност за нулевия модел (модел само с константа). Нулевата хипотеза гласи, че между тези два модела няма разлика, т.е. всички логистични коефициенти, с изключение на константата, са нула.

Model Fitting Information

183,06896,684 86,384 20 ,000

ModelIntercept OnlyFinal

-2 LogLikelihood

ModelFittingCriteria

Chi-Square df Sig.

Likelihood Ratio Tests

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

7

Page 8: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Непосредственият извод, който може да се направи в конкретния случай, е, че:

Моделът като цяло е значим, тъй като емпиричната стойност на равнището на значимост на LR теста е по-малка от критичната стойност, т.е. 0,000 < 0,05. Съществува статистически значима разлика между изучавания и нулевия (изучавания превъзхожда нулевия модел!). Това означава, че поне един от логистичните коефициенти в модела е различен от нула.

Изводи относно качеството на апроксимация на модела като цяло могат да се направят въз основа на данните от следващата таблица, в която се съдържат два теста за адекватността на модела като цяло. Нулевата хипотеза гласи, че моделът адекватно описва изходните данни и тя може да бъде приета при равнище на значимост на тестовете по-голямо от 0,05.

Goodness-of-Fit

161,690 156 ,36196,684 156 1,000

PearsonDeviance

Chi-Square df Sig.

Изводът, който може да се направи в конкретния случай, е, че:

Моделът адекватно описва изходните данни, тъй като равнището на значимост на хи квадрат теста на Пирсън и девиацията са по-големи от 0,05.

Оценката на един политомен логистичен модел се извършва и чрез три псевдо R2 статистики. Трябва да се отбележи, че докладваните три статистики не са показатели за качеството на апроксимация. Чрез тях се прави опит за измерване силата на връзката между зависимата и независимите променливи. Тези показатели обаче са най-подходящи при съпоставянето на няколко конкурентни модели. По правило се избира онзи модел, при който стойностите на псевдо R2 статистиките са най-високи.

Pseudo R-Square

,609,705,472

Cox and SnellNagelkerkeMcFadden

Въз основа на стойностите на псевдо R2 статистиките може да се направи следния извод:

Стойностите и на трите псевдо R2 статистики са добри (стойности над 0,4), а според Нагелкерк – много добри (над 0,5).

Освен на ниво модел, LR тестът се изчислява и на равнище предиктор. В случая чрез него се проверява статистическата значимост на регресионните коефициенти. Нулевата хипотеза гласи, че регресионните параметри са равни на 0, т.е. съответстващите им предиктори (в случая 10-те продуктови атрибута) не оказват статистическо значимо влияние върху зависимата (в случая избора на някоя от трите марки).

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

8

Page 9: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Likelihood Ratio Tests

106,258 9,573 2 ,008101,116 4,432 2 ,109

97,841 1,157 2 ,561105,520 8,836 2 ,012100,707 4,022 2 ,134

97,339 ,655 2 ,72199,971 3,286 2 ,193

103,822 7,138 2 ,02897,900 1,216 2 ,544

100,392 3,708 2 ,157109,235 12,551 2 ,002

EffectInterceptSpreadPriceDurabilityFat_acidRoastTasteCaloriesAnimal_acidVitamineNaturalness

-2 LogLikelihood of

ReducedModel

Model FittingCriteria

Chi-Square df Sig.

Likelihood Ratio Tests

The chi-square statistic is the difference in -2 log-likelihoodsbetween the final model and a reduced model. The reduced modelis formed by omitting an effect from the final model. The nullhypothesis is that al l parameters of that effect are 0.

Обобщавайки данните от таблицата, може да се заключи, че:

Променливи трайност, съдържание на калории и натурален продукт са статистически значими (p-value < 0,05).

Променливи подходящ за размазване, цена, дял на ненаситените мастни киселини, подходящ за печене и пържене, вкус, дял на животински мазнини, съдържание на витамини не оказват статистически значимо влияние върху избора на марка.

В следващата таблица се съдържат оценките на параметрите на логистичното уравнение и тяхната статистическа значимост1. Важно е да се отбележи, че директната интерпретация на логистичните коефициенти е невъзможна. Интерпретацията при логистичната регресия се реализира чрез т.нар. вероятностно съотношение (Odds ratio), наречено още относителен риск и винаги спрямо референтната група (в случая за референт е избрана последната група, т.е. групата с най-голям код или това са марки от група 3). Вероятностното съотношение се извежда посредством следната формула:

)1(1)1(=−

==

ypypOdds

Или вероятностното съотношение представлява отношението на вероятността да настъпи дадено събитие (например да бъде избрана марка от група 1) и вероятността да бъде избрана марка от референтната група. Интерпретацията на показателя е както следва:

1 Тъй като в таблицата с логистичните коефициенти се докладват техните стойности единствено за група 1 спрямо референтната група 3 и за група 2 спрямо група 3, за изчисляването на техните стойности за група 1 спрямо група 2 трябва да се използва следната

зависимост: (група1) (група1) (група 2)ln ln ln(група 2) (група 3) (група 3)

P P PP P P

= −

.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

9

Page 10: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

• В случай, че оценката за съдържанието на калории се увеличи с единица, относителният риск да бъде избрана марка от група 1 пред марка от група 3 ще се промени 0,376 пъти (т.е. нараства вероятността да бъде избрана марка от група 3!). Ако вероятността на един респондент за избор на марка от група 1 е 0,9, то тогава вероятностното съотношение за избор на марка от група 1 е 9. Тогава при изменение в оценката на атрибута с единица относителният риск се променя на 0,376 х 9 = 3,384. Така съответстващата вероятност за избор на марка от група 1 намалява на [3,384 / (1+3,384) = 0,77].

• В случай, че оценката за трайност се увеличи с единица, относителният риск да бъде избрана марка от група 2 пред марка от група 3 ще се промени 4,651 пъти (т.е. нараства вероятността да бъде избрана марка от група 2!).

Parameter Estimates

4,606 3,704 1,547 1 ,214,708 ,515 1,887 1 ,169 2,030 ,739 5,571

-,469 ,452 1,079 1 ,299 ,625 ,258 1,5161,214 ,678 3,202 1 ,074 3,367 ,891 12,728

,523 ,473 1,225 1 ,268 1,687 ,668 4,260,118 ,386 ,094 1 ,759 1,125 ,528 2,397

-,773 ,746 1,073 1 ,300 ,462 ,107 1,993-,979 ,410 5,686 1 ,017 ,376 ,168 ,840-,095 ,245 ,150 1 ,698 ,909 ,563 1,470,743 ,570 1,697 1 ,193 2,102 ,688 6,427

-1,861 ,645 8,329 1 ,004 ,156 ,044 ,5508,238 3,395 5,890 1 ,015

,109 ,451 ,058 1 ,810 1,115 ,461 2,699-,331 ,420 ,619 1 ,431 ,719 ,315 1,6371,537 ,628 5,996 1 ,014 4,651 1,359 15,917

,761 ,444 2,940 1 ,086 2,140 ,897 5,107-,096 ,342 ,078 1 ,779 ,909 ,465 1,777

-1,080 ,707 2,330 1 ,127 ,340 ,085 1,359-,820 ,399 4,231 1 ,040 ,440 ,202 ,962-,214 ,227 ,882 1 ,348 ,808 ,517 1,261,206 ,521 ,156 1 ,693 1,229 ,442 3,414

-1,413 ,599 5,562 1 ,018 ,243 ,075 ,788

InterceptSpreadPriceDurabilityFat_acidRoastTasteCaloriesAnimal_acidVitamineNaturalnessInterceptSpreadPriceDurabilityFat_acidRoastTasteCaloriesAnimal_acidVitamineNaturalness

Група от маркиa

Group 1

Group 2

B Std. Error Wald df Sig. Exp(B) Lower Bound Upper Bound

95% Confidence Interval forExp(B)

The reference category is : Group 3.a.

Изводите, които могат да се направят, обобщавайки данните от таблицата с оценките на параметрите, се свеждат до следното:

Единствено променливи съдържание на калории и натурален продукт оказват статистическо статистически влияние върху избора на марка от група 1 пред марка от група 3 (p-value < 0,05).

Единствено променливи трайност, съдържание на калории и натурален продукт оказват статистическо статистически влияние върху избора на марка от група 2 пред марка от група 3 (p-value < 0,05).

Променливите цена, вкус, съдържание на калории, дял на животински мазнини и натурален продукт влияят негативно върху вероятността за избор на марка от група 1 пред марка от група 3. Всички останали атрибути оказват позитивно въздействие върху вероятността за избор.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

10

Page 11: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Променливите цена, подходящ за пържене и печене, вкус, съдържание на калории, дял на животински мазнини и натурален продукт влияят негативно върху вероятността за избор на марка от група 2 пред марка от група 3. Всички останали атрибути оказват позитивно въздействие върху вероятността за избор.

Важен инструмент за оценка на модела е класификационната матрица. В тази матрица по главния диагонал се съдържат правилно класифицираните случаи или 6 от общо 19 респонденти (31,6 %), избрали група 1, 45 от общо 51 (88,2 %), избрали група 2 и 19 от общо 22 респонденти (86,4 %), избрали група 3, са съотнесени правилно към априори дефинираните групи. Всички останали случаи не са коректно класифицирани. Или процентът на попаденията (общо за извадката) е 76,1 %, т.е. грешката при класификацията е в размер на 23,9 %.

Classification

6 12 1 31,6%4 45 2 88,2%1 2 19 86,4%

12,0% 64,1% 23,9% 76,1%

ObservedGroup 1Group 2Group 3Overall Percentage

Group 1 Group 2 Group 3PercentCorrect

Predicted

За оценка качеството на класификацията, постигната от логистичната регресия, може да се използва т.нар Q-тест на Прес (Press’s Q-test). Последният приема, че грешката при класификацията следва хи квадрат разпределение. Q-тестът на Прес се използва за проверка на значимостта на резултатите от класификацията (т.е. да се оцени дали коефициент на попаденията от 76,1% е статистически значим или не). Той проверява нулева хипотеза, която гласи, че правилното класифициране на случаите е случайно. Емпиричната стойност на Q-теста на Прес се изчислява въз основа на следната формула:

)1.()..('Pr

2

−−

=−GK

aGKKtestQsess

където:

K - броят на случаите (при конкретния пример – общо 92 случая); G – броят на групите (при конкретния пример – 3 групи); a – коефициент на правилно класифицираните случаи (при конкретния пример коефициентът на попаденията е 0,761).

В конкретния пример Press Q емпирична = (92 – 92.3.0,761)2/(92.(3-1)) = 13932,5/184 = 75,72. На тази емпирична стойност и при степен на свобода 2 (df=G-1) съответства емпирично равнище на значимост в размер на 0,0002. Оттук може да бъде направен изводът, че:

2 За да намерите съответстващата на теста емпирична стойност на p-value, използвайте познатия ви линк: http://www.danielsoper.com/statcalc/calc11.aspx.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

11

Page 12: Mnl Tutorial Mr2 Spss

Логистична регресия с SPSS

Резултатите от класификацията са надеждни и могат да бъдат отнесени и за по-големи съвкупности (свойството генерализуемост). Правилното класифициране на случаите към априори дефинираните групи не е случайно (нулевата хипотеза за случайност в подредбата е отхвърлена, тъй като 0,000 < 0,05).

Преценка относно качеството на класификация може да се извърши и въз основа на показателя критерий на пропорционалния шанс (Proportional Chance Criterion=PCC). За изчисляването му се използва следната формула:

∑=

=G

ggPCC

1

където gα представлява делът на група g в общата извадка3. В конкретния пример PCC = 0,2072 + 0,5542 + 0,2392 = 0,4069 = 40,69 %. Получената стойност за РСС се сравнява с процента на правилно класифицираните от логистичната регресия случаи (76,1 %). Непосредственият извод е, че:

Логистичната регресия демонстрира добри класификационни възможности, тъй като 76,1 % > 40,69 %.

3 Информацията се съдържа в таблица Case Processing Summary.

© Доц. д-р Маруся Иванова, Маркетингови изследвания 2: Многомерни методи за маркетингови изследвания

12