business research method 6

Post on 08-May-2015

2.348 Views

Category:

Business

0 Downloads

Preview:

Click to see full reader

TRANSCRIPT

PHÂN TÍCH DỮ LIỆU

Xử lý dữ liệu

Phân tích đơn biến

Phân tích nhị biến

Tổng quan về phân tích đa biến

Xử lý dữ liệu

Phân tích đơn biến

Phân tích nhị biến

Tổng quan về phân tích đa biến

Hiệu chỉnh (Editing)

Mã hoá (Coding)

Tạo tập tin dữ liệu

Mục đích

Đúng thủ tục/đối tượng phỏng vấn (legibility)

Xử lý các phỏng vấn/trả lời không hoàn chỉnh (completeness)

Tính nhất quán của các trả lời (consistency)

Sự chính xác của các trả lời (accuracy)

Sự rõ ràng của các trả lời (clarification)

Quá trình

Hiệu chỉnh sơ bộ (field editing):

• Thực hiện bởi interviewer• Càng sớm càng tốt sau khi phỏng vấn xong

Hiệu chỉnh cuối cùng (office editing):

• Thực hiện bởi editor• Sau khi thu thập xong data• Đòi hỏi người hiệu chỉnh phải có nhiều kinh nghiệm,

kiến thức.

Xử lý khi phát hiện lỗi

Liên lạc trở lại để bổ sung hoặc làm rõ

Hiệu chỉnh, làm rõ hoặc bổ sung theo trí nhớ hoặc các cứ liệu/suy luận khác

Hủy bỏ một số câu trả lời (missing value)

Hủy hoàn toàn cuộc phỏng vấn/questionnaire

Là quá trình gán mã số (số hoặc nhãn) cho các biến và các trả lời.

Thang đo của biến tùy thuộc vào cách hỏi và bản chất của biến được hỏi.

Các bước mã hoá◦ Đặt tên biến cho các câu hỏi

Câu hỏi 1 chọn lựa

Câu hỏi nhiều chọn lựa

◦ Chuyển tập các chọn lựa trả lời của mỗi câu hỏi thànhtập các số/nhãn phù hợp, có ý nghĩa.

Câu hỏi đóng

Câu hỏi mở

Câu hỏi có chọn lựa: “Khác”

Hai trường hợp “Không biết”

Tính phù hợp(appropriateness)

Tính toàn diện (exhaustiveness)

Tính loại trừ nhau(mutual exclusivity)

Tính đơn nguyên(unidimensionality)

NGUYÊN TẮC

Cách phân loại/ nhómphải phù hợp với vấnđề/ mục tiêu nghiêncứu.

Thí dụ: Thông tin cá nhânhoặc doanh nghiệp.Tuổi <18 18-30 …. ?

<16 16-25 …. ?

Tính phù hợp(appropriateness)

Tính toàn diện (exhaustiveness)

Các mã số cần thểhiện các loại cần NC.

Loại “trả lời khác” nênchiếm tỉ lệ nhỏ nhất.

Thí dụ: Tuổi <1818-30>30??

Mỗi trả lời chỉ tương ứng với một mã số.

Tính loại trừ nhau(mutual exclusivity)

Thí dụ: quốc doanh, tư

nhân, TNHH, cổ phần ??

Mỗi câu trả lời ứng vớimột thứ nguyên duynhất.

Tính đơn nguyên(unidimensionality)

Nhập dữ liệu vào file (SPSS)

Cải biến tập dữ liệu

Tạo biến mới, biến trung gian, v.v.

Xử lý missing value

Thí dụ về data file

Xử lý dữ liệu

Phân tích đơn biến

Phân tích nhị biến

Tổng quan về phân tích đa biến

Tổng quan về phân tích dữ liệu

Tổng quát về phân tích đơn biến

Thống kê mô tả

Kiểm nghiệm giả thuyết đơn biến

Chọn phương pháp phân tích đơn biến nào?

Tùy vào:Có bao nhiêu biến được phân tích đồngthời?Mục tiêu phân tích chỉ là mô tả mẫu hay suyđoán cho tổng thểCác biến được đo bởi thang đo gì? Chỉdanh, thứ tự, khoảng, tỉ lệ.

Start

Bao nhiêu biếnđược phân tích

đồng thời

Phân tíchđơn biến

Phân tíchnhị biến

Phân tíchđa biến

2 biến1 biến Trên 2 biến

Phân tích đơn biến

Chi – square test

Kolmogorov– Smirnov

test

Yếu vịTần suất

Trung vịKhoảng/

phần trăm

Z test/ t test

Trung bìnhPhương sai

Thang đocủa biến

Thứ tự

Chỉ danhKhoảng

MÔ TẢ

SUY ĐOÁN

Response Category

Frequency Percentage Cum. Percentage

Benthanh 1 - -Foster 3 1 1Saigon 45 18 19

Heineken 120 46 65Tiger 92 35 100

261 100%

Biến chỉ danh, thứ tựVí dụ

Lợi ích của biến chỉ danh, thứ tự:

Trình bày phân phối dữ liệu của một biến cóthang đo nominal hoặc ordinal.

Phát hiện một số dạng sai sót khi mã hoá.

So sánh với các phân phối/ dữ liệu có liên quan.

Đề nghị những phương pháp biến đổi các biến

Kiểm tra sampling.

N 215Minimum 1Maximum 5

Mean Statistic 2.25Std. Error 0.06

Std. Deviation Statistic 0.83

Skewness Statistic 0.57Std. Error 0.17

Kurtosis Statistic 0.45Std. Error 0.33

Biến khoảng

Ví dụ

Kiểm chứng xem những phát biểu nào đó cóthích hợp cho tổng thể nghiên cứu hay không.

• TD: Bình quân tuổi của 100 SV trong mẫu là Ā =24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể:• Null hypothesis Ho: µ = 23 • Alternative hypothesis H1: µ ≠ 23

Các phân tích liên quan đến kiểm nghiệm giảthuyết gọi là phân tích suy luận (inferentialanalysis).

B1• Thiết lập giả thuyết H0 và H1

B2• Xác định phương pháp test phù hợp (statistical test).

B3• Chọn trước mức ý nghĩa α (significance level)

B4

• Tính (tra bảng) giá trị test tới hạn (critical value) ứng với α (one/ two tailed)

B5• Tính giá trị kiểm nghiệm thống kê từ tập số liệu

B6

• Nếu giá trị tính được ở B5 lớn hơn giá trị tới hạnloại Ho

Biến đo bằng thang khoảng (interval)◦ Có thể dùng t Test hoặc Z Test để test giá trị trung bình

của tổng thể khi biết giá trị trung bình của mẫu

Z TEST t TESTBiết phương sai σ của tổng

thể và cỡ mẫu bất kỳ.

Không biết phương sai σcủa tổng thể và cỡ mẫu n >30

Không biết phương sai σ củatổng thể và cỡ mẫu bất kỳ.

Khi cỡ mẫu n > 30 thì phânphối t = phân phối z

Lưu ý: khi tra bảng tc thìdF = n-1

xSxt μ−

=

Thí dụ (tiếp theo thí dụ trên)Bình quân tuổi của 100 SV trong mẫu là Ā = 24 (s=5). Nhà NC muốn kiểm chứng cho tổng thể:

Null hypothesis Ho: µ = 23 Alternative hypothesis H1: µ ≠ 23Do n = 100 > 30 nên dùng Z testChọn mức ý nghĩa α = 0.05 (two tailed) Zc = 1.96Tính Z khi chưa biết σ : Z = (Ā - µ) n1/2/s

= (24 - 23) x 1001/2/5 = 2Z = 2 > Zc = 1.96 loại Ho

Không thể kết luận (với significant 5%) là µ = 23Lưu ý: Nếu biến tỉ lệ thì Z = (p - π)/ (pq/ n)1/2

Biến đo bằng thang thứ tự (ordinal)

◦ Dùng chi-square test để so sánh phân phối các loại(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

B1. Phát biểu giảthuyết H0, H1

B2. Xác định mứcý nghĩa α và bậctự do df

B5. Bác bỏ/chấp nhậnH0 dựa trên tiêu chuẩn“Bác bỏ H0- nếu (tínhđược) > (tới hạn)”.

B3. Tra bảng Chi-Square chuẩn

B4. Tính giá trị kiểmnghiệm theo công thức

2cχ

df = k – 1 (k là số loạidanh định có thể chọntrong biến thứ tự)

∑=

−=

k

i i

ii

EEO

1

22 )(χ Oi: Số lần xuất hiện loại i trong mẫu

Ei: Giá trị kỳ vọng của số lần xuất hiện

Biến đo bằng thang thứ tự (ordinal)

◦ Dùng chi-square test để so sánh phân phối các loại(categories) của mẫu và kỳ vọng của tổng thể

Các bước tiến hành

◦ Nghĩa là có sự khác biệt giữa phân phối của mẫu vàphân phối của tổng thể.

◦ Kiểm định Chi-Square không có ý nghĩa khi số lầnxuất hiện kỳ vọng cho mỗi lựa chọn < 5.

Thí dụ: Khảo sát 100 người đang sử dụng internet ở HCMC

Nghề nghiệp Oi Ei Oi - Ei (Oi - Ei)2 (Oi - Ei)2/ Ei

Lao động

Nhân viên VP

Quản lý

Sinh viên

15

20

30

35

25

25

25

25

-10

-5

5

10

100

25

25

100

4

1

1

4Total 100 100 =102χ

Thí dụ: Khảo sát 100 người đang sử dụnginternet ở HCMC (n = 100)Cột 1: Phân bố nghề nghiệp của những người sửdụng internet.Cột 2: Phân bố kỳ vọng (bằng nhau cho các nhóm)Ho: Không có sự khác nhau về nghề nghiệp củanhững người sử dụng internetK = 4 loại nghề nghiệp Df = k - 1 = 3

= 6.25 ( với α = 10%)Vì = 10 > = 6.25 loại bỏ H0

2cχ

2χ 2cχ

Xử lý dữ liệu

Phân tích đơn biến

Phân tích nhị biến

Tổng quan về phân tích đa biến

Bảng 2 chiều (Two – way Tabulation)

Khảo sát mức độ và các mối liên hệ (có thể có)giữa các cặp biến.

Thích hợp cho các trường hợp số loại trong mỗibiến không lớn, thang đo nominal hoặc ordinal.

Chỉ định hướng, không kết luận về mối quan hệnhân quả giữa các biến.

Kết quả có thể bị lệch nếu các ô có giá trị nhỏ.

Function group Total

Mkt & Sales Prodct Others

Gen

der

Male

Count 41 62 41 144

% within Gender 28.5% 43.1% 28.5% 100.0%

% within Functgr 74.5% 93.9% 53.2% 72.7%

% of Total 20.7% 31.3% 20.7% 72.7%

Female

Count 14 4 36 54

% within Gender 25.9% 7.4% 66.7% 100.0%

% within Functgr 25.5% 6.1% 46.8% 27.3%

% of Total 7.1% 2.0% 18.2% 27.3%

Total

Count 55 66 77 198

% within Gender 27.8% 33.3% 38.9% 100.0%

% within Functgr 100.0% 100.0% 100.0% 100.0%

% of Total 27.8% 33.3% 38.9% 100.0%

Phương pháp Áp dụng Minh họaChi – Square Contingency

Test

Quan hệ giữa 2 biến chỉ danh.

Quan hệ giữa thu nhập(hoặc nghề nghiệp) vớiviệc chọn nhãn hiệu bia.

Hệ sốtương quanSpearman

Quan hệ giữa 2 biến thứ tự.

Quan hệ giữa mức thưởngnhân viên bán hàng (mức1, 2, 3, 4) và thành tích(mức 1, 2, 3, 4, 5).

Hệ số tương quan

Pearson

Quan hệ giữa 2 biến metric

(khoảng hay tỉ lệ).

Quan hệ giữa tuổi củakhách hàng và chi phí hàngtháng cho y tế.

Hồi quy đơn giản

Xây dựng một hàm tuyến tính giữa

2 biến metric(phụ thuộc nhau)

Doanh thu (đồng) theo chiphí khuyến mãi.

Chi – Square contingency test Mục đích:

Xác định sự tồn tại mối quan hệ giữa 2 biến danhđịnh.

Yêu cầu:Không có ô nào có số lần xuất hiện kỳ vọng < 1Không quá 1/5 tổng số ô có số lần xuất hiện < 5

Hạn chế:Chỉ xác định có quan hệ hay không, không chobiết mức độ quan hệ.

Hệ số Contingency thường được bổ sung vào kiểmnghiệm Chi-Square để biết mức độ quan hệ giữa 2 biến.

2

2

χχ+

=n

c

)1(

2

−=

fnv χ

C = 0: không có quan hệ

C không có chặn trên khó diễn dịch

V = 0: không có quan hệV = 1: có quan hệ hoàn hảo

Nên trong thực tế hay dùng hệ số thống kê Cramer

Thí dụ: Kết quả khảo sát nhãn hiệu Bia ưa thíchnhất phân theo mức thu nhập.

Thu nhậpNhãn hiệu bia ưa thích nhất

TổngBia A Bia B Bia C

Thấp 50(109.38)

200(101.56)

125(164.06) 375

Trung bình 200(189.58)

100(176.04)

350(284.38) 650

Cao 100(51.04)

25(47.40)

50(76.56) 175

Tổng 350 325 525 1200

Ghi chú: Con số trong ngoặc chỉ giá trị kỳ vọng của mỗi ôtrong bảng. Chúng được xác định theo tỉ lệ với tổng về thunhập và loại bia ưa thích.(Ô 1-1 có giá trị kỳ vọng = 350 x 375 / 1200 = 109.38)Tính

Kết quả : = 252.2Df = (k-1)(l-1) = (3-1)(3-1) = 4

Nếu chọn α = 1% thì = 13.3 (tra bảng)= 252.2 > = 13.3 loại Ho

Có sự khác biệt đáng kể giữa phân phối của mẫu và kỳvọng (tổng thể)

∑∑=

=

−=

k

j ij

ijijl

i EEO

1

2

12 )(χ2χ

2Cχ

2χ 2Cχ

Hệ số tương quan Spearman và Pearson

Spearman: tương quan giữa 2 biến thứ tự (ordinal)Pearson: tương quan giữa các biến khoảng/ tỉ lệ.

Hệ số tương quan r = 0 1 (không kể dấu +/-)r > 0.8 rất mạnhr = 0.6 – 0.8 mạnhr = 0.4 – 0.6 có tương quanr = 0.2 – 0.4 tương quan yếur < 0.2 không tương quan

Lưu ý:

Hai biến phải có phân phối chuẩn nhị biến.Phương sai của 1 biến tại bất kỳ giá trị nào củabiến kia cũng phải bằng nhau.Khi r nhỏ không có nghĩa là không tương quan, màchỉ không tương quan tuyến tính.

Khi |r| lớn chỉ cho thấy mối tương quan, nhưngkhông xác định quan hệ nhân quả.

Phân tích hồi quy tuyến tính đơn◦ Phân tích 2 biến khoảng/ tỉ lệ: Hồi quy tuyến tính đơn

Y = aX + b

◦ Sự khác biệt giữa hồi quy và tương quan

Hồi quy tuyến tính

Tạo ra một phươngtrình toán học liên kếtcác biến lại

Tồn tại giả thiết nhân –quả: Biến độc lập –Biến phụ thuộc

Tương quan

Phát hiện ra mức độtương quan giữa2 biến

Không có giả thiết vềnhân quả

Xử lý dữ liệu

Phân tích đơn biến

Phân tích nhị biến

Tổng quan về phân tích đa biến

Phân tích phụ thuộc

• Xác định được biến nào là phụ thuộc, biến nào là độc lập• Bao gồm các phương pháp: phân tích hồi quy đa biến, ANOVA, Conjoint, Discriminant, Canonical analysis...

Phân tích tương tác

• Không xác định trước biến nào là phụ thuộc, biến nào là độc lập, chủ yếu là tìm kiếm các mô thức tương quan. • Bao gồm các phương pháp: Factor analaysis, Cluster, Multi-dimensional Scaling.

Phân tích đa biến giúp giải quyết nhiều bài toán phứctạp. Tuy nhiên, mỗi phương pháp phân tích đa biến đềudựa trên một số giả thiết (ngầm) cần thận trọng.

Phương phápThang đo của biến

Phụ thuộc Độc lập

Một biến phụ thuộc

Hồi quy bội Interval Interval

ANOVA Interval Nominal

Hồi quy bội - biến dummy Interval Nominal

Discriminant analysis Nominal Interval

Conjoint analysis Ordinal Nominal

Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

Phương phápThang đo của biến

Phụ thuộc Độc lập

Hai biến phụ thuộc trở lên

Canonical analysis Interval Interval

MANOVA Interval Nominal

Mạng lưới của nhiều biến phụ thuộc và độc lập

Structural Equation Modeling (SEM) Interval Interval

Các phương pháp phân tích phụ thuộc – Yêu cầu về thang đo

HỒI QUY TUYẾN TÍNH BỘI

y = a1X1 + a2X2 + a3X3 + ... anXn + b

Dạng mở rộng của hồi quy đơn.

Một biến phụ thuộc, nhiều biến độc lập.

Tất cả được đo bằng thang interval (ngoại lệ: dummy-variable multiple regression)

Đánh giá mô hình và kết quả hồi quy theo 3 phần:Mức độ phù hợp của phương trình hồi quy:

Dùng hệ số r2 (coefficient of determination)r2 = 0 ÷ 1 đặc trưng cho % của biến thiên trongbiến phụ thuộc được giải thích do sự biến thiên củabiến độc lập.

Kiểm nghiệm mức ý nghĩa của r2:Dùng F – test, với độ tự do: df = n – k – 1 cho mẫusố và df = k cho tử số (n: cỡ mẫu, k: số biến độc lập)

Kiểm nghiệm mức ý nghĩa của các độ dốc ai:Dùng t – test với độ tự do df = n – k – 1

Kiểm nghiệm các giả thuyết của phương pháp hồi quy

Linearity

Đa cộng tuyến (Multicolinearity)

Phân phối chuẩn (Normality) của sai số và mỗi biến

Sai số hồi quy có variance không đổi

Tính độc lập của các sai số hồi quy

Linearity

Có mối quan hệ tuyến tính giữa biến phụ thuộc vàcác biến độc lập.

Test: quan sát scatter diagram hoặc ma trận tươngquan

Đa cộng tuyến (Multicolinearity)

Giả thuyết: các biến độc lập không có tương quan tuyến tính với nhau.

Khi bị vi phạm Có hiện tượng đa cộng tuyến, nghĩa là hiện hữu mối tương quan tuyến tính giữa ≥ 2 biến độc lập.

Đa cộng tuyến gây ra:

Hạn chế giá trị r2

Sai lệch/ đổi dấu các hệ số hồi quy

Test đa cộng tuyến: hệ số Tolerance hoặc VIF

Một số lưu ý khi sử dụng multiple regression:Phân tích hồi quy tuyến tính chỉ có nghĩa khi có tương

quan TUYẾN TÍNH giữa các biến.r2 không nói lên được quan hệ nhân quả giữa các biếnCó thể dự đoán sai nếu nằm ngoài khoản tính toánĐể đảm bảo độ tin cậy phải có nhiều hơn 10 điểm cho mỗi

biến độc lập đưa vào phương trình ( yêu cầu cỡ mẫu)Khoảng dao động (range) các biến có thể ảnh hưởng đến ý

nghĩa phương trình hồi quy.Trường hợp biến độc lập là nominal thì có thể sử dụng

dummy-variable. Khi đó:Số biến dummy = k-1; với k = số loại của biến nominalMỗi biến dummy chỉ nhận giá trị 0 hoặc 1

Thí dụ:Bài toán tìm các yếu tố quyết định sự thỏa mãncủa nhân viên trong Cty XYZ.

Biến phụ thuộc: sự thỏa mãn của nhân viên Cty.

Biến độc lập: thu nhập, điều kiện làm việc, sự quantâm của cấp trên, quan hệ với đồng nghiệp, cơ hộithăng tiến, cơ hội học tập, v.v..

Biến độc lập

Uns

tand

ardi

zed

Coe

ffici

ents

Stan

dard

ized

C

oeffi

cien

ts

t Sig.

Collinearity Statistics

B Std. Error Beta Tolerance VIF

(Constant) .540 .193 2.793 .007

Thu nhập .526 .081 .596 6.491 .000 .793 1.262

Sự quan tâm/ công nhận

.205 .061 .310 3.380 .001 .793 1.262

r = 0.787 r2 = 0.619 F sig. = 0.000

ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Khảo sát mối quan hệ giữa các biến độc lập

và phụ thuộc

ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

Tương tự như phân tích hồi quy, nhưng các biến độc lập là

biến nonmetric (nominal/ ordinal)

ANOVA – ANALYSIS OF VARIANCE

Mục đích Đặc điểm Áp dụng

So sánh giá trị trung bình của một thuộc tính (biến phụ thuộc/ thang metric) thể hiện ảnh hưởng của một hay nhiều thuộc tính khác (biến độc lập/thang nonmetric)

ANOVA – ANALYSIS OF VARIANCENếu có nhiều biến độc lập với thang chỉ danh gọi là

Factorial ANOVA

Nguyên tắc: Nếu có sự khác biệt đáng kể giữa cácnhóm thì “between-group variance > within-group variance”

ANCOVA: có xét đến các ảnh hưởng của một haynhiều biến ngoại lai (gọi là control variable hoặc covariates- thang đo metric) và sẽ loại ra khỏi tập biến phụ thuộctrước khi phân tích ANOVA.

MANOVA nếu có nhiều biến phụ thuộc

MANCOVA có nhiều biến phụ thuộc và biến kiểm soát

Thí dụ:

Khảo sát 200 doanh nghiệp thuộc 3 ngành Maymặc, Mỹ phẩm và Nhựa gia dụng về chi phídành cho khuyến mãi hằng năm.

Mục đích phân tích nhằm tìm xem có sự khácnhau đáng kể/ có ý nghĩa thống kê giữa 3ngành này về chi phí khuyến mãi không?

Cty Ngành Chi phí KM (1000 USD)

1234..

199200

MayMay

Mỹ phẩmNhựa

.

.NhựaMay

123235

1346876

.

.6812

Biến độc lập:ngành (chỉ danh)(3 treatments)

Biến phụ thuộc:chi phí khuyếnmãi (ratio)

Bài toán này có thể so sánh giá trị trung bình của chi phí khuyến mãi theo từng cặp ngành (dùng t –test). Tuy nhiên, khi số treatment lớn số lượng so sánh sẽ rất lớn.

Khi đó nên dùng ANOVA: ◦ H0 : μ1 = μ2 = ... = μk = μ

◦ Ha : có ít nhất 1 giá trị μi khác những giá trị kia.

Với μ là trung bình của tổng thể

DISCRIMINANT ANALYSIS

Mục đích Đặc điểm Nguyên tắc

Nhận ra nhữngthuộc tính (cácbiến độc lập) đểphân biệt cácnhóm định trướccủa biến phụthuộc

Biến độc lập cóthang metric,biến phụ thuộccó thangnonmetric.

Hàm phân biệt có dạng:

Y= v1.X1 + v2.X2 + v3.X3 + …

Sau khi tính được Y, sosánh với giá trị chuẩn Ycđể biết đối tượng thuộcnhóm nào.

Thí dụ:Công ty máy tính muốn biết xem thu nhập gia đình (X1)và số năm học ở trường của chủ hộ (X2) có phải là hữuích trong việc phân biệt hộ có mua máy tính PC haykhông. Khảo sát X1 và X2 của 2 nhóm mẫu ngẫu nhiên(có và không có PC).

Biến độc lập: X1 – thu nhập,X2 – số năm học : metric

Biến phụ thuộc: Có PC, Không có PC: category.Kết quả sẽ là hàm phân biệt: Y= v1X1 + v2X2v1, v2 : trọng số phân biệt (hằng số) Y: điểm phân biệtSo sánh Yi và Yc

Phần tử i sẽ thuộc nhóm nào trong 2 nhóm mẫu trên.

CONJOINT ANALYSIS

Mục đích Áp dụng

CONJOINT ANALYSIS

Phân tích ảnh hưởng tổng hợp (joint effects) của 2 haynhiều biến độc lập (thang nominal) lên một biến phụthuộc (utility score - thang đo ordinal)

Mục đích

CONJOINT ANALYSIS

Áp dụng

Thường dùng trong test sản phẩm với nhiều yếu tố khácnhau (chất lượng, kiểu dáng, giá bán, nhãn hiệu, v.v.).Mỗi yếu tố có vài phương án khác nhau. Tìm xem tổhợp nào được ưa thích nhất.

CONJOINT ANALYSIS – ÁP DỤNG

Nhà NC tạo ra một tập các phương án sản phẩm. Mỗiphương án là 1 tổ hợp của các yếu tố.

Tập các phương án này được đưa cho đối tượng chọn/xếp hạng (hoặc cho điểm thể hiện mức ưa thích).

Conjoint analysis sẽ đánh giá ảnh hưởng của các utility score thành phần (hay part-worths, tượng trưng cho mức độ quan trọng của mỗi yếu tố) lên sự ưa thích tổng hợp (utility) đối với một sản phẩm.

CONJOINT ANALYSIS – ÁP DỤNGCó thể dùng kết quả để

Đánh giá thị phần của các nhãn hiệu trên thị trường

Phân khúc thị trường

Nhận dạng cơ hội thị trường cho một sản phẩm với tổ hợp thuộc tính mới

Thí dụ:Thiết kế sản phẩm mới có 3 thuộc tính:

Giá : (cao, trung bình, thấp)

Kiểu dáng : (cao, trung bình, thấp)

Chức năng : (đơn giản, phức tạp) ...

Chỉ cần đánh giá 1 nhóm khoảng 8 tổ hợp (thay vì18 tổ hợp) về tính hấp dẫn của sản phẩm đối vớikhách hàng.

Thí dụ:

Nhà nghiên cứu

Tầm quan trọng của mỗi thuộc tính

Tầm quan trọng của mỗi mức độ

trong các thuộc tính

Tạo ra sảnphẩm có độvị lợi caonhất đối vớingười mua.

Phân tích phụ thuộc

Phân tích tương tác

FACTOR ANALYSIS (PHÂN TÍCH NHÂN TỐ)

Là phép rút gọn dữ liệu và biến bằng cách nhóm chúng lại với các nhân tố đại diện

Điều kiện: các biến phải có thang đo metric

• Xây dựng bộ thang đo Multiple – item• Xác định cấu trúc bộ dữ liệu • Giảm thứ nguyên trong tập dữ liệu, rút gọn dữ liệu

Ứng dụng

Thí dụ:Case X1 X2 X3 … … Xm

1

2

3

n

Factor analysis:gom m biếnthành k factor

Factor 1 gồm X1 X6 X9 Xm2 gồm X2 X3 X10 Xm - 13 gồm X4 X5 X7 X8 ...

Tùy mục đích bàitoán, có thểdùng: Exploratoryfactor analysis(EFA) hoặcConfirmatoryfactor analysis(CFA)

CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)

Mục tiêu

Phân chia các đối tượng/ người thànhcác nhóm với các thành viên trongnhóm có các đặc trưng tương tự.

Thí dụ: Bài toán phân khúc thị trường (Segmentation)Phân loại hành vi mua (Typology)

CLUSTER ANALYSIS (PHÂN TÍCH NHÓM)Quá trình thực hiện

Xác định các biến làm cơ sở để phân nhóm

Phần chia các nhóm dựa trên sự tương tự

Đặc tên nhóm dựa theo đặc điểm chungcủa các thuộc tính (các biến cơ sở)

Chuẩn định (Validation) và mô tả đặc trưng(profiling)

Thí dụ: Cluster analysis để phân khúc thị trườngYêu cầu thang đo: metric

Công ty TICO: Xác định các Nhóm Khách Hàng khác nhau căn cứ trên hành vi mua.“Hãy đánh giá mức độ quan trọng của các yếu tố sau đây trong quyết định mua hàng của Ông/ Bà”

1 2 3 4 5 6 7

Không qtrọng Rất qtrọng

X1 – Chất lượng sản phẩmX2 – Giá bánX3 – Thời gian giao hàngX4 – Uy tín nhà sản xuấtX5 – Các dịch vụ đi kèm

Thí dụ: Cluster analysis để phân khúc thị trườngHơn 300 khách hàng được khảo sátNhận dạng ra các nhóm khác nhau.Trong mỗi nhóm có sự tương tự nhau về tầm quantrọng của các yếu tố (X1 X5) ảnh hưởng đến quyếtđịnh mua.

Nhóm 1Khách hàng trẻ, thu nhập cao, ở TP...

Nhóm 2Khách hàng công nghiệp –sản xuất

Nhóm 1: X1, X4, X5 là quan trọng trongquyết định mua

Nhóm 2: X1, X2, X3 là quan trọng.

TICO sẽ có chiến lược tiếp thị đốivới từng nhóm khách hàng khác nhau.

MULTIDIMENTIONAL SCALING (perceptual mapping)Mục đích: Xác định số lượng và bản chất của các thứnguyên (dimensions) đặc trưng cho nhận thức/ đánh giácủa khách hàng về các đối tượng.

Thang đo: Cả hai loại thang metric/nonmetric

Trong MR: Thường được sử dụng trong bài toán xác địnhvị trí tương đối (relative position) của các nhãn hiệu cạnhtranh nhau do phản hồi từ phía khách hàng.

Xác định những yếu tố đặc trưng cho việc đánh giá củakhách hàng.

Là phương pháp ngược với Cluster

Multidimentional Scaling

• Phát hiện các thứnguyên đặc trưng(UnderlyingDimensions) từcác phản hồi

Cluster Analaysis

• Gộp các đối tượngthành các nhómtheo 1 số đặc tínhtượng tự nhau

KỸ THUẬT ĐO VÀ THU THẬP DỮ LIỆU

top related