bai tap tim can b&#97

7
MÔN HỌC: LÝ THUYẾT TRÒ CHƠI ĐÁP ÁN BÀI TẬP SỐ 1: TƯƠNG TÁC CHIẾN LƯỢC Trong 4 bài toán sau đây (câu 1 đến câu 4), hãy xác định: a. Chiến lược phản ứng tốt nhất của các người chơi (Best response) b. Chiến lược trội (nếu có) (Dominant strategy) c. Chiến lược bị trội (nếu có) (Dominated strategy) d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi Câu 1: Công ty A Dự án 1 Dự án 2 Công ty B Dự án 1 5 , 3 6 , 4 Dự án 2 4 , 2 5 , 3 a. Chiến lược phản ứng tốt nhất của các người chơi (Best response - BR) Đáp ứng tốt nhất (Best response – BR) của một người chơi là chiến lược mang lại thu hoạch lớn nhất (lợi ích tối đa, thiệt hại tối thiểu) của người chơi đó đối với từng chiến lược cụ thể của đối phương. Điều này nói lên rằng, với từng chiến lược của đối phương, chúng ta luôn có ít nhất một BR Lời giải: Tìm Best Response của A đối với từng chiến lược (CL) của B: Khi B đi CL: DA1 BR của A là DA2 vì thu hoạch mang lại lớn hơn (4>3) so với DA1 1

Upload: phap-nguyen

Post on 30-Jun-2015

630 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: Bai tap tim can b&#97

MÔN HỌC: LÝ THUYẾT TRÒ CHƠI

ĐÁP ÁN BÀI TẬP SỐ 1: TƯƠNG TÁC CHIẾN LƯỢC

Trong 4 bài toán sau đây (câu 1 đến câu 4), hãy xác định:

a. Chiến lược phản ứng tốt nhất của các người chơi (Best response)

b. Chiến lược trội (nếu có) (Dominant strategy)

c. Chiến lược bị trội (nếu có) (Dominated strategy)

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

Câu 1:

Công ty ADự án 1 Dự án 2

Công ty BDự án 1 5 , 3 6 , 4Dự án 2 4 , 2 5 , 3

a. Chiến lược phản ứng tốt nhất của các người chơi (Best response - BR)

Đáp ứng tốt nhất (Best response – BR) của một người chơi là chiến lược mang lại thu

hoạch lớn nhất (lợi ích tối đa, thiệt hại tối thiểu) của người chơi đó đối với từng chiến

lược cụ thể của đối phương. Điều này nói lên rằng, với từng chiến lược của đối phương,

chúng ta luôn có ít nhất một BR tương ứng (trường hợp có nhiều hơn 1 BR là khi thu

hoạch của nhiều chiến lược của ta đối với một CL cụ thể của đối phương là bằng nhau)

Lời giải:

Tìm Best Response của A đối với từng chiến lược (CL) của B:

Khi B đi CL: DA1 BR của A là DA2 vì thu hoạch mang lại lớn hơn (4>3) so với DA1

Khi B đi CL: DA2 BR của A là DA2 vì thu hoạch mang lại lớn hơn (3>2) so với DA1

Tìm Best Response của B đối với từng chiến lược (CL) của A:

Khi A đi CL: DA1 BR của B là DA1 vì thu hoạch mang lại lớn hơn (5>4) so với DA2

Khi A đi CL: DA2 BR của B là DA1 vì thu hoạch mang lại lớn hơn (6>5) so với DA2

Lưu ý: Để tránh nhầm lẫn, ta cần phân biệt:

Dữ liệu (con số) phía bên phải, theo cột là thu hoạch mà mỗi chiến lược của A mang lại tương ứng với từng chiến lược của B.

Dữ liệu (con số) phía bên trái, theo dòng là thu hoạch mà mỗi chiến lược của B mang lại tương ứng với từng chiến lược của A.

b. Chiến lược trội (nếu có) (Dominant strategy)

1

Page 2: Bai tap tim can b&#97

Chiến lược trội (Dominant strategy): là CL đáp ứng tốt nhất (BR) đối với mọi CL của

đối phương, hay là CL mang lại cho ta những thu hoạch lớn hơn hẳn những thu hoạch

có được nhờ những CL khác (cũng của ta), bất luận lựa chọn của đối phương là gì.

Nếu một đấu thủ có một chiến lược trội thì tất cả những chiến lược khác của đấu thủ này

tất nhiên là những chiến lược bị trội.

Một đấu thủ duy lí (hay có lí trí) chỉ có thể lựa chọn chiến lược trội của mình để chơi.

Tuy nhiên, việc toàn thể các đấu thủ vận dụng – nếu có thể - những chiến lược trội của

mình có thể dẫn đến những tình trạng không tối ưu (trong nghĩa của Pareto), như ví dụ

của Thế lưỡng nan của những người tù cho thấy (hai người tù đều chọn CL trội của

mình lại dẫn đến việc phải ngồi tù lâu hơn không tối ưu).

Có hai cách để tìm CL trội:

Cách 1: Sau khi đã tìm Best Response, như đã làm ở câu a, ta có:

- Nếu với mọi CL của B ta thấy chỉ có 1 CL đáp ứng tốt nhất của A thì CL đó là CL trội, ta thấy với cả 2 CL của B, A đều có BR là DA2, vậy có thể kết luận ngay là DA2 là CL trội của A.

- Tương tự, DA1 là CL trội của B.

Cách 2: Khi chưa tìm BR, thì ta so sánh nhanh những thu hoạch của các CL của từng đấu thủ (người chơi) để kết luận:

- Đối với A: so sánh các thu hoạch từ các CL của A ( theo cột), xem hình:

Công ty ADự án 1 Dự án 2

Công ty BDự án 1 5 , 3 6 , 4Dự án 2 4 , 2 5 , 3

Ta thấy rằng, CL DA2 của A luôn mang lại thu hoạch lớn hơn CL DA1, bất kể B chọn CL DA nào. Vậy ta có thể kết luận rằng, CL DA2 của A là chiến lược trội.

- Đối với B: so sánh các thu hoạch từ các CL của B ( theo hàng), xem hình:

Công ty ADự án 1 Dự án 2

Công ty B

Dự án 1 5 , 3 6 , 4

Dự án 2 4 , 2 5 , 3

Ta thấy rằng, CL DA1 của B luôn mang lại thu hoạch lớn hơn CL DA2, bất kể A chọn CL DA nào. Vậy ta có thể kết luận rằng, CL DA1 của B là chiến lược trội.

c. Chiến lược bị trội (nếu có) (Dominated strategy)

2

Page 3: Bai tap tim can b&#97

Chiến lược bị trội (Dominated strategy): là chiến lược của một đấu thủ trong mọi tình

huống (nghĩa là bất luận quyết định của các đấu thủ khác ra sao), mang về cho anh ta

một thu hoạch nhỏ hơn thu hoạch mà một chiến lược khác, cũng của anh ta, mang về

được.

Khi một đấu thủ chỉ có 2 CL, nếu có 1 CL bị trội thì CL kia sẽ là CL trội và ngược lại.

Một đấu thủ duy lí (hay có lí trí) sẽ loại bỏ chiến lược bị trội của mình ra khỏi không

gian chiến lược, tức là anh ta sẽ không bao giờ chơi CL ấy.

Dựa vào định nghĩa trên đây, và xem hình ở câu b, chúng ta thấy rằng:

- A có CL DA1 bị trội bởi CL DA2 của mình (A);

- B có CL DA2 bị trội bởi CL DA1 của mình (B);

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

Trạng thái cân bằng (Nash Equilibrium - NE) của cuộc chơi:

Định nghĩa 1: Cân bằng Nash là thế cân bằng mà ở đó, không một người chơi nào có

thể cải thiện được vị thế (thu hoạch) của mình, khi cho trước CL của đối phương.

Định nghĩa 2: Cân bằng Nash để chỉ mọi tổ hợp Chiến lược – một tổ hợp cho mỗi đấu

thủ - sao cho không có đấu thủ nào tiếc nuối lựa chọn của mình sau khi nhận thấy lựa

chọn của các đấu thủ khác.

Như vậy, ở một cân bằng Nash nào đó, chiến lược (tạo nên thế cân bằng) của đấu thủ

này sẽ là đáp ứng tốt nhất (BR) đối với CL (tạo nên thế cân bằng) của đấu thủ còn lại.

Ví dụ : NE của 2 đấu thủ A và B được tạo nên bởi CL X của A và CL Y của B thì X là

đáp ứng tốt nhất đối với Y và ngược lại, Y là đáp ứng tốt nhất của X. Có thể biểu diễn

như sau : NE = (SA*, SB*) = (X, Y) với X=BR(Y) và Y=BR(X).

Cân bằng Nash là lời giải trong lý thuyết trò chơi, còn gọi là kết cục của cuộc chơi.

Có thể có một, hai, nhiều hay vô số cân bằng Nash và cũng có thể không có cân bằng

Nash nào trong LTTC.

Cách tìm cân bằng Nash (Nash Equilibrium - NE) của cuộc chơi:

1. Nếu có CL trội, người chơi sẽ sử dụng nó

2. Nếu có CL bị trội, người chơi sẽ loại bỏ nó

3. Lần lượt dùng 2 cách (1) và (2) ở trên cho các người chơi để đơn giản hóa trò

chơi cho đến khi tìm thấy cân bằng của cuộc chơi.

4. Nếu không có CL trội lẫn bị trội thì tìm theo định nghĩa 2 ở trên, tìm BR của

từng đối thủ để xem xét.

3

Page 4: Bai tap tim can b&#97

Với câu 1, cân bằng Nash được tìm thấy bằng cách loại bỏ CL bị trội của A (DA1) và CL bị trội của B (DA2) - (đồng nghĩa với việc chọn CL trội của A và B)

Công ty ADự án 1 Dự án 2

Công ty B Dự án 1 5 , 3 6 , 4Dự án 2 4 , 2 5 , 3

Vậy cân bằng của cuộc chơi tạo nên khi A làm Dự Án 2 và B làm Dự Án 1. Lúc đó, thu hoạch mang lại cho A là 4 và mang về cho B là 6.

Lưu ý: CB Nash là tổ hợp chiến lược, chứ không phải là thu hoạch, ghi NE = (6,4) là sai Đúng là: NE = (ADA2, BDA1)

Câu 2:

Công ty AGiữ giá Giảm giá

Công ty BGiữ giá 3 , 3 1 , 40

Giảm giá 6 , -1 0 , 0

a.b.c. BR, CL trội, CL bị trội

Xét A:

Khi B đi CL: Giữ Giá BR của A là Giảm giá (40>3)

Khi B đi CL: Giảm giá BR của A là Giảm giá (0>-1)

Giảm giá là CL trội của A và CL bị trội của A là CL Giữ giá

Xét B:

Khi A đi CL: Giữ Giá BR của B là Giảm giá (6>3)

Khi A đi CL: Giảm giá BR của B là Giữ giá (1>0)

B không có CL trội và bị trội

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Giảm giá A sẽ sử dụng CL này. B không có CL trội lẫn bị trội B sẽ sử dụng BR đối với CL trội của A là CL Giữ giá. Vậy cân bằng của cuộc chơi là khi A sử dụng CL Giảm giá và B sử dụng CL Giữ giá. Khi đó thu hoạch của A và B lần lượt là 40 và 1. Xem hình:

Công ty AGiữ giá Giảm giá

Công ty B Giữ giá 3 , 3 1 , 40Giảm giá 6 , -1 0 , 0

4

ĐườngLoại bỏ

Page 5: Bai tap tim can b&#97

Câu 3

Công ty AThức ăn 1 Thức ăn 2

Công ty BThức ăn 1 100 , 100 150 , 50Thức ăn 2 150 , 150 50 , 25

a.b.c. BR, CL trội, CL bị trội

Xét A:

Khi B đi CL: Thức ăn 1 BR của A là Thức ăn 1 (100>50)

Khi B đi CL: Thức ăn 2 BR của A là Thức ăn 1 (150>25)

Thức ăn 1 là CL trội của A và Thức ăn 2 của A là CL bị trội

Xét B:

Khi A đi CL: Thức ăn 1 BR của B là Thức ăn 2 (150>100)

Khi A đi CL: Thức ăn 2 BR của B là Thức ăn 1 (150>50)

B không có CL trội và bị trội

d. Trạng thái cân bằng (Nash Equilibrium) của cuộc chơi

A có CL trội là Thức ăn 1 A sẽ sử dụng CL này. B không có CL trội lẫn bị trội B sẽ sử dụng BR đối với CL trội của A là CL Thức ăn 2. Vậy cân bằng của cuộc chơi là khi A sản xuất Thức ăn 1 và B sản xuất Thức ăn 2. Khi đó thu hoạch của A và B lần lượt là 150, 150. Xem hình:

Công ty AThức ăn 1 Thức ăn 2

Công ty BThức ăn 1 100 , 100 150 , 50Thức ăn 2 150 , 150 50 , 25

Câu 4

Công ty A

Dự án 1 Dự án 2 Dự án 3

Công ty B

Dự án 1 -2 , 3 -1 , 1 4 , -3

Dự án 2 5 , -4 2 , -3 3 , -4

Dự án 3 7 , -6 -3 , 2 -4 , 6

Xét A:

Khi B đi CL: Dự án 1 BR của A là Dự án 1 (3>1 & 3>-3)

Khi B đi CL: Dự án 2 BR của A là Dự án 2 (-3>-4 & -3>-4 )

Khi B đi CL: Dự án 3 BR của A là Dự án 3 (6>2 & 6>-6)

A không có CL trội và bị trội

5

Page 6: Bai tap tim can b&#97

Xét B:

Khi A đi CL: Dự án 1 BR của B là Dự án 3 (7>5 & 7>-2)

Khi A đi CL: Dự án 2 BR của B là Dự án 2 (2>-1 & 2>-3 )

Khi A đi CL: Dự án 3 BR của B là Dự án 1 (4>3 & 4>-4)

B không có CL trội và bị trội

Vì cả 2 Công ty A và B đều không có chiến lược trội và bị trội nên ta tìm NE theo định nghĩa.

Từ trên ma trận (các ô vuông màu vàng và màu hồng) hoặc 2 dòng bôi vàng Đáp ứng tốt nhất của 2 người chơi đối với chiến lược của nhau ta thấy rằng: Dự án 2 của A là đáp ứng tốt nhất đối với Dự án 2 của B và ngược lại. Vậy đây chính là cân bằng Nash của cuộc chơi. Thu hoạch mang lại cho A là -3 và B là 2.

6