mo+hinh+so+lieu+mang (1)

26
Vấn đề cơ bản về mô hình số liệu mảng tuyến tính với yếu tố không quan sát (pg 247 -265) Trong Chương 7, chúng ta đã xem xét tổng quan về một lớp của các mô hình số liệu mảng tuyến tính, ở mức tối thiểu, sai số trong mỗi khoảng thời kỳ được giả định là tương quan với các biến giải thích trong cùng một khoảng thời gian. Đối với các ứng dụng số liệu mảng, giả định này là quá mạnh. Trên thực tế, mục đích chính cho việc sử dụng số liệu mảng là để giải quyết vấn đề các biến bị bỏ sót. Trong chương này, chúng ta nghiên cứu các mô hình tổng thể với một thời gian liên tục, ảnh hưởng không quan sát được. nghiên cứu trong chương này là mới với ý nghĩa rằng những ảnh hưởng không quan sát được được coi như là các biến ngẫu nhiên, rút ra từ tổng thể cùng với biến được giải thích và các biến giải thích, đối lập với các tham số ước lượng được. Trong khuôn khổ này, vấn đề chính là liệu các yếu tố không quan sát được là có tương quan với các biến giải thích không? 10.1 vấn đề thêm biến Dễ thấy rằng số liệu mảng được sử dụng như thế nào, ít nhất là dưới một số giả thiết là để có được các ước lượng với sự có mặt của biến thêm vào. Đặt y và X = (x1, x2,…., xk) là các biến ngẫu nhiên được quan sát, và đặt c là biến ngẫu nhiên không quan sát được; vector (y, x1, x2, ... ; xk, c) đại diện cho toàn bộ tổng thể quan tâm. Thông thường, trong trường hợp trong ứng dụng trong kinh tế, chúng ta quan tâm đến những ảnh hưởng từng phần của các quan sát của biến giải thích xj trong hàm hồi quy tổng thể E(y/ x1, x2, ... ; xk; c) (10.1) Nói cách khác, chúng ta muốn giữ c liên tục khi có được ảnh hưởng từng phần của các quan sát của biến giải thíchquan sát.

Upload: duc-hoang

Post on 25-Jul-2015

594 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Mo+Hinh+So+Lieu+Mang (1)

Vấn đề cơ bản về mô hình số liệu mảng tuyến tính với yếu tố không quan sát (pg 247 -265)

Trong Chương 7, chúng ta đã xem xét tổng quan về một lớp của các mô hình số liệu mảng tuyến tính, ở mức tối thiểu, sai số trong mỗi khoảng thời kỳ được giả định là tương quan với các biến giải thích trong cùng một khoảng thời gian. Đối với các ứng dụng số liệu mảng, giả định này là quá mạnh. Trên thực tế, mục đích chính cho việc sử dụng số liệu mảng là để giải quyết vấn đề các biến bị bỏ sót.

Trong chương này, chúng ta nghiên cứu các mô hình tổng thể với một thời gian liên tục, ảnh hưởng không quan sát được. nghiên cứu trong chương này là mới với ý nghĩa rằng những ảnh hưởng không quan sát được được coi như là các biến ngẫu nhiên, rút ra từ tổng thể cùng với biến được giải thích và các biến giải thích, đối lập với các tham số ước lượng được. Trong khuôn khổ này, vấn đề chính là liệu các yếu tố không quan sát được là có tương quan với các biến giải thích không?

10.1 vấn đề thêm biến

Dễ thấy rằng số liệu mảng được sử dụng như thế nào, ít nhất là dưới một số giả thiết là để có được các ước lượng với sự có mặt của biến thêm vào.

Đặt y và X = (x1, x2,…., xk) là các biến ngẫu nhiên được quan sát, và đặt c là biến ngẫu nhiên không quan sát được; vector (y, x1, x2, ... ; xk, c) đại diện cho toàn bộ tổng thể quan tâm. Thông thường, trong trường hợp trong ứng dụng trong kinh tế, chúng ta quan tâm đến những ảnh hưởng từng phần của các quan sát của biến giải thích xj trong hàm hồi quy tổng thể

E(y/ x1, x2, ... ; xk; c) (10.1)

Nói cách khác, chúng ta muốn giữ c liên tục khi có được ảnh hưởng từng phần của các quan sát của biến giải thíchquan sát. Theo Chamberlain (1984) trong việc sử dụng c để biểu thịcho biến không quan sát được. Phần lớn các tài liệu số liệu mảng sử dụng ký tự Hy Lạp, chẳng hạn α là hoặc ф, nhưng chúng ta muốn nhấn mạnh rằng không quan sát được là một biến ngẫu nhiên, không phải là một tham số để ước lượng (Chúng ta thảo luận về điểm này trong mục 10.2.1.)

Giả sử trong mô hình tuyến tính, với c thêm vào cùng với xj, ta có

E(y/X; c) = β0 + Xβ + c (10.2)

Trong đó điều quan tâm nằm trong vector β (k x 1). Một mặt, nếu c không tương quan vớimỗi xj, thì c chỉ là một yếu tố khác không quan sát được ảnh hưởng đến y, điều đó không tương quan có tính hệ thống đến quan sát của các biến giải thích. Mặt khác, nếu Cov (xj, c) ≠ 0 với mọi j, thì sẽ đưa c vào loại sai số, khi đó có thể gây vấn đề nghiêm trọng. Nếu không có thêm thông tin, ta không thể ước lượng β thích hợp, cũng sẽ không thể xác định xem liệu có vấn đề

Page 2: Mo+Hinh+So+Lieu+Mang (1)

nào đó (ngoại trừ bằng cách tự quan sát, hoặc các ước lượng của β là bằng cách nào đó không hợp lý).

Theo giả thiết bổ sung, có nhiều cách để giải quyết các vấn đề Cov(x, c) ≠ 0. Ta khái quát ít nhất là ba khả năng trong trường hợp phân tích số liệu chéo:

(1) ta có thể có thể tìm một biến đại diện thích hợp cho c, trong trường hợp chúng ta có thểước lượng phương trình bằng OLS để gắn cho c;

(2) ta thể có thể tìm một số công cụ cho các yếu tố của X mà có tương quan với c và sử dụng phương pháp các biến công cụ, chẳng hạn như 2SLS,

(3) Ta có thể có thể tìm thấy các chỉ số của c, sau đó có thể sử dụng thủ tục các biến công cụ cho nhiều chỉ số.

Những giải pháp này được đề cập trong Chương 4 và 5.

Nếu chúng ta phải có một thành phần chéo duy nhất của quan sát, từ đó ba biện pháp khắc phục được liệt kê, hoặc các biến thức nhỏ trong số các quan sát, phần lớn là lấp đầy các khả năng. Tuy nhiên, nếu chúng ta có thể quan sát các đơn vị số liệu mảng như nhau tại các thời điểm khác nhau theo thời gian, có nghĩa là, nếu chúng ta có thể thu thập dữ liệu của số liệu mảng thì các khả năng khác sẽ xảy ra.

Để minh hoạ, giả sử chúng ta có thể quan sát y và x tại hai thời điểm khác nhau, gọiyt, Xt với t = 1, 2. Hiện tại, tổng thể đại diện cho hai thời kỳ trên cùng một đơn vị. Ngoài ra, giả sử biến bị bỏ qua c là liên tục. Từ đó, ta chú ý đến hàm hồi quy tổng thể:

E(yt/Xt; c) = β0 + Xtβ + c , t = 1,2 (10.3)

trong đó: Xtβ = β1xt1 + ….+ βkxtk

với xtj là biến xj xác định tại thời điểm t

Mô hình (10,3) giả định rằng c có cùng tác động đến các kết quả trung bình trong mỗi khoảng thời gian.

Để không mất tính tổng quát, ta đặt c =1 .

(Vì c là không quan sát và hầu như không có một đơn vị đo lường, sẽ là vô nghĩa để cố gắng ước lượng ảnh hưởng của c)

Giả định rằng c là hằng số theo thời gian (và có tác động liên tục theo thời gian) là rất quan trọng để phân tích sau này.Biến liên tục được gọi là một tác động không quan sát trong phân tích dữ liệu mảng. Khi t đại diện cho các khoảng thời gian khác nhau của cùng một cá thể, ảnh hưởng không quan sát này thường được hiểu là tính năng có được của một cá thể, chẳng hạn

Page 3: Mo+Hinh+So+Lieu+Mang (1)

như khả năng nhận thức, vận động, hoặc học vấn, được đưa ra và không thay đổi theo thời gian. Tương tự như vậy, nếu mỗi quan sát là xác định, c chứa các đặc tính xác định không rõ ràng, chẳng hạn như chất lượng quản lý, cấu trúc, có thể được xem như là (khoảng) liên tục trong toàn bộđược đề cập. Chúng ta xem xét một số ví dụ xác định về các mô hình hiện ứng không quan sát mô hình tại Mục 10,2.

Để thảo luận về các giả định bổ sung đủ để ước lượng β, nó rất hữu ích để viết mô hình (10.3) dưới hình thức sai số như sau:

yt = β0 + Xtβ + c + ut (10.4)

trong đó ta định nghĩa: E(ut/xt, c) = 0 với t = 1,2 (10.5)

điều đó ngụ ý rằng: E(x’tut) = 0 với t = 1,2 (10.6)

Nếu chúng ta giả thiết rằng E(x’t; c) = 0, chúng ta có thể áp dụng OLS gộp, như chúng ta khái quát trong Mục 7.8. Nếu c là tương quan với bất kỳ thành phần của xt, OLS gộp bị ảnh hưởng và không phù hợp.

Với dữ liệu 2 năm, ta có thể dạng phương trình (10.4) khác thông qua hai khoảng thời gianđể loại bỏ yếu tố không quan sát được thời gian liên tục , c,

Ta định nghĩa: Δy = y2 - y1 ; Δx = x2 - x1; Δu = u2 - u1

Từ đó, ta có dạng (10.4) khác: Δy = Δxβ + Δu (10.7)

đây chỉ là một mô hình tuyến tính chuẩn hóa trong các dạng khác của tất cả các biến (mặc dù hệ số chặn được bỏ ra). Điều quan trọng, các vector tham số quan tâm, β, xuất hiện trực tiếp trong phương trình (10,7), và các biểu diễn này gợi ý phương trình (10,7) được lượng bằng OLS. Với một dữ liệu mảng hai khoảng thời gian, phương trình (10.7) chỉ là phương trình số liệu chéo chuẩn hóa. Theo những gì giả định; các ước lượng OLS từ phương trình (10.7) sẽ là phù hợp?

Vì chúng ta giả định từ một mẫu ngẫu nhiên từ tổng thể, chúng ta có thể áp dụng các kết quả trong Chương 4 trực tiếp vào phương trình (10,7). Điều kiện then chốt cho OLS để luônước lượng được β là:

- Điều kiện trực giao (giả thiết OLS.1) : E(Δx’Δu) = 0 (10.8)

- Điều điện hạng (giả thiết OLS.2) : E(Δx’Δx) = K (10.9)

Điều kiện (10.8), ta có:

Page 4: Mo+Hinh+So+Lieu+Mang (1)

E((x2 - x1)’(u2 - u1)) = 0 hay (10.10)

Hai yếu tố đầu tiên trong phương trình (10,10) là bằng 0 do điều kiện (10.6), giữ chot = 1, 2. Nhưng điều kiện (10.5) không đảm bảo rằng x1 và u2 là không tương quan hoặc x2 và u1 là không tương quan. Có thể lý do từ giả định rằng điều kiện (10.8) giữ nguyên, nhưng ta nhận ra rằng nó không tuân theo điều kiện (10.5). Giả sử rằng sai số ut không tương quan với x1 và x2 với t = 1, 2 là một ví dụ về một giả định chặt về trong các mô hình số liệu mảng với các thành phần không quan sát được. Chúng ta thảo luận về các giả định ngặt tổng quát trong Mục 10,2

Ta nhấn mạnh rằng giả định cov(xt; us) = 0 với mọi t ,s đặt trong mối tương quangiữa xt và các ảnh hưởng không quan sát c.

Giả định thứ hai, điều kiện (10.9), cũng đáng được quan tâm bởi vì các yếu tố của xt xuất hiện trong phương trình cấu trúc (10.3) đã được phân biệt theo thời gian.

Nếu xt có chứa một biến liên tục theo thời gian cho mỗi giá trị của tổng thể; từ đó Δx bao gồm phần nhập giống nhau bằng không, và điều kiện và (10.9) không thỏa mãn. Kết quả này không phải là đáng ngạc nhiên: nếu c được cho tương quan với các yếu tố của xt, tác động của biến bất kỳ mà biến đó là hằng số theo thời gian, không được tách biệt với tác động của c. Vì vậy, Ta chỉ có thể ước lượng βj khi có một số biến thức trong xtj theo thời gian.

Trong phần còn lại của chương này, ta sẽ khái quát nhiều cách khác nhau giải quyết các tác động không quan sát được với các giả định được đặt ra khác nhau. Giả sử chúng ta cólặp đi lặp lại quan sát trên một bộ số liệu mảng của N cá thể, hộ gia đình, các công ty, trường học huyện, thành phố, hoặc một số đơn vị kinh tế nào đó. Như trong Chương 7, chúng ta giả định trong rằng chúng tôi có khoảng thời gian như nhau, ký hiệu là t = 1, 2; ... T, cho bộ số liệu mảng. Một bộ dữ liệu thường được gọi là một bảng cân bằng (balanced panel) bởi vì cùng một thời gian tồn tại tất cả các thành phần phần chéo. Trong khi cơ chế không cân bằng đòi hỏi một phương pháp mô tả mà mảng số liệu có thể không cân bằng và các vấn đề lựa chọn mẫu có thể rất tinh tế. Vì vậy, chúng tôi khái quát mảng không cân bằng tới Chương 17, nơi mà chúng tôi thảo luận về các lựa chọn mẫu và các vấn đề loại mẫu.

Chúng tôi vẫn tập trung vào tính chất tiệm cận của các ước lượng, với kích thước mẫu T,được cố định và kích thước mảng số liệu N, không ràng buộc. Với các kích thước N lớn sẽ thuận tiện để xem xét các quan sát số liệu mảng với phân bố độc lập, như nhau được rút ra từ tổng thể. Đối với bất kỳ quan sát mảng số liệu bất kỳ i - biểu thị cho một cá thể, công ty, thành phố, và như vậy chúng ta biểu thị quan sát của các biến cho tất cả các khoảng thời gian T bằng (yit; xit) với t = 1,2 …T) do giả thiết T cố định , phân tích tiệm cận là phù hợp với thời gian phụ thuộc tùy ý và phân bố không đồng nhất qua t.

Khi áp dụng phân tích tiệm cận với các phương pháp số liệu mảng, điều quan trọng là mỗi thành phần tiệm cận là hữu ích trong chừng mực mà họ cung cấp 1 lý do hợp lý cho các thống

Page 5: Mo+Hinh+So+Lieu+Mang (1)

kê và các ước lượng của các mẫu hữu hạn. Ví dụ, thật khó để biết rằng khi N →tiện cầm vô cùng, với N = 50 tiểu bang; ở Hoa Kỳ và T = 8 năm. Nhưng chúng ta có thể thấy rằng N→ tiệm cận vô cùng thích hợp hơn so với N→ tiệm cận vô cùng, thậm chí N thực tế được cố định trong khi T có thể tăng. Với vùng địa lý rộng lớn, giả định lấy mẫu ngẫu nhiên kích thước số liệu chéo là khái niệm thiếu sót. Tuy nhiên, nếu N có mối quan hệ đầy đủ hơn T, và chúng ta có thể giả định độc lập của các số liệu chéo, sau đó phân tích tiệm cận của chúng tôi sẽ cung cấp các kết quả phù hợp xấp xỉ.

Nếu T là thứ tự giống như N; ví dụ, N = 60 quốc gia và T = 55 bài Chiến tranh thế giới thứ II -một phân tích tiệm cận làm cho giả định rõ ràng về bản chất của sự phụ thuộc chuỗi thời gian là cần thiết. (Trong trường hợp đặc biệt, các kết luận về dự toán phù hợp và xấp xỉ bình thường của số liệu thống kê t sẽ là tương tự, nhưng không nói chung) Khu vực này chỉ mới bắt đầu nhận được sự chú ý cẩn thận. Nếu T lớn hơn nhiều so với N, N = 5 công ty và T = 40 năm, khuôn khổtrở thành nhiều phân tích chuỗi thời gian: N có thể được tổ chức cố định trong khi T! y.

10,2. Giả thiết về biến không quan sát được và biến giải thích.

Trước đây khi phương pháp ước lượng số liệu mảng được phân tích chi tiết hơn, điều đó rất có ích trong việc khái quát về bản chất của yếu tố không quan sát được và các tính năng nhất định của biến giải thích.

10.2.1 Ảnh hưởng ngẫu nhiên hay cố định ?

Mô hình ảnh hưởng không quan sát được dạng cơ bản (UEM) có thể được xây dựng cho số liệu mảng ngẫu nhiên quan sát i là:

yit = Xitβ + ci + uit ; t = 1, 2,3….

Trong đó Xit là ma trận 1xK và gồm các biến được quan sát sự thay đổi theo t, không thay đổi theo i, biến thay đổi theo i nhưng không t, và các biến thay đổi theo t và i. ngoài ra, các ảnh hưởng không quan sát được có rất nhiều tên khác nhau cho ci trong ứng dụng: thành phần không quan sát, biến ẩn, và tính không đồng nhất không quan sát là phổ biến. Nếu gắn thêm chỉ số i, thì ci đôi khi được gọi là ảnh hưởng cá biệt hoặc không đồng nhất cá thể; tương tự áp dụng cho hộ gia đình, các doanh nghiệp, thành phố, và các số liệu mảng khác. Các uit các được gọi là sai số riêng hoặc phân bố riêng bởi vì chúng có thể thay đổi theo t hoặc theo i.

Đặc biệt, trong lý thuyết, mà còn trong các ứng dụng, người ta thường tranh luận các ci là ngẫu nhiên hay cố định?. Thông thường, các tranh luận này tập trung vào xem ci được xem như là một biến ngẫu nhiên hoặc như một tham số được ước lượng. Trong cách tiếp cận truyền thống để mô hình số liệu mảng, ci được gọi là " ảnh hưởng ngẫu nhiên '' khi ci được xử lý như là một biến ngẫu nhiên và " ảnh hưởng cố định "khi nó được xử lý như một tham số được ước lượng cho mỗi mảng số liệu quan sát i. Quan điểm của chúng tôi là các cuộc thảo luận về xem ci phải

Page 6: Mo+Hinh+So+Lieu+Mang (1)

được coi là biến ngẫu nhiên hoặc là các tham số ước lượng là tùy thuộc vào số liệu mảng kinh tế được áp dụng. Với mẫu ngẫu nhiên lớn được rút ra từ bộ số liệu mảng, luôn luôn tạo ra các ảnh hưởng không quan sát được , ci, mẫu ngẫu nhiên rút ra từ tổng thể, cùng với yit và xit. Cách tiếp cận này là chắc chắn thích hợp cho biến bỏ qua hoặc yếu tố không đồng nhất bị bỏ sót.

Như chúng tôi thảo luận tại mục 10.1 cho thấy, vấn đề quan trọng liên quan đến ci là có hay không tương quan với các biến giải thích quan sát xit, t = 1, 2; ... ; T. Mundlak(1978) lập luận này nhiều năm trước đây, và hiện tại vẫn là thuyết phục.

Trong cách nói kinh tế hiện đại, "ảnh hưởng ngẫu nhiên" là đồng nghĩa với không tương quan giữa giữa các quan sát của biến giải thích quan sát và ảnh hưởng ngẫu nhiên.

Cov(Xit, ci) = 0, t = 1, 2; ... ; T.

[Trên thực tế, giả thiết trung bình có điều kiện mạnh mẽ hơn giả thiết độc lập, E(ci/xi1, xi2,…xiT) = E(ci) sẽ được giải thích rõ hơn trong mục 10,4) Trong lý thuyết, khi ci được gọi" tác động ngẫu nhiên cá biệt”, từ đó ci có thể được giả định là không tương quan với các xit.

Trong ứng dụng kinh tế lượng, thuật ngữ " tác động cố định" thường không mang nghĩa là không ngẫu nhiên, mà có nghĩa là thừa nhận mối tương quan giữa các tác động không quan sát ci và biến giải thích quan sát xit. Vì vậy, nếu ci được gọi là một " tác động cố định cá thể " hoặc một "tác động cố định công ty ," sau đó, cho mục đích thực tế, thuật ngữ này có nghĩa là ci được cho tương quan với xit. Trong cuốn sách này, chúng tôi tránh đề cập đến ci như là một tác động ngẫu nhiên hoặc cố định. Thay vào đó,chúng ta sẽ coi ci như ảnh hưởng không quan sát được, các quan sát thay đổi, và như vậy , sau đó chúng ta sẽ gắn nhãn 2 phương pháp ước lượng khác nhau ngẫu nhiên cho ước lượng tác động ngẫu nhiên và ước lượng tác động cố định.

10.2.2 Các giả thiết ngặt với biến giải thích

Các thành phần không được quan sát truyền thống của mô hình số liệu mảng sử dụng xit là cố định. Chúng ta sẽ không giả định xit là không ngẫu nhiên vì tác động ngược lại từ yit tới xis với s > t cần phải được giải quyết một cách rõ ràng

Trong Chương 7, chúng ta đã thảo luận về những giả định ngặt trong các mô hình số liệu mảng không bao hàm ảnh hưởng của yếu tố không quan sát được. trong phần này, chúng ta cung cấp các giả thiết ngoại sinh ngặt cho các mô hình với các yếu tố không quan sát được.

Mục 10.1, chúng ta đã nêu giả thiết ngoại sinh ngặt không tương quan giữa các thành phần. Đối với các cuộc tranh luận và suy luận , chúng ta cần nêu rõ các giả thiết về kỳ vọng có điều kiện, và vấn đề này cũng đưa ra các giả thiết một cách nghĩa rõ ràng. Với yếu tố không quan sát, dạng thức rõ ràng nhất của giả thiết là mô hình số liệu mảng ảnh hưởng không quan sát được dạng tuyến tính là:

Page 7: Mo+Hinh+So+Lieu+Mang (1)

E(yit/xi1, xi2, …, xiT, ci) =E(yit/xit, ci) = Xitβ + ci với t = 1,2…,T (10.12)

phương trình thứ hai là giả thiết về dạng hàm E(yit/xit, ci). Phương trình đầu đưa ra giả thiết ngặt của biến giải thích. Nó có nghĩa rằng, một khi xit và ci bị phụ thuộc, xis không tác động toàn phần yit với s ≠ t.

Với giả thiết (10.12), chúng ta gọi xit, i=1,…T là điều kiện ngoại sinh ngặt với ảnh hưởng không quan sát được.Giả định (10,12) và các thuật ngữ tương ứng đã được giới thiệu và được sử dụng bởi Chamberlain (1982).Chúng tôi sẽ làm rõ ràng cách tiếp cận Chamberlain để ước lượng mô hình ảnh hưởng không quan sát trong chương kế tiếp, nhưng cách của các giả định của Chamberlain nêu rõ là hướng dẫn, thậm chí để phân tích dữ liệu của phân tích mảng số liệu truyền thống.

Giả thiết (10,12) giá trị kỳ vọng của yit có thể phụ thuộc vào các biến giải thích trong các khoảng thời gian khác nhau, nhưng nó là hợp lý hơn điều kiện không chặt về ảnh hưởng không quan sát được. Nếu không có điều về một ảnh hưởng không quan sát, giả thiết ngoại sinh ngặt là:

E(yit/xi1, xi2, …, xiT) =E(yit/xit) = Xitβ với t = 1,2…,T (10.13)

Ta thấy rằng giả thiết (10,13) là ít có khả năng thỏa mãn so với giả định (10,12)

Xem xét một ví dụ:

Giả sử yit đó là sản lượng đậu tương cho trang trại i trong năm t, và xit bao gồm vốn, lao động, các vật liệu (chẳng hạn như phân bón), lượng mưa, và các yếu tố đầu vào khác. Các yếu tố không quan sát được, ci, có thể là chất lượng trung bình của đất đai,khả năng quản lý của gia đình quản lý các trang trại, và các yếu tố không quan sát khác . Giả thiết đương nhiên là đầu vào hiện tại đã bị ảnh hưởng ci, đầu vào được sử dụng trong những năm khác không có ảnh hưởng đến sản lượng đầu ra trong năm nay. Tuy nhiên, khi lựa chọn tối ưu của các yếu tố đầu vào trong mỗi năm thường phụ thuộc vào ci, có khả năng tồn tại mối tương quan từng phần giữa sản lượng đầu ra trong năm t và các đầu vào trong những năm khác nếu ci không được kiểm soát giả thiết (10,12) là thỏa mãn, trong khi giả thiết (10,13) là không thỏa mãn.

Thông thường, dễ thấy rằng giả thiết (10.3) không thỏa mãn khi giữ lại giả thiết (10.12) và giá trị kỳ vọng của ci phụ thuộc vào (xi1,…., xiT). Từ quy luật về giá trị kỳ vọng, nếu giả thiết (10.12) được thỏa mãn thì:

E(yit/xi1, xi2, …, xiT) = Xitβ + E(ci/xi1, xi2, …, xiT)

Và giả thiết 10.13 không thỏa mãn khi E(ci/xi1, xi2, …, xiT) ≠ E(ci)

Trong thực hành, giả thiết (10.13) không thỏa mãn nếu ci tương quan với xit bất kỳ.

Page 8: Mo+Hinh+So+Lieu+Mang (1)

Từ phương trình (10.11), giả thiết ngoại sinh ngặt có thể được đặt ra cho chuỗi sai số riêng là:

E(uit/xi1, xi2, …, xiT, ci) = 0 với t = 1,2…,T (10.14)

Giả thiết này ngụ ý rằng các biến giải thích trong mỗi khoảng thời gian là không tương quan với các sai số riêng .

Hay E(x’is uit) = 0 với s, t = 1,2…,T (10.15)

Giả thiết này mạnh hơn giả thiết về không tương quan đồng thời: E(x’it uit) = 0 với t = 1,2…,T.

Tuy nhiên, giả thiết (10.15) đặt ra mối tương quan tùy ý giữa ci và xit với mọi t, cuối cùng, chúng ta sẽ sử dụng giả thiết (10.14) với ngụ ý rằng uit và ci là không tương quan với nhau.

Để kiểm tra tính nhất quán của các ước lượng số liệu mảng, giả thiết không tương quan (10,15) nói chung là thỏa mãn. Hơn nữa, giả định (10,15) thường là cách dễ nhất để suy nghĩ rằng liệu giả thiết ngoại sinh ngặt có thể thỏa mãn ứng dụng cụ thể.Nhưng dạng phân bố chuẩn của suy diễn thống kê, cũng như hiệu quả của các ước lượng tiêu chuẩn, dựa trên việc giả thiết về trung bình có điều kiện mạnh hơn giả định (10,14). Vì vậy, chúng tôi tập trung vào giả định (10,14 )

10.2.3 Một số ví dụ về mô hình số liệu mảng với ảnh hưởng không quan sát được

Trong mục 10.2.1 và 10.2.2 nhấn mạnh rằng trong bất kỳ ứng dụng số liệu mảng, ban đầu chúng ta nên tập trung vào hai câu hỏi:

(1) ảnh hưởng không quan sát là gì, ci, có hay không tương quan với xit với mọi t?(2) giả định ngoại sinh chặt (điều kiện trên ci) hợp lý hay không?

Các ví dụ sau đây minh họa làm thế nào để chúng ta có thể giải quyết về hai câu hỏi này.

Ví dụ 10.1 (Giá trị chương trình): Một mô hình tiêu chuẩn để đánh giá tác động của đào tạo nghề hoặc các chương trình khác tới tiền lương là:

Log(wage it) = θt + zitγ+δ1progit + ci + uit (10.16)

Trong đó: i là chỉ số cá thể

t là chỉ số thời gian

tham số θt: hệ số chặn liên tục

zit: là tập hợp quan sát các đặc tính có ảnh hưởng đến tiền lương, có thể tương quan với các chương trình tham gia

Page 9: Mo+Hinh+So+Lieu+Mang (1)

Mô phỏng tập hợp dữ liệu thường được thu thập tại hai điểm trong thời gian:

Tại t = 1, không có ai tham gia chương trình, vì vậy prog it = 0 với mọi i.

Sau đó, một nhóm được chọn tham gia chương trình (hoặc các cá nhân lựa chọn để tham gia), và tiền lương tiếp theo được quan sát tại t = 2

Mô hình (10,16) cho phép bất kỳ số lượng thời gian và mẫu tham gia chương trình

Lý do để tồn tại cả các ảnh hưởng cá thể, ci, là bỏ qua câu chuyện năng lực thông thường: nếu cá nhân lựa chọn có hoặc không tham gia trong chương trình, sự lựa chọn có thể bị tương quan với năng lực. Khả năng này thường được gọi là vấn đề tự lựa chọn. Ngoài ra, các quản trị viên có thể phân công người dựa trên những đặc điểm mà các nhà kinh tế lượng không thể quan sát

Các vấn đề khác là giả thiết ngoại sinh ngặt của các biến giải thích, đặc biệt là biến progit. Thông thường, chúng ta cảm thấy thoải mãn với giả thiết uit đó là không tương quan với progit. Nhưng những gì về tương quan giữa uit và,,progit cho biết điều gì? Tham gia chương trình trong tương lai có thể phụ thuộc vào uit nếu mọi người chọn tham gia trong tương lai dựa trên những cú sốc tiền lương của họ trong quá khứ, hoặc nếu các quản trị viên chọn người tham gia tại thời điểm t +1 có thể thấp hơn uit. Những thông tin phản hồi không có thể là rất quan trọng,kể từ khi ci được cho phép, nhưng nó có thể được. Xem, ví dụ, Bassi (1984) vàHàm và Lalonde (1996). Một vấn đề khác dễ dàng xử lý là chương trình đào tạo có thể có tác dụng lâu dài. Nếu vậy, thì chúng ta nên bao gồm độ trễ của progit trong mô hình (10,16). Hoặc, chương trình chính nó có thể kéo dài hơn một thời gian, trong đó trường hợp progit có thể được thay thế bằng một loạt các biến giảcho dài đơn vị tại thời điểm t cho mỗi chương trình.

Ví dụ 10.2 ( Mô hình trễ phân phối- Distributed Lag Model ):

Hausman, Hall, và Griliches (1984) ước lượng mô hình trễ phân phối dạng phi tuyến để nghiên cứu mối quan hệ giữa bằng sáng chế được trao cho một công ty và mức độ chi tiêu hiện và quá khứ cho nghiên cứu và phát triểu (R & D). Một tuyến tính, mô hình dạng trễ 5 thời kỳ:

Patents it = θt + zitγ+δ0RDit + δ1Rdit-1+…+ δ5Rdit-5+ ci + uit (10.17)

Trong đó: RDit là chi tiêu cho R & D cho công ty tại thời điểm t

zit chứa các biến như quy mô doanh nghiệp (được đo bằng doanh số bán hàng hoặc nhân viên).

biến Ci mang tính không đồng nhất của công ty có thể ảnh hưởng đến patentsit và có thể tương quan với chi phí R & D ở hiện tại, quá khứ, và tương lai . điều quan tâm nằm trong mô hình của hệ số δj. Như với các ví dụ khác, chúng ta phải quyết định rằng liệu chi

Page 10: Mo+Hinh+So+Lieu+Mang (1)

tiêu R &D có bị tương quan với ci.Ngoài ra, nếu những cú sốc tài chính ngày hôm nay (thay đổi trong uit) ảnh hưởng tới chi tiêu R & D trong tương lai, thì giả thiết ngoại sinh ngặt có thể không thỏa mãn, và các phương pháp trong chương này sẽ không áp dụng được.

Ví dụ tiếp theo trình bày một trường hợp giả thiết ngoại sinh ngặt cần thiết phải là sai, và các hiệu ứng không quan sát và biến giải thích phải tương quan với nhau.

Ví dụ 10,3 (biến phụ thuộc bị trễ): Một mô hình động đơn giản xác định tiền lương với tính không đồng nhất không quan sát là:

Log(wage uit) = β1 log(wagei, t-1) + ci + uit với t = 1,2…,T (10.18)

Thông thường, điều quan tâm là tiền lương dài hạn (được đo bằng kích thước của β1) bị ảnh hưởng bởi tính không đồng nhất không quan sát (năng suất cá nhân) Ci. Gọi yit = log(wage uit), có giả thiết tiêu chuẩn sẽ là

E(uit/yi,t-1, …, yi0, ci) = 0 (10.19)

Điều đó có nghĩa là tất cả các yếu tố động là bị chi phối bởi giá trị trễ đầu tiên. Đặt xit = yi,t-1. Từ đó, giả thiết (10.19) nghĩa rằng uit không tương quan với các xit, xit-1,…, xi1) nhưng uit không thể không tương quan với (xi, t+1, …., xiT), với xi,t+1 = yit

Thật vậy:

E(yit uit) = β1 E(yi, t-1 uit) + E(ci uit) + E(u2 it) = E(u2 it) (10.20)

Vì: E(yi, t-1 uit) = và E(ci uit) = 0do giả thiết (10.19)

Từ đógiả thiết ngoại sinh ngặt không thỏa mãn đối với mô hình ảnh hưởng không quan sát với biến phụ thuộc bị trễ.

Ngoài ra, yi, t-1 và ci nhất thiết phải tương quan với nhau (kể từ thời điểm t-1, yi,t_1 là biến nằm phí bên trái). Không chỉ giả thiết ngoại sinh ngặt không thỏa mãn trong mô hình này, mà giả thiết ngoại sinh yêu cầu ước lượng OLS gộp của mô hình(10,18) cũng vi phạm. Chúng tôi sẽ nghiên cứu các mô hình ước lượng như vậy trong chương 11.

10.3. Ước lượng mô hình ảnh hưởng ko nhìn thấy được bằng mô hình OLS gộp

Với các giả định cụ thể của OLS pooled, ước lượng được β trong mô hình:

yit=xit.β + vit, t = 1, 2, …T (10.21)

trong đó vit=ci + uit , t= 1, 2,…T là các sai số phức hợp. Với mỗi t, vit là tổng của ảnh hưởng không quan sát dược và các sai số đặc trưng. Trong phần 7.8, ta đã biết rằng OLS pooled ước

Page 11: Mo+Hinh+So+Lieu+Mang (1)

lượng theo công thức này là phù hợp nếu E(x’it.uit) = 0. Thực tế mà nói, không có sự tương quan giữa xit và vit , có nghĩa là chúng ta giả sử E(x’it.uit)=0 và E (x’it.ci)=0, t=1, 2,…T. (10.22)

Phương trình 10.22 là hạn chế của giả thiết. Từ đó E(x’ it.uit)=0 được nắm giữ nếu ta có mô hình E(yit|xit, ci).

Trong mô hình tĩnh và có đuôi phân phối giới hạn, đôi khi ta thực hiện được giả thiết 10.22. Thực tế, chúng ta sẽ làm thử trong mục ước lượng ảnh hưởng ngẫu nhiên. Xem ví dụ 10.3, mô hình có đuôi phụ thuộc vào biến xit phải vi phạm giả thiết 10.22 vì yi,t-1 và ci phải có tương quan với nhau.

Thậm chí, nếu giải thiết 10.22 được giữ thì sai số phức hợp sẽ có ương quan từng kỳ bởi sự có mặt của ci trong mỗi thời kỳ. Do đó, suy ra sử dụng mô hình OLS pooled yêu cầu ước lượng ma trận phương sai thực (robust) và kiểm định thống kê thực từ chương 7. Do v it phụ thuộc vào ci

với mọi t, tương quan giữa vit và vis không bị giảm khi tăng khoảng cách |t-s|. Chuỗi thời gian chỉ ra vit không phụ thuộc yếu vào thời gian trôi qua. (Ta chỉ ra rõ ràng kết luận này trong phần sau khi uit: t=1,…T là homoskedastic và không tương quan theo từng kỳ).

Do vậy, việc quan trọng là có thể tính N đủ lớn và T cố định tiệm cận khi áp dụng OLS pooled. Như đã thỏa thuận ở chương 7, mỗi (y i,Xi) có T dòng và nên được phân cấp theo thứ tự thời gian và (yi,Xi) nên được đo lường từ i= 1,…N.

Quan sát đường chéo của phân cấp này là không thích hợp như thông thường.

10.4. Mô hình ảnh hưởng ngẫu nhiên

14.4.1. Ước lượng và kết luận theo giả thiết ngẫu nhiên cơ bản với OLS pooled

phân tích ảnh hưởng ngẫu nhiên đặt ci vào trong các sai số thời kỳ. Thực tế, phân tích ảnh hưởng ngẫu nhiên cần nhiều giả thiết hơn cho OLS pooled. Ngoại sinh được thêm vào là trực giao của c i

và xit. Bắt đầu giả thiết trong kỳ theo các điều kiện, ta có:

Giả thiết RE.1:

(a) E(uit|xi,ci)=0, t=1,…T

(b) E(ci|xi)=E(ci)=0

Trong đó: xi=(xi1,…xiT)

Trong phần 10.2 ta đã thảo luận ý nghĩa giả thiết ngoại sinh RE.1a. Giả thiết RE.1b chỉ ra làm thế nào chúng ta chỉ ra tính trực giao giữa ci và mỗi xit. Để kết quả đạt được là vững, ta phải nới lỏng RE.1b thanh giả thiết 10.22 nhưng trong thực hành, cách tiếp cận này tạo ra ít đặc điểm tổng quát và ta phải sử dụng RE.1b sau hi chuyển cách tiếp cận truyền thống của biến cho các

Page 12: Mo+Hinh+So+Lieu+Mang (1)

ước lượng ảnh hưởng ngẫu nhiên. Giả thiết RE.1b luôn hàm chứa giả thiết rằng x it là cố định và E(ci)=0, hoặc bằng giả thiết là ci độc lập với xi. 1 phần quan trọng là:

E(ci|xi)= E(ci)

Giả thiết E(ci)=0 tức là không có sai sót, và chỉ ra hệ số chặn trong xit. Tại sao ta phải duy trì RE.1 khi mà nó hạn chế hơn các điều kiện cần cho OLS pooled? Ảnh hưởng ngẫu nhiên khai thác các tương quan từng kỳ trong sai số phức hợp vit = ci + uit theo mô hình bình phương tổng quát GLS.

Điều kiện chỉ cần đảm bảo rằng GLS khả thi là phù hợp. Ta cần vài công thức cho ngoại sinh toàn phần giữa các biến giải thích và sai số phức hợp.

Theo giả thiết RE.1, ta có: yit = xit .β+ vit (10.23)

E(vit|xi)=0, t=1,…T (10.24)

Trong đó vit = ci + uit (10.25)

Phương trình 10.24 chỉ ra rằng xit: t=1,…T thỏa mãn giả thiết SGLS ngoại sinh toàn phần (đọc chương 7) theo mô hình 10.23. Do đó, ta có thể áp dụng phương pháp GLS cho cấu trúc sai số thành phần trong phương trình 10.25.

Mô hình 10.23 cho toàn bộ T thời kỳ là: yit = xit .β+ vit

Trong đó vi=ci.JT + ui

JT là vectore Tx1.

Định nghĩa ma trận phương sai ko điều kiện của vi là:

Ω=E(vi.v’i)

Ma trận TxT chỉ ra ta giả sử 1 xác định dương. Nên nhớ rằng ma trận này chỉ cần giống nhau với mọi i bởi giả thiết mẫu ngẫu nhiên trong đường chéo.

Đối với GLS, ta cần xếp hạng điều kiện cho GLS:

Giả thiết RE2: Hạng E(X’i.Ω-1.Xi)=K

Áp dụng kết quả chương 7, ta biết rằng GLS và GLS khả thi là phù hợp theo giả thiết RE1 và RE2.

Phân tích FGLS, sử dụng 1 ước lượng biến không bị hạn chế Ω là phù hợp và √N (căn N) tiệm cận khi N ∞. Nhưng ta sẽ không dùng cấu trúc ảnh hưởng không nhìn thấy của v it. 1 phân tích

Page 13: Mo+Hinh+So+Lieu+Mang (1)

ảnh hưởng ngẫu nhiên chuẩn bổ sung giả thiết về sai số đặc trưng là lấy Ω theo 1 công thức đặc biệt. Giả thiết thứ nhất chỉ ra rằng sai số đặc trưng uit có 1 hằng số không đổi.

E(u2it)=σ2

u , t=1,…T (10.28)

Giả thiết thứ 2 chỉ ra rằng sai số đặc trưng không có tương quan từng thời kỳ

E(uit, uis)=0 với mọi t khác s (10.29)

Theo 2 giả thiết này, ta có thể lấy được phương sai và hiệp phương sai của vi

Theo giả thiết RE.1a, E(ci.uit)=0 (t=1,…T)

Và có E(v2it)=E(c2

i)+ 2.E(ci.uit)+ E(u2it)= σ2

c + σ2u

Trong đó: σ2c = E(c2

i) với mọi t khác s

E(vit.vis)=E[(ci+uit).(ci+uis)]=E(c2i)= σ2

c

Do đó, theo giả thiết RE1, công thức 10.28, 10.29, Ω được tính bằng:

(10.30)

Do JT.J’T là ma trận TxT đồng nhất mọi yếu tố, ta có thể viết 10.30 thành:

Ω= σ2u.IT+ σ2

c. JT.J’T (10.31)

Khi Ω được tính theo công thức 10.31, ta nói nó có cấu trúc ảnh hưởng ngẫu nhiên.

Hơn nữa, phụ thuộc vào T(T+1)/2 để không giới hạn phương sai và hiệp phương sai; như trường hợp này của phân tích GLS, Ω chỉ phụ thuộc vào 2 tham số σ2

c và σ2u, ko gắn với kích thước của

T. Tương quan giữa sai số phức hợp vit và vis không phụ thuộc vào sự khác biệt của t và s.

Corr(vis,vit)= σ2c / (σ2

c + σ2u)≥0 với mọi s khác t

Tương quan này là tỷ số phương sai của ci và phương sai của sai số phức hợp, và nó có ích để đo lường sự quan trọng tương đối của ảnh hưởng không quan sát được ci.

Giả thiết 10.28 và 10.29 là ảnh hưởng ngẫu nhiên đặc biệt.

Page 14: Mo+Hinh+So+Lieu+Mang (1)

Để có hiệu quả của mô hình GLS khả thi, ta giả sử ma trận phương sai của điều kiện v i trong xi

là không đổi

E(vi.v’ixi)= E(vi.v’i) (10.32)

Giả thiết 10.28, 10.29 và 10.30 được áp dụng bằng giả thiết ảnh hưởng ngẫu nhiên thứ 3.

Giả thiết RE3:

(a) E(ui.u’ixi,ci)=σ2u.IT

(b) E(cixi)= σ2c

Theo giả thiết 3a, E(u2ixi,ci)= σ2

u , t=1…T (đã bao gồm giả thiết 10.28 và E(uit.uisxi,ci)=0

Giống như giả thiết RE1b, RE3b tương đương với Var(cixi)= var(ci)

Which is a homoskedasticity assumption trong ảnh hưởng ko nhìn thấy ci

Theo giả thiết RE3, giả thiết 10.32 vẫn giữ, Ω có công thức 10.30.

Để triển khai quá trình FGLS, cần xác định σ2v = σ2

c + σ2u. Đến nay, giả định rằng chúng ta có

ước lượng phù hợp của σ2c và σ2

u, ta có:

(10.33)

Là ma trận TxT mà chúng ta giả thiết là xác định dương.

Trong tình huống dữ liệu mảng, ước lượng FGLS được sử dụng cho ma trận phương sai 10.33 là những gì cần được biết đến là ước lượng ảnh hưởng ngẫu nhiên.

(10.34)

Ước lượng ảnh hưởng ngẫu nhiên là động cơ thúc đẩy rõ ràng bởi giả thiết RE3. Tuy nhiên, là phù hợp dù giả thiết RE3 có được duy trì hay ko? Miễn là giả thiết RE1 và điều kiện hạng

thích hợp vẫn được giữ, tiến đến β theo p khi N ∞. Luận cứ này hầu hết đều chỉ ra rằng mức độ chắc chắn của ước lượng FGLS không dựa vào E(vi.v’ixi)=Ω. Thậm chí, nếu Ω không

được tính bằng công thức 10.31 thì sự khác biệt chỉ là với định nghĩa là xác suất giới hạn. Thực tế là không cần thiết phải kéo E(vi.v’ixi) ảnh hưởng đến quá trình ảnh hưởng ngẫu nhiên.

(về mặt kỹ thuật, ta cần thay đổi Ω với plim ( )) trong giả thiết RE2.

Page 15: Mo+Hinh+So+Lieu+Mang (1)

Theo giả thiết RE3, ước lượng ảnh hưởng ngẫu nhiên có hiệu quả trong các lớp ước lượng phù hợp theo E(vixi=0, bao gồm mô hình OLS pooled và 1 loại ước lượng LS có trọng số, bởi RE là đường tiệm cận tương đương trong GLS theo giả thiết RE1- RE3. Ma trận phương sai GLS khả thi- xem công thức 7.5.1 có giá trị theo giả thiết RE1- RE3. Chỉ sự khác biệt từ phân tính chung

mới chỉ ra được được chọn để thể hiện 10.33.

Để triển khai quá trình RE, ta cần tính được và .Thực tế, đó là cách dễ nhất để tìm =

+

Theo giả thiết RE3a, cho mọi i. Do đó, trung bình v2it cho mọi i và t sẽ đưa ra

chỗ ước lượng vững cho σ2v. Nhưng ta cần ước lượng β để có phương pháp hoạt động. Ước

lượng ban đầu của β là OLS pooled, chỉ rõ là ở đây là . chỉ là phần dư của OLS pooled. Ước lượng vững chắc của σ2

v là:

(10.35). nó là ước lượng biến động thông thường từ hồi quy OLS cho dữ liệu pooled.

Hệ số tự do điều chỉnh của công thức 10.35 (thường sử dụng NT-K hơn NT) không có ảnh hưởng tiệm cận.

Theo giả thiết RE1-RE3, công thức 10.35 là ước lượng vững chắc của σ2v.

Để tìm 1 ước lượng vững của σ2c , còn gọi là σ2

c= E(vit.vis) với mọi t khác s. Do đó, với mỗi I, có T(T-1)/2 sai số ko thừa, có thể sử dụng để ước lượng σ2

c.

Nếu ta tổng tất cả và tính kỳ vọng, ta có cho mọi i

(10.36).

Trong đó ta có thể sử dụng 1 thực tế là tổng của T-1 số nguyên dương đầu tiên là T(T-1)/2.

Thông thường, 1 ước lượng vững được sử dụng để thay thế cho kỳ vọng với trung bình (là đường chéo i) và thay thế vit với phần dư OLS pooled. Ta đưa ra hệ số tự do điều chỉnh là mẫu nhỏ hiệu chỉnh

(10.37)

Page 16: Mo+Hinh+So+Lieu+Mang (1)

Là ước lượng vững của σ2c theo giả thiết RE1-RE3.

Dựa vào và , ta có: = -

[Đặc tính của biến sai số, σ2u, có thể ước lượng theo phương pháp ảnh hưởng cố định, vấn đề sẽ

được thảo luận trong mục 10.5. Do đó, có các phương pháp khác để ước lượng σ2c. Ước lượng

thông thường của σ2c là căn cứ vào ước lượng β, sẽ được nghiên cứu trong mục 10.5, xem Hsiao

(1986, mục 3.3) và Baltagi (1995, mục 2.3). Do ước lượng RE là ước lượng GLS khả thi, nên tất cả những gì ta cần là ước lượng vững của σ2

u và σ2c để có được căn N- ước lượng hiệu quả β].

Theo thực tế, công thức 10.37 không đảm bảo dương, mặc dù nó nằm trong ứng dụng lớn. 1 giá

trị âm của theo từng thời kỳ trong uit, hầu như chắc chắn một số lớn đáng kể, có nghĩa là giả thiết RE3 bị vi phạm.

Một số giả thiết khác trong mô hình có thể sai. Ta nên đảm bảo là thời gian giả là không bao gồm trong mô hình nếu chúng đáng tin cậy; sự bỏ quên chúng có thể gây ra tương quan từng thời kỳ

trong uit. Nếu là âm, FGLS không giới hạn có thể được xác định, xem mục 10.4.3.

Ví dụ 10.4: Ước lượng ảnh hưởng của trợ cấp dạy nghề.

Ta sử dụng dữ liệu trong JTRAIN1.RAW để ước lượng ảnh hưởng của trợ cấp dạy nghề cho các hãng nhỏ, sử dụng phân tích ảnh hưởng ngẫu nhiên. Có 54 hãng báo cáo cho các năm 1987, 1988, 1989. Trợ cấp không được cấp trong năm 1987, 1 số hãng nhận trợ cấp năm 1988, 1 số hãng khác nhận trong năm 1989, và 1 hãng ko được nhận 2 lần. Từ đó, các hãng đã nhận trợ cấp trong năm 1988 cần phân tích ảnh hưởng của trợ cấp đến từng giai đoạn trong năm 1989. Công thức ước lượng là:

(0.243) (0.109) (0.132) (0.411) (0.148) (0.205)

Giá trị lagged của trợ cấp lớn hơn ảnh hưởng và có ý nghĩa thống kê là 5% cho phía alternative. Bạn được yêu cầu ước lượng ảnh hưởng của trợ cấp (yêu cầu 6.7%) và không có ý nghĩa thống kê.

Kiểm định giả thiết bội số là tiến hành như 1 phân tích FGLS bất kỳ, đọc mục 7.6 khi G=T.

Trong tính toán, kiểm định F căn cứ trên tổng tỷ trọng của bình phương phần dư. trong biểu thức 10.33 phải căn cứ vào phần dư của OLS pooled từ mô hình không hạn chế. Sau đó, phần dư

có được từ ước lượng ảnh hưởng ngẫu nhiên không hạn chế là

Page 17: Mo+Hinh+So+Lieu+Mang (1)

bao hàm ước lượng ảnh hưởng ngẫu nhiên với Q tuyến tính bắt buộc hạn chế, và xác định

phần dư ảnh hưởng ngẫu nhiên hạn chế là (vi ngã) Đưa vào công thức 7.52 ở chỗ

và ui ngã cho thấy thống kê Khi bình phương và công thức 7.53 cho thống kê F.

Trong ví dụ 10.4, kiểm định Wald chỉ ra sự liên hệ đáng tin cậy giữa trợ cấp và trợ cấp-1 (trợ cấp kỳ trước) (tương phản với alternative 2 chiều). Ước lượng Khi bình phương trong 3.66, p-value =0.16 (kiểm định trong Stata).

10.4.2. ước lượng ma trận phương sai thực

Do thiếu giả thiết RE3 không là nguyên nhân mâu thuẫn trong ước lượng RE, nó rất có ích để có thể kiểm soát suy diễn thống kê không sử dụng giả thiết. Giả thiết RE3 có thể sai do 2 nguyên nhân. Thứ nhất, E(vi.v’ixi) có thể không cố định, do đó E(vi.v’ixi) khác E(vi.v’i).

Đầu ra luôn là xác suất của phân tích GLS. Thứ hai, E(vi.v’i) có thể không có cấu trúc ảnh hưởng ngẫu nhiên, sai số đặc trưng uit có thể có phương sai thay đổi, hoặc chúng có tương quan từng thời kỳ. Trong 1 trường hợp khác, ma trận phương sai thực có thể dùng được cho phân tích

ở chương 7. Ta sử dụng công thức 7.49 với thay đổi bởi với i=1,…N là vecto Tx1 của phần dư RE. Sai số chuẩn thực đạt được theo các thông thường là từ ước lượng ma trận phương sai thực, kiểm định Wald thực đạt được từ công thức

Trong đó, là ước lượng ma trận phương sai thực. Nên nhớ rằng nếu giả thiết R13 bị vi phạm, tổng bình phương phần dư trong kiểm định F ko tính được.

Ý tưởng đằng sau việc sử dụng ma trận phương sai thực như sau: giả thiết RE1-RE3 dẫn đến ước lượng kỹ thuật nổi tiếng, đặc tính của nó được hiểu theo giả thiết. Nhưng đây luôn là ý tưởng hay để tính số thực bất cứ khi nào khả thi. Với T cố định và N đủ lớn, ta không mất gì khi sử dụng sai số chuẩn thực và kiểm định thống kê nếu giả theiets RE3 vẫn được đảm bảo. Trong mục 10.7.2, ta sẽ chỉ ra làm thế nào để ước lượng từ hồi quy OLS pooled cá biệt, cái mà tính ra sai số chuẩn thực, t và kiểm định F 1 cách dễ dàng.