cnsh trong b_nh cgy [15]

118
TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI KHOA NÔNG HỌC CÔNG NGHỆ SINH HỌC TRONG BỆNH CÂY (Bài giảng) 3 tín chỉ Biên soạn TS. Hà Viết Cường 2009

Upload: thuong-ho

Post on 30-Jul-2015

384 views

Category:

Documents


0 download

TRANSCRIPT

TRƯỜNG ĐẠI HỌC NÔNG NGHIỆP HÀ NỘI

KHOA NÔNG HỌC

CÔNG NGHỆ SINH HỌC

TRONG BỆNH CÂY (Bài giảng)

3 tín chỉ

Biên soạn

TS. Hà Viết Cường

2009

2

Mô tả môn học

Ứng dụng công nghệ sinh học trong nghiên cứu:

1. Sự đa dạng của tác nhân gây bệnh

2. Tương tác giữa tác nhân gây bệnh và cây

3. Chẩn đoán tác nhân gây bệnh

4. Phòng chống tác nhân gây bệnh

Các nhóm tác nhân gây bệnh được lựa chọn là nấm/nấm trứng, vi khuẩn và virus. Các

kiến thức trên sẽ được minh họa dựa trên các tác nhân gây bệnh/cây ký chủ quan trọng (hoặc

là mô hình nghiên cứu phổ biến trên thế giới; hoặc có ý nghĩa kinh tế đối với Việt Nam).

Mục tiêu

Sinh viên có khả năng hiểu và vận dụng các kiến thức của môn học trong nghiên cứu bệnh

cây đặc biệt trong chẩn đoán, nghiên cứu đa dạng và phòng chống.

Học phần tiên quyết

Bệnh cây đại cương (hoặc Bệnh cây Nông nghiệp)

Công nghệ sinh học thực vật

3

MỤC LỤC

Giới thiệu CNSH trong bệnh cây .................................................................................... 8 1.1. Khái niệm về công nghệ sinh học ........................................................................ 8

1.2. Công nghệ sinh học trong bệnh cây ..................................................................... 8

Chương 1. Di truyền quần thể trong bệnh cây ............................................... 9

1. Sinh học quần thể của tác nhân gây bệnh ............................................................ 9

2. Tiến hóa ................................................................................................................ 9

2.1. Tiến hóa.............................................................................................................. 9

2.2. Sinh học tiến hóa: Di truyền quần thể và phả hệ trong bệnh cây .......................... 9

3. Năm lực tiến hóa (Five Evolutionary Forces) .................................................... 10

4. Đột biến ............................................................................................................... 11

4.1. Định nghia ........................................................................................................ 11

4.2. Vai trò .............................................................................................................. 11

4.3. Một mô hình đột biến đơn giản ......................................................................... 11

4.4. Đột biến trong tác nhân gây bệnh cây................................................................ 13

4.5. Đột biến và chiến lược tạo giống kháng ............................................................ 13

5. Trôi dạt di truyền ............................................................................................... 14

5.1. Định nghĩa ........................................................................................................ 14

5.2. Đặc điểm .......................................................................................................... 14

5.3. Nguyên nhân .................................................................................................... 14

5.4. Đo trôi dạt di truyền .......................................................................................... 14

5.5. Trôi dạt di truyền làm giảm đa dạng di truyền và dẫn tới phân chia quần thể ..... 15

5.6. Trôi dạt di truyền trong tác nhân gây bệnh cây .................................................. 16

5.7. Ví dụ trôi dạt di truyền trong bệnh cây .............................................................. 17

6. Giao lưu gene và kiểu gen (Gene and Genotype Flow) ..................................... 17

6.1. Định nghĩa. ....................................................................................................... 17

6.2. Đặc điểm .......................................................................................................... 17

6.3. Giao lưu gen (gene flow) và giao lưu kiểu gen (genotype flow) ........................ 17

6.4. Phân chia quần thể và giao lưu gen ................................................................... 18

6.5. Ví dụ giao lưu gen trong bệnh cây .................................................................... 20

6.6. Mối liên hệ giữa trôi dạt di truyền và giao lưu gen ............................................ 20

6.7. Khái niệm siêu quần thể và tác nhân gây bệnh .................................................. 21

7. Hệ thống sinh sản/ghép cặp (Reproductive/Mating Systems) ........................... 23

7.1. Đánh giá cấu trúc di truyền trong quần thể ........................................................ 23

7.2. Hệ thống sinh sản và ghép cặp của các tác nhân gây bệnh cây........................... 24

7.3. Đa dạng gen và đa dạng kiểu gen ...................................................................... 26

7.3.1 Đa dạng gen .............................................................................................. 26

7.3.2 Đa dạng kiểu gen ...................................................................................... 27

7.3.3 Ví dụ đo đa dạng gen và đa dạng kiểu gen ................................................. 27

8. Chọn lọc tự nhiên ................................................................................................ 29 8.1. Khái niệm ......................................................................................................... 29

8.2. Hai mô hình chọn lọc ........................................................................................ 30

9. Tương tác giữa các lực tiến hóa và cấu trúc di truyền của quần thể tác nhân

gây bệnh ........................................................................................................................... 30

9.1. Tương tác giữa đột biến và chọn lọc ................................................................. 30

9.2. Tương tác giữa tái tổ hợp và chọn lọc ............................................................... 31

9.3. Tương tác giữa trôi dạt di truyền, giao lưu kiểu gen và chọn lọc........................ 31

4

9.4. Tương tác giữa chọn lọc và giao lưu kiểu gen ................................................... 32

9.4.1 Tương tác giữa tái tổ hợp và giao lưu gen.................................................. 32

9.5. Ứng dụng di truyền quần thể để đánh giá các nguy cơ do tiến hóa của tác nhân

gây bệnh 34

Chương 2. Lựa chọn vùng gen của tác nhân gây bệnh................................. 38

1. Bộ gen của tác nhân gây bệnh ............................................................................ 38

1.1. Bộ gen viroid .................................................................................................... 38

1.2. Bộ gen virus ..................................................................................................... 38

1.3. Bộ gen vi khuẩn và phytoplasma....................................................................... 39

1.4. Bộ gen nấm ...................................................................................................... 40

2. Chọn vùng gen nghiên cứu ................................................................................. 40 2.1. Chọn vùng gen virus ......................................................................................... 40

2.2. DNA ribosome ................................................................................................. 41

2.2.1 Cấu trúc và chức năng RNA ribosome ...................................................... 41

2.2.2 Vai trò của rDNA trong phân loại và nghiên cứu đa dạng và chẩn đoán..... 42

2.3. Gen mã hóa ...................................................................................................... 43

2.4. Các chuỗi lặp .................................................................................................... 43

2.4.1 Các chuỗi lặp liền kề (tandem repetitive sequences) .................................. 43

2.4.2 Các chuỗi lặp phân bố rải rác (Dispersed repetitive sequences) ................. 44

2.5. DNA ti thể (mitochondrial DNA) ...................................................................... 44

Chương 3. Các kỹ thuật CNSH trong nghiên cứu bệnh cây ........................ 45

1. Các marker di truyền ......................................................................................... 45

1.1. Định nghĩa ........................................................................................................ 45

1.2. Phân loại ........................................................................................................... 45

2. Các loại marker phân tử .................................................................................... 45

3. Kỹ thuật dựa trên lai phân tử: RFLP ................................................................ 46

3.1. RFLP: các chú ý về kỹ thuật ............................................................................. 46

3.1.1 RFLP: Các ưu điểm chính ......................................................................... 47

3.1.2 RFLP: Các hạn chế chính .......................................................................... 47

4. Các kỹ thuật dựa trên PCR ................................................................................ 48

5. Các kỹ thuật dựa trên PCR dùng mồi tùy ý: RAPD, AP-PCR và DAF ........... 48 5.1. RAPD ............................................................................................................... 48

5.1.1 RAPD: nhược điểm ................................................................................... 49

5.2. DAF ................................................................................................................. 49

5.3. AP-PCR ............................................................................................................ 49

6. Kỹ thuật dựa trên PCR dùng mồi tùy ý: AFLP ................................................ 49

6.1. AFLP: các bước ................................................................................................ 49

6.2. AFLP: ưu điểm ................................................................................................. 50

6.3. AFLP: nhược điểm ........................................................................................... 50

7. Kỹ thuật dựa trên PCR dùng mồi tùy ý: ISSR .................................................. 50

8. Kỹ thuật dựa trên PCR dùng mồi đặc hiêu: SSR (=Microsatellites) ................ 51 8.1. Phân loại microsatellite ..................................................................................... 51

8.2. Đặc điểm di truyền của microsatellite ............................................................... 51

8.3. Cơ chế tạo đột biến của microsatellite ............................................................... 52

8.4. Phân bố của microsatellite ................................................................................ 53

8.5. Trình tự phân tích microsatellite ....................................................................... 53

8.6. Microsattelite: ưu điểm chính............................................................................ 56

8.7. Microsattelite: nhược điểm chính ...................................................................... 56

9. Marker EST (expressed sequence tags) ............................................................. 56

10. Kỹ thuật CAPS ................................................................................................... 57

5

11. Kỹ thuật SNP ...................................................................................................... 57

12. Kỹ thuật rep-PCR ............................................................................................... 58

13. Tóm tắt các kỹ thuật ........................................................................................... 59

Chương 4. Phân tích kết quả dựa vào số liệu băng điện di .......................... 61

1. Giới thiệu ............................................................................................................ 61

2. Các bước chính trong phân tích đa dạng dựa trên băng điện di ...................... 62 2.1. Mô tả sự đa dạng .............................................................................................. 62

2.2. Tính toán mối quan hệ giữa các đơn vị được phân tích ở bước trên ................... 62

2.3. Biểu diễn mỗi quan hệ ...................................................................................... 62

3. Lượng hóa mức đa dạng: đo đa dạng trong quần thể ....................................... 63 3.1. Dựa trên số lượng biến dị .................................................................................. 63

3.1.1 Mức đa hình hay tỷ lệ đa hình (Pj) ............................................................ 63

3.1.2 Tỷ lệ các locus đa hình (P) ........................................................................ 63

3.1.3 Số allele trung bình trên locus ................................................................... 63

3.2. Dựa vào tần số biến dị ...................................................................................... 64

3.2.1 Số lượng allele hiệu quả (Ae) .................................................................... 64

3.2.2 Mức dị hợp tử kỳ vọng trung bình (H = mức đa dạng di truyền Nei (D) .... 64

3.3. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker đồng trội ................ 65

3.4. Ví dụ ................................................................................................................ 65

3.4.1 Các bước tính (bảng dưới) ......................................................................... 66

3.5. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker trội ......................... 67

3.5.1 Ví dụ ......................................................................................................... 67

3.5.2 Các bước tính (bảng dưới) ......................................................................... 67

4. Lượng hóa mối quan hệ di truyền: khoảng cách di truyền (nghĩa rộng) ......... 68 4.1. Đánh giá các mối quan hệ dựa theo khoảng cách hình học ................................ 69

4.1.1 Các phương pháp phổ biến tính hệ số tương đồng S (similarity) dựa trên

biến nhị thức (0, 1) ........................................................................................................ 69

5. Phần mềm ........................................................................................................... 70

Chương 5. Phân tích đa dạng, phân loại dựa trên trình tự DNA ................ 71

1. Các thuật ngữ/khái niệm .................................................................................... 71

2. Giải trình tự chuỗi DNA (sequencing) ............................................................... 71 2.1. Giới thiệu ......................................................................................................... 71

2.2. Sequencing dùng BigDye Terminator ............................................................... 71

3. Tìm kiếm chuỗi có quan hệ gần trên ngân hàng gen ......................................... 72 3.1. Ngân hàng gen (Genbank) và NCBI .................................................................. 72

3.2. Tìm kiếm chuỗi DNA trên GenBank bằng phần mềm BLAST .......................... 72

4. So sánh trình tự .................................................................................................. 73

4.1. Căn trình tự đa chuỗi bằng phần mềm ClustalX ................................................ 76

4.2. Xác định mức đồng nhất (sequence identity) bằng phần mềm Bioedit ............... 76

4.3. Xác định khoảng cách di truyền (genetic distance) ............................................ 77

4.3.1 Khái niệm khoảng cách di truyền phân tử .................................................. 77

4.3.2 Mô hình thay thế nucleotide (subtituation model). ..................................... 77

4.3.3 Ví dụ tính khoảng cách di truyền dựa trên 5 chuỗi 16S RNA vi khuẩn dùng

phần mềm MEGA ......................................................................................................... 79

5. Xây dựng cây phả hệ .......................................................................................... 80

5.1. Maximum parsimony ........................................................................................ 80

5.2. Maximum likelyhood ........................................................................................ 82

5.3. Phương pháp khoảng cách (Distance) ............................................................... 82

5.4. Ví dụ xây dựng cây phả hệ của chuỗi các chuỗi 16S RNA vi khuẩn dùng phần

mềm MEGA .................................................................................................................... 85

6

Chương 6. Công nghệ microarray (chip gen) ............................................... 87

1. Giới thiệu ............................................................................................................ 87

2. Các loại microarray DNA................................................................................... 88 2.1. Microarray với các dò oligonucleotide ngắn ...................................................... 88

2.2. Microarrays với dò oligonucleotide dài ............................................................. 88

2.3. Microarrays với dò cDNA ................................................................................ 88

3. Các phương pháp cố định dò trong microarray DNA ...................................... 88

3.1. Tổng hợp trực tiếp ngay trên giá đỡ (in situ) ..................................................... 88

3.2. Tạo microarray bằng spotting ........................................................................... 88

4. Gán nhãn dò........................................................................................................ 89 4.1. Gán nhãn trực tiếp ............................................................................................ 89

4.2. Gán nhãn gián tiếp ............................................................................................ 89

4.3. Gãn nhãn dùng dendrimer ................................................................................. 90

5. Vật liệu để cố định dò ......................................................................................... 90

6. Các phương pháp gắn dò vào lam kính ............................................................. 90

7. Ứng dụng microarray DNA ............................................................................... 91 7.1. Nghiên cứu biểu hiện gen ―gene expression profiling‖ ...................................... 91

8. Chẩn đoán và nghiên cứu kiểu gen (genome typing) ......................................... 91

Chương 7. Công nghệ RNA interference ...................................................... 93

1. Lịch sử phát hiện ................................................................................................ 93

1.1. Hiện tượng đồng ức chế .................................................................................... 93

1.2. Hiện tượng chế ngự (quelling) .......................................................................... 93

1.3. Hiện tượng câm gen cảm ứng bởi virus ............................................................. 93

1.4. RNA Interferrence ............................................................................................ 93

2. Small interfering RNA (siRNA) và microRNA (miRNA) ................................. 94 2.1. miRNAs - khám phá ......................................................................................... 94

2.2. miRNAs - định nghĩa ........................................................................................ 94

2.3. miRNAs – nguồn gốc ....................................................................................... 94

2.4. miRNAs – sinh tổng hợp................................................................................... 94

2.5. siRNAs - khám phá ........................................................................................... 95

2.6. siRNAs - định nghĩa ......................................................................................... 95

2.7. siRNAs – nguồn gốc ......................................................................................... 95

2.8. siRNAs – sinh tổng hợp .................................................................................... 95

3. So sánh miRNA và siRNA .................................................................................. 95 3.1. Giống nhau ....................................................................................................... 95

3.1.1 Khác nhau ................................................................................................. 96

4. Công nghệ RNAi trong tạo giống kháng bệnh virus ......................................... 96

4.1. Giới thiệu ......................................................................................................... 96

4.2. Các đặc điểm chính trong công nghệ RNAi dựa trên siRNA ............................. 97

4.2.1 Thiết kế cấu trúc chuyển gen ..................................................................... 97

4.2.2 Chọn chuỗi gen virus ................................................................................ 97

5. Ví dụ công nghệ RNAi kháng bệnh virus .......................................................... 98 5.1. Tạo cây chuyển gen kháng PVY thông qua RNA silencing ............................... 98

5.1.1 Giới thiệu. ................................................................................................. 98

5.1.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen

98

5.1.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây ........................................ 99

5.1.4 Các phân tích chính cây chuyển gen .......................................................... 99

5.2. Tạo cây chuyển gen kháng TYLCV thông qua RNA silencing ........................ 100

5.2.1 Giới thiệu. ............................................................................................... 100

7

5.2.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen

101

5.2.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây ...................................... 102

5.2.4 Các phân tích chính cây chuyển gen ........................................................ 103

6. Sử dụng công nghệ microRNA trong phòng chống bệnh virus ...................... 103

6.1. Dùng công nghệ miRNA tạo tính kháng CMV ................................................ 104

6.1.1 Giới thiệu ................................................................................................ 104

6.1.2 Thiết kế cấu trúc miRNA chuyển gen ...................................................... 104

6.1.3 Chuyển gen vào cây thuốc lá ................................................................... 105

6.1.4 Lây nhiễm nhân tạo ................................................................................. 106

6.1.5 Đánh giá cây chuyển gen được lây nhiễm CMV dựa trên triệu chứng ..... 106

6.1.6 Phân tích miRNA trên cây chuyển gen .................................................... 106

6.1.7 Phân tích RNA của CMV trên cây lây nhiễm .......................................... 106

6.1.8 Phân tích virion CMV trên cây lây nhiễm ................................................ 107

Chương 8. PCR trong chẩn đoán tác nhân gây bệnh ................................. 108

1. Tóm tắt kỹ thuật ............................................................................................... 108

2. Thiết kế và lựa chọn mồi (primer) ................................................................... 108

2.1. Tự thiết kế mồi ............................................................................................... 108

2.1.1 Các chú ý khi thiết kế mồi ....................................................................... 109

2.1.2 Thiết kế mồi chung (degenerate primer) .................................................. 110

2.1.3 Phần mềm ............................................................................................... 110

2.2. Ví dụ mồi chung ............................................................................................. 110

Chương 9. Công nghệ huyết thanh học trong chẩn đoán ........................... 112

1. Cơ sở của phản ứng huyết thanh học ............................................................... 112

2.3. Các khái niệm ................................................................................................. 112

2.3.1 Kháng nguyên (antigen): ......................................................................... 112

2.3.2 Nhóm quyết định kháng nguyên (epitope) ............................................... 112

2.3.3 Kháng nguyên của tác nhân gây bệnh cây ............................................... 112

2.3.4 Kháng thể (antibody) .............................................................................. 112

2.4. Kháng thể đơn dòng và kháng thể đa dòng ...................................................... 113

3. Sản xuất kháng thể đơn dòng ........................................................................... 114 3.1. Các bước chính để sản xuất kháng thể đơn dòng gồm ..................................... 114

3.2. Qui trình tạo kháng thể đơn dòng .................................................................... 115

3.2.1 Gây miễn dịch trên thỏ ............................................................................ 115

3.2.2 Dung hợp (lai) ......................................................................................... 115

3.2.3 Sản xuất .................................................................................................. 116

4. Kỹ thuật chẩn đoán bằng ELISA ..................................................................... 117 4.1. Vật liệu chính cho ELISA ............................................................................... 117

4.2. Các kỹ thuật ELISA. ....................................................................................... 117

4.2.1 Kỹ thuật ELISA trực tiếp kiểu kẹp kép kháng thể (DAS-ELISA) ............ 118

4.2.2 Phản ứng ELISA gián tiếp kiểu bẫy kháng nguyên trước (PTA-ELISA) .. 118

8

Giới thiệu CNSH trong bệnh cây

1.1. Khái niệm về công nghệ sinh học

Có rất nhiều định nghĩa về công nghệ sinh học (biotechnology) nhưng nhìn chung CNSH

có thể được hiểu theo 2 nghĩa. Theo nghĩa rộng, điển hình như định nghĩa trong Công ước về

Đa dạng Sinh học của Liên hiệp quốc (1992) thì CNSH là ―Bất kỳ ứng dụng công nghệ sử

dụng các hệ thống sinh học, các sinh vật sống hoặc các thành phần của chúng nhằm tạo ra

hoặc biến đổi các sản phẩm hoặc qui trình cho một mục đích đặc biệt‖ ―any technological

application that uses biological systems, living organisms, or derivatives thereof, to make or

modify products or processes for specific use‖. Một cách đơn giản, CNSH là công nghệ được

áp dụng trên một đối tượng sinh vật.

Hiện nay, CNSH thường được hiểu theo nghĩa hẹp hơn nhiều. Nó thường được xem như

các công nghệ liên quan đến sinh học phân tử chẳng hạn công nghệ AND, công nghệ chuyển

gen, công nghệ nuôi cấy mô và tế bào...Theo định nghĩa của FAO: CNSH là kiến thức liên

quan đến khía cạnh phân tử của sinh vật và tế bào của chúng.

1.2. Công nghệ sinh học trong bệnh cây

Bệnh cây học (phytopathology = plant patho logy) nghiên cứu 4 lĩnh vực chính:

1. Tác nhân gây bệnh (pathogens): nghiên cứu đặc điểm hình thái, sinh học, phân loại, di

truyền, tiến hóa của tác nhân gây bệnh.

2. Tương tác giữa tác nhân gây bệnh và cây ký chủ (plant-pathogen interaction): nghiên

cứu cơ chế tấn công của tác nhân gây bệnh và cơ chế phòng thủ của cây, hậu quả của mối

tương tác này đối với cây (các biến đổi cấu trúc và chức năng của tế bào và mô cây bị

bệnh).

3. Dịch bệnh học (phytopathological epidemiology): nghiên cứu động thái phát triển của

bệnh cây theo không gian và thời gian, các yếu tố của cây ký chủ, môi trường , tác nhân

gây bệnh và con người ảnh hưởng đến sự hình thành và phát triển của bệnh.

4. Phòng chống: nghiên cứu các nguyên lý phòng chống, các biện pháp phòng chống.

Công nghệ sinh học trong bệnh cây, do vậy, cũng nhằm vào 4 lĩnh vực trên.

Các nghiên cứu đa dạng, tiến hóa của các nhóm tác nhân gây bệnh chủ yếu dựa vào các

phân tích phân tử. Nhiều nhóm tác nhân gây bệnh, chẳng hạn virus, viroid, phytoplasma, chỉ

có thể được xác định, phân loại chính xác khi phân tích bộ gen của chúng. Xác định đầy đủ

thành phần, nguồn gốc, mức độ đa dạng của tác nhân gây bệnh luôn là thông tin đầu tiên và

quan trọng đối với bất kỳ chiến lược phòng chống nào.

Sự tương tác giữa tác nhân gây bệnh và cây thường rất phức tạp với sự tham gia của

nhiều gen ở cả 2 phía. Hiện nay, một công nghệ dựa trên lai phân tử gọi là công nghệ

microarray (chip gen) có thể xác đinh sự biểu hiện đồng thời của hàng chục nghìn gen chỉ trên

một lam kính.

Trong lĩnh vực phòng chống bệnh, có vô số ví dụ cho thấy vai trò của CNSH. Các giống

kháng bệnh có thể đươc tạo ra dùng 2 chiến lược chính: (i) dùng gen kháng có nguồn gốc từ

cây. Đây là chiến lược áp dụng cho mọi đối tượng dịch hại. (ii) dùng gen từ tác nhân gây bệnh

để tạo tính kháng (tính kháng có nguồn gốc từ bệnh). Đây là chiến lược áp dụng cho các bệnh

virus. Vai trò của CNSH thể hiện ở các kỹ thuật phân lập gen kháng, thiết kế các cấu trúc

chuyển gen, chuyển gen, lai tạo với sự trợ giúp của các marker phân tử. Sử dụng VSV đối

kháng hoặc các sản phẩm có nguồn gốc VSV để phòng chống bệnh cũng có thể được xem là

ứng dụng CNSH (theo nghĩa rộng) trong bệnh cây.

9

Chương 1. Di truyền quần thể trong bệnh cây

Mục tiêu của chương này là cung cấp các khái niệm cơ bản trong di truyền quần thể. Các

khái niệm này sẽ rất cần thiết giúp sinh viên có khả năng phân tích kết quả sau khi thực hiện

các thí nghiệm dựa trên công cụ CNSH khi đánh giá đa dạng của tác nhân gây bệnh cây.

1. Sinh học quần thể của tác nhân gây bệnh

Sinh học quần thể nghiên cứu các quá trình sinh học ảnh hưởng tới quần thể sinh vật.

Sinh học quần thể, do vậy, cũng là một lĩnh vực nghiên cứu của bệnh cây học vì bệnh cây chỉ

hình thành dưới tác động của 1 quần thể tác nhân gây bệnh. Một vết bệnh trên lá sẽ không có

ý nghĩa về mặt kinh tế lẫn sinh thái. Một vụ dịch gây thiệt hại kinh tế lớn thường do vô số các

sự kiện xâm nhiễm gây bệnh liên quan đến toàn thể quần thể ký sinh và ký chủ. Để phòng

chống bệnh, người ta phải xây dựng các biện pháp phòng chống nhằm vào toàn bộ quần thể

tác nhân gây bệnh. Như vậy, hiểu được sinh học quần thể tác nhân gây bệnh là bước quan

trọng nhằm phát triển các chiến lược phòng chống bệnh hiệu quả.

Một quần thể là một tập hợp các cá thể cùng loài chiếm một không gian địa lý nhất định

và thể hiện sự liên tục về mặt sinh sản từ thế hệ này sang thế hệ khác. Mối tương tác sinh thái

và sinh sản của các cá thể trong cùng quần thể, do vậy, phổ biến hơn so với mối tương tác của

các cá thể thuộc các quần thể khác nhau.

Di truyền quần thể tập trung vào quá trình dẫn tới trao đổi di truyền hay tiến hóa trong

quần thể theo thời gian và không gian. Phần lớn các nghiên cứu di truyền quần thể dựa trên

qui mô thời gian dài (ví dụ qua nhiều mùa vụ hoặc qua nhiều thế hệ tác nhân gây bệnh) và

không gian lớn (ví dụ qui mô toàn cầu cho các đối tượng bệnh có thể phát tán xa). Di truyền

quần thể giải quyết chủ yếu các các quá trình di truyền như đột biến, trôi dạt di truyền, giao

lưu gen, hệ thống sinh sản/ghép cặp và chọn lọc tự nhiên.

2. Tiến hóa

2.1. Tiến hóa

Tiến hóa là một quá trình thay đổi vật liệu di truyền từ thế hệ này sang thế hệ khác và

gồm 2 bước. Đầu tiên là quá trình đột biến gen hoặc tái tổ hợp di truyền xảy ra và tạo nên sự

đa dạng di truyền trong quần thể. Tiếp theo, các quá trình như chọn lọc hoặc trôi dạt di truyền

sẽ tác động làm thay đổi tần số allele trong quần thể.

Tiến hóa, như vậy, hình thành từ sự thay đổi tần số allele trong quần thể. Ví dụ, khi một

quần thể cây ký chủ trải qua một sự gia tăng trong tần số các allele kháng hình thành từ sự

chọn lọc các cá thể kháng thì quần thể cây này đã tiến hóa lên một mức độ kháng cao hơn.

Tương tự, khi một quần thể tác nhân gây bệnh không độc trải qua một sự gia tăng trong tần số

allele độc nhờ quá trình chọn lọc các cá thể độc có khả năng thoát khỏi sự nhận biết của các

allele kháng của cây ký chủ kháng bệnh thì người ta gọi quần thể tác nhân gây bệnh này đã

tiến hóa tới một mức độ độc cao hơn.

2.2. Sinh học tiến hóa: Di truyền quần thể và phả hệ học trong bệnh cây

Sinh học tiến hóa là một ngành nghiên cứu quá trình dẫn tới thay đổi di truyền hoặc tiến

hóa của quần thể hoặc của loài. Di truyền quần thể và phả hệ học là 2 ngành phụ trong sinh

học tiến hóa. Di truyền quần thể nghiên cứu các quá trình vi tiến hóa (microevolution) xảy ra

trong loài nhằm giải thích sự phân bố biến dị di truyền bên trong các quần thể hoặc giữa các

quần thể của cùng loài. Phả hệ học nghiên cứu các quá trình đại tiến hóa (macroevolution)

xảy ra trong loài nhằm giải thích mối quan hệ phả hệ (quan hệ tổ tiên – con cháu) dẫn tới sự

phân bố của loài hiện tại theo không gian và thời gian.

10

Hình 1. Mối quan hệ giữa phả hệ học và di truyền quần thể trong quá trình biệt hóa loài

Bệnh cây học nghiên cứu sinh học tiến hóa vì (1) quần thể tác nhân gây bệnh thường tiến

hóa nhằm phản ứng lại các biện pháp phòng chống và (2) người ta thường không rõ liệu một

quần thể tác nhân gây bệnh mới hình thành và thay thế một quần thể đang tồn tại trước đó là

một quần thể chuyển ký chủ hay là một loài mới hoàn toàn. Phân tích phả hệ sẽ phân biệt

được các loài dựa trên mối quan hệ tổ tiên – con cháu từ các tổ tiên chung; trong khi đó di

truyền quần thể xác định mối quan hệ giữa các quần thể của cùng một loài. Ranh giới giữa di

truyền quần thể và phả hệ học là sự biệt hóa loài (speciation) tức là quá trình hình thành loài

mới. Sự biệt hóa loài có thể xảy ra trong cùng một vùng địa lý, hoặc tại các vùng địa lý cách

xa nhau hoặc tại các vùng địa lý lân cận. Sự biệt hóa loài có thể xuất hiện nhanh hơn đối với

tác nhân gây bệnh cây so với các sinh vật khác do hậu quả của sự đồng tiến hóa.

Phả hệ học và di truyền quần thể sử dụng các các công cụ phân tích di truyền khác nhau.

Phân tích phả hệ sử dụng các đặc điểm đặc trưng cho loài nhằm xác định các đơn vị phân loại

dựa trên 2 phương pháp là phương pháp phân nhánh (cladistics) và phương pháp kiểu hình

(phenetics). Di truyền quần thể sử dụng các tần số allele tại các vị trí đa hình (polymorphic

loci) nhằm xác định cấu trúc di truyền và ranh giới quần thể. Cả 2 lĩnh vực nghiên cứu trên

đều nhằm làm sáng tỏ quá trình dẫn tới thành phần quần thể và loài hiện tại.

Trong quá trình xác định nguồn gốc của các loài tác nhân gây bệnh mới, người ta có tể

phải sử dụng các công cụ nghiên cứu của cả phả hệ học và di truyền quần thể.

3. Năm lực tiến hóa (Five Evolutionary Forces)

Trong hệ sinh thái nông nghiệp, chúng ta quan tâm liệu một biện pháp phòng chống

(chẳng hạn dùng một gen kháng, phun một loại thuốc hóa học, áp dụng một chương trình

kiểm dịch mới, luân canh cây trồng…) sẽ ảnh hưởng tới di truyền quần thể hay tiến hóa của

một quần thể tác nhân gây nào đó như thế nào.

Trong di truyền quần thể, nhìn chung, người ta xét 5 lực tiến hóa có ảnh hưởng tới quần

thể tác nhân gây bệnh. Các lực này là:

Đột biến (mutation)

Trôi dạt di truyền (genetic drift)

Giao lưu gen/kiểu gen (gene/genotype flow)

Hệ thống sinh sản/ghép cặp (reproductive/mating type systems)

Phả hệ học (Phylogenetics)

(Đại tiến hóa = macroevolution)

Biệt hóa loài (Speciation)

Di truyền quần thể (Population genetics)

(Vi tiến hóa = microevolution)

Sinh

học

tiến

hóa

11

Chọn lọc tự nhiên (natural selection)

Nếu không có đột biến, trôi dạt di truyền, giao lưu gen/kiểu gen và chọn lọc tự nhiên thì

quần thể sẽ đạt tới trạng thái cân bằng theo định luật Hardy-Wenberg.

Để đơn giản, chúng ta sẽ xét chỉ một lực tiến hóa tại một thời điểm mặc dù trong tự

nhiên, tất cả các lực này thường xảy ra đồng thời và tương tác với nhau để định hình cấu trúc

di truyền của quần thể.

4. Đột biến

4.1. Định nghia

Đột biến là 1 thay đổi trong DNA ở một locus nào đó của sinh vật.

4.2. Vai trò

Đột biến là một lực tiến hóa yếu để có thể làm thay đổi tần số allele nhưng là một lực

tiến hóa mạnh để tạo ra một allele mới. Đột biến là nguồn chủ yếu để tạo thành các allele

mới trong quần thể tác nhân gây bệnh. Do vậy, đột biến cũng cũng là nguồn chủ yếu để tạo

thành các allele mới có khả năng tạo ra các kiểu gen mới của một tác nhân gây bệnh (chẳng

hạn chủng mới, dạng chuyên hóa mới).

Đột biến đóng một vai trò quan trọng trong tiến hóa. Nguồn chủ yếu các biến dị di

truyền là đôt biến. Đột biến quan trọng vì là bước đầu tiên của tiến hóa khi nó tạo ra các trình

tự DNA mới cho môt gene (tức tạo ra các allele mới). Cần chú ý là tái tổ hợp (recombination)

cũng có vai trò tương tự. Đột biến có vai trò như là một lực tiến hóa vì nó có khả năng gây ra

những thay đổi đáng kể trong tần số allele qua một thời gian rất lâu. Nhưng nếu đột biến là

lực tiến hóa duy nhất tác động lên quần thể tác nhân gây bênh thì tốc độ tiến hóa thấp tới mức

chúng ta không thể quan sát thấy được.

Trong bệnh cây, chúng ta thường quan tâm nhất tới các đột biến ảnh hưởng tới tính độc

của tác nhân gây bệnh hoặc tính mẫn cảm đối với thuốc hóa học. Đối với tác nhân gây bênh

có mối quan hệ gene-đối-gene đối với cây thì chúng ta đặc biệt quan tâm tới các đột biến làm

tác nhân gây bệnh chuyển từ tính không độc sang tính độc vì đây là các đột biến dẫn tới mất

tính kháng di truyền của cây ở cả hệ sinh thái nông nhiệp và hệ sinh thái tự nhiên. Tuy nhiên

các đột biến làm tác nhân gây bệnh chuyển từ trạng thái mẫn cảm thuốc sang trạng thái kháng

thuốc cũng quan trọng trong hệ sinh thái nông nghiệp vì chúng ảnh hưởng tới tính thích nghi

của tác nhân gây bệnh.

4.3. Một mô hình đột biến đơn giản

Nhằm chứng minh đột biến có thể dẫn tới thay đổi tần số allele như thế nào, hãy xét một

mô hình đột biến đơn giản. Giả sử chúng ta có 2 allele ở một locus gọi là A1 và A2, trong đó

A1 có thể đột biến thuận thành A2 và A2 có thể đột biến ngược thành A1. Tiếp theo, giả sử

A1 đột biến thành A2 với tần số u trên một thế hệ (u là tốc độ đột biến thuận), A2 đột biến

ngịch thành A1 với tần số v trên 1 thế hệ (v là tốc độ đột biến nghịch). Ở thời điểm t, tần số

của allele A1 là pt và tần số allele A2 là qt. Ở mọi thế hệ, có một tỷ lệ allele A1 bị đột biến

thành A2. Tỷ lệ này sẽ bằng tốc độ đột biến thuận u nhân với tần số allele A1 = up. Tương tự,

ỏ mọi thế hệ cũng có một tỷ lệ allele A2 đột biến nghịch thành allele A1 và tỷ lệ này = vq.

12

f(A1) = pt f(A2) = qt

A1 = avirulence allele, A2= virulence allele

Thuận (u)

A1

A2

Nghịch (v)

up

A1 A2

A1 A2

vq

q = upt - vqt thêm mất

Điều gì sẽ xảy ra với tần số allele A2 với điều kiện trên? Ở mọi thế hệ, tần số allele A2 sẽ

tăng lên (up) do đột biến thuận nhưng cũng đồng thời bị giảm (vq) do đột biến nghịch. Như

vậy, ở mỗi thế hệ, tổng thay đổi tần số allele A2 (q) = up – vq. Có thể suy ra tần số allele A2

ở thế hệ t +1 sẽ là

q(t+1) = qt + q

q(t+1) = qt + (upt - vqt)

Ví dụ

Giả sử u = 1 x 10-5

và v = 1 x 10-6

/ thế hệ (đây là tốc độ đột biến thuận và nghịch điển

hình). Giả sử tần số allele A1 (p) = 0.99 và tần số A2 (q) = 0.01. Vậy tần số mới của A2 là bao

nhiêu sau một thế hệ đột biến?

Tần số mới của allele A2 = 0.01 + [(10-5

)(0.99) - (10-6

)(0.01)] = 0.01 + 9.89 x 10-6

=

0.01001.

Chúng ta có thể thấy rằng sự thay đổi tần số allele A2 là không đáng kể qua mỗi thế hệ.

Nhìn chung, sau t thế hệ, tần số của allele A1 (wild-type) sẽ là:

pt = p0(1-u)t

Để tính số thế hệ cần nhằm thay đổi tần số allele với một số cho trước:

t = log(pt/p0)/log(1-u)

Chúng ta có thể dùng công thức trên để tính số thế hệ cần để thay đổi các tần số allele với

điều kiện đột biến là lực tiến hóa duy nhất tác động lên quần thể. Để thay đổi tần số allele 1%

(0.01) sẽ cần một thời gian dài. Giả sử u = 10-5

/ thế hệ (đây là một tốc độ đột biến cao). Để

chuyển tần số allele A1 từ 1.00 lên 0.99 (thay đổi 1%) sẽ cần 2000 thế hệ. Để chuyển tần số

này từ 0.10 lên 0.09 (thay đổi 1%) sẽ cần 10,000 thế hệ. Nhìn chung, khi tần số của allele

hoang dại giảm thì nó sẽ cần thời gian lâu hơn để tạo ra cùng số lượng đột biến.

Mô hình này chứng tỏ rằng đột biến là lực tiến hóa rất yếu để có thể thay đổi tần số

allele.

Tuy nhiên, đột biến lại quan trọng trong khi tạo ra các allele mới trong quần thể. Số

lượng allelle trong quần thể biến đổi theo kích thước quần thể. Tốc độ đột biến được tính theo

thế hệ. Một tốc độ đột biến = 1 x 10-6

có thể có ý nghĩa là một đột biến ở một cặp gen sẽ xuất

hiện một lần / 1 triệu tế bào / thế hệ hoặc cũng có thể có ý nghĩa là đột biến ở một cặp gen sẽ

xuất hiện một lần / 1 triệu cặp base / thế hệ. Các đột biến chỉ có thể truyền sang thế hệ con

cháu nếu xuất hiện ở các tế bào sinh sản như bào tử nấm, trứng + tinh trùng (của tuyến trùng,

côn trùng), tế bào vi khuẩn hoặc phân tử virus. Một đột biến = 1 x 10-6

cũng ngụ ý rằng đột

13

biến xuất hiện ở tần số 1 / 1 triệu cá thể của quần thể. Tốc độ đột biến they đổi theo gen và

loại sinh vật, nhưng nhìn chung chúng thường thấp và có thể được xem là sự kiện hiếm trong

hầu hết các trường hợp.

Giả sử một đột biến có tốc độ 1 x 10-6

. Điều này có nghĩa trung bình, trong 1 quần thể 1

triệu cá thể (bào tử nấm, tế bào vi khuẩn, phân tử virus), người ta có thể hy vọng tìm được 1

đột biến trên bất kỳ một locus gen/thế hệ. Tương tự, trong 1 quần thể 10 triệu cá thể, người ta

có thể hy vọng tìm thấy 10 đột biến.

4.4. Đột biến trong tác nhân gây bệnh cây

Lấy 1 ví dụ là nấm phấn trắng lúa miến (barley) Blumeria graminis f. sp. hordei. Một vết

bệnh phấn trắng thành thục tạo ~104 bào tử /ngày. Nếu chỉ số bệnh (= % diện tích lá bị bệnh)

trên một cánh đồng là 10 % thì sẽ có khqảng 105 vết bệnh / m

2 và số lượng bào tử hình thành

là khoảng 109 bào tử/ m

2 / ngày hay 10

13 bào tử/ ha/ ngày. Với một tốc độ đột biến = 10

-6 tại

một locus qui định tính không độc thì sẽ có khoảng 107 bào tử mang đột biến độc được tạo ra

/ha/ngày. Các đột biến độc này phát tán sang các ruộng trồng giống kháng trồng cạnh đó và

nhiễm trên các cây mang gen kháng và tạo ra một thế hệ con cháu mang gen độc. Quá trình

này xảy ra khá phổ biến đối với nấm sương mai và gỉ sắt, và cuối cùng dẫn tới cái gọi là chu

trình ―đỉnh – và – đáy‖ (boom – and – bust). Trong chu trình này, đột biến là giai đoạn đầu

tiên chủ chốt để tạo ra ―đáy‖.

Nhìn chung, quần thể tác nhân gây bệnh lớn thường có nhiều allele hơn quần thể nhỏ vì

có nhiều đột biến là nguyên liệu cho chọn lọc hoặc trôi dạt di truyền. Đây là một lý do người

ta nên giữ quần thể tác nhân gây bệnh ở kích thước càng nhỏ càng tốt. Về lý thuyết, nếu kích

thước quần thể là <106, người ta khó có thể tìm được nhiều allele đột biến cho bất kỳ gene

nào, kể cả gene độc.

Ngoài ra, kích thước quân thể lớn thường chứa nhiều allele hơn do chúng trải qua trôi dạt

di truyền ít hơn. Như trình bày ở phần..., trôi dạt di truyền làm giảm số lượng allele của quần

thể.

Cuối cùng, sự đa dạng của các allele tại một locus sẽ bị ảnh hưởng bởi độ dài thời gian

mà quần thể chiếm một vùng địa lý nào đó. Quan hàng ngàn thế hệ, nhiều đột biến sẽ được

hình thành trong quần thể và một số trong các đột biến này có thể gia tăng tần số ở mức có thể

phát hiện được do hậu quả của chọn lọc và trôi dạt di truyền. Cả 2 quá trình này có thể phải

diễn ra trong một thời gian rất lâu để có thể tạo ra một sự gia tăng về mức độ đa dạng allele có

thể lượng hóa được. Khái niệm «trung tâm đa dạng di truyền » thường được dùng để xác định

trung tâm khởi nguyên của của một cây ký chủ và ký sinh của nó. Trung tâm đa dạng di

truyền thường là trung tâm khởi nguyên của cả ký sinh và ký chủ và là nơi quá trình đồng tiến

hóa đã xảy ra trong khoảng thời gian lâu nhất. Vì hậu quả của quá trình đồng tiến hóa, trung

tâm khởi nguyên sẽ có sự đa dạng lớn nhất các allele kháng (của ký chủ) cũng như các allele

độc và không độc của ký sinh.

4.5. Đột biến và chiến lược tạo giống kháng

Xét các ảnh hưởng của việc qui tụ các gene kháng. Nếu 2 gene kháng được đưa vào đồng

thời trên một cây ký chủ thì tác nhân gây bệnh sẽ phải cần đồng thời 2 đột biến từ trạng thái

không độc sang độc. Nếu giả sử tốc độ đột biến điển hình = 10-6

, thì xác xuất để 2 đột biến

này cùng xuất hiện trong một chủng là 10-6

x 10-6

= 10-12

. Như vậy, lấy lại ví dụ về bệnh phấn

trắng lúa miến ở trên, sẽ chỉ khoảng 10 đột biến kép có thể xảy ra mỗi ngày/ha. Nếu người ta

đưa vào 3 gene kháng, thì xác suất tạo 3 đột biến đồng thời là 10-18

và sẽ chỉ có 1 cá thể mang

3 đột biến đồng thời / 105 ha cây ký chủ. Đây là lý do tại sao các nhà chọn giống thích đưa

nhiều gen kháng vào một giống. Vì diện tích 106 ha là diện tích canh tác cây cốc khá phổ biến

ở nhiều nơi trên thế giới (?) và thường chỉ có thể cho 2-3 gene kháng nên người ta có thể hỏi

14

tại sao tính kháng không bị bẻ gẫy nhanh chóng. Lý do là không phải tất cả các cá thể (bào tử)

mang nhiều đột biến đông thời để bẻ gây tính kháng đa gene có cơ hội nhiễm trên cây kháng.

Phần lớn trong số chúng sẽ rơi xuống đất, biến mất trên không khí, rơi trên cây ký chủ không

phù hợp, và thậm chí nếu rơi trên cây ký chủ thích hợp thì lại gặp phải điều kiện môi trường

không phù hợp cho sự nhiễm bệnh.

5. Trôi dạt di truyền

5.1. Định nghĩa

Trôi dạt di truyền là 1 quá trình trong đó tần số allele của một quần thể bị thay đổi qua

các thế hệ một cách hoàn toàn ngẫu nhiên.

5.2. Đặc điểm

Trôi dạt di truyền là một quá trình ngẫu nhiên có thể dẫn tới các thay đổi lớn về cấu trúc

di truyền của quần thể trong thời gian ngắn.

Trôi dạt di truyền dẫn tới cố định allele hay kiểu gene trong quần thể, làm tăng hệ số giao

phối và tăng mức đồng hợp tử (homozygosity) do hâu quả của việc loại bỏ các allele.

Trôi dạt di truyền có lẽ phổ biến trong các quần thể trải qua chu kỳ tuyệt chủng

(extinction) và tái xuất hiện (recolonization). Điều này đặc biệt quan trọng trong hệ sinh thái

tự nhiên nơi cả ký sinh và ký chủ phân bố không đều với mỗi phần là 1 quần thể nhỏ.

Vì trong trôi dạt di truyền, tần số allele không thay đổi theo bất kỳ hướng xác định trước

nào nên người ta còn gọi trôi dạt di truyền là trôi dạt ngẫu nhiên hay trôi dạt di truyền ngẫu

nhiên.

5.3. Nguyên nhân

Trôi dạt di truyền có thể xảy ra do 3 nguyên nhân và chúng ta sẽ xét các nguyên nhân này

theo mối quan hệ tam giác bệnh (cây ký chủ – tác nhân gây bệnh – môi trường).

(1). Sự xuất hiện lại các quần thể có kích thước nhỏ. Kích thước nhỏ của quần thể tác

nhân gây bệnh hình thành lại khi không có nhiều cây ký chủ trên vùng nhiễm bệnh, hoặc khi

môi trường không thích hợp cho sự nhiễm bệnh.

(2). Hiện tượng “thắt cổ chai” (hay là sự suy giảm mạnh kích thước quần thể). Một

hiện tượng thắt cổ chai xuất hiện khi quần thể cây ký chủ bị loại bỏ (ví dụ do thu hoạch), hoặc

khi môi trường thay đổi đã ngăn sự nhiễm bệnh trên cây hoặc tiêu diệt trực tiếp tác nhân gây

bệnh (ví dụ thời tiết khô, nóng, băng giá…)

(3). Hiệu ứng nền. Một hiệu ứng nền xuất hiện khi một số lượng nhỏ các cá thể, đại diện

chỉ một phần nhỏ của tổng vốn gene của loài, bắt đầu một quần thể mới. Chẳng hạn, một hiệu

ứng nền sẽ xuất hiện khi một vài cây mang mầm bệnh thoát khỏi sự kiểm tra của cơ quan

kiểm dịch và hình thành một bệnh tại một nơi vốn trước đây không có bệnh.

5.4. Đo trôi dạt di truyền

Đối với một quần thể, mức độ trôi dạt di truyền phụ thuộc Ne . Ne là kích thước quần thể

hiệu quả (effective population size) và là một quần thể lý tưởng có kích thước xác định. Quần

thể lý tưởng là quần thể trong đó tất cả bố mẹ có cơ hội bằng nhau để là bố mẹ của bất kỳ con

cháu nào (không có chọn lọc). Ne hiếm khi là số lượng cá thể thực sự của quần thể (N, còn gọi

là kích thước dân số). Ne là một số lý thuyết trình bày số lượng cá thể khác biệt về mặt di

truyền đóng góp vào sự hình thành giao tử cho thế hệ kế tiếp. Ne cũng còn được gọi là số cá

thể giao phối khác biệt về di truyền của quần thể. Ne không dễ xác định vì nó bị ảnh hưởng

15

bởi phương thức giao phối và sinh sản (tự thụ, giao phối chéo, sinh sản vô tính) và phụ thuộc

vùng địa lý mà quần thể được lấy mẫu. Ne không dễ xác định đối với các tác nhân gây bệnh

nấm có kiểu sinh sản vô tính và hữu tính hỗn hợp vì số lượng cá thể có thể rất lớn nhưng số

kiểu gene khác nhau có trải qua tái tổ hợp hữu tính có thể tương đối nhỏ. Ví dụ một nghiên

cứu về nấm Mycosphaerella graminicola gây bệnh trên lúa mỳ cho thấy Ne của nấm ít nhất

gồm 70 chủng (strains) / m2 (Zhan et al., 2001).

Nếu biết kích thước quần thể hiệu quả Ne, chúng ta có thể biết trôi dạt di truyền tới mức

nào. Sự biến động (biểu diễn bằng phương sai Var) trong tần số allele (p) của một quần thể

có trôi dạt di truyền được tính theo công thức:

Var (p) = Ne

pq

2 sau 1 thế hệ trôi dạt di truyền đối với sinh vật lưỡng bội

Sau nhiều thế hệ trôi dạt di truyền, một cân bằng hình thành và tại điểm cân bằng, chúng

ta có:

Var (p) = p0q0

Trong đó p0 và q0 là tần số ban đầu của 2 alllele tại một locus.

Nếu p0=q0=0.5 và Ne = 50 thì Var (p) = 0.0025

Độ lệch chuẩn SD của (p) = (0.0025)0.5

= 0.05.

Độ lệch chuẩn là trung bình giá trị tuyệt đối của sai khác được kỳ vọng trong quần thể sau

1 thế hệ trôi dạt di truyền và xấp xỉ bằng thay đổi được kỳ vọng trong tần số allele ( p) trong

một quần thể. Do vậy trong một quần thể có 50 cá thể với 2 allele có tần số ban đầu bằng

nhau thì chúng ta có thể dự đoán tần số các allele này sẽ thay đổi khoảng 5 % qua mỗi thế hệ.

Mức độ thay đổi sẽ tăng khi kích thước quần thể giảm. Ví dụ

Nếu p0=q0=0.5 và Ne = 5 thì Var (p) = 0.05

Độ lệch chuẩn SD của (p) = (0.05)0.5

= 0.22

Trong trường hợp này, quần thể với 5 cá thể trải qua trôi dạt di truyền sẽ có sự thay đổi

tần số allele khoảng 22% qua mỗi thế hệ.

5.5. Trôi dạt di truyền làm giảm đa dạng di truyền và dẫn tới phân chia quần thể

Cơ hội để cố định (fix) một allele tại một locus do trôi dạt di truyền phụ thuộc kích thước

quần thể hiệu quả Ne và tần số của allele đó. Một allele được cố định có nghĩa allele này có

tần số = 1 (tức là tất cả các thể của quần thể có cùng allele này). Trong một quần thể có kích

thước quần thể hiệu quả lớn và các allele có tần số ngang bằng thì cơ hội cho một allele trở

nên được cố đinh sẽ giảm. Các allele có tần số thấp sẽ ở vị trí bất lợi trong quá trình trôi dạt di

truyền vì nguy cơ bị biến mất cao hơn so với các allele có tần số cao.

.Trong điều kiện trôi dạt thuần túy, xác suất cố định của một allele trong một quần thể là

tần số ban đầu của nó. Nếu giả sử tần số ban đầu của một allele là 0.01 thì sẽ có 1% cơ hội để

allele này được cố định trong quần thể.

16

Hình. Xác xuất 1 allele sẽ biến mất do trôi dạt di truyền khi giả sử quần thể có 2 allele với

các tần số ban đầu khác nhau và kích thước quần thể hiệu quả khác nhau.

Trôi dạt di truyền có thể dẫn tới nhiều hậu quả:

Dẫn tới thay đổi tần số allele

Dẫn tới cố định allele do mất allele hoặc kiểu gen

Dẫn tới cố định hay mất toàn bộ kiểu gen của một sinh vật sinh sản vô tính

Dẫn tới tăng tính đồng hợp tử đối với sinh vật lưỡng bội và tăng hệ số tự thụ

Dẫn tới tăng sự sai khác di truyền giữa các quần thể nếu không có sự giao lưu gen

(gene flow) giữa chúng

Trôi dạt di truyền cũng có 2 hậu quả quan trọng về mặt tiến hóa qua thời gian dài.

Tạo điều kiện cho sự biệt hóa loài (tạo loài mới) bằng cách cho phép tích lũy các các

đột biến không thích nghi dẫn tới tạo điều kiện phân chia quần thể

Tạo điều kiện cho sự di chuyển của một quần thể từ mặt bằng thích nghi thấp lên mặt

bằng thích nghi cao hơn theo lý thuyế chuyển dịch cân bằng Sewall Wright.

Sự phân chia quần thể do trôi dạt di truyền sẽ tăng do các allele có trong các quần thể

khác nhau sẽ bị mất một cách ngẫu nhiên. Ngoài ra, thay đổi tần số allele một cách ngẫu

nhiên trong quần thể cũng sẽ xảy ra trong các quần thể khác nhau và các thay đổi ngẫu nhiên

này làm các quần thể trở nên biệt hóa. Cuối cùng, nếu trôi dạt di truyền xảy ra ở các quần thể

có kích thước quần thể hiệu quả nhỏ thì xác suất giao phối chéo giữa các họ hang gần gũi có

xu hướng tăng dẫn tới tăng tự thụ và tiếp theo làm giảm mức dị hợp tử (heterozygosity)

5.6. Trôi dạt di truyền trong tác nhân gây bệnh cây

Trong hệ sinh thái nông nghiệp, các quần thể tác nhân gây bệnh thường trở nên rất lớn do

hậu quả tính đồng nhất di truyền cao của quần thể cây ký chủ. Do vậy, trôi dạt di truyền có

thể không đóng một vai trò quan trọng trong quá trình tiến hóa của tác nhân gây bệnh trong

phạm vi một diện tích canh tác nhỏ (chẳng hạn một cánh đồng của nông dân).

Tuy nhiên đã có rất nhiều bằng chứng về hiệu ứng nền trong hệ sinh thái nông nghiệp.

Một ví dụ điển hình là Úc. Đây là một lục địa độc lập. Trong quá trình khai phá, người châu

Âu đã mang cây trồng cũng như bệnh của chúng vào lục địa này.

17

Trong hệ sinh thái tự nhiên, trôi dạt di truyền có lẽ đóng vai trò lớn hơn trong tiến hóa của

tác nhân gây bệnh vì ngoài tự nhiên, quần thể cây ký chủ đa dạng về di truyền hơn, thường có

phân bố không đều nên kích thước quần thể tác nhân gây bệnh không quá lớn. Hiện tượng

thắt cổ chai thường xuất hiện trong quần thể tự nhiên nhiều hơn so với hệ sinh thái nông

nghiệp. (Xem thêm khái niệm siêu quần thể)

5.7. Ví dụ trôi dạt di truyền trong bệnh cây

Một ví dụ về trôi dạt di truyền trong bệnh cây là trường hợp nấm Puccina striiformis gây

bệnh gỉ sắt dạng sọc lúa mỳ ở Úc. Thông qua các phân tích phân tử, các nhà khoa học phát

hiện thấy rằng nấm này đã tới Úc vào năm 1979 bằng 1 clone từ châu Âu vì trong 2 năm

1979-1980, chỉ 1 race của nấm này được phát hiện tại Úc và giống với 1 race của Châu Âu

(Steele et al. 2001).

6. Giao lưu gene và kiểu gen (Gene and Genotype Flow)

6.1. Định nghĩa.

Giao lưu gene/kiểu gen (hay di cư gen/kiểu gen) là quá trình chuyển vật liệu di truyền

(dưới dạng gen/kiểu gen) từ quần thể này sang quần thể khác của cùng loài.

6.2. Đặc điểm

Giao lưu gen là một lực ngăn cản sự đa dạng của các quần thể. Giao lưu gen phá vỡ rào

cản địa lý hoặc các rào cản khác gây ra sự biệt lập quần thể. Các quần thể biệt lập, do không

có trao đổi di truyền nên sẽ trở nên đa dạng do trôi dạt di truyền và chọn lọc các allele thích

nghi nhất đối với ổ sinh thái của quần thể đó. Nhưng nếu giao lưu gene xuất hiện ở mức độ đủ

lớn và hiệu quả thì các quần thể biệt lập sẽ trở nên không còn đa dạng về di truyền; nói cách

khác chúng trở nên giống nhau và tiến hóa như một đơn vị tiến hóa duy nhất.

Giao lưu gen đặc biệt quan trọng đối với tác nhân gây bệnh cây trong hệ sinh thái nông

nghiệp vì nó là quá trình đưa các gen mới vào một vùng địa lý cách xa điểm xuất hiện đầu

tiên của gen đó. Nó là quá trình đưa các allele độc vào một quần thể mới. Giao lưu gene do

vậy có thể đưa các allele mới thay thế các allele cũ nếu các allele mới thích nghi hơn trên cây

ký chủ hiện tại

6.3. Giao lưu gen (gene flow) và giao lưu kiểu gen (genotype flow)

Trong các quần thể tác nhân gây bệnh chỉ bao gồm một hoặc một vài dòng (chủng) đồng

nhất, có thể xảy ra trường hợp giao lưu gene đặc biệt, trong đó, mỗi dòng (có kiểu gene đồng

nhất) sẽ có nhiều đột biến làm nó khác với dòng ban đầu. Thực tế là nhiều gene di chuyển

cùng với nhau trong các dòng vô tính nên người ta cũng quan tâm tới giao lưu kiểu gene. Giao

lưu kiểu gene là sự di chuyển của toàn bộ kiểu gen từ quần thể này sang quần thể khác. Giao

lưu kiểu gene chỉ xuất hiện đối với các sinh vật có kiểu sinh sản vô tính chiếm ưu thế trong

vòng đời hay hoàn toàn sinh sản vô tính. Ví dụ: giao lưu kiểu gen xuất hiện khi 1 kiểu gen

(clone) của nấm Fusarium oxysporum f. sp. melonis (gây bệnh héo Fusarium trên cây dưa) di

chuyển từ Bắc Mỹ tới Israel qua ủng dính đất mang mầm bệnh của một nhà khoa học. Trong

trường hợp này, vì nấm F. oxysporum không sinh sản hữu tính nên toàn bộ kiểu gen của nó đã

được đưa vào một quần thể nấm mới. Nếu clone này có mức độ thích nghi cao, nó sẽ tồn tại

được ở một vị trí mới.

Đối với vi khuẩn và virus, mặc dù tái tổ hợp có thể xảy ra, nhưng do chúng sinh sản hoàn

toàn vô tính nên giao lưu kiểu gene phổ biến hơn giao lưu gen. Trong khi đó, đối với nấm, do

có cả sinh sản hữu tính và vô tính nên chúng có cả giao lưu gen và giao lưu kiểu gen

18

6.4. Phân chia quần thể và giao lưu gen

Sự phân chia quần thể do trôi dạt di chuyền có thể bị khắc phục nhờ giao lưu gen. Mô

hình dễ nhất để xem quá trình này diễn ra thế nào là mô hình Lục địa – Đảo do Sewall

Wright, một nhà di truyền quần thể, đề xuất.

Hình. Mô hình lục địa – đảo về giao lưu gen

Diễn giải mô hình

Mô hình giả thiết giao lưu gen chỉ xảy ra một chiều từ quần thể cho (lục địa) sang quần

thể nhận (đảo).

Giả sử a là một allele mang đột biến độc xuất hiện tại một locus (A là allele không độc

tương ứng). Giả sử tần số của allele a là f(a) = q và tần số tương ứng của A là f(A) = p.

m = là tỷ lệ quần thể di cư ra đảo

1-m = tỷ lệ quần thể bản địa có sẵn trên đảo

Q = Tần số allele a của quần thể di cư ra đảo

qo = Tần số allele a của quần thể bản địa tiếp nhận allele a từ quần thể di cư

Sau một chu kỳ giao lưu gen chúng ta có:

q1 = (1-m)qo + mQ

q = -m(qo - Q)

Trong đó q = q1-q0

Công thức này có thể được dùng để tính tốc độ thay đổi tần số allele do giao lưu gen.

Ví dụ: xét sự di chuyển giả định của một allele độc (a) của nấm gỉ sắt hại lá lúa mỳ từ Anh

sang Pháp

f(a) = 0.50, quần thể nấm ở Anh có tần số cao về allele độc vì hầu hết các giống lúa mỳ ở

Anh có gen kháng Lr13.

qo = 0.00,

m = 0.05, tốc độ di cư là cao vì một số lượng lớn bào tử đã bay từ Anh sang Pháp qua một

trận bão.

q = -0.05(0.00-0.50) = 0.025

q1 = 0.025 => ~3% của quần thể nấm tại Pháp bây giờ chứa gen độc (avrLr13)

19

Tại điểm cân bằng (sau nhiều chu trình giao lưu gen do bào tử liên tục bay từ Anh sang

Pháp), tần số allele của quần thể cho (Anh) bằng tần số allele của quần thể nhận (Pháp) qo =

Q. Như vậy, tần số của allele độc (avrLr13) sẽ đạt tới 0.50 ở Pháp mặc dù các nhà chọn giống

Pháp không dùng gen kháng Lr13 trong tạo giống kháng bệnh. Đây là một ví dụ giải thích tần

số cao bất thường của các allele độc trong các quần thể của một số tác nhân gây bệnh khi ký

chủ của nó thiếu gen kháng tương ứng.

Nhiều loại mô hình đã được đề xuất phù hợp với nhiều hệ sinh thái nông nghiệp và tự

nhiên khác nhau (Hình)

Hình . Minh họa các mô hình giao lưu gen. A) Mô hình lục địa – đảo (Continent-island); B)

Mô hình toàn đảo (Full island); C) Mô hình bắc cầu một hướng (One-dimensional stepping

stone); và D) mô hình bắc cầu hai hướng (two-dimensional stepping stone).

Kết quả cuối cùng của giao lưu gen là làm cho các quần thể trở nên giống nhau về mặt di

truyền. Hình dưới cho thấy, các quần thể biệt lập về mặt địa lý có thể nhanh chóng hội tụ về

cùng tần số allele khi các quần thể chứa 10% các các thể di cư từ nơi khác.

Hình . Thay đổi tần số allele nhanh chóng qua các thế hệ của 5 quần thể có tốc độ di cư

m=0.1 / thế hệ.

20

6.5. Ví dụ giao lưu gen trong bệnh cây

Có rất nhiều ví dụ về giao lưu gen trong quần thể tác nhân gây bênh qua khoảng cách xa ở

qui mô vùng hoặc toàn cầu.

Giao lưu gen ở qui mô toàn cầu đối với nấm mốc sương khoat tây (Phytophthora

infestans). Dựa vào các kỹ thuật DNA fingerprints, Goodwin et al. (1992, 1994, 1997) đã

cung cấp bằng chứng rõ ràng về sự giao lưu gen của nấm. Vụ dịch toàn cầu vào những năm

1840 làm khoảng 1.5 triệu người chết đói ở Bắc Âu là do sự di cư của một dòng nấm từ

Mexico (là trung tâm khởi nguyên và đa dạng của nấm). Sau khi di chuyển tới Bắc Mỹ, nấm

di chuyển tiếp sang châu Âu qua củ khoai tây bị nhiễm và tiếp theo phát tán khắp toàn cầu

qua hàng hóa thương mại (khoai tây). Nấm yêu cầu 2 kiểu ghép cặp (A1 và A2) để sinh sản

hữu tính. Vì chỉ có một dòng nấm thoát khỏi Mexico nên tất cả các quần thể nấm, được xác

định cho tới gần đây, đều sinh sản vô tính. Bắt đầu cuối những năm 1970, các dòng nấm khác,

kể cả kiểu ghép cặp còn lại ―thoát khỏi‖ Mexico nên hiện nay mức độ đa dạng của nấm ngày

càng tăng (cả về tính gây bệnh và tính kháng thuốc metalaxyl) do sinh sản hữu tính. Kiểu

ghép cặp A2 đầu tiên được phát hiện thấy bên ngoài Mexico là tại Thụy Sĩ vào năm 1980.

Hình Các sự kiện di cư của nấm bắt đầu từ một dòng nấm Phytophora infestans ban đầu

(Goodwin 1997).

6.6. Mối liên hệ giữa trôi dạt di truyền và giao lưu gen

Các biến động di truyền do trôi dạt có thể được khắc phục nhờ giao lưu gen. Nếu có đủ số

lượng cá thể được trao đổi giữa 2 quần thể đang trôi dạt di truyền độc lập thì các quần thể

đang trôi dạt sẽ liên kết về di truyền và sự phân chia quần thể sẽ không xảy ra.

Mối liên hệ này có thể được giải thích nhờ tham số Nem. Ne là kích thước quần thể hiệu

quả (một phép đo của trôi dạt di truyền) và m là phần trăm của quần thể tiếp nhận nhưng chỉ

bao gồm các cá thể nhập cư. Như vậy tích của 2 tham số = Nem là giá trị trung bình của các

các thể nhập cư được trao đổi trong quần thể của mỗi thế hệ. Giá trị của Nem có thể được xác

định dùng phép đo của phân chia quần thể gọi là FST, hay dùng các allele riêng (là các allele

chỉ phát hiện trong một quần thể).

Nếu Nem = 0, không có cá thể di cư nào trao đổi giữa các quần thể. Kết quả là các allele

khác nhau có thể bị cố định do trôi dạt di truyền. Các quần thể trở nên khác nhau và xuất hiện

phân chia quần thể.

Nếu Nem >1, trung bình có 1 hoặc nhiều cá thể trao đổi giữa các quần thể qua mỗi thế hệ,

do vậy quần thể sẽ không phân hóa bởi trôi dạt di truyền và chúng sẽ dần trở nên giống nhau.

Rất ít giao lưu gen cần để chống lại trôi dạt di truyền

21

Nếu Nem = 1, các ảnh hưởng của trôi dạt bị cân bằng lại chính xác bằng ảnh hưởng của

giao lưu gen, quần thể sẽ không phân hóa cũng như không hội tụ

Có thể minh họa nguyên lý trên qua ví dụ sau:

Giả sử p = q = 0.5 (có nghĩa 2 allele tại một locus có mặt ở tần số bằng nhau).

Với Ne = 10, ảnh hưởng của trôi dạt lớn: Var(p) = 0.0125 (s.e. 0.11). Trong quần thể này,

một cá thể nhập cư (Nem = 1) tương ứng m = 0.10; Do vậy, 10 % quần thể là gồm các cá thể

nhập cư. Để chống lại Ne nhỏ thì m phải tương đối lớn.

Với Ne = 10,000, ảnh hưởng của trôi dạt là nhỏ: Var(p) = 0.0000125 (s.e. 0.0035). Trong

quần thể này, một cá thể nhập cư (Nem = 1) tương ứng với m = 0.0001; do vậy 1 % quần thể

là bao gồm các cá thể nhập cư. Để chống lại một Ne lớn thì chỉ cần m nhỏ.

6.7. Khái niệm siêu quần thể và tác nhân gây bệnh

Một siêu quần thể (metapopulation) là 1 tập hợp các quần thể địa phương liên hệ với nhau

bởi sự di cư của các cá thể. Các quần thể địa phương có thể trải qua các chu trình diệt vong và

tái phục hồi; trái lại siêu quần thể có thể tương đối ổn định. Một siêu quần thể là một quần thể

của các quần thể.

Để hiểu được siêu quần thể, cần nhớ rằng các quần thể thực sự chưa bao giờ cân bằng

(ngoại trừ trong các mô hình toán). Do vậy chúng ta có thể xem một loài là một tập hợp các

quần thể nhỏ chưa bao giờ cân bằng.

Các mô hình siêu quần thể có thể giúp giải thích các tác nhân gây bệnh đã tiến hóa như

thế nào trong hệ sinh thái nông nghiệp, đặc biệt đối với các tác nhân gây bệnh nhóm biotroph

– nhóm chỉ gây hại và tồn tại trên mô ký chủ sống. Trong hệ sinh thái nông nghiệp, một ổ

sinh thái mới có thể hình thành đối với một tác nhân gây bệnh khi cánh đồng được trồng với

một cây ký chủ mẫn cảm. Hiệu ứng nền xảy ra khi tác nhân gây bệnh gặp cây ký chủ mẫn

cảm và phát triển số lượng. Ổ sinh thái này bị loại bỏ khi cây được thu hoạch. Sau khi cây ký

chủ bị loại bỏ, tác nhân gây bệnh có thể bị diệt vong (tuyệt chủng) hoặc trải qua quá trình thắt

cổ chai.

Mô hình siêu quần thể nhìn chung không áp dụng cho các nhóm tác nhân gây bệnh luôn

tạo ra các cấu trúc (dạng bảo tồn) lâu dài, có thể tồn tại qua đông hoặc chuyển vụ ngay tại

chỗ.

Một ví dụ rất tốt về mô hình siêu quần thể là mô hình bệnh gỉ sắt cây cốc (lúa mỳ, lúa

miến và yến mạch (wheat, barley, and oats) hàng năm theo đường hướng Puccinia "Puccinia

pathway" ở Bắc Mỹ.

22

Hình. Minh họa đường hướng puccinia của nấm gỉ sắt cây cốc ở Bắc Mỹ. Bào tử nấm gỉ sắt di

chuyển lên phía bắc vào mùa xuân và mùa hè (mũi tên đen) và di chuyển lại xuống phía nam

vào mùa thu (mũi tên đỏ) theo hướng gió

Do việc loại bỏ cây ký chủ phụ là barberry nên giai đoạn qua đông chuyển vụ của nấm gỉ

sắt thân lúa mỳ (Puccinia graminis f. sp. tritici ) không tồn tại trong vùng. Nhiều loài nấm gỉ

sắt lại qua đông ở các bang miền nam như Texas hoặc ở Mexico. Bào tử sẽ theo gió di chuyển

lên phía Bắc theo sự phát triển của cây cốc và tới Canada vào mùa hè - đúng lúc để xâm

nhiễm trên cây cốc đã được trồng vào mùa xuân.

Vào mùa thu, khi cây cốc được thu hoạch ở Canada và các bang Bắc mỹ thì bào từ nấm lại

di chuyển xuống phương nam nhờ gió và nhiễm trên tàn dư cây cốc trên đồng ruộng. Mùa

đông lạnh ở phương Bắc đảm bảo chắc chắn rằng không một bào tử nấm nào có thể tồn tại để

bắt đầu một vụ dịch mới trong năm tiếp theo. Như vậy quần thể nấm địa phương miền bắc sẽ

tuyệt chủng trong mùa đông nhưng cây cốc vụ tới vẫn bị xâm nhiễm bởi các bào tử di cư từ

miền nam tới trong mùa hè.

Hình dung một loạt các cánh đồng cây cốc của nông dân dọc theo ―Puccinia pathway‖.

Cây cốc trên các cánh đồng này bị nhiễm bởi bào tử hạ của nấm. Các bào tử này có thể tới từ

các cánh đồng cách xa (chẳng hạn từ miền nam USA hoặc Mexico) hay từ các cánh đồng lân

cận. Trên mỗi cánh đồng, quần thể nấm địa phương có thể tuyệt chủng do: thu hoạch,

phun thuốc hóa học, luân canh với cây – phi ký chủ, trồng giống kháng, điều kiện khắc nghiệt

của một mùa đông lạnh.

Sau khi sự tuyệt chủng xuất hiện, các cánh đồng này lại tái nhiễm khi nông dân trồng một

vụ lua mỳ mới. Nguồn bệnh sơ cấp khởi đầu một sự nhiễm bệnh mới trên mỗi cánh đồng có

thể tới từ các cánh đồng cách rất xa hoặc từ các cánh đồng lân cận.

Như vậy các quần thể nấm địa phương dọc đường hướng này luôn trải qua qua trình diệt

vong và tái xuất hiện nhưng toàn bộ quần thể nấm ở vùng Bắc Mỹ (siêu quần thể) vẫn ổn

định.

23

7. Hệ thống sinh sản/ghép cặp (Reproductive/Mating Systems)

7.1. Đánh giá cấu trúc di truyền trong quần thể

Trôi dạt di truyền, đột biến, di cư (giao lưu), chọn lọc và các lực khác làm thay đổi tần số

gen của một quần thể phụ và ảnh hưởng tới cấu trúc di truyền của toàn quần thể.

Để đánh giá cấu trúc di truyền của quần thể, người ta thường sử dụng chỉ số sai khác di

truyền (index of genetic differenciation) hay còn gọi là chỉ số cố định F (fixation index). Chỉ

số này cũng được ký hiệu là FST. Có nhiều cách diễn giải chỉ số sai khác di truyền thông qua

các công thức tính.

Cách diễn giải 1. Về mặt toán học, FST là xác suất mà 2 allele của một cặp gen trong một

cá thể lưỡng bội giống nhau, có nghĩa chúng có nguồn gốc từ một tổ tiên chung trong các thế

hệ trước. FST là phép đo sự sai khác (differentiation) của quần thể dựa trên các số liệu đa hình

di truyền (genetic polymorphism), chẳng hạn như đa hình nucleotid đơn (Single nucleotide

polymorphisms (SNPs) hay đa hình microsatellites. Nó là một trường hợp đặc biệt của thống

kê F. Thống kê F so sánh sự sai khác di truyền bên trong quần thể và giữa các quần thể. FST

được tính như sau:

Trong đó ΠBetween và ΠWithin trình bày số sai khác trung bình giữa 2 cá thể được lấy từ các

quần thể khác nhau (ΠBetween) hay được lấy từ cùng quần thể (ΠWithin). Số sai khác trung bình

giữa 2 cá thể trong cùng quần thể là tổng số sai khác giữa từng cặp cá thể chia cho tổng số cặp

so sánh. Chú ý là giá thị ΠWithin nên được tính cho mỗi quần thể sau đó lấy trung bình.

Cách diễn giải 2. FST là tỷ lệ lượng dị hợp tử (HS) kỳ vọng trong các quần thể phụ trên

lượng dị hợp tử kỳ vọng của toàn quần thể (HT) và được tính theo công thức

FST = (HT – HS ) / HT = 1 – (HS / HT)

Trong công thức này,

HT là số lượng dị hợp tử (Heterozygote) kỳ vọng của toàn thể quần thể (Total

population).

HS là số lượng dị hợp tử (Heterozygote) kỳ vọng trong các quần thể phụ

(Subpopulation).

Có thể minh họa cách diễn giải này bằng hình sau.

24

Chú ý: trong cách diễn giải 1 và 2, FST nhận giá trị từ 0 đến 1

Cách diễn giải 3. Cách diễn 3 có công thức tính như sau:

F = 1 – (Hobs / Hexp)

Trong công thức này, Hobs là mức dị hợp tử trung bình quan sát thấy (observated) / locus

và Hexp là tỷ lệ dị hợp tử kỳ vọng khi giả thiết quần thể giao phối ngẫu nhiên (Hexp tương tự

như mức đa dạng gen của Nei, xem phần )

Dưới điều kiện tự thụ hoàn toàn, Hobs sẽ ~ 0 và F sẽ ~ 1. Dưới điều kiện giao phối ngẫu

nhiên, Hobs sẽ ~ Hexp và F sẽ ~ 0. Giá trị F nằm giữa 0 và 1 cho biết các mức tự thụ khác

nhau. Giá trị F <0 cho biết các cá thể dị hợp tử chiếm ưu thế do giao phối không tương hợp di

truyền hoặc do sự chiếm ưu thế của các dòng dị hợp tử đặc biệt thích nghi.

7.2. Hệ thống sinh sản và ghép cặp của các tác nhân gây bệnh cây

Tác nhân gây bệnh có thể sinh sản vô tính (bằng nguyên nhiễm) hoặc hữu tính (bằng

giảm nhiễm) hoặc hỗn hợp cả sinh sản vô tính lẫn hữu tính.

Vi khuẩn và virus có kiểu sinh sản vô tính. Nấm và VSV giống nấm có kiểu sinh sản hoặc

vô tính, hoặc hữu tính hoặc hỗn hợp cả hai.

Hệ thống ghép cặp (mating systems) chỉ thích hợp đối với các sinh vật có trải qua sinh sản

hữu tính. Hệ thống ghép cặp có thể nằm trong phạm vi từ 100% tự thụ tới 100% giao phối

chéo. Ví dụ nấm Phytophthora có sinh sản hữu tính, tuy nhiên có loài lại sinh sản hữu tính

kiểu tự thụ (đồng tản), có loài lại sinh sản hữu tính kiểu giao phối chéo (dị tản) (bảng ).

Hệ thống ghép cặp và sinh sản có ảnh hưởng đến cách các allele của cá thể kết hợp với

nhau. Các sinh vật giao phối chéo tạo ra các tổ hợp gen mới một cách nhanh chóng dẫn tới có

nhiều kiểu gen trong quần thể và cũng tạo ra mức độ đa dạng kiểu gen cao; hậu quả chúng có

khả năng thích ứng tốt với sự thay đổi môi trường. Nếu một sinh vật có kiêu giao phối chéo

bắt buộc thì việc tái tổ hợp thường xuyên có thể phá vỡ các tổ hợp allele đã cùng thích nghi.

Điều này có thể là bất lợi đối với tác nhân gây bệnh nếu môi trường ổn định.

Tác nhân gây bệnh tự thụ hoặc trải qua sinh sản vô tính có xu hướng giữ lại các tổ hợp

gen cũ dẫn tới mức đa dạng di truyền giảm. Nếu một kiểu gen đã thích nghi tốt (chứa 1 tổ hợp

Quần thể

(HT)

Quần thể

phụ 2

HS<HT

Quần thể

phụ 1

HS<HT

Quần thể

phụ 4

HS<HT

Quần thể

phụ 3

HS<HT

25

các allele đã đồng thích nghi) thì tác nhân gây bệnh tự thụ hoặc sinh sản vô tính có xu hướng

giữ lại các tổ hợp này trong thời gian lâu. Tuy nhiên, nếu môi trường thay đổi nhanh thì các

sinh vật này phải mất thời gian lâu hơn để có được các tổ hợp allele mới cho phép chúng thích

ứng với điều kiện môi trường mới.

Các tác nhân có kiểu sinh sản/ghép căp hỗn hợp chứa cả ưu và nhược điểm của mỗi kiểu.

Nấm đặc biệt mềm dẻo khi xét tới các kiểu sinh ghép cặp và sinh sản. Vi khuẩn và virus

có thể tái tổ hợp không cần giảm nhiễm nhưng hệ thống sinh sản của chúng hoàn là vô tính

Hệ thống ghép căp (Mating systems) thường được định nghĩa là lượng tự phối xuất hiện

trong quần thể các sinh vật sinh sản hữu tính và được đánh giá bằng hệ số tự phối (inbreeding

coefficient) thường được viết tắt là F (hay chỉ số cố định Fixation index = F)

Hình . Phạm vi sinh sản của tác nhân gây bệnh và ảnh hưởng có thể của kiểu sinh sản đến

mức độ thuần nhất/đa dạng di truyền trong quần thể

Khi F = 1, chúng ta có kiểu ghép cặp tương hợp di truyền (genetic assortative mating).

Các sinh vật có kiểu ghép cặp tương hợp di truyền có xu hướng ghép cặp giữa các cá thể có

các allele giống nhau, như các họ hàng gần. Ví dụ về kiểu ghép cặp cực kỳ tương hợp di

truyền là sự tự phối ở nhiều loài cây tự thụ. Đối với các cây tự phối nghiêm ngặt, F=1.

Một số tác nhân gây bệnh cũng có kiểu ghép cặp tương hợp di truyền. Một ví dụ là các

loài nấm Phytophthoa nhóm đồng tản có nghĩa là tự thụ (bảng ). Kết quả của sự ghép cặp

tương hợp di truyền là một quần thể có cấu trúc di truyền được đặc trưng bởi sự chiếm ưu thế

của các cá thể đồng hợp tử và có mức đa dạng kiểu gen thấp. Nhiều chu kỳ tự phối sẽ tạo ra

các dòng thuần nhất (clonal lines) trong các quần thể này.

Ngược với kiểu ghép cặp tương hợp di truyền là kiểu ghép cặp không tương hợp di truyền.

Các sinh vật có kiểu ghép cặp không tương hợp di truyền có xu hướng ghép cặp giữa các cá

thể không có các allele giống nhau, có nghĩa chúng không có tổ tiên chung. Một ví dụ về kiểu

ghép cặp cực kỳ không tương hợp di truyền là sự giao phối chéo bắt buộc ở các cây giao phấn

và nhiều loài nấm. Ví dụ, môt số nấm đảm như Armillaria spp. có hệ thống ghép cặp tứ cực

(tetrapolar) không cho phép chúng tự thụ. Hậu quả của sự ghép cặp không tương hợp di

truyền là tạo ra các quần thể có cấu trúc di truyền gồm các các thể di hợp tử chiếm ưu thế và

mức độ đa dạng kiểu gen cao.

Ở dạng trung gian, chúng ta có kiểu ghép cặp ngẫu nhiên (random mating). Các sinh vật

có kiểu ghép cặp ngẫu nhiên có xu hướng ghép cặp ngẫu nhiên với các cá thể khác trong quần

thể. Kết quả của ghép cặp ngẫu nhiên là cân bằng di truyền theo định luật Hardy-Weinberg.

Tần số đồng hợp tử và dị hợp tử quan sát thấy đối với bất kỳ locus cũng phù hợp với tần số

tiên đoán với giả thiết là giao tử kết hợp một cách ngẫu nhiên để thành hợp tử. Hậu quả nữa

của ghép cặp ngẫu nhiên là sư kết hợp ngẫu nhiên trong số các allele tại các locus khác nhau ở

các sinh vật đơn bội, một trạng thái được gọi là cân bằng giao tử (gametic equilibrium).

F = 1 F = 0 F = -1

Sinh sản vô tính

Hữu tính: tự thụ

Đa dạng kiểu gen thấp

Chủ yếu các dòng

Sinh sản hữu tính

Giao phối (không

tương hợp)

Đa dạng kiểu gen cao

Không có các dòng

riêng biệt

Sinh sản hỗn hợp

Đa dạng kiểu gen

trung gian

26

Hệ thống ghép cặp đã được nghiên cứu đối với nhiều tác nhân gây bệnh nấm. Đối với các

loại nấm lưỡng bội như nấm Phytophthora, hệ thống ghép cặp xắp xếp từ tự phối (các loài

đồng tản) tới giao phối chéo (các loài dị tản) với chỉ số cố định F nằm trong phạm vi từ 1.0 tới

-0.82 (Bảng). Đối với các tác nhân gây bệnh đơn bội, người ta không thể áp dụng định luật

Hardy-Weinberg để đo cân bằng mà phải áp dụng cân bằng giao tử (gametic equilibrium).

Nhiều loại nấm túi (ví dụ nấm đạo ôn Pyricularia oryzae) thuộc nhóm này.

Các quần thể ghép cặp ngẫu nhiên thường có mức độ đa dạng kiểu gen cao. Tuy nhiên,

nếu mức độ đa dạng gen trong quần thể thấp (chẳng hạn như đối với các quần thể bắt đầu từ

một số lượng nhỏ cá thể = hiệu ứng nền) thì đa dạng kiểu gen cũng vẫn có thể thấp.

Bảng. Chỉ số cố định của các loài Phytophthora (Goodwin, 1997)

Loài Kích thước

mẫu Số locus

Lượng dị hợp tử F

Quan sát Kỳ vọng

Các loài đồng tản

P. boehmeriae 11 12 0.015 0.32 0.95

P. cactorum 47 18 0.056 0.037 -0.51

P. citricola 125 14 0.007 0.279 0.97

P. heveae 14 17 0.05 0.16 0.69

P. katsurae 16 17 0.00 0.11 1.0

P. sojae 48 15 0.00 — 1.0

Các loài dị tản

P. botryosa 10 18 0.006 0.08 0.93

P. cambivora 25 18 0.060 0.071 0.15

P. capsici 84 18 0.019 0.20 0.91

P. cinnamomi

Worldwide 81 18 0.098 0.134 0.27

Australia 165 20 0.010 0.049 0.80

Australia 280 19 0.051 0.115 0.56

PNG 18 20 0.058 0.088 0.34

P. citrophthora 43 18 0.107 0.20 0.47

P. infestans

Tại Mexico 50 15 0.037 0.046 0.20

Bên ngoài 46 15 0.120 0.066 -0.82

P. meadii 33 18 0.066 0.12 0.45

P. megakarya 15 17 0.078 0.19 0.59

P. palmivora

Worldwide 106 17 0.111 0.08 -0.39

East Asia 62 17 0.135 0.122 -0.11

P. parasitica 60 19 0.079 0.11 0.28

7.3. Đa dạng gen và đa dạng kiểu gen

Đa dạng di truyền gồm 2 thành phần là đa dạng gen và đa dạng kiểu gen.

7.3.1 Đa dạng gen

Đa dạng gen ám chỉ sự đa dạng về các allele của 1 gen hoặc locus nào đó trên 1 nhiễm sắc

thể. Đa dạng gen có được là do sự khác nhau về trình tự DNA. Để đo đa dạng gen, tốt nhất là

27

dùng các marker di truyền trung tính đa allele như isozymes, RFLPs, microsatellites, hoặc

single nucleotide polymorphisms (SNPs). Tuy nhiên, đa dạng gen cũng có thể được đánh giá

dùng các marker trội như AFLP.

Lượng hóa đa dạng gen được dựa trên số lượng và tần số allele của một locus. Mức độ đa

dạng sẽ tăng khi số lượng allele (tại 1 locus) tăng và khi tần số các allele phân bố đồng đều.

Đa dạng gen bị ảnh hưởng của marker di truyền dùng để kiểm tra (các marker trung tính sẽ

cho mức độ đa dạng cao hơn các marker chọn lọc), kích thước quần thể (quần thể càng lớn

càng ít bị trôi dạt di truyền và có nhiều allele hơn), và tuổi quần thể (quần thể càng già càng

có nhiều thời gian cho đột biến xảy ra và cho trôi dạt di truyền gia tăng tần số các đột biến

trung tính).

Phép đo đa dạng gen phổ biến nhất là do Nei (1973) đề xuất với công thức sau:

h = 1- xj2

Trong đó, h là mức đa dạng gen tại một locus và xj là tần số allele thứ j tại locus đó.

Đối với quần thể lưỡng bội đạt được cân bằng Hardy-Weinberg thì mức độ đa dạng gen

bằng tần số dị hợp tử tại một locus kỳ vọng đạt được. Do vậy, mức độ đa dạng gen của quần

thể lưỡng bội còn được gọi là mức dị hợp tử (heterozygosity).

Mức độ đa dạng gen của Nei là xác suất để 2 phiên bản (copy) của cùng một gen được

chọn ngẫu nhiên trong quần thể là 2 allele khác nhau. Hai copy này nên được chọn từ cùng cá

thể lưỡng bội (trường hợp này là đo heterozygosity) hay từ 2 cá thể đơn bội khác nhau

(trường hợp này là đo đa dạng gen).

7.3.2 Đa dạng kiểu gen

Đa dạng kiểu gen ám chỉ sự đa dạng về sự kết hợp của nhiều allele xuất hiện ở tất cả các

locus được thử. Nói cách khác, đa dạng kiểu gen dựa trên số các cá thể khác biệt về di truyền

trong 1 quần thể và tần số của nó. Đo đa dạng kiểu gen là vô nghĩa đối với các sinh vật chỉ có

giao phối ngẫu nhiên (ví dụ như loài người) vì mỗi cá thể của chúng (ngoại trừ trường hợp

sinh đôi) hoàn toàn khác nhau về di truyền, do đó đa dạng kiểu gen luôn luôn ở mức tối đa.

Tuy nhiên, đa dạng kiểu gen lại rất quan trọng đối với tác nhân gây bệnh sinh sản vô tính hoặc

sinh sản hỗn hợp. Đa dạng kiểu gen thường được đo dùng các kỹ thuật DNA fingerprinting

(như AFLP) hoặc dùng các marker đa locus (như rep-PCR, RFLP dùng dò đa locus) đối với

mỗi cá thể trong quần thể.

Mức độ đa dạng kiểu gen được đo dựa trên số lượng và tần số các kiểu gen trong quần

thể. Mức độ đa dạng tăng khi số lượng kiểu gen tăng và tần số kiểu gen phân bố đồng đều

trong quần thể. Đa dạng kiểu gen bị ảnh hưởng bởi hệ thống ghép cặp (quần thể tự thụ có mức

độ đa dạng kiểu gen thấp hơn quần thể giao phối), hệ thống sinh sản (sinh vật sinh sản hữu

tính có mức độ đa dạng kiểu gen cao hơn sinh vật sinh sản vô tính) và chọn lọc. Nếu 1 hoặc 2

dòng tác nhân gây bệnh gia tăng tần số so với các dòng khác trên 1 cánh đồng do chọn lọc thì

mức đa dạng kiểu gen chung trong quần thể sẽ giảm.

Như vậy kiểu ghép cặp và sinh sản có tác động đáng kể đến đa dạng kiểu gen nhưng

không nhất thiết có tác động lên đa dạng gen. Điều này có thể được minh họa qua 1 ví dụ

dưới đây.

7.3.3 Ví dụ đo đa dạng gen và đa dạng kiểu gen

Đo đa dạng gen và đa dạng kiểu gen nên dựa trên kích thước mẫu gồm ít nhất 30 cá thể /

quần thể.

Để đơn giản hóa, ví dụ dưới đây chỉ gồm 8 cá thể /quần thể với 3 loci.

28

Xét 2 quần thể đơn bội (điển hình cho phần lớn nấm, vi khuẩn gây bệnh cây) với 3 locus,

mỗi locus gồm 2 allele. Locus A có 2 allele, A1 và A2. Locus B có 2 allele, B1 và B2. Locus

C có 2 allele C1 và C2.

Pop. 1 Pop. 2

A1 B1 C1 A1 B1 C2 A1 B2 C1 A1 B2 C2 A2 B1 C1 A2 B1 C2

A2 B2 C1 A2 B2 C2

A2 B1 C2 A2 B1 C2 A2 B1 C2 A2 B1 C2 A1 B2 C1 A1 B2 C1

A1 B2 C1 A1 B2 C1

8 genotypes 2 genotypes

f(A1) = f(A2) = 0.5 f(B1) = f(B2) = 0.5 f(C1) = f(C2) = 0.5

f(A1) = f(A2) = 0.5 f(B1) = f(B2) = 0.5 f(C1) = f(C2) = 0.5

Trong trường hợp này, 2 quần thể đồng nhất về đa dạng gen vì mỗi quần thể có cùng số

lượng allele với cùng tần xuất. Dùng công thức của Nei, chúng ta tính được đa dạng gen là 0.5

cho tất cả 3 locus ở cả 2 quần thể. Tuy nhiên đa dạng kiểu gen khác nhau đáng kể giữa 2 quần

thể vì quần thể 1 có tổng số 8 kiểu gen và quần thể 2 có tổng số 2 kiểu gen.

Các quần thể tác nhân gây bệnh sinh sản hữu tính thường xuyên xắp sếp lại kiểu gen của

chúng dẫn tới các allele độc và các allele kháng thuốc có thể kết hợp lại với nhau nhanh

chóng hơn (như ở quần thể 1).

Các quần thể tác nhân gây bệnh sinh sản vô tính có thể có mức độ đa dạng gen cao như ở

quần thể hữu tính nhưng mức độ đa dạng của các allele được phân bố trong các dòng vô tính

của chúng thay vì trong các cá thể. Nói cách khác, chúng có mức độ đa dạng kiểu gen thấp

hơn (như ở quần thể 2).

Các marker di truyền trội dựa trên PCR như AFLP và RAPD (chỉ có 2 allele /locus) có

mức đa dạng gen tối đa = 0.50 khi cả 2 allele có tần số tươg đương. Do vậy, sẽ không thích

hợp khi so sánh đa dạng di truyền của các tác nhân gây bệnh khác nhau nếu phương pháp

đánh giá khác nhau (vd RFLPs và AFLPs). Lợi thế của các kỹ thuật đánh giá đa allele như

RFLPs, microsatellites, hoặc SNPs là ở chỗ chúng có thể tiến gần tới giá trị đa dạng gen tối đa

lý thuyết =1 (bảng) và có thể cung cấp các thông tin bổ sung về đa dạng gen vì sự có mặt của

các allele hiếm (rare allele) hoặc các allele riêng (private allele). Các allele hiếm và allele

riêng có thể được sử dụng để xác định trung tâm đa dạng của tác nhân gây bệnh và để đánh

giá sự di chuyển của các quần thể tác nhân gây bệnh theo không gian và thời gian. Tuy nhiên,

các allele hiếm chỉ có thể đóng góp ít vào mức đa dạng gen chung (bảng).,

29

Bảng Đa dạng gene theo tần số của 2 hay 3 allele. Chú ý h đạt tối đa với 3 allele = 0.67;

h giảm mạnh khi allele chung nhất có tần số = 90% (vd allele 2)

Quần thể Tần số allele 1 Tần số allele 2 Tần số allele 3 Nei's h

1 0.50 0.50 0.00 0.50

2 0.40 0.60 0.00 0.48

3 0.30 0.70 0.00 0.42

4 0.20 0.80 0.00 0.32

5 0.10 0.90 0.00 0.18

6 0.01 0.99 0.00 0.02

7 0.02 0.96 0.02 0.08

8 0.05 0.90 0.05 0.19

9 0.33 0.34 0.33 0.67

8. Chọn lọc tự nhiên

8.1. Khái niệm

Chọn lọc là một quá trình có định hướng dẫn tới tăng hoặc giảm tần số gen hay tần số kiểu

gen. Chọn lọc xuất hiện nhằm phản ứng lại một yếu tố môi trường đặc biệt nào đó. Hậu quả

của chọn lọc lên cấu trúc và tiến hóa của sinh vật là phức tạp.

Chọn lọc có thể làm giảm biến dị di truyền trong quần thể sinh vật bằng giữ lại hoặc loại

bỏ 1 gen hoặc 1 tổ hợp gen đặc biệt nào đó (chọn lọc có định hướng).

Chọn lọc có thể làm tăng biến dị di truyền trong quần thể nhờ giữ lại nhiều gen hoặc tổ

hợp gen đặc biệt nào đó và loại bỏ các dạng trung gian (chọn lọc ngắt quãng, chọn lọc cân

bằng).

Chọn lọc có thể dẫn tới biệt hóa loài nhờ tích lũy các biến dị di truyền thích nghi trong

quần thể biệt lập về sinh sản.

Chọn lọc có thể ngăn sự biệt hóa loài bằng cách đồng nhất cấu trúc di truyền của các quần

thể tại các địa điểm khác nhau.

Chọn lọc trong bệnh cây chủ yếu được xét trong phạm vi quá trình đồng tiến hóa gen-đối

gen. Nó là quá trình làm tăng tần số allene kháng trong hệ sinh thái tự nhiên thông qua quá

Bảng Thay đổi mức đa dạng gen (h) theo số allele

Số alleles h tối đa

2 0.50

3 0.67

4 0.75

5 0.80

6 0.83

7 0.86

30

trình đồng tiến hóa, làm tăng tần số allele độc trong hệ sinh thái nông nghiệp qua chu trình

―đỉnh – đáy‖

8.2. Hai mô hình chọn lọc

Một câu hỏi quan trọng trong di truyền quần thể là biến dị di truyền lớn tới mức nào để có

thể tồn tại trong 1 quần thể hay 1 loài. Có 2 mô hình chọn lọc các biến dị di truyền có thể trả

lời câu hỏi này là mô hình cân bằng và mô hình trung tính.

Mô hình cân bằng. Theo mô hình này, không có 1 allele nào là tốt nhất tại bất kỳ một

locus nào mà thay vào đó bể gen của quần thể chứa một số lượng lớn các các allele khác nhau

và có tần số khác nhau tại một locus. Do không có một allele nào tốt nhất nên các cá thể dị

hơp tử trong 1 quần thể sẽ có ưu thế thích nghi hơn các cá thể đồng hợp tử. Đặc điểm này

được gọi là siêu trội (overdominance). Theo mô hình cân bằng, quần thể sẽ có nhiều biến dị di

truyền, và hầu hết cá thể là dị hợp tử tại một số lượng lớn loci. Tiến hóa trong các quần thể

này xảy ra do sự thay đổi dần dần tần số allele hay tổ hợp allele thích nghi với điều kiện môi

trường.

Mô hình trung tính. Theo mô hình này, phần lớn các biến dị di truyền không có ảnh

hưởng lên sự thích nghi. Đa số các đột biến là gây chết và nhanh chóng bị loại bỏ bởi chọn

lọc nhưng các đột biến còn lại là trung tính hoặc gần trung tính nên tồn tại được trong bể gen

của quần thể. Đột biến trung tính sẽ dẫn tới sự đa dạng mà ta có thể quan sát thấy ở mức

protein hay DNA.

Như vậy, mô hình trung tính tương phản với mô hình cân bằng ở chỗ mô hình cân bằng

cho rằng mức độ biến dị di truyền cao, nhìn chung, sẽ làm tăng tính thích nghi của quần thể

có lẽ do nó tạo ra một khả năng đêm (buffering) cho quần thể trước những thay đổi đột ngột

của môi trường hay do nó tạo ra sự siêu trội (dị hợp tử có lợi thế thích nghi cao hơn đồng hợp

tử).

9. Tương tác giữa các lực tiến hóa và cấu trúc di truyền của quần thể tác

nhân gây bệnh

Hậu quả cuối cùng của sự tương tác giữa các lực tiến hóa là cấu trúc di truyền của quần

thể tác nhân gây bệnh. Cấu trúc di truyền có thể được xem như số lượng và phân bố của biến

di di truyền bên trong và giữa các quần thể được hình thành do tổng ảnh hưởng (có sự tương

tác) của tất cả các lực tiến hóa tác động lên quần thể theo thời gian. Các tương tác giữa các

lực tiến hóa bao gồm

Tương tác giữa đột biến và chọn lọc

Tương tác giữa tái tổ hợp và chọn lọc

Tương tác giữa trôi dạt di truyền, giao lưu gen và chọn lọc

Tương tác giữa chọn lọc và giao lưu gen

Tương tác giữa tái tổ hợp và giao lưu gen

9.1. Tương tác giữa đột biến và chọn lọc

Mặc dù nhiều lực có thể tương tác để xác định sự tiến hóa của quần thể thì tương tác

giữa đột biến và chọn lọc được xem là quan trọng nhất nhằm giải thích sự tiến hóa của các

tác nhân gây bệnh cây trải qua các chu trình ―đỉnh – và – đáy, boom – and – bust‖, trong đó

mối quan hệ của cây ký chủ và tác nhân gây bệnh tuân theo quan hệ gen – đối - gen. Trong

chu trình đỉnh và đáy, khi một giống cây với một gen kháng chủ (allele kháng 1) chống một

tác nhân gây bênh nào đó được đưa vào trồng, nếu giống kháng này có các tính trạng nông

31

học tốt và kháng bệnh tốt thì nó sẽ được nông dân trồng trên diện tích lớn. Đây là pha đỉnh

(boom) của allele kháng 1. Tiếp theo, trong quần thể tác nhân gây bệnh, một đột biến từ

không độc sang độc sẽ hình thành và tạo ra một chủng độc (chứa alellele độc 1) thoát khỏi sự

nhận biết của ký chủ. Chọn lọc do tác động của giống kháng sẽ làm tăng tần số của chủng độc

(chứa allele độc 1), thường ―chậm‖ hơn so với sự gia tăng tần số của allle kháng 1 của ký chủ.

Do chủng độc dần chiếm ưu thế (bởi giao lưu gen hay giao lưu kiểu gen) dẫn tới tính kháng

dần dần mất hiêu quả hay nói cách kháng tính kháng bị bẻ gẫy. Hậu quả là nông dân không

trồng giống kháng này nữa và tần số allele kháng 1 lại giảm dần. Đây là pha đáy ―bust‖ của

allele kháng 1. Chu trình lại tiếp tục bằng cách đưa giống chứa allele kháng 2 vào trồng.

Hình. Đồ thị minh họa chu trình ― đỉnh – và – đáy‖. Theo thời gian, tần số allele độc luôn

―chậm‖ hơn tần số allele kháng do tác động chọn lọc của giống kháng.

9.2. Tương tác giữa tái tổ hợp và chọn lọc

Ảnh hưởng của tái tổ hợp và chọn lọc lên sự đa dạng của 1 tác nhân gây bệnh có thể được

minh họa qua trường hợp nấm gỉ sắt Puccinia graminis f. sp. tritici trên lúa mỳ ở Bắc Mỹ.

Trước khi áp dụng một chương trình nhằm loại bỏ cây ký chủ phụ của nấm là cây barberry (~

500 triệu cây đã bị loại bỏ trong vòng 50 năm), thì nấm đã tồn tại dưới dạng vô số (hàng trăm

tới hàng ngàn) các kiểu gây bệnh (pathotypes) khác nhau. Sự đa dạng này có được là do nấm

đã tái tổ hợp trên cây barberry (nấm gỉ sắt P. graminis f.sp. triciti là nấm gỉ săt chu trình lớn,

dị chủ và chỉ sinh sản hữu tính trên cây ký chủ phụ là cây barberry). Việc loại bỏ cây ký chủ

phụ đã dẫn tới nấm không còn khả năng tái tổ hợp và hậu quả là sự đa dạng di truyền của nấm

cũng giảm theo. Sự chọn lọc, thông qua việc sử dụng các giống kháng đã dẫn tới nấm chỉ tồn

tại dưới dạng một số các dòng khá thuần nhất và nguồn tạo ra sự đa dạng của nấm chỉ là do sự

đột biến trong mỗi dòng nấm.

9.3. Tương tác giữa trôi dạt di truyền, giao lưu kiểu gen và chọn lọc

Mối tương tác này có thể được minh họa đối với quần thể nấm gỉ sắt lúa mỳ (Puccinia

graminis f. sp. Tritici) ở Australia. Nấm đã được đưa vào Úc do người nhập cư châu Âu vào

những năm 1780s. Lúc đầu, chỉ có một ít chủng nấm được đưa vào Úc dẫn tới hiệu ứng nền.

Ở Úc không có cây barberry nên sự đa dạng do tái tổ hợp hữu tính không xảy ra. Hậu quả là

nấm tồn tại dưới dạng các dòng thuần nhất mà sự tiến hóa của mỗi dòng chỉ do đột biến trong

nội bộ mỗi dòng. Một dòng thuần (gọi là race 126) chiếm ưu thế trên các cánh đồng lúa mỳ

của Úc từ 1921 – 1954. Năm 1954, một race mới xuất hiện (gọi là race 21) và thay thế hoàn

toàn race 126. Race 21 đã tới Úc từ Tây Phi nhờ jet steam (một luồng không khí ở độ cao

khoảng 10 km, di chuyển qua khoảng cách xa 1000-4000 km, với vận tôc ~ 100 km/giờ).

Race 21 này có các allele độc mới, marker isozyme mới, đa hình DNA mới. Sự xuất hiện của

Race 21 điển hình cho giao lưu kiểu gen, trong đó, các kiểu gen mới, thích nghi hơn thay thế

cho kiểu gen cũ do hậu quả của chọn lọc có định hướng.

32

9.4. Tương tác giữa chọn lọc và giao lưu kiểu gen

Sự tương tác giữa chọn lọc và giao lưu kiểu gen có thể được minh họa dựa trên ví dụ

bệnh héo Fusarium (Fusarium oxysporum). F. oxysporum là một loài nấm truyền qua đất rất

đa dang, gây bệnh héo trên nhiều cây trồng khắp nơi. Quần thể tự nhiên nấm tấn công vỏ rễ

nhưng thường không gây bệnh. Dạng hoang dại (wild-type) là nấm hoại sinh thực sự. Các

quần thể có tính gây bệnh cho cây dường như sinh sản vô tính nghiêm ngặt. Các dạng chuyên

hóa (Formae speciales, số nhiều) của nấm (gây bệnh trên một loài cây) xuất hiện khi trồng

độc canh một loài cây nào đó. Việc trồng độc canh, chẳng hạn cà chua, dưa, chuối đã tạo điều

kiện cho các đột biến gây bệnh hình thành các dạng chuyên hóa là F. oxysporum f.sp.

lycopercisi, Foc f.sp. melonis và Foc f.sp. cubense.

Nấm F. oxysporum trong cùng một dạng chuyên hóa có thể phân biệt thành các chủng

(race, pathotype) khác nhau dựa theo phản ứng với các gen kháng chủ của cây. Các dòng

(clone) nấm lại có thể được phân biệt dùng các nhóm tương hợp vô tính (vegetative

compatibility groups (VCGs), isozymes, hoặc các marker DNA. Người ta đã quan sát thấy

nhiều lần rằng cùng một race nấm có thể có nền di truyền khác nhau. Điều này có nghĩa các

dòng nấm của cùng môt race đã tiến hóa hoàn toàn độc lập (Gordon and Martyn 1997). Trái

lại, cũng có nhiều ví dụ cho thấy các race khác nhau lại có cùng nền di truyền có nghĩa là

chọn lọc đã cho phép hình thành các thể đột biến mới từ không độc sang độc ở trong cùng

một dòng nấm

Một diễn giải về các quan sát trên là: một dạng chuyên hóa mới hình thành do áp lực chọn

lọc cao của trồng độc canh một loài cây trong một hệ sinh thái, nơi mức độ đồng nhất cao của

ký chủ đã tạo ra một nich sinh thái mới cho phép các thể đột biến (hiếm) có thể gây bệnh hình

thành từ quần thể hoang dại hoại sinh vốn rất đa dạng trong đất. Các dạng chuyên hóa có khả

năng gây bệnh di chuyển sang các cánh đồng mới, thậm chí qua các khoảng cách xa khắp thế

giới qua cây hay đất nhiễm nấm gây bệnh. Các dạng chuyên hóa có thể có nguồn gốc độc lập

từ các hệ sinh thái khác nhau tạo ra các chủng gây héo có nền di truyền độc lập (khác) nhau.

Một ví dụ là dạng chuyên hóa F. oxysporum f. sp. cubense (gây bệnh héo Panama trên chuối).

Dạng này có bản chất đa nguồn gốc (polyphyletic). Hai dòng nấm có nguồn gốc độc lập đã di

chuyển khắp thế giới (Koenig et al. 1997).

Sự giải thích trên cũng phù hợp với các quan sát về nhiều dạng chuyên hóa của nấm F.

oxysporum khác như các dạng chuyên hóa gây hại trên cẩm chướng, coca, cọ dầu, cà chua,

lily, đậu…

Như vậy, các dạng chuyên hóa nấm nấm F. oxysporum gây bệnh héo hình thành một cách

tự phát trên các cây trồng độc canh và là vật liệu cho giao lưu kiểu gen.

9.4.1 Tương tác giữa tái tổ hợp và giao lưu gen

Tương tác giữa tái tổ hợp và giao lưu gen có thể được minh họa đối với nấm

Mycosphaerella graminicola (giai đoạn vô tính là Septoria tritici) gây bệnh đốm lá lúa mỳ.

Các phân tích RFLP cho thấy quần thể nấm khắp thế giới có mức độ đa dạng kiểu gen cao

(trong tổng số 1673 mẫu nấm thử/15 quần thể khắp thế giới, có tới 1327 kiểu gen khác nhau)

chứng tỏ có vai trò của tái tổ hợp thông qua sinh sản hữu tính. Minh họa về mức độ đa dạng

kiểu gen có thể thấy ở hình….

Các marker RFLP trung tính cho thấy mức độ tương đồng cao trong số các quần thể nấm

khắp thế giới chứng tỏ đã có giao lưu gen trong các quần thể (hình).

Người ta đã chứng minh rằng có sự cân bằng giữa sinh sản hữu tính và di cư đối với nấm

này. Khi bắt đầu vụ trồng, mức độ đa dạng chủ yếu do các bào tử phát tán từ nơi khác tới (di

cư). Vào cuối vụ trồng, sự đa dạng lại chủ yếu từ tái tổ hợp do sinh sản hữu tính từ các isolate

trong cùng ruộng (Zhan et al. 1998).

33

Hình. DNA fingerprints của nấm các isolate nấm Mycosphaerella graminicola được lấy mẫu

tại 5 vị trí (site) cách nhau 10 m trên một cánh đồng. Kết quả cho thấy nấm rất đa dạng về

kiểu gen. Các kiểu gen đồng nhất (mũi tên) chỉ phát hiện thấy trong một vài trường hợp (ví dụ

2 dòng nấm phân lập từ 2 quả cành khác nhau nhưng trên cùng 1 vết bệnh (site C); hoặc 2

dòng nấm phân lập từ 2 lá khác nhau nhưng trong cùng 1 ví trí cách nhau vài mét (site E)).

34

Hình. Phân tích RFLP tại 4 locus: A) Locus pSTL10, B) Locus pSTL31 và C) Locus

pSTS14. D) Locus pSTS192A của nấm Mycosphaerella graminicola. Sự xuất hiện của các

băng AFLP giống nhau ở các quần thể khác nhau chứng tỏ có sự giao lưu gen giữa các quần

thể (Zhang et al. 2003)

9.5. Ứng dụng di truyền quần thể để đánh giá các nguy cơ do tiến hóa của tác nhân gây

bệnh

Các nhà bệnh cây nghiên cứu tiến hóa của tác nhân gây bệnh vì chúng tiến hóa để khắc

phục gen kháng của ký chủ hay trở nên kháng với thuốc trừ bệnh. Tác nhân gây bệnh tiến hóa

nhanh nhất sẽ có nguy cơ nhất trong việc khắc phục các gen kháng chủ hoặc chống lại các

biện pháp phòng chống hóa học.

Các tác nhân gây bệnh có tốc độ đột biến cao có nguy cơ lớn hơn các tác nhân gây bệnh

có tốc độ đột biến thấp vì tốc độ đột biến cao làm tăng xác suất đột biến từ không độc sang

độc hoặc từ tính mẫn cảm thuốc sang tính kháng thuốc. Nhìn chung, tốc độ đột biến là thấp dù

chúng có thể khác nhau theo loci và theo loại tác nhân gây bệnh. Quần thể tác nhân gây bệnh

có yếu tố di động (transposable elements) hoạt động sẽ có nguy cơ hơn quần thể không có

yếu tố di động hoạt động. Cần chú ý rằng một đột biến hình thành nhưng thiếu tác động của

35

các lực tiến hóa khác thì chưa chắc sẽ xuất hiện ở một tốc độ đủ cao để có thể tạo ra những

thay đổi có thể phát hiện được trong tần số allele.

Tác nhân gây bệnh với kích thước quần thể lớn có tiềm năng tiến hóa hơn tác nhân gây

bệnh với kích thước quần thể nhỏ vì chúng có nhiều allele đột biến hơn. Các tác nhân gây

bệnh trải qua sự suy giảm nhanh, đều đặn kích thước quần thể (chẳng hạn do hậu quả của luân

canh hoặc điều kiện thời tiết cực bất thuận) sẽ kém đa dạng hơn do hậu quả của trôi dạt di

truyền và kém thích nghi hơn so với tác nhân gây bệnh duy trì được kích thước quần thể

quanh năm. Hai cách đơn giản để làm giảm kích thước quần thể tác nhân gây bệnh là luân

canh cây thường xuyên và tránh trồng các cây quá mẫn cảm mà chúng cho phép tác nhân gây

bệnh bùng nổ về kích thước quần thể.

Các tác nhân gây bệnh với khả năng giao lưu gen cao có nguy cơ lớn hơn tác nhân gây

bệnh với khả năng giao lưu gen thấp do 2 lý do: (1) Chúng có kích thước quần thể lớn hơn và

do vậy duy trì nhiều allele hơn. (2) Chúng có khả năng cao hơn trong việc truyền các đột biến

kháng thuốc hoặc đột biến độc qua các khoảng cách địa lý xa hơn. Sự di chuyển của nguồn

bệnh sinh sản vô tính (giao lưu kiểu gen) có nguy cơ cao hơn sự di chuyển của nguồn bệnh

sinh sản hữu tính (giao lưu gen) vì nguồn bệnh sinh sản vô tính chứa toàn bộ các gen đồng

thích nghi (coadapted) đã được chọn lọc từ trước về tính gây bệnh trên cây nơi nó hình thành.

Trái lại các nguồn bệnh sinh sản hữu tính (chẳng hạn các bào tử túi, mặc dù có các tổ hợp

allele mới nhưng chưa được chọn lọc về tính gây bệnh trên cây). Chúng ta không thể kiểm

soát được sự giao lưu gen./kiểu gen do sự phát tán tự nhiên của tác nhân gây bệnh nhờ gió,

nước, côn trùng nhưng chúng ta có thể hạn chế khả năng giao lưu qua qua khoảng cách xa do

con người như mang vật liệu cây, đất, dụng cụ nhiễm bệnh từ quần thể tác nhân gây bệnh này

sang quần thể tác nhân gây bệnh khác vốn biệt lập. Các biện pháp cụ thể là kiểm dịch thực vật

hoặc loại bỏ các ký chủ mẫn cảm đóng vai trò như cầu nối sống giữa các quần thể tác nhân

gây bệnh hoặc trồng các giải cây kháng bệnh có vai trò như rào cản giữa các quần thể ký chủ

mẫn cảm.

Các tác nhân gây bệnh trải qua tái tổ hợp thường xuyên (qua phân bào giảm nhiễm ở nấm,

tuyến trùng, giao nạp – conjugation ở vi khuẩn hoặc tái tổ hợp ở virus do cây bị nhiễm hỗn

hợp, dung hợp sợi nấm (anastomosis) hoặc tái tổ hợp vô tính (parasexual recombination) ở

nấm) đều có có nguy cơ cao hơn các tác nhân gây bênh không hoặc ít tái tổ hợp vì có thể

nhanh chóng tạo ra các tổ hợp allele mới có tính độc cao hơn, chống lại nhiều gen kháng cùng

một lúc. Vì lý do này, thậm chí một chiến lược dựa vào qui tụ gen kháng (gen pyramid) cũng

chưa chắc tạo ra tính kháng bền vững đối với các tác nhân có khả năng tái tổ hợp thường

xuyên.

Các tác nhân gây bệnh có kiểu sinh sản hỗn hợp (cả vô tính và hữu tính) sẽ có nguy cơ

tiến hóa cao hơn vì chúng nhận được lợi thế của cả 2 kiểu sinh sản. Tái tổ hợp qua sinh sản

hữu tính cho phép nhiều tổ hợp allele mới hình thành và được thử về khả năng gây bệnh tại

điều kiện địa phương. Sinh sản vô tính cho phép các kiểu gen thích nghi nhất phát triển thành

các dòng thuần nhất, duy trì các tổ hợp allele thích nghi nhất và phát tán các kiểu gen/tổ hơp

alalle trên diện rộng nếu tác nhân gây bệnh mang chúng có thể di chuyển qua khoảng cách xa.

Các quần thể tác nhân gây bệnh được đặt dưới áp lực chọn lọc có định hướng mạnh qua

nhiều thế hệ có nguy cơ cao hơn các quần thể được đặt dưới áp lực chọn lọc yếu hoặc được

đặt dưới áp lực chọn lọc không liên tục (do phân bố theo không gian và thời gian của lực chọn

lọc). Chọn lọc là lực tiến hóa dễ dàng được kiểm soát bởi con người và do đó là điểm thực

tiễn nhất mà con người có thể can thiệp vào quá trình tiến hóa của tác nhân gây bệnh. Các hệ

sinh thái nông nghiệp dựa trên sử dụng rông rãi các gen kháng chủ, đơn (trồng độc canh, đồng

nhất về di truyền) sẽ tạo ra áp lực chọn lọc có định hướng mạnh lên quần thể tác nhân gây

bệnh. Các hệ sinh thái nông nghiệp trồng hỗn hợp hoặc luân phiên các cây mang gen kháng

36

khác nhau sẽ làm giảm hiệu quả của chọn lọc hoặc tạo ra áp lực chọn lọc ổn định và thấp,

hoặc không liên tục dẫn tới làm giảm tốc độ gia tăng tần số các đột biến độc.

Đóng góp của mỗi lực tiến hóa vào nguy cơ gây bệnh do tiến hóa của tác nhân gây bệnh

có thể được tổng kết ở bảng sau.

Bảng. Mức nguy cơ do tiến hóa của tác nhân gây bệnh nhằm khắc phục các biện pháp

phòng chống

Nguy cơ cao Nguy cơ thấp

Tốc độ đột biến cao,

Các yếu tố di động hoạt động

Tốc độ đột biến thấp,

Không có các yếu tố di động

Kích thước quần thể lớn.

Quần thể qua đông lớn

Quần thể địa phương hiếm khi tuyệt

chủng

Không có trôi dạt di truyền

Không bị mất allele

Kích thước quần thể nhỏ.

Không có quần thể qua đông

Quần thể địa phương thường xuyên tuyệt

chủng

Trôi dạt di truyền đáng kể

Bị mất allele

Giao lưu gen/kiểu gen cao

Nguồn bệnh vô tính phát tán qua

khoảng cách xa (nhờ gió)

Phát tán nhờ con người qua khoảng

cách xa phổ biến

Giao lưu gen/kiểu gen thấp

Nguồn bệnh vô tính thuộc nhóm truyền

qua đất

Kiểm dịch thực vật hiệu quả

Sinh sản kiểu hỗn hợp (vô tính + hữu

tính): Tạo cả nguồn bệnh hữu tính và vô

tính hàng năm

Chỉ sinh sản vô tính: chỉ tạo nguồn bệnh vô

tính

Chọn lọc có định hướng, mạnh

Cây mang gen kháng R được trồng độc

canh, đồng nhất giống, liên tục, trên diên

rộng

Chọn lọc không liên tục.

Cây mang gen kháng R được trồng theo kiểu

hỗn hợp giống, giống nhiều dòng; được trồng

luân canh (thời gian) hoặc xen canh (không

gian)

Dựa vào đánh giá nguy cơ do tến hóa của tác nhân gây bệnh, chúng ta có thể xây dựng

được một sơ đồ cho phép hướng dẫn sử dụng các chiến lược tạo và sử dụng giống kháng dựa

trên hiểu biết về di truyền quần thể của tác nhân gây bệnh

37

Mức đa dạng di

truyền của quần

thể tác nhân gây

bệnh

CAO Sinh sản hữu

tính, hỗn hợp /

giao phối

Giao lưu gen

Giao lưu gen

THẤP

THẤP

CAO

Sinh sản vô

tính / tự phối

TKD

(qui tụ)

TKD

(đơn gen)

TKN

+

TKD (dùng hỗn hợp giống &

giống nhiều dòng)

(pyramid)

CAO THẤP

TKN

+

TKD (theo vùng)

VD: Phytophthora sojae

Rhizoctonia solani

VD: Phytophthora infestans

Blumeria

VD: Nấm gỉ

sắt sinh sản vô

tính (Puccinia

maydis) ở

VN?

VD: Fusarium

oxysporum

Hình Sơ đồ hướng dẫn sử dụng các chiến lược tạo và sử dụng giống kháng dựa trên hiểu

biết về di truyền quần thể của tác nhân gây bệnh. TKN : tính kháng ngang (tuân theo mô

hình gen-đối-gen). TKD: tính kháng dọc.

38

Chương 2. Lựa chọn vùng gen của tác nhân gây bệnh

1. Bộ gen của tác nhân gây bệnh

Tùy theo nhóm tác nhân gây bệnh, kích thước bộ gen cũng như số lượng gen của chúng

thay đổi đáng kể (bảng ).

Bảng . Ví dụ kích thước bộ gen một số sinh vật

Nhóm Ví dụ Kích thước bộ gen

(1000 bp)

Số gen Số NST

Viroid Potato spindle viroid 0.36 0

Vệ tinh virus DNA-β 1.35 1

Virus Begomoviruses (bộ gen đơn) 2.7 6

Virus Papaya ringspot potyvirus 10 10

Virus Rice grassy stunt oryza virus 25 12

Vi khuẩn Ca. Phytoplasma asteris 700 708

Vi khuẩn Xanthomonas oryzae 4900 4400

Vi khuẩn Ralstonia solanacearum 5800 5000

Nấm Pyricularia oryzae 40000 - 6

Nấm Puccinia graminis 80000 - 18

Nấm noãn Phytophthora infestans 240000 - 10

Thực vật Arabidopsis thaliana 157000 39.000 5

Thực vật Oryza sativae (japonica) 420000 40.000 12

Côn trùng Drosophila melanogaster 165000 14.000 4

Tuyến trùng Caenorhabditis elegans 98000 20.000 6

Người Homo sapiens 840000 33.000 24

Một số điểm khi chú ý về bộ gen của tác nhân gây bệnh là:

1.1. Bộ gen viroid

Đây là nhóm tác nhân gây bệnh rất đặc biệt, bộ gen của chúng chỉ là các phân tử RNA sợi

đơn dạng vòng, kích thước cực kỳ nhỏ khoảng 250 - 350 nts (có thể xem là nhóm tác nhân

gây bệnh có kích thước nhỏ nhất). Chúng không mã hóa một protein nào nhưng có thể gây

bệnh cho cây thông qua can thiệp vào hệ thống gene silencing của cây. Việc nghiên cứu đa

dạng cũng như phân loại nhóm tác nhân gây bệnh này dựa vào trình tự toàn bộ bộ gen của

chúng.

1.2. Bộ gen virus

Virus thực vật có bộ gen cũng rất nhỏ, mã hóa ít gen. Mặc dù bộ gen virus rất đơn giản

nhưng cực kỳ đa dạng.

Khoảng 25% số virus thực vật có bộ gen dạng DNA dạng vòng, sợi đơn hoặc kép. Các

gen trên bộ gen virus có thể được mã hóa cùng chiều hay ngược chiều kim đồng hồ.

39

Khoảng 75% các virus thực vật còn lại là các virus RNA. Các virus RNA cũng có thể có

bộ gen sợi đơn hoặc sợi kép. Bộ gen của chúng có thể được gọi là cực (+) nếu được dịch mã

trên sợi virus hoặc cực (-) nếu được dịch mã trên sợi trung gian trong quá trình tái sinh, hoặc

lưỡng cực. Phần lớn virus thực vật có bộ gen RNA sợi đơn, cực +.

Bộ gen của virus có thể phân mảnh hoặc không phân mảnh. Đối với các virus có bộ gen

phân mảnh thì các phân tử genome của chúng có thể được lắp ráp trong cùng một phân tử

hoặc được lắp ráp trong các phân tử khác nhau.

Các gen của virus không chứa intron. Đối với một số virus, protein của chúng có thể có

thể được xử lý hậu dịch mã để hình thành các protein chức năng.

Một số virus RNA trong quá trình tái sinh có thể hình thành các phân tử RNA có kích

thước nhỏ hơn kích thước bộ gen virus gọi là bộ gen phụ (subgenomic). Các phân tử bộ gen

phụ này cũng mã hóa các protein như của bộ gen chính.

Một số virus (cả DNA và RNA) có thể có các phân tử vệ tinh (satellite). Các phân tử vệ

tinh này phải nhờ virus để tái sinh và phát tán.

Một số ví dụ

1. Các begomovirus nhóm bộ gen đơn (gây bệnh xoăn vàng lá cà chua): bộ gen sợi vòng

đơn (gọi là DNA-A), kích thước ~ 2.7 kb; bộ gen gồm 6 gen mã hóa theo 2 chiều ngược nhau.

2. Banana bunchytop virus (BBTV, chi Babuvirus, gây bệnh chùn ngọn chuối): bộ gen

phân mảnh gồm 6 phân tử DNA sợi vòng đơn, mỗi phân tử có kích thước khoảng 1.35 kb. và

được lắp ráp riêng rẽ. Trên mỗi sợi chứa 1 ORF mã hóa 1 protein khác nhau.

3. Cauliflower mosaic virus (CaMV) gây bệnh trên nhiều cây, rice tungro bacilliform

virus (RTBV) gây bệnh tungro trên lúa): Bộ gen là 1 phân tử DNA sợi vòng kép, kích thước

khoảng 8 kb. Bộ gen gồm 4 gen mã hóa theo 1 chiều.

5. Các potyvirus như papaya ringspot virus (PRSV), potatovirus Y (PVY): bộ gen RNA

sợi đơn cực dương, kích thước khoảng 10 kb, chứa 1 đầu 5‘UTR và 1 đầu 3‘UTR. Đầu

3‘UTR tận cùng bằng 1 chuỗi polyadenine. Bộ gen chứa 1 ORF lớn mã hóa 1 polyprotein và

được xử lý sau dịch mã thành 10 protein chức năng.

1.3. Bộ gen vi khuẩn và phytoplasma

Bộ gen của vi khuẩn và phytoplasma có cấu trúc đơn giản. Phần lớn chúng có bộ gen là

một phân tử DNA sợi kép dạng vòng. Gần đây người ta đã chứng minh một số vi khuẩn có bộ

gen dạng sợi thẳng (chẳng hạn phần lớn vi khuẩn thuộc chi Streptomyces). Ngoài DNA

genome, đa số vi khuẩn còn mang một hoặc nhiều phân tử plasmid.

Bộ gen vi khuẩn nhìn chung có kích thước nhỏ (trong phạm vi từ 0.5 tới 10 Mb).

Bộ gen không chứa intron dẫn tới các gen có thể được gọi là các ORF. Một số gen có thể

gối lên nhau. Một số gen có kích thước rất nhỏ (<60 bp).

Ví dụ. Bô gen của Ralstonia solanacearum (gây bệnh héo xanh vi khuẩn nhiều loại cây

trồng). Bộ gen của R. solanacearum gồm 2 phân tử DNA vòng có kích thước lớn. Phân tử thứ

nhất là nhiễm sắc thể của vi khuẩn (có kích thước 3.7 Mb) còn phân tử kia gọi là siêu plasmid

(megaplasmid, có kích thước 2.1 Mb). Phân tử plasmid này cũng mã hóa nhiều gen quan

trọng của vi khuẩn.

40

1.4. Bộ gen nấm

Nấm là các sinh vật nhân thật, các gen cũng được mã hóa trên các nhiễm sắc thể khác

nhau. Phần lớn nấm có kích thước bộ gen nhỏ hơn so với thực vật. Kích thước bộ gen trung

bình của nấm khoảng 14 Mb.

So với thực vật và động vật bậc cao, nấm có tỷ lệ DNA không mã hóa thấp hơn nhiều (chỉ

khoảng 10 – 20 %).

Khoảng 30 % bộ gen nấm chứa các chuỗi lặp. Các chuỗi lặp này có tiềm năng là marker

phân tử vì chúng có số copy cao.

Một điểm rất quan trọng (khi xét đến việc lựa chọn marker phân tử): ngoại trừ nấm đảm

(ví dụ như nấm than đen, gỉ sắt), thì ở các loại nấm khác, giai đoạn đơn bội (haploid) chiếm

ưu thế trong chu kỳ phát triển.

Ngoài ra, bộ nhiễm sắc thể của nấm có thể rất đa dạng. Ở nhiều loài nấm, thậm chí số

lượng và kích thước nhiễm sắc thể có thể khác nhau giữa các isolate (vd như đối với nấm

Colletotrichum type B và Fusarium oxysporum fsp.cubense).

2. Chọn vùng gen nghiên cứu

Về cơ bản, việc chọn vùng gen nghiên cứu đối với tác nhân gây bệnh cây cũng dựa theo

đặc điểm bộ gen của 3 nhóm sinh vật là: virus/viroid, prokaryote (vi khuẩn, phytoplasma) và

eurkaryote (nấm, tuyến trùng…).

2.1. Chọn vùng gen virus

Virus nói chung có kích thước bộ gen rất nhỏ, mã hóa chỉ một số ít gen chịu trách nhiệm

nhiều chức năng sống của virus trong đó có 4 chức năng quan trọng là cấu trúc (lắp ráp phân

tử virus), tái sinh, di chuyển (trong nội bộ tế bào, giữa các tế bào và hệ thống trong cây).

41

Một trong các gen được sử dụng phổ biến nhất trong nghiên cứu đa dạng và phân loại đối

với virus thực vật là gen mã hóa vỏ protein (CP gen). Thông thường, gen CP của virus là một

protein đa chức năng, trong đó chức năng chủ yếu nhất là cấu trúc.

Ví dụ, đối với potyvirus, nhóm virus chiếm tới 20% tổng số virus thực vật, người ta

thường nghiên cứu mức đa dạng dựa trên phân tích chuỗi gen CP.

2.2. DNA ribosome

DNA ribosome (rDNA), đặc biệt là vùng mã hóa các tiểu phần rRNA và các spacers liên

quan của nó, là một trong các vùng DNA được sử dụng phổ biến nhất trong nghiên cứu đa

dạng đối với sinh vật nhân thật (karyote) và tiền nhân (prokaryote).

2.2.1 Cấu trúc và chức năng RNA ribosome

Ribosome.Ribosomes là cơ quan tử cần cho tổng hợp protein. Một tế bào có thể chứa

hàng ngàn ribosome.

Ribosome ở cả sinh vật tiền nhân và nhân thật gồm 2 tiểu phần có kích thước không

ngang bằng (tiểu phần lớn và tiểu phần nhỏ). Mỗi tiểu phần gồm ít nhất một phân tử rRNA

nhiều tiểu phần protein ribosome (rprotein).

Ở sinh vật tiền nhân, ribosome là 70S (tiểu phần lớn là 50S và tiểu phần nhỏ là 30S)

Tiểu phần lớn 50S gồm rRNA 23S (~3000 nts) + rRNA 5S (120 nts0 + khoảng 30

protein ribosome.

Tiểu phần nhỏ 30S gồm rRNA 16S (~1500 nts) + khoảng 20 protein ribosome

Ở sinh vật nhân thật, ribosome là 80S (tiểu phần lớn là 60S và tiểu phần nhỏ là 40S)

Tiểu phần lớn 60S gồm rRNA 28S (~4700 nts) + rRNA 5.8S (160 nts) + khoảng 50

protein ribosome.

Tiểu phần nhỏ 40S gồm rRNA 18S (~1900 nts) + khoảng 35 protein ribosome

RNA ribosome (rRNA)

Các gen không mã hóa protein cũng phải được phiên mã, chẳng hạn phiên mã thành

rRNA. Vùng DNA mã hóa rRNA được gọi là DNA ribosome (rDNA). Các rDNA được tổ

chức thành các đơn vị phiên mã. Mỗi đơn vị phiên mã có thể được lặp lại nhiều lần trên bộ

genome. Số lượng lặp cũng như cấu trúc của các đơn vị phiên mã khác nhau giữa giữa sinh

vật nhân thật và sinh vật tiền nhân (hình)

Ở sinh vật tiền nhân, số đơn vị phiên mã có thể chỉ là 1 hoặc lặp lại rải rác trên bộ gen

(chẳng hạn bằng 7 ở E. coli). Về cấu trúc, mỗi đơn vị phiên mã của prokaryote gồm các gen

xếp theo thứ tự là 16S-23S-5S. Ở 2 đầu của đơn vị phiên mã là các vùng 5‘ và 3‘ ETS

(external transcribed spacer); còn ở 2 đầu của gen 23S là 2 vùng ITS (internal transcribed

spacer). Một đoạn mã hóa tRNA thường nằm ở vùng ITS giữa gen 16S và 23S (và cũng

thường nằm ở vùng 3‘ETS). Chú ý là các đoạn spacer sẽ bị loại bỏ sau khi phiên mã để tạo ra

các RNA chức năng.

Ở sinh vật nhân thật, các đơn vị phiên mã thường lặp lại nhiều lần và kề nhau thành các

cụm đơn vị phiên mã. Số đơn vị lặp trong một cụm thường nhiều (ở nấm men là 100 – 200

lần). Các cụm đơn vị phiên mã cũng lại lặp lại nhiều lần trên các nhiễm sắc thể khác nhau (ở

người có thể tới 5 cụm). Về cấu trúc, một đơn vị phiên mã gồm các gen xếp theo thứ tự là

18S-5.8S-28S. Tương tự như ở prokaryote, xung quanh vùng mã hóa của các gen RNA của

eukaryote cũng là các vùng spacer. Do các đơn vị phiên mã của eukaryote lặp xếp liền kề

nhau nên vùng spacer giữa các đơn vị lặp còn được gọi là vùng IGS (intergenic spacer).

42

2.2.2 Vai trò của rDNA trong phân loại và nghiên cứu đa dạng và chẩn đoán

rDNA là một vùng gen quan trọng trong nghiên cứu đa dạng và phân loại vì

Là một vùng gen có mặt ở tất cả các đối tượng có cấu tạo tế bào.

Các gen nằm trên rDNA có cả cùng bảo thủ lẫn vùng biến động và do vậy có thể được

dùng để so sánh các chi khác nhau.

Các vùng spacer biến động hơn rất nhiều và do vậy có thể dùng để so sánh các loài

khác nhau, và trong một số trường hợp có thể ở mức dạng chuyên hóa.

Về mặt kỹ thuật, trên rDNA của có nhiều vị trí cắt giới hạn, do vậy tạo điều kiện thuận lợi

cho cloning.

Các nghiên cứu đầu tiên đối với rDNA thường áp dụng kỹ thuật RFLP + lai hóa bằng dò +

DNA tổng số được cắt bằng RE

Gần đây hơn (khoảng 1990>+, các kỹ thuật trên được thay thế bằng PCR và có thể được

sử dụng ngay trên mẫu cây nhiễm tác nhân gây bệnh (nấm, vi khuẩn)

Cả vùng ITS và IGS đã được sử dụng để thiết kế các mồi đặc hiệu loài nhằm phát hiện tác

nhân gây bệnh ngay trên cây bị nhiễm.

Hiện nay, người ta quan tâm nhiều hơn đến việc giải trình tự toàn bộ đơn vị phiên mã

rDNA để có được thông tin về tất cả các vùng trong đơn vị. Mặc dù vậy, người ta vẫn có thể

có thông tin hữu ích dựa vào các băng đa hình cắt bằng RE đối với sản phẩm PCR khuyếch

đại từ 1 vùng nào đó của đơn vị phiên mã. Cách này rất đơn giản, thường tạo 1 – 4 băng.

Cần chú ý phân tích RFLP dựa vào rRNA chỉ dựa trên sự sai khác ở chuỗi nhận biết của

RE nên nếu một phân tích (1) tạo ra 2 mô hình RFLP khác nhau cho biêt 2 mẫu là khác nhau

nhưng (2) tạo ra 2 mô hình RFLP giống nhau không có nghĩa các vùng gen còn lại của cụm

rRNA là giống nhaug nhau.

(tham khảo: www.mendel.berkeley.edu/boletus/boletus.html; www.

biology.duke.edu/fungi/).

43

2.3. Gen mã hóa

Có rất nhiều gen mã hóa đã được sử dụng trong nghiên cứu đa dạng của tác nhân gây

bệnh.

Đối với nấm, một số gen phổ biến đã được sử dụng là các gen mã hóa actin, tubulin, yếu

tố qui định kéo dài sự dịch mã (elongation factors), cytochromes, proteases, và nhiều protein

khác. Các gen này nhìn chung bảo thủ cao thậm chí gữa các sinh vật thuốc các đơn vị phân

loại khác nhau. Tuy nhiên, vì chúng chứa các chuỗi intron ngắn rất biến động về số lượng

cũng như vị trí trên gen nên có thể được sử dụng làm marker phân tử nhằm nghiên cứu các

sinh vật có quan hệ gần. Ví dụ: nhiều nấm đã được nghiên cứu dựa trên các gen mã hóa là

Fusarium, Ascochyta, và Phoma.

Đối với vi khuẩn, nhiều loại gen mã hóa có thể được sử dụng. Một số ví dụ là gen virD2

(Agrobacterium), gen mã hóa pectate lyase (pel) (Erwinia carotovora), gen mã hóa protein

không độc avrBS2 (Xanthomonas).

2.4. Các chuỗi lặp

Trên bộ gen của prokaryote và eukaryote có nhiều chuỗi lặp thường được sử dụng trong

phân loại và đánh giá đa dạng.

Đối với karyote, các chuỗi lặp này thường chiếm 1 tỷ lệ rất cao trong bộ gen của các

eukaryote (ví dụ khoảng 50 % DNA của người là các chuỗi lặp).

Các chuỗi lặp có thể được chia thành:

2.4.1 Các chuỗi lặp liền kề (tandem repetitive sequences)

Chuỗi DNA vệ tinh đơn (satellite DNA). Gồm các đoạn 5 – 10 bp, lặp lại khoảng 100 lần

Minisatellites. Gồm các đoạn 15-100 bp, lặp lại khoảng 20-50 lần

44

VNTR (variable number tandem repeat): gồm các đoạn lặp có chiều dài rất thay đổi ( ~ 1-

2000 bp)

Microsatellites: gồm các đoạn lặp 2-4 bp, lặp lại khoảng 20-50 lần. Các microsatellite là

các các chuỗi lặp rất quan trọng, đặc biệt trong nghiên cứu đa dạng của eukaryote nên

được trình bày riêng.

2.4.2 Các chuỗi lặp phân bố rải rác (Dispersed repetitive sequences)

Đây là các chuỗi DNA có kích thước khác nhau và lặp lại nhiều lần nhưng không liền

kề nhau mà phân bố rải rác khắp bộ gen. Một ví dụ điển hình là các yếu tố di động (mobile

elements = gen nhảy).

Đối với eukaryote, các chuỗi lặp phân bố rải rác có thể có kích thước ngắn (Short

interspersed elements, SINES) từ 150 - 300 bp (ví dụ chuỗi lặp Alu ở người có kích thước

300 bp, lặp lại từ 0.5 – 1 triệu lần trong bộ gen, chiếm ~5% tổng DNA). Các chuỗi lặp có thể

có kích thước dài (Long interspersed elements (LINES)) với kích thước 5000 - 7000 bp.

Đối với prokaryote, bộ gen của chúng cũng chứa nhiều loại chuỗi lặp phân bố rải rác.

Một số chuỗi lặp có ý nghĩa trong nghiên cứu đa dạng và phân loại vi khuẩn là:

Các chuỗi lặp đối song (REP, repetitive extragenic palindromic) có kích thước 35 - 40 bp.

Các chuỗi lặp bảo thủ vùng liên gen (ERIC, enterobacterial repetitive intergenic

consensus) có kích thước 124 - 127 bp.

Nguyên tố BOX có kích thước 54-bp.

2.5. DNA ti thể (mitochondrial DNA)

DNA ti thể (mitochondrial DNA = mt DNA) đã được sử dụng nhiều trong nghiên cứu tác

nhân gây bệnh cây (nấm). DNA ti thể là một phân tử DNA vòng di truyền chủ yếu theo dòng

mẹ. Đối với nấm, mtDNA có đặc điểm sau:

- Kích thước từ 17-121 Kb

- Chiếm từ 1 – 20 % DNA của tế bào

- Các vùng không mã hóa chiếm một tỷ lệ cao

- Chứa nhiều các chuỗi lặp và intron. Đặc điểm này làm cho mtDNA của các sinh vật quan

hệ gần có một mức đa dạng đáng kể.

- Số lượng copy trong tế bào có thể khá lớn

- Ở một số loài nấm có thể có sự tái tổ hợp mtDNA

- .Có thể được chuyển (độc lập với bộ gen nhân) sang tế bào khác thông qua dung hợp

- Có thể chứa các chuỗi lặp đối song giàu GC

- Chứa cả các vùng bảo thủ và vùng biến động nên thông tin về trình tự chuỗi có thể rất có

ích trong phân biệt nấm ở nhiều mức phân loại.

- Trong một số trường hợp, các loài có qua hệ gần gũi có thể có bộ gen mt DNA rất khác

nhau. Ví dụ các loài nấm men Saccharomyces có mtDNA biến động từ 24 – 78 kb.

45

Chương 3. Các kỹ thuật CNSH trong nghiên cứu bệnh cây

Chương này nhằm hệ thống lại các kỹ thuật CNSH dựa trên phân tích băng điện di được

sử dụng trong bệnh cây. Hầu hết các kỹ thuật quan trọng đã được mô tả chi tiết trong nhiều tài

liệu CNSH. Vì tác nhân gây bệnh cây rất đa dạng bao gồm các eukaryote, prokaryote, virus và

viroid nên trong tài liệu này, người đọc nên chú ý đến đặc điểm, ưu nhược điểm của mỗi

phương pháp nhằm áp dụng kỹ thuật phù hợp với đối tượng nghiên cứu.

1. Các marker di truyền

1.1. Định nghĩa

Một marker di truyền có thể được định nghĩa theo 1 trong các cách sau:

Một dấu hiệu trên nhiễm sắc thể hoặc allele cho phép xác đinh một vùng DNA đặc biệt.

Một đoạn DNA đặc biệt với vị trí đã biết trên genome

Một gen mà biểu hiện kiểu hình của nó thường được phân biệt dễ dàng, được sử dụng xác

định một cá thể hoặc 1 tế bào mang nó, hoặc như một dò để đánh dấu 1 nhân, nhiễm sắc

thể hay locus (King and Stansfield, 1990).

1.2. Phân loại

Marker di truyền có thể được chia làm 3 nhóm chính:

Các tính trạng hình thái có thể quan sát bằng mắt.

Các marker sinh hóa dựa trên sản phẩm gen (isozyme, allozyme, acit béo…)

Các marker phân tử dựa trên các thử nghiệm liên quan đến DNA. Chú ý là các marker

phân tử không nên được xem là các gen thông thường mà nên được xem như các dấu hiệu

cố định trên genome. Chúng là các chuỗi DNA có thể xác định được, nằm tại một vị trí

đặc biệt trên genome và có thể truyền được sang thế hệ sau.

Vì có quá nhiều kỹ thuật phân tử với nguyên lý khác hẳn nhau nên người nghiên cứu phải

cẩn thân trong việc lựa chọn kỹ thuật phù hợp

2. Các loại marker phân tử

Có rất nhiều các loại marker phân tử khác nhau như liệt kê ở bảng dưới đây

Bảng. Các loại marker phân tử

TT Tên đầy đủ Viết tắt

1 allele specific oligo ASO

2 allele specific polymerase chain reaction AS-PCR

3 amplified fragment length polymorphism AFLP

4 anchored microsatellite primed PCR AMP-PCR

5 arbitrarily primed PCR AP-PCR

6 cleaved amplified polymorphic sequence CAPS

7 degenerate oligonucleotide primed PCR DOP-PCR

8 DNA amplification fingerprinting DAF

9 expressed sequence tags EST

10 inter-simple sequence repeat ISSR

11 inverse PCR IPCR

12 Microsatellite primed PCR MP-PCR

13 multiplexed allele-specific diagnostic assay MASDA

46

14 random amplified microsatellite polymorphisms RAMP

15 random amplified microsatellites RAM

16 Random amplified polymorphic DNA RAPD

17 selective amplification of microsatellite polymorphic loci SAMPL

18 sequence characterized amplified regions SCAR

19 sequence specific amplification polymorphisms SSAP

20 sequence tagged microsatelite site STMS

21 sequence tagged site STS

22 short tandem repeats STR

23 simple sequence length polymorphism SSR

23 single nucleotide polymorphism SNP

25 single primer amplification reactions SPAR

26 Single stranded conformational polymorphism SSCP

27 site-selected insertion PCR SSI

28 strand displacement amplification SDA

29 variable number tandem repeat VNTR

30 Repetitive element based PCR = repetitive sequence primed

PCR = repetitive sequence based PCR

Rep-PCR

Một số loại marker rất giống nhau như ASAP, ASO và AS-PCR. Một số là đồng nghĩa

như ISSR, RAMP, RAM, SPAR, AMP-PCR, MP-PCR và ASSR. Một số là đồng nhất như

SSLP, STMS, STR và SSR.

Các loại marker trên có thể được phân loại theo các nhóm sau:

Kiểu di truyền: gen nhân cả bố và mẹ, gen nhân qua mẹ, cơ quan tử qua mẹ, cơ quan tử

qua bố

Kiểu hoạt động của gen: trội hay đồng trội

Phương pháp phân tích: dựa trên lai phân tử (ví dụ RFLP) hay dựa trên PCR (ví dụ rep-

PCR, SSR)

3. Kỹ thuật dựa trên lai phân tử: RFLP

RFLP (Restriction fragment length polymorphism) là kỹ thuật được sử dụng lần đầu tiên

vào năm 1975 để xác định đa hình DNA nhằm lập bản đồ di truyền của một đột biến mẫn cảm

nhiệt độ của các serotype của adenovirus.

Kỹ thuật dựa trên việc cắt bằng RE toàn bộ bộ gen của vi sinh vât. Mặc dù 2 cá thể cùng

loài nhìn chung có bộ gen đồng nhất thì chúng vẫn khác nhau một số nucleotide do các

nguyên nhân sau: đột biến điểm, thêm/mất, chuyển vị trí, đảo vị trí và lặp (duplication)

nucleotide. Hậu quả là sản phẩm cắt DNA sẽ có số lượng và kích thước thay đổi. Qui trình

RFLP nhìn chung gồm các bước sau:

Cắt DNA mẫu bằng 1 hoặc nhiều RE

Tách sản phẩm cắt bằng điện di agarose

Chuyển các sản phẩm đã tách từ gel agarose sang màng bằng Southern bloting.

Phát hiện các đoạn bằng lai DNA với dò (probe) thích hợp.

Hình ảnh hóa (autoradiography) phụ thuộc nhãn dò (bức xạ hay huỳnh quang)

3.1. RFLP: các chú ý về kỹ thuật

Chất lượng DNA phải rất sạch vì phản ứng cắt băng RE yêu cầu chất lượng DNA cao

47

RE: có thể có đoạn nhận biết 4, 6, 8 bp (vd ECoRI có chuỗi nhận biết là 6

(5‘…GAATTC…3‘). Việc lựa chọn RE phụ thuộc mức độ phân giải. Nếu RE có chuỗi nhận

biết = 4 thì mức độ phân giải cao nhất (số băng hình thành nhiều nhất, kích thước băng nhỏ).

Trái lại nếu dùng RE có chuỗi nhận biết bằng 8 thì sẽ tạo ít băng DNA hơn, kích thước băng

lớn và do vậy phải yêu cầu điều kiện điện di phức tạp. Thông thường, người ta hay dùng RE

có chuỗi nhận biết bằng 6 (sẵn có hơn, rẻ hơn, thường tạo các đoạn DNA có kích thước từ 200

– 20.000 bp nên dễ tách bằng điện di agarose)

Điện di: có thể điện di agarose hoặc polyacrylamide phụ thuộc RE (RE-4 tạo đoạn quá

nhỏ nên phải dùng polyacrylamide. Trái lại RE = 6 không thể tách =polyacrylamide nên phải

dùng agarose)

Dò: dò có thể đặc hiệu loài, đặc hiệu môt locus đơn (single locus RFLP), đặc hiệu nhiều

locus (multiple locus RFLP) (thường dùng các chuỗi lặp làm dò). Dò có thể là các clone DNA

hoặc cDNA. Dò có thể gán nhãn phóng xạ hoặc gán nhãn huỳnh quang

Phần trăm gel để tách các sản phẩm DNA sợi thẳng

Agarose Polyacrylamide

Nồng độ gel (%) Phạm vi tách (bp) Nồng độ gel (%) Phạm vi tách (bp)

0.5 1000 - 30000 3.5 100 – 1000

0.7 800 – 12000 5.0 80 – 500

1.0 500 – 10000 8.0 60 – 400

1.2 400 – 7000 12.0 40 – 200

1.4 200 – 4000 20.0 5 - 100

2.0 50 - 2000

3.1.1 RFLP: Các ưu điểm chính

Có khả năng lặp lại cao (giữa các phòng thí nghiệm)

Xác định được di truyền đồng trội

Marker có tính đặc hiệu locus (nên trình tự bảo thủ của các gen của các sinh vật có quan

hệ gần gũi có thể được xác định)

Không yêu cầu thông tin chuỗi

Dễ ghi điểm do kích thước các băng thường khác nhau đáng kể

3.1.2 RFLP: Các hạn chế chính

Yêu cầu số lượng và chất lượng DNA cao

Việc xây dựng bộ dò khá phức tạp

Không thể tự động hóa được (nên tốn công sức và chi phí)

Mức độ đa hình thấp, chỉ một số ít locus được nghiên cứu trong một lần thử

Tốn thời gian, lao động và đắt

Dò yêu cầu gán nhãn bức xạ nên độc hại (hiện nay thường gán nhãn huỳnh quang an toàn

hơn nhưng đắt)

48

4. Các kỹ thuật dựa trên PCR

Từ khi được phát minh bởi Kary Mullis năm 1983 (đoạt giả Nobel năm 1993), PCR là

một kỹ thuật được sử dụng phổ biến nhất trong sinh học phân tử. Các kỹ thuật dựa trên PCR

có một số lợi thế là

Lượng DNA yêu cầu nhỏ (trong nhiều trường hợp không cần chất lượng cao)

Không cần gán nhãn bức xạ ở phần lớn các kỹ thuật

Khả năng nhân chuỗi DNA từ mô bảo quản

Không yêu cầu trang thiết bị quá phức tạp

Nhiều kỹ thuật không cần biết trước trình tự chuỗi gen cần phân tích (AP-PCR, RAPD,

DAF, AFLP và ISSR.

Mức độ đa hình cao cho phép tạo nhiều marker di truyền trong thời gian ngắn

Khả năng kiểm tra nhiều gen đồng thời

Các lợi thế trên, tuy nhiên, có thể thay đổi tùy kỹ thuật đặc biệt. Phụ thuộc loại mồi sử

dụng, các kỹ thuật dựa trên PCR có thể chia làm 2 nhóm chính

Các kỹ thuật dùng mồi tùy ý (hoặc bán tùy ý). Do mồi tùy ý nên không cần biết trước

thông tin chuỗi của đối tượng nghiên cứu (Vd:AP-PCR, DAF, RAPD, AFLP, ISSR).

Các kỹ thuật dùng mồi đặc hiệu được thiết kế từ các chuỗi đã biết (Vd: EST, CAPS, SSR,

SCAR, STS, Rep-PCR).

5. Các kỹ thuật dựa trên PCR dùng mồi tùy ý: RAPD, AP-PCR và DAF

RAPD (random amplified polymorphic DNA), AP-PCR (arbitrarily primed PCR) và

DAF (DNA amplification fingerprinting) là 3 kỹ thuật phổ biến thường được gọi chung là

MAAP (multiple arbitrary amplicon profiling). Sự khác nhau chủ yếu của các kỹ thuật MAAP

là biến đổi mô hình băng điện di bằng cách thay đổi trình tự và độ dài mồi, Ta, số chu trình

PCR, enzyme DNA polymerase chịu nhiệt và cắt khuôn DNA hay sản phẩm PCR bằng RE;

kỹ thuật tách và nhuộm sản phẩm PCR. Các kỹ thuật này tạo các profile khác nhau đáng kể,

thay đổi từ khá đơn giản (RADP) tới rất phức tạp (DAF). Cả 3 kỹ thuật RAPD, AP-PCR và

DAF sử dụng một mồi tùy ý đê nhân DNA với sản phẩm nhìn chung có kích thước < 3000 bp.

5.1. RAPD

RADP thường dùng 1 mồi có kích thước khoảng 10 bp có nhiệt độ gắn mồi Ta thấp (34 –

37 OC). Mặc dù trình tự mồi là tùy ý nhưng cần đảm bảo 2 chỉ tiêu cơ bản: hàm lượng GC tối

thiểu = 40% (thông thường 50 – 80 %) và phải không chứa các chuỗi đối song (palindromic).

Để đảm bảo sự thống nhất giữa các phòng thí nghiệm, các mồi RADP có thể được mua từ một

số nguồn khác nhau như University of British Colombia

(http://www.michaelsmith.ubc.ca/services/ hoặc từ hãng Operon Biotechnologies

(http://www.operon.com)...

Sản phẩm PCR có thể được điện di trên gel agarose 1.5-2.0 % agarose (nhuộm với

ethidium bromide) hoặc polyacrylamide (nhuộm với AgNO3 hoặc sử dụng mồi gán nhãn

phóng xạ hoặc huỳnh quang). Mặc dù mức độ phân giải thấp nhưng do tính đơn giản, nhanh

và chỉ cần sử dụng điện di gel agarose rẻ hơn nên RADP được sử dụng phổ biến hơn AP-PCR

và DAF

Phần lớn các đoạn RAPD hình thành từ một locus nên 2 loại đa hình sẽ xuất hiện: (1) có

hay không có băng và (2) độ đậm của băng. Vì độ đậm của băng có thể hình thành từ số copy

49

hoặc số lượng của khuôn nên dựa theo độ đậm, người ta có thể phân biệt được cá thể trội

đồng hợp tử với cá thể dị hợp tử. Tuy nhiên điều này không luôn luôn đúng vì độ đậm của

băng còn phụ thuộc vào mức độ mismatch tại vị trí gắn mồi; do vậy nhiều tác giả không tính

mức độ đậm nhạt của băng.

5.1.1 RAPD: nhược điểm

Tính lặp lại thấp. Do kỹ thuật dựa vào PCR nên nhiều yếu tố có thể ảnh hưởng đến kết

quả RADP: chất lượng và số lượng khuôn DNA, nồng độ MgCl2, Ta, nguồn Taq, nguồn

máy PCR. Hậu quả là RADP có thể cho các dấu hiệu (+) giả hoặc (-) giả.

Di truyền trội. Do các marker RAPD là marker của các allele trội nên không thể phân biệt

được các các cá thể đồng hợp tử trội và các cá thể dị hợp tử.

Tính cùng nguồn (homology) đôi khi không rõ. Do kết quả được thường được đánh giá

dựa trên điện di agarose nên các nhược điểm của điện di agarose cũng cần tính đến. Chẳng

hạn, nhìn chung, các băng DNA di chuyển cùng mức trên gel agarose thường được xem là

cùng locus. Tuy nhiên, nhiều nghiên cứu cho thấy ở các loài đa bội, các băng giống nhau

có thể khác locus. Nhược điểm này có thể được khăc phục bằng điện di polyacrylamide

(có mức độ phân biệt cao hơn).

5.2. DAF

DAF chủ yếu khác RAPD ở chỗ nó sử dụng các mồi ngắn hơn (5-8 bp), nồng độ mồi cao

hơn, dùng chu trình nhiệt 2 bước thay vì 3 bước và phát hiện sản phẩm PCR bằng điện di

polyacrylamide + nhuộm AgNO3.

5.3. AP-PCR

AP-PCR khác RAPD và DAF ở chỗ phản ứng PCR được chia làm 3 bước, mỗi bước có

điều kiện phản ứng và điều kiện khác nhau. Nồng độ mồi cao được sử dụng ở các chu trình

đầu tiên. Các mồi, có kích thước >= 20 nts được thiết kế tùy ý.

6. Kỹ thuật dựa trên PCR dùng mồi tùy ý: AFLP

Kỹ thuật AFLP (amplified fragment length polymorphism) được sử dụng lần đầu tiên bởi

Vos et al. vào năm 1995 và hiện nay là một trong các kỹ thuật sinh học phân tử được sử dụng

nhiều nhất trong nghiên cứu đa dạng thực vật, nấm và vi khuẩn. Điều thú vị là mặc dù AFLP

là một trong số các kỹ thuật hiệu quả nhất trong nghiên cứu DNA fingerprinting thì số lượng

các nghiên cứu tương tự dùng kỹ thuật này trên động vật lại ít hơn rất nhiều so với trên thực

vật và vi sinh vật. Lý do là các nhà nghiên cứu động vật đã (1) quen với các kỹ thuật dựa trên

microsattelite và (2) không muốn sử dụng các marker trội vì đã có nhiều báo cáo về tính

không ổn định của RAPD (mặc dù điều này không đúng với AFLP).

AFLP là kỹ thuật kết hợp ưu điểm của RFLP (RE trên toàn bộ bộ gen) và PCR.

Đặc điểm quan trọng nhất của AFLP là khả năng đánh giá mức độ đa hình trên toàn bộ bộ

gen hay nói cách khác là kiểm tra đồng thời một cách ngẫu nhiên các sản phẩm từ nhiều locus

trên.

6.1. AFLP: các bước

Tinh chiết DNA của tác nhân gây bệnh. Vì bước tiếp theo là cắt bằng enzyme cắt giới hạn

nên, giống như đối với kỹ thuật RFLP, chất lượng DNA là yêu cầu quan trong.

Cắt DNA bằng 2 RE, thường 1 ER có chuỗi cắt hiếm (như EcoRI) còn ER kia có chuỗi cắt

phổ biến hơn.

50

Nối sản phẩm cắt với adaptor (chứa chuỗi ER). Sản phẩm nối là khuôn cho phản ứng PCR

tiếp theo. Trình tự adapter và trình tự của RE là trình tự găn mồi của bước tiếp theo.

PCR lần 1 (preselective amplification): sử dụng 2 mồi tiền chọn lọc. Trình tự mồi tiền

chọn lọc là trình tự adapter + trình tự của RE + 1 nucleotid được thêm vào đầu 3‘. Sản

phẩm PCR lần 1 (hòa loãng) được sử dụng làm khuôn cho PCR lần 2. Chú ý: đối với một

số protocol, mồi tiền chọn lọc có thể không chứa 1 nucleotid bổ sung.

PCR lần 2 (selective amplification): sử dụng 2 mồi chọn lọc. Trình tự mồi chọn lọc là

trình tự mồi tiền chọn lọc + 2 nucleotid được thêm vào đầu 3‘. Số lượng nucleotid (1,2,3)

thêm vào đầu 3‘ sẽ tăng mức độ chọn lọc đồng thời giảm số sản phẩm PCR tương ứng từ

4, 16 và 64 lần). Một trong 2 mồi chọn lọc thường được đánh dấu bức xạ hoặc huỳnh

quang nhằm phân tích điện di tự động. Nhiều cặp mồi chọn lọc có thể được được sử dụng

để đánh giá chính xác mức độ đa hình.

Sản phẩm PCR là các băng chung + các băng khác nhau giữa các mẫu. Sản phẩm PCR có

thể được điện di agarose nhưg phổ biến hơn là điện di poyacrylamide (+ nhuộm AgNO3

hoặc đánh dấu bức xạ, huỳnh quang) hoặc điện di dùng sequencer. Các băng khác nhau

này là các DNA đa hình và sẽ được đánh giá dùng phần mềm thích hợp.

6.2. AFLP: ưu điểm

Độ tin cậy và khả năng lặp lại cao

Không cần biết trước về thông tin genome của đối tượng nghiên cứu.

Rất giàu thông tin vì có thể đánh giá đồng thời nhiều locus (có nghĩa có khả năng đánh giá

đa hình trên toàn bộ bộ gen) với chỉ một cặp mồi và trên một lần chạy điện di (lợi thế

quan trọng nhất so với RFLP, RAPD và microsatellite + các kỹ thuật tương tự)

Các sản phẩm cùng kích thước phần lớn là cùng nguồn (homology) và đặc hiệu locus (trừ

ngoại lệ là các loài đa bội)

6.3. AFLP: nhược điểm

Yêu cầu nhiều bước để thực hiện

Giống như đối với kỹ thuật RFLP, chất lượng DNA yêu cầu cao (vì bước đầu tiên sau khi

chiết DNA là cắt bằng RE).

Phát hiện sản phẩm bằng điện di polyacrylamide (+ nhuộm AgNO3 hoặc đánh dấu bức xạ

hoặc đánh dấu huỳnh quang) hoặc điện di bằng sequencer <=> đắt và tốn lao động hơn

Đắt hơn vì phải thêm chi phí RE + adapter.

Giống như đối với RAPD, phần lớn các locus AFLP là trội nên không phân biệt được cá

thể đồng hợp tử trội với cá thể dị hợp tử. Điều này làm giảm tính sát thực (accuracy) trong

phân tích di truyền quần thể, lập bản đồ di truyền và chọn lọc bằng marker phân tử đối với

các loài giao phối bắt buộc.

7. Kỹ thuật dựa trên PCR dùng mồi tùy ý: ISSR

ISSR (inter-simple sequence repeat) là kỹ thuật dùng PCR để nhân đoạn gen nằm giữa 2

vùng microsattelite đồng nhất có hướng ngược nhau (xem phần microsattelite). Kỹ thuật dùng

môt mồi được thiết kế trên vùng microsattelite. Đoạn lặp microsattelite có thể là vùng lặp

2,3,4 hay 5 nts. Mồi có thể không mỏ neo hay phổ biến hơn có mỏ neo với 1 – 4 nts suy biến

cao ở đầu 3‘ hay 5‘. ISSR sử dụng các mồi dài hơn RAPD (15 – 30 nts) nên Ta cao hơn và

51

như vậy đặc hiệu hơn. Sản phẩm PCR thường có kích thước 200 – 2000 bp và được phát hiện

hoặc bằng điện di agarose hay polyacrylamide.

ISSR dùng microsatellite để thiết kế mồi nhưng không cần biết trước trình tự DNA của

đối tượng nghiên cứu.

ISSR là kỹ thuật đơn giản, nhanh và có thể không cần điện di polyacrylamide (mặc dù nếu

dùng thì khả năng phát hiện tốt hơn).

Giống RAPD, kỹ thuật ISSR có tính lặp lại kém, marker trội và không phân biệt được cá

thể đồng hợp tử trội và dị hợp tử; không phân biệt được nguồn gốc các băng có cùng kích

thước.

8. Kỹ thuật dựa trên PCR dùng mồi đặc hiêu: SSR (=Microsatellites)

Bộ gen của vi sinh vật nhân thật chứa 3 loại chuỗi DNA lặp là DNA satellite,

minisatellites và microsatellites. Các chuỗi lặp nằm theo hàng (tandem) và có kích thước rất

khác nhau. Trong số các chuỗi lặp đơn giản này, microsatellite là một marker di truyền quan

trọng, thường được sử dụng trong nghiên cứu đa dạng.

Microsatellite (còn được gọi là các chuỗi lặp đơn giản = simple sequence repeats (SSRs),

các chuỗi lặp liền kề ngắn = short tandem repeats (STRs) hay các đoạn đa hình chuỗi đơn

giản = simple sequence length polymorphisms (SSLPs) là nhóm các chuỗi DNA đơn giản lặp

lại nhỏ nhất. Microsatellite là các chuỗi lặp, tùy theo tác giả, 1-5, 1-6 hoặc 2 - 8 nts.

Các chuỗi lặp thường đơn giản, bao gồm 2, 3, 4 nucleotid (gọi là di-, tri-, and

tetranucleotide repeats). Một ví dụ phổ biến của microsatellite là 1 dãy chuỗi lặp 2

dinucleotide (CA)n, trong đó n là tổng số chuỗi lặp nằm trong phạm vi từ 10 – 100. Các

marker này thường tạo ra mức đa hình cao trong nội bộ loài và giữa các loài, đặc biệt khi số

chuỗi lặp n bằng 10 hoặc lớn hơn.

Microsatelite là một trong các marker phân tử được sử dụng rộng rãi nhất vì nó có một

đặc điểm quan trọng là có tốc độ đột biến cao hơn các phần khác của bộ gene.

8.1. Phân loại microsatellite

Các microsatellite được phân loại theo loại chuỗi lặp như sau:

Microsatellite hoàn hảo: gồm các chuỗi lặp đều đặn chẳng hạn TATATATATATATATA.

Microsatellite không hoàn hảo: có một bp nằm xen giữa các chuỗi lặp (Vd

TATATATACTATATA).

Microsatellite gián đoạn: có các chuỗi nhỏ khác nằm bên trong (Vd

TATATACGTGTATATATATA).

Microsatellite phức: gồm 2 chuỗi lặp khác nhau (Vd TATATATATAGTGTGTGT)

8.2. Đặc điểm di truyền của microsatellite

Ở một locus microsatellite đồng hợp tử, số các chuỗi lặp giống nhau. Ở một locus

microsatellite dị hợp tử, số các chuỗi lặp khác nhau (chẳng hạn 1 microsattellite có 9 chuỗi

lặp còn microsatellite có 10 chuỗi lặp). Nhìn chung tại một locus microsatellite của một quần

thể đa allelle (theo nghĩa alelle của microsatelite) thì microsatellite của mỗi allele sẽ khác

nhau về số chuỗi lặp. Đây là đặc điểm di truyền quan trọng của microsatellite làm cho nó trở

thành một marker cực kỳ hữu hiệu trong việc phân biệt các cá thể của 1 quần thể => được ưa

thích trong nghiên cứu di truyền quần thể và tội phạm học.

52

8.3. Cơ chế tạo đột biến của microsatellite

Tốc độ đột biến của microsatellite cao hơn nhiều so với các vùng khác của bộ gen, nằm

trong phạm vi từ 10-2

đến 10

-6 /locus/thế hệ. Một số các cơ chế gây ra tốc độ đột biến cao của

microsatellite là: lỗi trong quá trình tái tổ hợp, trao đổi chéo không ngang bằng, trượt

(slippage) của DNA polymerase trong quá trình tái sinh và sửa chữa DNA.

Lỗi trong quá trình tái tổ hợp. Đây không phải là cơ chế chủ yếu vì người ta đã phát hiện

tốc độ đột biến microsattelte tương đương nhau ở chủng vi khuẩn E. Coli có hệ thống tái

tổ hợp và chủng không có hệ thống tái tổ hợp.

Trao đổi chéo không ngang bằng. Đây là một cơ chế quan trọng, tạo ra các đột biến mất

đoạn và thêm đoạn lớn. Lý do là trong quá trình tiếp hợp, trên vùng microsatellite của một

nhiễm sắc thể hình thành 1 cấu trúc kẹp tóc (hairpin). Hậu quả là sau khi trao đổi chéo,

một nhiễm sắc thể sẽ có một satellite dài hơn còn nhiễm sắc thể kia sẽ có microsatellite

ngắn hơn.

Trượt (slippage) của DNA polymerase trong quá trình tái sinh và sửa chữa DNA. Đây

cũng là một cơ chế quan trọng. Trong quá trình tái sinh và sửa chữa DNA, một sợi tạm

thời tách khỏi sợi kia và nhanh chóng tái hợp nhưng ở một vị trí khác dẫn tới lỗi ghép cặp

bazơ. Hậu quả là 1 allele sẽ tăng số chuỗi lặp nếu lỗi xuất hiện ở sợi thứ (sợi tương đồng)

hoặc giảm số chuỗi lặp nếu lỗi xuất hiện ở sợi chủ. Mặc dù cơ chế trượt của DNA

polymerase khá phổ biến nhưng hậu quả thường chỉ dẫn tới sự thêm hay giảm số lượng

chuỗi lặp của microsatellite (có nghĩa là đoạn thêm hay giảm ngắn hơn nhiều so với hậu

quả gây ra bởi cơ chế trao đổi chéo không ngang bằng)

Hình. Trao đổi chéo không ngang

bằng. Vùng đen và xám là

microsatellite

53

8.4. Phân bố của microsatellite

Trên một bộ genome, microsatellite phân bố không đều vì

Tần số của chúng khác nhau giữa vùng mã hóa và vùng không mã hóa. Do tốc độ đột biến

cao nên vùng mã hóa có mật độ microsatellite thấp hơn so với vùng không mã hóa. Người

ta đã chứng minh rằng, các microsatellite với chuỗi lặp là 3 hoặc 6 bp tồn tại với mật độ

tương đương ở vùng mã hóa và không mã hóa. Tuy nhiên, các microsatellite với chuỗi lặp

không phải là bội số của 3 thì tồn tại chủ yếu ở vùng không mã hóa.

Vai trò chức năng của microsatellite. Các nghiên cứu trên thực vật cho thấy, áp lực chọn

lọc tác động khác nhau lên vùng 5‘UTR, vùng mã hóa và 3‘UTR.

Tần số thay đổi theo đơn vị phân loại (theo nghĩa số lượng tuyệt đối các loci microsatellite

và motif của chuỗi lặp). Ở thực vật, tần số microsatellite cao ở thực vật có bộ gen nhỏ (vd

0.85% ở cây Arabidopsis) và thấp hơn ở cây có bộ gen lớn (vd 0.37% ở ngô). Tần số =

1.07% ở nhiễm sắc thể 22 của người và 0.21% ở tuyến trùng Caernorhabditis elegans.

8.5. Trình tự phân tích microsatellite

Thực hiện một phân tích microsatellite không đơn giản như đối với các phân tích dùng

mồi ngẫu nhiên hoặc ISSR. Có nhiều kỹ thuật microsatellite khác nhau nhưng phổ biến nhất

là PCR sử dụng 2 mồi F và R được thiết kế ở một locus bảo thủ ở 2 phía của của

microsatellite. Như vậy cặp mồi này có thể được áp dụng cho mọi cá thể của loài và tạo ra sản

phẩm PCR có kích thước khác nhau nếu microsatellite của các cá thể là khác nhau (hình ).

Tuy nhiên để có được bộ mồi thích hợp không hề dễ dàng vì microsatellite phải được phân lập

trước.

Hình Cơ chế ―trượt =

slippage‖ trong quá trình

tái sinh DNA. Giả sử

phân tử DNA gốc có 5

chuỗi lặp (hộp nhọn). Cơ

chế ―trượt‖ có thể dẫn tới

hình thành các allele mới

với 6 hoặc 4 chuỗi lặp

phụ thuộc sợi chứa lỗi

trượt.

54

Các bước chính trong phân tích microsatellite bao gồm

1. Xây dựng thư viện microsatellite

2. Xác định loci microsatellite duy nhất

3. Xác định vùng thích hợp để thiết kế mồi

4. Thử PCR

5. Đánh giá và diễn giải các băng

6. Đánh giá sản phẩm PCR tao sự đa hình.

Xây dựng thư viện microsatellite. Đây là bước phức tạp, tốn công sức nhất. Các bước cụ

thể gồm:

- Tinh chiết DNA genomic

- Cắt sản phẩm DNA genome bằng RE.

- Điện di sản phẩm cắt bằng agarose nồng độ thấp (khoảng 0.7%). Chọn vùng điện di

chứa các băng trong khoảng 300 – 700 bp. Tinh chiết các băng khỏi gel agarose.

- Clone các băng (dùng TA vector hoặc adapter) vào E.coli.

- Chọn lọc các clone (+, có khả năng chứa microsatellite) bằng Southen blot với dò

chứa các chuỗi lặp.

- Giải trình tự các clon +.

Sau khi đã biết trình tự các clone, các mồi đặc hiệu sẽ được thiết kế và thử PCR.

Vì xây dựng thư viện microsatellite theo phương pháp truyền thống rất tốn công sức (có

thể mất 1 tháng để hoàn thành), hơn nữa năng suất lại không cao nên đã có nhiều kỹ thuật

khác được áp dụng. Chẳng hạn, trong một kỹ thuật gọi là PIMA (PCR isolation of

microsatellite arrays), thay vì cắt sản phẩm DNA genome và clone, người ta thực hiện RAPD

dùng mồi ngẫu nhiên. Các sản phẩm RAPD được clone và kiểm tra bằng mồi đặc hiệu chuỗi

lặp và mồi đặc hiệu vector. Kỹ thuật PIMA dựa trên cơ sở là các sản phẩm RAPD thường

chứa nhiều microsatellite hơn các sản phẩm cắt ngẫu nhiên. Kỹ thuật PIMA có thể giảm thời

gian xuống còn 1 tuần.

Hình Phát hiện microsatellites từ DNA genome. Hai mồi F và R (mũi tên

xám) được thiết kế ở 2 bên vùng microsatellite. Nếu không có microsatellite

=> có sản phẩm 100 bp. Giả sử có một microsatellite với chuỗi lặp CA và n =

8 (dài 16 bp) thì sản phẩm PCR có kích thước = 116 bp.

55

Bước tiếp theo là chọn các marker satellite tốt nhất và tối ưu hóa điều kiện phản ứng PCR.

Mục tiêu là để cân bằng giữa giữa yêu cầu đặc hiệu cao và năng suất của sản phẩm PCR.

Ngoài ra còn cần phải xét đến khả năng nhận được sản phẩm từ nhiều loci microsatelitte khác

Hình. Sơ đồ trình bày các bước thiết lập marker microsatellite. Bên trái là sơ đồ truyền thống

và bên phải là sơ đồ PIMA (Zane et al., 2002).

56

nhau với kích thước không trùm (overlap) lên nhau. Hiệu quả của microsatellite phụ thuộc

vào sự phong phú của các chuỗi lặp vì càng nhiều chuỗi lặp khác nhau thì càng dễ chọn lựa

marker thích hợp.

Nhìn chung, các nhà nghiên cứu thích dùng các mồi nhằm vào các đoạn microsatellite với

3 hoặc 4 nts lặp (để tránh hiện tượng hình thành các băng ―stutters‖ thường bắt gặp ở các

microsatellite 2 nts).

8.6. Microsattelite: ưu điểm chính

Là marker đồng trội => cực kỳ tuyệt vời cho phân tích di truyền quần thể đối với các sinh

vật giao phối.

Có thể tự động hóa nếu mồi được gán nhãn huỳnh quang và được phân tích trên máy

sequencer tự động.

Nếu bộ mồi đã được lựa chọn thì việc áp dụng tương đối dễ dàng.

8.7. Microsattelite: nhược điểm chính

Như đã trình bày, việc xây dựng thư viện microsattelite và chọn lựa mồi thích hợp là cực

kỳ tốn kém công sức và tiền bạc.

Các sản phẩm PCR trong phân tích microsatellite thường có kích thước nhỏ (một vài trăm

bp) và chênh lêch kích thước nhiều khi không nhiều dẫn tới phải điện di agarose nồng độ

cao (~3 %) hoặc điện di polyacrylamide hoặc phân tích dùng máy sequencer tự động

(đắt).

9. Marker EST (expressed sequence tags)

Mỗi gen phải được phiên mã sang messenger RNA (mRNA) trước khi dịch mã sang

protein. Tuy nhiên vì mRNA rất không bền bên ngoài tế bào nên các nhà khoa học phải

chuyển nó sang dạng DNA bổ trợ (cDNA = complementary DNA). Ngay sau khi cDNA đã

được phân lập, các nhà khoa học có thể giải trình tự vài trăm nts đầu 5‘ và đầu 3‘ của nó để

tạo ra các nhãn chuỗi biểu hiện 5‘ETS hoặc 3‘ ETS (expressed sequence tags). 3‘ETS thường

nằm trong vùng không mã hóa (intron) hoặc UTR nên có xu hướng kém bảo thủ giữa các loài

hơn.

EST đầu tiên được sử dụng để xác định các transcripts nhưng dần trở thành công cụ để

khám phá gen nhằm có được thông tin về biểu hiện và điều hòa gen và để phát triển các

marker phân tử như EST-based RFLPs, SSRs, SNPs, và CAPS.

ESTs đã được sử dụng để thiết kế các dò cho microarray DNA; phát triển các marker

RFLP đơn hay có số copy thấp. Các marker RFLP xây dựng từ EST đã được sử dụng rộng rãi

để xây dựng các bản đồ liên kết di truyền mật độ cao. Thông thường, các marker RFLP dựa

trên EST cho phép thiết lập bản đồ liên kết có khả năng so sánh giữa các loài vì vùng mã hóa

thường bảo thủ. Do vậy, phát triển một marker cho 1 loài có thể sử dụng sô liệu của loài khác

đã có sẵn.

EST cũng cho phép tính toán để phát triển các marker SSR hay SNP. Các phần mềm tìm

kiếm mô hình (pattern) cho phép xác định các chuỗi lặp SSR trong EST. Thông tin trình tự

nucleotide sẵn có cho phép thiết kế các cặp mồi để kiểm tra tính đa hình của đối tượng nghiên

cứu. Khoảng 1 -5% các EST ở nhiều loài cây có các SSR có độ dài thích hợp (>=20 bp). Có

thể tìm một số lượng lớn SSR của một đối tượng nếu nhiều EST của nó đã được xác định. Ví

dụ Kantety et al. (2002) đã tiềm kiếm các SSR với chuỗi lặp 2,3 và 4 nucleotid với độ dài tối

thiểu 18 nucleotid) từ 262,631 EST của 5 loài cây (ngô, lúa, lúa mỳ, lúa miến và yến mạch)

sẵn có trên cơ sở dữ liệu và phát hiện thấy rằng 3,2% EST chứa SSR. Các SSR dựa trên EST

57

thường liên kết với các vùng phiên mã bảo thủ trong loài hơn là liên kết với các vùng không

phiên mã; do đó, các SSR này có thể áp dụng trên các đối tượng thuộc cùng chi. Các SSR dựa

trên EST cũng có khả năng cao hơn trong đánh giá sự biểu hiện khác nhau của gen so với các

SSR dựa trên genome ngẫu nhiễn khác.

10. Kỹ thuật CAPS

CAPS (cleaved amplified polymorphic sequence) là một kỹ thuật kết hợp giữa PCR và

RFLP nên còn có tên nguyên thủy là PCR-RFLP. Kỹ thuật rất đơn giản và gồm 2 bước: (1)

PCR để nhân một đoạn genome quan tâm và (2) tiếp theo, dùng RE thích hợp để cắt sản phẩm

PCR. Do vậy, CAPS phụ thuộc vào mô hình cắt bằng RE.

Ưu điểm

- Đơn giản: chỉ PCR và cắt bằng RE (không cần phát triển dò và lai phân tử như RFLP)

- Chủ yếu di truyền đồng trội.

Nhược điểm

- Khả năng phát hiện đa hình DNA không cao bằng SSR và AFLP vì mức đa hình chỉ

phụ thuộc vào sự thay đổi trình tự tại vị trí nhận biết của RE trên sản phẩm PCR.

11. Kỹ thuật SNP

Đơn vị cấu trúc nhỏ nhất của bộ genome là nucleotide. Có 4 loại nucleotide là A, G, C, T.

Một đa hình nucleotide đơn (SNP, single nucleotide polymorphism) hình thành ở một vị trí

nucleotide, và một loại nucleotide ở vị trí này được gọi là một allele. Ví dụ, có 2 đoạn DNA

CCACGTT và CCATGTT, trong đó có 2 nucleotide khác nhau ở vị trí thứ tư là C và T; trong

trường hợp này chúng ta gọi SNP có 2 allele. Mặc dù sự đa hình có thể gồm 2, 3 hay 4 allele

các SNP 3 hay 4 allele là cực kỳ hiếm. Do vậy, nhìn chung SNP được xem như là đa hình 2

allele.

Để sai khác trở thành một SNP nó phải có tần số > 1%. Một locus SNP được gọi là đồng

hợp tử khi 2 allele giống nhau và dị hợp tử khi 2 allele khác nhau. Allelle có tần số cao hơn

được gọi là hoang dại (wildtype) còn allele kia được gọi là đột biến.

Vì số lượng SNP khá phong phú và phân bố đều khắp bộ gen của nhiều sinh vật (Vd ở bộ

gen lúa, trung bình cứ 170 bp có 1 SNP) nên SNP đã trở thành 1 công cụ phân tích di truyền

hấp dẫn.

Vì marker SNP chỉ là sự sai khác của 1 bp nên trái với các loại marker khác, người ta

không thể phân biệt được allele trên cơ sở so sánh kích thước băng điện di. Có nhiều phương

pháp genotyping dựa trên SNP và tất cả các phương pháp đều gồm 2 phần: (1) tạo một sản

phẩm đặc hiệu allele và (2) phân tích sản phẩm đó. Phần lớn các phương pháp thuộc 1 trong 4

nhóm sau:

Các kỹ thuật lai trực tiếp đặc hiệu allele. Dựa trên khả năng phân biệt 2 chuỗi DNA khác

nhau chỉ bởi 1 nucleotide bằng lai DNA. Hai dò đặc hiệu allele sẽ được thiết kế, thường với

một nucleotide đa hình ở giữa. Dưới điều kiện lai hóa đã được tối ưu hóa, chỉ các tổ hợp lai

khớp nhau hoàn hảo mới ổn định. Phần lớn các lớn các kỹ thuật lai là Dot Blot trong đó DNA

thử (genome, cDNA hay sản phẩm PCR) được cố đinh trên màng và được lai hóa với dò

(thường là oligonucleotide). Trong kỹ thuật Dot Blot đảo, dò sẽ được cố định trước lên màng.

Nhìn chung, kỹ thuật lai hóa dễ mắc lỗi nên cần phải thiết kế dò cẩn thận và chuẩn điều kiện

lai. Cải tiến mới nhất đối với nhóm kỹ thuật lai là dùng microarray (xem phần).

Các kỹ thuật kéo dài mồi. Có 3 nhóm chính:

58

- Minisequencing. Nucleotide đa hình được xác định bằng cách thêm một

dideoxynucleotid triphosphate (ddNTP).

- Kéo dài mồi đặc hiệu allele. Mồi chỉ được tổng hợp tiếp nếu khớp hoàn hảo với

khuôn (chú ý đầu 3‘ của mồi).

- Pyrosequencing. Là kỹ thuật sequencing dựa trên sự phát hiện pyrophosphate giải

phóng ra trong quá trình sequencing.

Các kỹ thuật nối oligonucleotid. Hai dò oligonucleotid được thiết kế: một dò một dò đặc

hiệu allele (đầu 3‘ của nó là ở vị trí đa hình) và một dò kế tiếp phía hạ lưu. Khi lai hóa 2 dò

lên chuỗi thử, nếu không có mismat ở vị trí đa hình, đầu 3‘ của dò đặc hiệu allele sẽ được nối

với đầu 5‘ của dò thứ 2.

Các kỹ thuật cắt dò. Hai dò oligonucleotide được thiết kế: dò 1 (dò xâm nhập) tương

đồng phần 3‘ tính từ vị trí đa hình của chuỗi thử (đầu 3‘ của dò là 1 nucleotide không khớp

(non-matching) với nucleotide đa hình của của chuỗi thử). Dò 2 là dò đặc hiệu allele, được

thiết kế gối qua vị trí đa hình khoảng vài nucleotide. Khi lai với chuỗi thử, nếu không có

mismatch, hai dò sẽ tạo ra một cấu trúc 3 hướng và 1 cleavase sẽ nhận biết được cấu trúc này

và cắt phần gối của dò đặc hiệu allele. Phần bị cắ này thường được gắn với một nhãn huỳnh

quang và phát huỳnh quang khi được giải phóng khỏi dò.

12. Kỹ thuật rep-PCR

Rep-PCR (repetitive sequence primed PCR) là 1 kỹ thuật PCR fingerprinting rất hiệu quả

để nghiên cứu đa dạng các loài vi khuẩn. Kỹ thuật sử dụng các mồi được thiết kế dựa trên các

chuỗi lặp trên bộ gen vi khuẩn như: Các chuỗi lặp đối song vùng không mã hóa (REP,

repetitive extragenic palindromic) có kích thước 35 - 40 bp, các chuỗi lặp bảo thủ vùng liên

gen (ERIC, enterobacterial repetitive intergenic consensus) có kích thước 124 - 127 bp, chuỗi

BOX có kích thước 54-bp.

Phản ứng PCR sử dụng các mồi này được gọi cụ thể là REP-PCR, ERIC-PCR và BOX-

PCR.

Mặc dù Gillings & olley (1997) đã chứng minh rằng các chuỗi lặp này không có ở bộ gen

eukaryote nhưng kỹ thuật này cũng có thể được áp dụng để nghiên cứu đa dạng nhiều loài

nấm gây bệnh cây. Các mồi rep-PCR trong trường hợp nghiên cứu nấm, như vậy, đóng vai trò

như các mồi ngẫu nhiên giống như trong kỹ thuật RAPD.

Bảng: các mồi được sử dụng trong rep-PCR

Mồi Trình tự Tham khảo

BOX A1R 5'-CTACggCAAggCgACgCTgACg-3' Versalovic et al. 1994

ERIC 1R 5'-ATgTAAgCTCCTggggATTCAC-3' Versalovic et al. 1991

ERIC 2 5'-AAgTAAgTgACTggggTgAgCg-3' Versalovic et al. 1991

REP 1R 5'-IIIICgICgICATCIggC-3' Versalovic et al. 1991

REP 2I 5'-ICgICTTATCIggCCTAC-3' Versalovic et al. 1991

59

13. Tóm tắt các kỹ thuật

Thử thách đối với nhà nghiên cứu là làm sao chọn một hoặc vài kỹ thuật phù hợp với mục

tiêu nghiên cứu của mình. Các đặc điểm mong muốn của một marker phân tử tốt là: một mặt

có tính đa hình cao, di truyền đồng trội (phân biệt được cả đồng hợp tử và dị hợp tử), xuất

hiện thường xuyên và phân bố đồng đều trên bộ gen, chọn lọc trung tính; nhưng mặt khác lại

phải dễ tiếp cận, chi phí thấp, dễ thực hiện, có khả năng áp dụng với kết quả thống nhất giữa

các phòng thí nghiệm. Không có một marker phân tử nào hiện nay có thể đáp ứng được các

yêu cầu này, tuy nhiên người ta vẫn có thể chọn được các kỹ thuật mong muốn tùy đều kiện.

Các yếu tố cần xét khi lựa chọn là

Hệ thống marker sẵn có.

Tính đơn giản và thời gian thực hiện của kỹ thuật.

Mức đa hình yêu cầu của đối tượng nghiên cứu

Chất lượng và số lượng DNA của đối tượng nghiên cứu

Kỹ năng và trang thiết bị

Kinh phí của nghiên cứu.

Tính di truyền của marker trong đối tượng nghiên cứu (trội hay đồng trội)

Loại thông tin di truyền cần biết

Ví dụ, xét về điều kiện kinh tế, các kỹ thuật dựa trên microarray và sequencing (như SNP)

hiện nay có lẽ không dễ thực hiện tại các quốc gia đang phát triển như Việt Nam.

Xét về mức sẵn có của trình tự gen, các marker dựa trên EST như EST-SSR, EST-CAPS

và EST-RFLP chỉ có thể áp dụng cho các loài mà các chuỗi EST đã được xác đinh trước (sẵn

có trên ngân hàng gen)

Nhìn chung các kỹ thuật như RFLP, SSR, RAPD, AFLP, ISSR và rep-PCR có thể được áp

dụng cho nhiều đối tượng trong điều kiện Việt Nam.

Các bảng dưới đây mô tả đặc điểm một số kỹ thuật/marker phổ biến

Mức phân biệt trông nghiên cứu đa dạng và phân loại một số kỹ thuật/marker phân tử

Loại phân tích Mức phân biệt

RAPD Cá thể, nhóm dưới loài

SSR (Microsatellite) Cá thể, nhóm dưới loài, loài gần gũi (một số)

AFLP Cá thể, nhóm dưới loài, loài gần gũi

RFLP dựa trên mtDNA Nhóm dưới loài, loài gần gũi

RFLP dựa trên vùng ITS/IGS Loài gần gũi, nhóm dưới loài

Sequencing vùng ITS Loài gần gũi, nhóm dưới loài (một số)

Sequencing vùng rRNA Ngành (phylum), họ, chi, loài

Các gen mã hóa protein cấu trúc/chức

năng

Ngành (phylum), họ, chi, loài, dưới loài

(một số)

60

Bảng. Đặc điểm một số kỹ thuật/marker phân tử

RFLP Microsatellite RAPD AFLP ISSR

Mức phong phú trên bộ

gen

Cao Trung bình Rất cao Rất cao Trung bình

Phần gen được khảo sat

Các vùng mã hóa có số copy

thấp

Toàn bộ genome

Toàn bô genome

Toàn bộ genome

Toàn bộ genome

Lượng DNA yêu cầu

Cao Thấp Thấp Trung bình Thấp

Chất lượng DNA yêu cầu

Cao Trung bình Trung bình Cao Trung bình

Loại đa hình Các thay đổi, thêm, mất

nucleotide đơn

Các thay đổi độ dài đoạn

lặp

Các thay đổi, thêm, mất

nucleotide đơn

Các thay đổi, thêm, mất

nucleotide đơn

Các thay đổi, thêm, mất

nucleotide đơn

Mức đa hinh* Trung bình Cao Cao Rất cao Cao

Di truyền của marker

Đồng trội Đồng trội Trội Trội Trội

Phát hiện allele

Có Có Không Không Không

Dễ sử dụng Rất nhiều bước

Dễ Dễ Lúc đầu khó Dễ

Khả năng tự động

Thấp Cao Trung bình Trung bình Trung bình

Tính lặp lại (độ tin cậy)

Cao Cao Trung bình Cao Trung bình – Cao

Loại dò/mồi DNA genome có số copy thấp hoặc

clone cDNA

Các chuỗi DNA lặp đặc hiệu

Thường dài 10 nts (ngẫu nhiên)

Các chuỗi đặc hiệu

Các chuỗi DNA lặp đặc hiệu

Cloning

và/hoặc sequencing

Có Có Không Không Không

Phát hiện dùng bức xạ

Có/không Không Không Có/Không Không

Chi phí khởi đầu

Cao Cao Thấp Trung bình Trung bình

Hiện trạng bản quyền

Không Không (một số có)

Có Có Không

61

Chương 4. Phân tích kết quả dựa vào số liệu băng điện di

1. Giới thiệu

Các loại marker phân tử khác nhau sẽ cho các kết quả điện di khác nhau. Ví dụ kỹ thuật

RFLP và một số kỹ thuật fingerprinting khác như microsatellite (SSR) nhìn chung sẽ tạo các

băng điện di đơn, thường từ 1 – 20 băng. Các băng này có thể dễ dàng chuyển sang dạng số

liệu nhị nguyên (có băng = 1, không có băng = 0). Dựa trên số liệu này, người ta có thể tính

toán mức tương đồng di truyền S (xem các công thức tính hệ số tương đồng) và khoảng cách

di truyền D (=1-S), cuối cùng là xây dựng một cây phả hệ thường thông qua phân tích cụm.

Phân tích dựa trên băng điện di giống nhau cho 2 nhóm phân tích.

Nhóm 1 thường tạo ít băng (điển hình RFLP, microsatellite, ISSR)

Nhóm 2 thường tạo rất nhiều băng phức tạp (điển hình AFLP, rep-PCR). Mặc dù các băng

có thể được đánh giá và ghi bằng tay thì thông thường người ta dùng một 1 phần mềm

hình ảnh để scan các băng, điều chỉnh, chọn lựa và chuyển sang dạng số liệu nhị thức.

Vd phần mềm CrossChecker (miễn phí): http://en.bio-soft.net/draw/CrossChecker.html

Vd phần mềm GelcomparII (thương mại): http://www.applied-maths.be/gelcompar/gelcompar.htm

Hình. Biến dị allele trong phân tích microsatellite đối với nấm đạo ôn lúa (Pyricularia

oryzae. (Prondani et al. 2000). Một ví dụ về mô hình băng điện di đơn giản

Hình Đa dạng gen trong phâ tích rep-

PCR đối với vi khuẩn Xanthomonas

oryzae (Cruz et al 1996). Một ví dụ

về mô hình băng điện di phức tạp.

62

2. Các bước chính trong phân tích đa dạng dựa trên băng điện di

2.1. Mô tả sự đa dạng

Việc mô tả sự đa dạng có thể được thực hiện giữa các cá thể trong quần thể, giữa các quần

thể trong một khu vự với nhau, thậm chí giữa các đơn vị quần thể lớn hơn nhiều (ví du gữa

các vùng thuộc các lục địa khác nhau).

Locus Cá thể /quần thể

1 2 3 4 5 6

Số liệu

marker

A 1 0 1 1 0 1

B 1 0 0 0 1 1

C 0 1 1 0 1 0

D 1 0 0 0 1 1

E 0 0 1 1 0 0

F 1 1 1 0 0 0

G 1 0 1 0 1 1

2.2. Tính toán mối quan hệ giữa các đơn vị được phân tích ở bước trên

Bước này chủ yếu tính khoảng cách di truyền giữa các cặp đơn vị phân tích.

Ví dụ. Khoảng cách di truyền giữa các cá thể

1 2 3 4 5 6

1 0

2 0.56 0

3 0.33 0.33 0

4 0.47 0.26 0.50 0

5 0.32 0.43 0.37 0.28 0

6 0.33 0.56 0.56 0.37 0.46 0

2.3. Biểu diễn mỗi quan hệ

Biểu diễn mối quan hệ bằng các phương pháp khác nhau (ví dụ vẽ cây phả hệ…)

Cá thể 5

Cá thể 3

Cá thể 6

Cá thể 4

Cá thể 2

Cá thể 1

Hình. Cây phả hệ

thể hiện mối quan

hệ giữa các cá thể

ở trên.

63

3. Lượng hóa mức đa dạng: đo đa dạng trong quần thể

3.1. Dựa trên số lượng biến dị

3.1.1 Mức đa hình hay tỷ lệ đa hình (Pj)

Một gen được xem là đa hình nếu tần số của một trong các allele của nó ≤ 0.95 hoặc 0.99

Pj = q ≤ 0.95 hoặc Pj = q ≤ 0.99

Trong đó,

Pj = tỷ lệ đa hình

q = tần số allele

Pj chủ yếu được sử dung với các marker đồng trội vì các marker trội có thể bỏ qua các

biến dị hợp tử.

Một gen đa hình thường là gen mà allele phổ biến nhất của nó có tần số ≤ 0.95 . Các allele

hiếm của nó có thể có tần số ≤ 0.005. Đặt giới hạn tần số 0.95 hay 0.99 là tùy ý.

3.1.2 Tỷ lệ các locus đa hình (P)

Tỷ lệ locus đa hình được tính theo công thức đơn giản sau:

ntotal

npjP

Trong đó,

P = tỷ lệ các locus đa hình

npj = số lượng các locus đa hình

ntotal = tổng số locus nghiên cứu

P biểu diễn phần trăm các locus đa hình trong quần thể, được tính toán dựa trên đếm trực

tiếp các locus đa hình và tổng số locus nghiên cứu.

P chủ yếu được sử dụng cho các loại marker đồng trội

3.1.3 Số allele trung bình trên locus

Số allele trung bình trên locus cung cấp thông tin về mức độ đa dạng của quần thể. Nó

được tính bằng công thức đơn giản sau:

K

n

n

K

1i

i

Trong đó,

n = số allele trung bình trên locus

K = tổng số locus

ni = tổng số allele phát hiện thấy ở locus thứ i

Số allele trung bình trên locus được sử dụng với các marker đồng trội vì marker trội

không cho phép phát hiện tất cả các allele.

64

3.2. Dựa vào tần số biến dị

3.2.1 Số lượng allele hiệu quả (Ae)

Số lượng allele hiệu quả cho biết số allele có thể có mặt ở một locus trong quần thể và

được tính theo công thức sau

2

ip

1

h1

1 Ae

Trong đó,

pi = tần số của allele thứ i ở một locus

h = 1 – Σpi2

(mức dị hợp tử (heterozygosity) tại một locus)

Số lượng allele hiệu quả có thể được sử dụng với các marker đồng trội

Giá trị của nó bị ảnh hưởng bởi kích thước mẫu thử, do vậy nó có ý nghĩa trong chọn lựa

cách lấy mẫu. Ví dụ, chúng ta tính Ae trong một mẫu, sau đó ta tính Ae của một mẫu thứ 2

hoặc toàn bộ mẫu. Nếu số liệu lần thứ 2 nhỏ hơn lần thứ nhất thì có lẽ chúng ta phải lấy lại

mẫu.

Ví dụ tính số lượng allele hiệu quả Ae

Locus (A, B, C) Quần thể 1 Quần thể 2

Cá thể 1 A1 A1 B1 B1 C1 C1 A1 A1 B1 B3 C1 C1

Cá thể 2 A1 A2 B1 B2 C2 C2 A1 A1 B2 B3 C1 C1

Cá thể 3 A1 A1 B1 B1 C1 C3 A2 A2 B1 B4 C1 C1

Cá thể 4 A1 A3 B1 B3 C2 C3 A2 A2 B1 B1 C1 C1

Cá thể 5 A3 A3 B3 B3 C3 C3 A1 A2 B4 B4 C1 C1

Số allele 3 3 3 2 4 1

Tần số allele 1 0.60 0.60 0.30 0.50 0.40 0.10

Tần số allele 2 0.10 0.10 0.30 0.50 0.10 0.00

Tần số allele 3 0.30 0.30 0.40 - 0.20 0.00

Tần số allele 4 - - - - 0.30 -

Mức dị hợp tử (h) 0.54 0.54 0.66 0.50 0.70 0.00

Số allele hiệu quả (Ae) 2.17 2.17 2.94 2.00 3.33 1.00

3.2.2 Mức dị hợp tử kỳ vọng trung bình (H = mức đa dạng di truyền Nei (D)

Mức đa dạng di truyền Nei là xác suất để 2 allele bất kỳ tại một locus được lấy ngẫu nhiên

trong quần thể là khác nhau.

Có 3 cách tính :

22

j qp1 h (khi một locus chỉ có 2 allele)

65

2

ij p1 h (khi một locus thứ j có i allele)

L

h

H

L

j

j (khi tính trung bình cho tất cả các locus

Trong đó,

hj = mức dị hợp tử (heterozygosity) trên locus

p và q = các tần số allele

H = mức dị hợp tử (heterozygosity) trung bình trên nhiều locus

L = tổng số locus

H là một ước lượng mức độ biến dị di truyền trong quần thể, được tính bằng cách lấy 1 trừ

tần số đồng hợp tử tại 1 locus. Quá trình được lặp lại cho tất cả các locus và được lấy trung

bình.

H có thể được áp dụng cho cả 2 loại marker (trội và đồng trội).

H có giá trị từ 0 đến 1

H đạt giá trị tối đa khi tất cả các allele có tần số bằng nhau.

Để đảm bảo ý nghĩa thống kê, nên phân tích khoảng 30 locus / 20 cá thể /quần thể.

3.3. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker đồng trội

3.4. Ví dụ

Nửa trên của hình là một sơ đồ gel với 30 cá thể được phân tích với môt marker đồng

trội (ví dụ RFLP hoặc SSR). Marker này phát hiện 5 locus là A, B, C, D và E. Trong số các

66

locus này, chỉ có 3 locus là đa hình (A, B và E). Để đơn giản, chúng ta giả sử chỉ có tối đa 2

allele / locus.

Nửa dưới của hình là kết quả ghi điểm các băng cho mỗi cá thể và mỗi locus. Chú ý là các

băng thuộc locus C và D cũng được ghi điểm mặc dù điều này không cần thiết vì chúng

không tạo ra sự đa dạng.

Ví dụ cá thể 1 và 2 sẽ có số liệu sau:

Cá thể 1: 1101101001

Cá thể 2: 0101101011

3.4.1 Các bước tính (bảng dưới)

1. Đầu tiên, chúng ta để ý thấy rằng các locus A, B và E là đa hình vì chúng có tần số allele

nhỏ hơn 0.99. Trái lại, locus C và D là đơn hình (monomorphic) vì chúng có các tần số

allele = 1. Chú ý các chữ viết tắt: exp. = expected value; obs. = observed value.

2. Tỷ lệ các locus đa hình (P) = 3/5 = 0.6 hay 60%.

3. Để tính mức dị hợp tử trung bình quan sát (Ho ), chúng ta:

Đếm số locus dị hợp tử. Ví dụ: cá thể 1 có có 1 locus dị hợp tử (A), cá thể 2 có 1 locus

dị hợp tử (E), cá thể 27 có 2 locus dị hợp tử (A và E),….Tổng số, chúng ta có 16 cá

thể đơn hình (tức là chỉ có 1 băng ở tất cả 5 locus), 13 cá thể có 1 locus dị hợp tử và 1

cá thể có 2 locus dị hợp tử.

Tính mức dị hợp tử trung bình quan sát (Ho = observated heterozygosity): Ho =

[16(0/5) + 13(1/5) + 1(2/5)]/(30) = 0.1

4. Mức đa dạng gen trong nội bộ quần thể (hj) được tính cho mỗi locus theo công thức ở

hàng trên của bảng (như vậy, có thể gọi hj là mức đa dạng gen trong nội bộ locus) . Kết

quả, hj của của locus A = 0.23, của locus B = 0.41 và của locus E = 0.46.

5. Mức đa dạng gen trung bình (Hi) (i = intrapopulation = nội bộ quần thể) được tính theo

công thức là: Hi = (0.23 + 0.41 + 0.46)/5 = 0.22

Bang. Tính một số chỉ số đa dạng quần thể từ ví dụ trên

Locus Số liệu phân tích Tần số allele hj = 1 – p2 –q

2 Hi

A

Kiểu gen A1A1 A1A2 A2A2 Tổng

p q

0.22

Tần số gen (exp.) p2 2pq q2 1

Số cá thể 2 4 24 30

Tần số gen (obs.) P11 = 0.07 P12 = 0.13 P22 = 0.80 1 0.13 0.87 0.23

B

Kiểu gen B1B1 B1B2 B2B2 Tổng

p q Tần số gen (exp.) p2 2pq q2 1

Số cá thể 7 3 20 30

Tần số gen (obs.) P11 = 0.23 P12 = 0.10 P22 = 0.67 1 0.28 0.72 0.41

E

Kiểu gen E1E1 E1E2 E2E2 Tổng

p q Tần số gen (exp.) p2 2pq q2 1

Số cá thể 15 8 7 30

Tần số gen (obs.) P11 = 0.50 P12 = 0.27 P22 = 0.23 1 0.63 0.37 0.46

67

3.5. Ví dụ tính đa dạng di truyền trong quần thể dùng 1 marker trội

3.5.1 Ví dụ

Nửa trên của hình là một sơ đồ gel với 30 cá thể được phân tích với môt marker trội (ví

dụ AFLP hoặc ISSR). Marker này phát hiện 5 locus là A, B, C, D và E. Trong số các locus

này, chỉ có 3 locus là đa hình (A, B và E). Tương tự như ở ví dụ marker đồng trội, để đơn

giản, chúng ta giả sử chỉ có tối đa 2 allele / locus.

Nửa dưới của hình là kết quả ghi điểm các băng cho mỗi cá thể và mỗi locus. Chú ý, vì là

marker trội nên các băng sẽ được ghi điểm là 1 nếu có mặt hoặc 0 nếu không có mặt. Các

băng ở locus C và D (locus đơn hình) có thể không cần ghi điểm hoặc nếu có ghi thì chúng

nhận giá trị 1 cho tất cả các cá thể.

Ví dụ cá thể 1 và 2 sẽ có số liệu sau:

Cá thể 1: 100 (hoặc 10110)

Cá thể 2: 001 (hoặc 00111)

3.5.2 Các bước tính (bảng dưới)

1. Đầu tiên, chúng ta thấy rằng các locus A, B và E là đa hình vì chúng có tần số allele nhỏ

hơn 0.99. Trái lại, locus C và D là đơn hình (monomorphic) vì chúng có các tần số allele =

1. Chú ý các chữ viết tắt: exp. = expected value; obs. = observed value.

2. Tỷ lệ các locus đa hình (P) = 3/5 = 0.6 hay 60%. Mức dị hợp tử trung bình quan sát (Ho)

thể tính được vì các marker trội không phân biệt được giữa các cá thể đồng hợp tử và dị

hợp tử.

3. Tính mức đa dạng gen trong nội bộ locus (hj). Dựa vào công thức trên bảng, chúng ta có

thể tính được hj. Kết quả quả, hj của của locus A = 0.19, của locus B = 0.30 và của locus

E = 0.50.

4. Mức đa dạng gen trung bình (Hi) (i = intrapopulation = nội bộ quần thể) được tính theo

công thức là: Hi = (0.19 + 0.30 + 0.50)/5 = 0.198

68

Bang. Tính một số chỉ số đa dạng quần thể từ ví dụ trên

Locus Số liệu phân tích Tần số allele hj = 1 – p2 –q

2 Hi

A

Kiểu gen AA Aa aa Tổng

p q

0.198

Tần số gen (exp.) p2 2pq q2 1

Số cá thể 6 24 30

Tần số gen (obs.) P1 = 0.20 P2 = 0.80 1 0.11 0.89 0.19

B

Kiểu gen BB Bb bb Tổng

p q Tần số gen (exp.) p2 2pq q2 1

Số cá thể 10 20 30

Tần số gen (obs.) P1 = 0.33 P2 = 0.67 1 0.18 0.82 0.30

E

Kiểu gen EE Ee ee Tổng

p q Tần số gen (exp.) p2 2pq q2 1

Số cá thể 23 7 30

Tần số gen (obs.) P1 = 0.77 P2 = 0.23 1 0.52 0.48 0.50

4. Lượng hóa mối quan hệ di truyền: khoảng cách di truyền (nghĩa rộng)

Khoảng cách di truyền (D) giữa 2 mẫu mô tả tỷ lệ của các yếu tố di truyền (allele, gene,

giao tử, kiểu gen) khác nhau giữa chúng

D = 1 khi và chỉ khi 2 mẫu hoàn toàn không có các yếu tố di truyền giống nhau. Đương

nhiên các yếu tố này là các yếu tố phân tích.

Do quần thể thường tiến hóa theo mô hình không cân bằng, có nghĩa khoảng cách di

truyền sẽ thay đổi theo thời gian nên chúng ta cần phân biệt 2 loại khoảng cách là khoảng

cách hình học (geometric distance) và khoảng cách di truyền (genetic distance).

Khoảng cách hình học

Khoảng cách hình học được sử dụng trong các nghiên cứu đa dạng dựa trên các số liệu

hình thái hoặc các số liệu marker phân tử được thu thập từ các đơn vị phân loại hoạt động

(OUTs, operative taxonomic units). Các OTUs có thể là cá thể hay quần thể. Khoảng cách

hình học có thể được sử dụng với các marker trội hay đồng trội. Vì khoảng cách hình học

được tính chỉ dựa trên tần số allele nên không thể đánh giá được tiến trình tiến hóa theo thời

gian. Kết quả phân tích tạo ra 1 cây phả hệ dưới dạng 1 dendrogram (chỉ cho biết mối quan

hệ giữa các OTU chứ không cho biết tiến trình tiến hóa của các OTU; khoảng cách từ node

ngoài cùng của các OTU tới rễ là bằng nhau). (Trong các phân tích đa dạng dùng marker

phân tử dựa trên băng điện di, khi xây dựng các cây phả hệ dựa trên các chỉ số như Dice và

dùng phân tích UPGMA, thực ra người ta dùng khoảng cách hình học chứ không phải khoảng

cách di truyền)

Khoảng cách di truyền

Hình . Mô hình tiến hóa không cân

bằng. Khoảng cách di truyền sẽ thay

đổi theo thời gian do giao lưu gen/kiểu

gen và trôi dạt di truyền

69

Trái với khoảng cách hình học, khoảng cách di truyền sử dụng tần số allele như đối với

khoảng cách hình học. Tuy nhiên nó cũng yêu cầu một mô hình tiến hóa để phân tích. Từ

khoảng cách di truyền, người ta có thể xây dựng được 1 cây cây phả hệ dưới dạng 1

phylogram (cho biết mối quan hệ giữa các OTU, thông tin về quá trình tiến hóa của các

OUT; khoảng cách giữa 2 OTU bằng tổng khoảng cách các đoạn liên kết giữa chúng).

Khoảng cách di truyền có thể được sử dụng với cả marker trội và đồng trội. Trong trường hợp

sử dụng marker trội, khoảng cách di truyền yêu cầu phân tích 2 thế hệ của cùng quần thể

nhằm đánh giá sự phân ly tại các locus.

4.1. Đánh giá các mối quan hệ dựa theo khoảng cách hình học

Trong phân tích mối quan hệ dựa trên các số liệu marker phân tử, người ta thường sử dụng

khoảng cách hình học (D, distance) mặc dù vẫn thường được gọi là khoảng cách di truyền.

Khoảng cách hình học có thể được đo trực tiếp từ hệ số tương đồng S (similarity index)

theo công thức D = 1 – S.

4.1.1 Các phương pháp phổ biến tính hệ số tương đồng S (similarity) dựa trên biến nhị

thức (0, 1)

Có nhiều cách tính hệ số tương đồng S nhưng dưới đây chỉ trình bày 3 cách phổ biến dùng

cho các số liệu dưới dạng biến nhị thức (0,1). Trong nghiên cứu đa dạng dựa trên điện di gel,

băng xuất hiện nhận giá trị 1 còn băng không xuất hiện nhận giá trị 0. Ba cách tính hệ số

tương đồng dưới đây khác nhau về tính số lượng băng đơn hình và băng đa hình.

Giả sử so sánh hai cá thể thứ i và j. Gọi

Số băng giống nhau của 2 cá thể là a

Số băng chỉ xuất hiện ở cá thể i là b

Số băng chỉ xuất hiện ở cá thể j là c

Số băng không xuất hiện ở cả 2 cá thể (nhưng xuất hiện ở các cá thể khác) là d

Cá thể thứ j

1 0

Cá thể thứ i 1 a b a + b

0 c d c + d

Hệ số Nei & Li (1979) hay còn gọi là hệ số Dice (1945)

Công thức tính là:

cb 2a

2aS

Hệ số Nei & Li tính tất cả các băng có mặt ở 2 cá thể và tính điểm gấp đôi các băng chung

(2a). Vì nó cho rằng các băng thiếu không có ý nghĩa sinh học nên có thể xem hệ số này có ý

nghĩa tương tự so sánh chuỗi DNA.

Hệ số Nei & Li đươc áp dụng cho các marker đồng trội như RFLP và SSR

Hệ số Jaccard (1908):

70

Công thức tính là:

cb a

aS

Hệ số Jaccard không tính các băng thiếu, chỉ tính các băng có mặt đối với cả 2 cá thể. Các

băng thiếu ở cả 2 cá thể được xem là số liệu bị mất.

Hệ số Jaccard có thể được áp dụng với các marker đồng trội.

Hệ số Sokal and Michener (1958) hay còn gọi là hệ số phù hợp đơn giản SMC (simple

matching coefficient)

Công thức tính là

dcb a

daS

Hệ số SMC tính cả băng không có mặt vì cho rằng băng thiếu tương ứng với các allele

đồng hợp tử lặn.

Hệ số SMC có thể được sử dụng với các marker trội như RAPD và AFLP

5. Phần mềm

http://bioinformatics.psb.ugent.be/downloads/psb/Userman/treecon_userman.html

71

Chương 5. Phân tích đa dạng, phân loại dựa trên trình tự DNA

1. Các thuật ngữ/khái niệm

Một số thuật ngữ tiếng Anh sử dụng trong phân tích chuỗi DNA/protein

Homology (cùng nguồn). Đây là 1 thuật cho biết các chuỗi DNA/protein có cùng nguồn

gốc hay không. Đây là một thuật ngữ chất lượng, có nghĩa 2 chuỗi chỉ có thể cùng nguồn gốc

(homologous) hay khác nguồn gốc.

Để cho biết mức độ giống nhau về trình tự giữa các chuỗi, người ta dùng thuật ngữ:

Similarity (tương đồng) cho các trình tự amino acid. Ví dụ khi so sánh 2 chuỗi protein,

người ta có thể có số liệu như ― 2 chuỗi vỏ protein có mức tương đồng 80%‖

Identity (đồng nhất, mặc dù nhiều tài liệu tiếng Việt vẫn dùng là tương đồng) cho các

chuỗi nucleotide. Ví dụ khi so sánh 2 gen, người ta có thể có số liệu ― 2 gen mã hóa vỏ protein

có mức đồng nhất 80 %‖

2. Giải trình tự chuỗi DNA (sequencing)

2.1. Giới thiệu

Giải trình tự gen hiện nay là kỹ thuật rất phổ biến trong nghiên cứu sinh học. Đây là kỹ

thuật được xem là chính xác nhất trong xác định tác nhân gây bệnh cũng như là công cụ tuyệt

vời trong đánh giá mối quan hệ của tác nhân gây bệnh.

Nguyên lý của kỹ thuật sequencing đã được trình bày trong các tài liệu CNSH đại cương

nên không được trình bày chi tiết ở đây.

Tóm tắt, sequencing có thể được thực hiện dựa trên 2 kỹ thuật là

Maxam & Gilbert: sequencing bằng phân hủy hóa học (phổ biến cuối những năm 70,

đầu những năm 80)

Sanger: sequencing bằng enzyme dùng dideoxynucleotides. Kỹ thuật bắt đầu đươc sử

dụng vào 1977 và hiện nay là kỹ thuật phổ biến nhất. Ban đầu, phản ứng sequencing được

thực hiện trên 4 tube riêng biệt. Hiện nay, phản ứng được thực hiện trong một tube dùng hỗn

hợp dNTPs + ddNTP gán nhãn huỳnh quang. Kit phản ứng phổ biến nhất hiện nay là

BigDye® Terminator v3.1 Cycle Sequencing Kit (Applied Biosystems)

2.2. Sequencing dùng BigDye Terminator

Khuôn DNA: plasmid chứa DNA (tốt nhất) hoặc sản phẩm PCR. Chất lượng DNA phải

rất cao nên thường được tinh chiết dùng các kit thương mại

Chạy phản ứng: phản ứng được thực hiện bằng máy PCR (với các chu trình phản ứng

gần tương tự một phản ứng PCR thông thường). Hỗn hợp phản ứng gồm

Đệm phản ứng

Hỗn hợp BigDye (dNTPs + ddNTPs gán nhãn huỳnh quang + DNA polymerase

chịu nhiệt)

Khuôn DNA

Mồi sequencing

72

Đọc phản ứng. Phản ứng sequencing được phân tích (điện di polyacrylamide hoặc mao

dẫn, phát hiện phát xạ mầu, số liệu hóa) bằng máy sequencer tự động. Thường bước này được

thực hiện tại một trung tâm để tiết kiệm.

Biên tập trình tự. Trình tự các chuỗi sẽ được các trung tâm dịch vụ sequencing gửi cho

người nghiên cứu dưới dạng các file thô. Chất lượng trình tự sẽ được kiểm tra bằng phần mềm

thích hợp. Thông thường, một phản ứng chỉ tạo ra khoảng 0.6 kb có chất lượng tốt (các đỉnh

đồ thị trình tự mạnh, rõ ràng, không bị nhiễu).

Hình Một đoạn khoảng 50 nts gen S9 của rice grassy stunt virus (RRSV gây bệnh lùn

xoắn lá tại VN) từ 1 file thô được hiển thị bằng phần mềm BioEdit

3. Tìm kiếm chuỗi có quan hệ gần trên ngân hàng gen

3.1. Ngân hàng gen (Genbank) và NCBI

Genbank là một cơ sở dữ liệu chứa tất cả các chuỗi nucleotide công cộng trên toàn thế

giới. Cho tới 2008, đã có hơn 80 triệu chuỗi gen, đại diện cho hơn 260000 loài sinh vật có tên

trên GenBank. Các chuỗi gen của loài mới được gửi lên GenBank với tốc độ khoảng 1700

loài /tháng.

Genbank là được thành lập, duy trì và quản lý tại Trung tâm Thông tin CNSH Quốc gia

Mỹ (NCBI, National Center for Biotechnology Information).

Thông tin về các chuỗi DNA/protein, nhiều phần mềm CNSH cũng như nhiều bài báo

khoa học có thể truy cập từ website của NCBI (http://www.ncbi.nlm.nih.gov/)

Website của NCBI là một trong các địa chỉ bắt buộc cho các nhà nghiên cứu đang thực

hiện các phân tích chuỗi DNA/RNA/protein.

3.2. Tìm kiếm chuỗi DNA trên GenBank bằng phần mềm BLAST

BLAST là một phần mềm trực tuyến tại NCBI cho phép tìm kiếm các chuỗi DNA/protein

từ cơ sở dữ liệu GenBank. Sau khi đã giải trình tự một chuỗi DNA, chúng ta muốn biết chuỗi

này giống với chuỗi nào trên cơ sở dữ liệu. Cách tìm kiếm như sau:

Mở trang web BLAST tại địa chỉ:

http://blast.ncbi.nlm.nih.gov/Blast.cgi?CMD=Web&PAGE_TYPE=BlastHome

Trên trang web sẽ có các tùy chọn tìm kiếm

Tùy chọn Mục đích

nucleotide blast Tìm cơ sở dữ liệu nucleotide khi dùng chuỗi nucleotide làm

chuỗi hỏi (query)

protein blast Tìm cơ sở dữ liệu protein khi dùng chuỗi protein làm chuỗi hỏi

(query)

Blastx Tìm cơ sở dữ liệu protein khi dùng chuỗi protein được dịch mã

làm chuỗi hỏi (query)

73

Tblastn Tìm cơ sở dữ liệu protein được dịch mã khi dùng chuỗi protein

làm chuỗi hỏi (query)

Tblastx Tìm cơ sở dữ liệu protein được dịch mã khi dùng chuỗi protein

được dịch mã làm chuỗi hỏi (query)

Đối với chuỗi DNA, đầu tiên, chúng ta thường dùng tùy chọn ―nucleotide blast‖

Kích hoạt tùy chọn ―nucleotide blast‖ để mở trang tìm kiếm của tùy chọn này.

Tại cửa sổ ―Enter query sequence = nhập chuỗi hỏi‖; copy và dán chuỗi DNA với format

FASTA (bắt buộc). Format FASTA là một format chuỗi có dấu > ở đầu. Ví dụ

>S9-RRSV-Cần Thơ (967nts)

TTTACAGCTCCTGCTACAGGTACG……………………………ATGTACTCATCTGTGCATATAT

Tại cửa sổ ―choose search set = chọn bộ dữ liệu‖, chọn ―other‖ để tìm kiếm toàn bộ cơ sở

dữ liệu chuỗi nucleotide trên GenBank

Tại cửa sổ ―program selection = chọn chương trình‖, chọn ―highly similar sequences‖ nếu

muốn tìm các chuỗi có mức tương đồng cao, hoặc chọn ―somewhat similar sequences‖ nếu

muốn tìm cả các chuỗi có mức tương đồng thấp.

Cuối cùng, bấm nút ―BLAST‖ để tìm chuỗi.

Kết quả.

Sau vài chục giây (thời gian chờ có thể thay đổi tùy thời điểm và tốc độ đường truyền),

một trang kết quả tìm kiếm sẽ hiển thị. Kết quả tìm kiếm gồm 3 phần chính:

―Graphic summary‖: tóm tắt kết quả tìm kiếm dưới dạng đồ họa. Các chuỗi CSDL tương

đồng nhất với chuỗi hỏi được sắp xếp ở trên cùng. Theo chỉ thị màu từ đen tới đỏ, mức tương

đồng càng cao (biểu diễn bằng điểm Score).

―Descriptions‖: gồm ―accession‖ = mã Genbank, ― description‖ = mô tả danh tính chuỗi,

―max score‖ và ―total score‖ = các điểm tìm kiếm blast (càng cao càng tương đồng), ―query

coverage‖ = phần trăm chiều dài đoạn chuỗi hỏi được tính điểm, ―E value‖ = giá trị kỳ vọng,

là một phép tính thống kê cho biết số các chuỗi trong cơ sở dữ liệu có điểm blast bằng hoặc

cao hơn S xuất hiện ngẫu nhiên trong cơ sở dữ liệu. Giá trị E càng thấp thì điểm S càng có ý

nghĩa.

―Alignment‖: mô tả việc căn trình tự (alignment) theo từng cặp của chuỗi hỏi và các chuỗi

tìm kiếm trên CSDL.

4. So sánh trình tự

Để so sánh mức độ đa dạng của các chuỗi DNA/protein, đầu tiên, người ta phải thực hiện

phép căn trình tự đa chuỗi (multiple sequence alignment). Có nhiều phần mềm tin sinh thực

hiện phép căn trình tự đa chuỗi, trong đó phần mềm tốt nhất hiện nay là Clustal. Phiên bản

mới nhất của phần mềm này là ClustalW. ClustalW có thể được sử dụng như một phần mềm

riêng biệt là ClustalX (sử dụng giao diện window) hoặc được tích hợp trong một số gói phần

mềm phân tích trình tự như BioEdit, MEGA…. Các phần mềm trên có thể tải miễn phí từ các

địa chỉ sau:

. Clustal: http://www.clustal.org/download/current/

BioEdit: http://www.mbio.ncsu.edu/BioEdit/BioEdit.html

MEGA: http://www.megasoftware.net/index.html

Ví dụ so sánh trình tự

74

Giả sử chúng ta có 5 chuỗi DNA đều mã hóa 16S RNA ribosome của 4 vi khuẩn:

Chuỗi 1 (Xo-16S-AP008229): Xanthomonas oryzae gây bệnh bạc lá lúa.

Chuỗi 2 (Xo-16S-X95921): Xanthomonas oryzae gây bệnh bạc lá lúa.

Chuỗi 3 (Xc-16S-AE00892): Xanthomonas citri gây bệnh loét cây có múi

Chuỗi 4: (Rs-16S-CU914168): Ralstonia solanacearum gây bệnh héo xanh nhiều cây

Chuỗi 5: (Dt-16S-AJ864721): Deinococcus geothermalis là vi khuẩn chịu nhiệt

>Xo-16S-AP008229

TTTTAAGTGAAGAGTTTGATCCTGGCTCAGAGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCTCTTATGGGTGGCGAGTGGCGGACGGGTGAGGAATACATC

GGAATCTACTCTTTCGTGGGGGATAACGTAGGGAAACTTACGCTAATACCGCATACGACCTACGGG

TGAAAGCGGAGGACCTTCGGGCTTCGCGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGG

GGTAAAGGCCCACCAAGGCGACGATCCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACT

GAGACACGGTCCAGACTCCTACGGGAGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTG

ATCCAGCCATGCCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAA

GCAGTCGGTTAATACCCGATTGTTCTGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTGCCA

GCAGCCGCGGTAATACGAAGGGTGCAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGG

TGGTGGTTTAAGTCTGTTGTGAAAGCCCTGGGCTCAACCTGGGAATTGCAGTGGATACTGGGTCAC

TAGAGTGTGGTAGAGGGTAGCGGAATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAA

CATCAGTGGCGAAGGCGGCTACCTGGACCAACACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTCCACGCCCTAAACGATGCGAACTGGATGTTGGGTGCAATTTGG

CACGCAGTATCGAAGCTAACGCGTTAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTC

AAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGA

ACCTTACCTGGTCTTGACATCCACGGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACCGTGAG

ACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGC

AACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACCGCCGGTGACAAACCG

GAGGAAGGTGGGGATGACGTCAAGTCATCATGGCCCTTACGACCAGGGCTACACACGTACTACAA

TGGTAGGGACAGAGGGCTGCAAACCCGCGAGGGCAAGCCAATCCCAGAAACCCTATCTCAGTCCG

GATTGGAGTCTGCAACTCGACTCCATGAAGTCGGAATCGCTAGTAATCGCAGATCAGCATTGCTGC

GGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTTTGTTGCACCAGAAG

CAGGTAGCTTAACCTTCGGGAGGGCGCTTGCCACGGTGTGGCCGATGACTGGGGTGAAGTCGTAAC

AAGGTAGCCGTATCGGAAGGTGCGGCTGGATCACCTCCTTT

>Xo-16S-X95921

AGTGAACGCTGGCGGCAGGCCTAACACATGCAAGTCGAACGGCAGCACAGTAAGAGCTTGCT

CTTATGGGTGGCGAGTGGCGGACGGGTGAGGAATACATCGGAATCTACTCTTTCGTGGGGGATAAC

GTAGGGAAACTTACGCTAATACCGCATACGACCTACGGGTGAAAGCGGAGGACCTTCGGGCTTCG

CGCGATTGAATGAGCCGATGTCGGATTAGCTAGTTGGCGGGGTAAAGGCCCACCAAGGCGACGAT

CCGTAGCTGGTCTGAGAGGATGATCAGCCACACTGGAACTGAGACACGGTCCAGACTCCTACGGG

AGGCAGCAGTGGGGAATATTGGACAATGGGCGCAAGCCTGATCCAGCCATGCCGCGTGGGTGAAGAAGGCCTTCGGGTTGTAAAGCCCTTTTGTTGGGAAAGAAAAGCAGTCGGTTAATACCCGATTGTTC

TGACGGTACCCAAAGAATAAGCACCGGCTAACTTCGTGCCAGCAGCCGCGGTAATACGAAGGGTG

CAAGCGTTACTCGGAATTACTGGGCGTAAAGCGTGCGTAGGTGGTGGTTTAAGTCTGTTGTGAAAG

CCCTGGGCTCAACCTGGGAATTGCAGTGGATACTGGGTCACTAGAGTGTGGTAGAGGGTAGCGGA

ATTCCCGGTGTAGCAGTGAAATGCGTAGAGATCGGGAGGAACATCAGTGGCGAAGGCGGCTACCT

GGACCAACACTGACACTGAGGCACGAAAGCGTGGGGAGCAAACAGGATTAGATACCCTGGTAGTC

CACGCCCTAAACGATGCGAACTGGATGTTGGGTGCAATTTGGCACGCAGTATCGAAGCTAACGCGT

TAAGTTCGCCGCCTGGGGAGTACGGTCGCAAGACTGAAACTCAAAGGAATTGACGGGGGCCCGCA

CAAGCGGTGGAGTATGTGGTTTAATTCGATGCAACGCGAAGAACCTTACCTGGTCTTGACATCCAC

GGAACTTTCCAGAGATGGATTGGTGCCTTCGGGAACCGTGAGACAGGTGCTGCATGGCTGTCGTCA

GCTCGTGTCGTGAGATGTTGGGTTAAGTCCCGCAACGAGCGCAACCCTTGTCCTTAGTTGCCAGCACGTAATGGTGGGAACTCTAAGGAGACCGCCGGTGACAAACCGGAGGAAGGTGGGGATGACGTCAA

GTCATCATGGCCCTTACGACCAGGGCTACACACGTACTACAATGGTAGGGACAGAGGGCTGCAAA

CCCGCGAGGGCAAGCCAATCCCAGAAACCCTATCTCAGTCCGGATTGGAGTCTGCAACTCGACTCC

ATGAAGTCGGAATCGCTAGTAATCGCAGATCAGCATTGCTGCGGTGAATACGTTCCCGGGCCTTGT

ACACACCGCCCGTCACACCATGGGAGTTTGTTGCACCAGAAGCAGGTAGCTTAACCTTCGGGAGGG

CGCTTGCCACGGTGTGGCCGATGACTGGGGTGAAGTCGTAACAAGGTAGCCGTATCGGAAGGTGC

75

>Xc-16S-AE00892

AAAGGAGGTGATCCAGCCGCACCTTCCGATACGGCTACCTTGTTACGACTTCACCCCAGTCATCGGCCACACCGTGGCAAGCGCCCTCCCGAAGGTTAAGCTACCTGCTTCTGGTGCAACAAACTCCCAT

GGTGTGACGGGCGGTGTGTACAAGGCCCGGGAACGTATTCACCGCAGCAATGCTGATCTGCGATTA

CTAGCGATTCCGACTTCATGGAGTCGAGTTGCAGACTCCAATCCGGACTGAGATAGGGTTTCTGGG

ATTGGCTTGCCCTCGCGGGTTTGCAGCCCTCTGTCCCTACCATTGTAGTACGTGTGTAGCCCTGGTC

GTAAGGGCCATGATGACTTGACGTCATCCCCACCTTCCTCCGGTTTGTCACCGGCGGTCTCCTTAGA

GTTCCCACCATTACGTGCTGGCAACTAAGGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACA

TCTCACGACACGAGCTGACGACAGCCATGCAGCACCTGTCTCACGGTTCCCGAAGGCACCAATCCA

TCTCTGGAAAGTTCCGTGGATGTCAAGACCAGGTAAGGTTCTTCGCGTTGCATCGAATTAAACCAC

ATACTCCACCGCTTGTGCGGGCCCCCGTCAATTCCTTTGAGTTTCAGTCTTGCGACCGTACTCCCCA

GGCGGCGAACTTAACGCGTTAGCTTCGATACTGCGTGCCAAATTGCACCCAACATCCAGTTCGCAT

CGTTTAGGGCGTGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGTGCCTCAGTGTC

AGTGTTGGTCCAGGTAGCCGCCTTCGCCACGGATGTTCCTCCCGATCTCTACGCATTTCACTGCTACACCGGGAATTCCGCTACCCTCTACCACACTCTAGTGACCCAGTATCCACTGCAATTCCCAGGTTGA

GCCCAGGGCTTTCACAACAGACTTAAACCACCACCTACGCACGCTTTACGCCCAGTAATTCCGAGT

AACGCTTGCACCCTTCGTATTACCGCGGCTGCTGGCACGAAGTTAGCCGGTGCTTATTCTTTGGGTA

CCGTCAGAACAATCGGGTATTAACCGACTGCTTTTCTTTCCCAACAAAAGGGCTTTACAACCCGAA

GGCCTTCTTCACCCACGCGGCATGGCTGGATCAGGCTTGCGCCCATTGTCCAATATTCCCCACTGCT

GCCTCCCGTAGGAGTCTGGACCGTGTCTCAGTTCCAGTGTGGCTGATCATCCTCTCAGACCAGCTAC

GGATCGTCGCCTTGGTGGGCCTTTACCCCGCCAACTAGCTAATCCGACATCGGCTCATTCAACCGC

GCGAAGCCCGAAGGTCCTCCGCTTTCACCCGTAGGTCGTATGCGGTATTAGCGTAAGTTTCCCTAC

GTTATCCCCCACGAAAGAGTAGATTCCGATGTATTCCTCACCCGTCCGCCACTCGCCACCCATAAG

AGCAAGCTCTTACTGTGCTGCCGTTCGACTTGCATGTGTTAGGCCTGCCGCCAGCGTTCACTCTGAG

CCAGGATCAAACTCTTCACTTA

>Rs-16S-CU914168

AAGGAGGTGATCCAGCCGCACCTTCCGATACGGCTACCTTGTTACGACTTCACCCCAGTCATGA

ACCCTGCCGTGGTAATCGCCCCCCTTGCGGTTAGGCTAACTACTTCTGGCAAAACCCACTCCCATGG

TGTGACGGGCGGTGTGTACAAGACCCGGGAACGTATTCACCGCGGCATGCTGATCCGCGATTACTA

GCGATTCCAGCTTCACGTAGTCGAGTTGCAGACTACGATCCGGACTACGATGCATTTTCTGGGATT

AGCTCCACCTCGCGGCTTGGCAACCCTCTGTATGCACCATTGTATGACGTGTGAAGCCCTACCCATAAGGGCCATGAGGACTTGACGTCATCCCCACCTTCCTCCGGTTTGTCACCGGCAGTCTCTCTAGAGTG

CCCTTTCGTAGCAACTAGAGACAAGGGTTGCGCTCGTTGCGGGACTTAACCCAACATCTCACGACA

CGAGCTGACGACAGCCATGCAGCACCTGTGTCCACTTTCTCTTTCGAGCACCTAATGCATCTCTGCT

TCGTTAGTGGCATGTCAAGGGTAGGTAAGGTTTTTCGCGTTGCATCGAATTAATCCACATCATCCAC

CGCTTGTGCGGGTCCCCGTCAATTCCTTTGAGTTTTAATCTTGCGACCGTACTCCCCAGGCGGTCAA

CTTCACGCGTTAGCTACGTTACTAAGGAAATGAATCCCCAACAACTAGTTGACATCGTTTAGGGCG

TGGACTACCAGGGTATCTAATCCTGTTTGCTCCCCACGCTTTCGTGCATGAGCGTCAGTGTTATCCC

AGGAGGCTGCCTTCGCCATCGGTATTCCTCCACATCTCTACGCATTTCACTGCTACACGTGGAATTC

TACCTCCCTCTGACACACTCTAGCTGTGCAGTCACCAATGCAATTCCCAGGTTAAGCCCGGGGATTT

CACATCGGTCTTGCACAACCGCCTGCGCACGCTTTACGCCCAGTAATTCCGATTAACGCTTGGACCC

TACGTATTACCGCGGCTGCTGGCACGTAGTTAGCCGGTCCTTATTCTTCCGGTACCGTCATCCACTCCAGGTATTAACCGAAGCGATTTCTTTCCGGACAAAAGTGCTTTACAACCCGAAGGCCTTCTTCACA

CACGCGGCATTGCTGGATCAGGGTTGCCCCCATTGTCCAAAATTCCCCACTGCTGCCTCCCGTAGG

AGTCTGGGCCGTGTCTCAGTCCCAGTGTGGCTGATCGTCCTCTCAGACCAGCTACTGATCGTCGCCT

TGGTGGGCCTTTACCCCACCAACTAGCTAATCAGACATCGGCCGCTCCTATAGCATGAGGCCTTGC

GGTCCCCCACTTTCACCCTCAGGTCGTATGCGGTATTAGCTAGTCTTTCGACTAGTTATCCCCCACT

ACAGGGCACGTTCCGATGTATTACTCACCCGTTCGCCACTCGCCGGCAGGTAGCAAGCTACCCCCG

CTGCCGTTCGACTTGCATGTGTAAGGCATGCCGCCAGCGTTCAATCTGAGCCAGGATCAAACTCTT

CAGTT

>Dt-16S-AJ864721

GGTGAACGCTGGCGGCGTGCTTAAGACATGCAAGTCGAACGATCGTCTTCGGACGGTAGTGGC

GCACGGGTGAGTAACGCGTAACTGACCTGCCCCCAAGACCGAACTAACTCCCCGAAAGGGGAGCT

AATGTGGGATGTGCTGTCCGGCTGTGGCCGGACAGTAAAGGCTGAGGCCGCTTGGGGATGGGGTT

GCGTTCCATCAGCTAGATGGTGGGGTAAAGGCCTACCATGGCGACGACGGATAACCGGCCTGAGA

76

GGGTGGCCGGTCACAGGGGCACTGAGACACGGGCCCCACTCCTACGGGAGGCAGCAGTTAGGAAT

CTTCCCCAATGGGCGCAAGCCTGAGGGAGCGACGCCGCGTGAGGGATGAAGGTCCTCGGATTGTA

AACCTCTGAACGAGTGACGAAAGGCCCCGGATGGGGAGATGACGGTARCTCGGTAATAGCACCGG

CTAACTCCGTGCCAGCAGCCGCGGTAATACGGAGGGTGCAAGCGTTACCCGGAATCACTGGGCGT

AAAGGGCGTGTAGGCGGGAAGCTAAGTCCGACTTTAAAGACCGGGGCTCAACCCCGGGAGTGGGT

TGGAGACTGGCTTTCTGGACCTCTGGAGAGGCAACTGGAATTCCTGGTGTAGCGGTGGAATGCGTA

GATACCAGGAGGAACACCAATGGCGAAGGCAGGTTGCTGGACAGAAGGTGACGCTGAGGCGCGAAAGTGTGGGGAGCGAACCGGATTAGATACCCGGGTAGTCCACACCCTAAACGATGCACGTTGGCC

GAGCGCGGGATGCCGTGCTGGGCGAAGCCAACGCGAGAAACGTGCCGCCTGGGAAGTACGGCCGC

AAGGTTGAAACTCAAAGGAATTGACGGGGGCCCGCACAAGCGGTGGAGCATGTGGTTTAATTCGA

AGCAACGCGAAGAACCTTACCAGGTCTTGACATGCACCGAACCCTGCTGAAAGGTGGGGGTGCCC

TTCGGGGAGCGGTGACACAGGTGCTGCATGGCTGTCGTCAGCTCGTGTCGTGAGATGTTGGGTTAA

GTCCCGCAACGAGCGCAACCCTTGCCCTTCGTTGCCAGCAGTTCGGCTGGGGACTCGAGGGGGACT

GCCGGTGAAAGCCGGAGGAAGGCGGGGATGACGTCTAGTCAGCATGGTCCTTACGACCTGGGCGA

CACACGTGCTACAATGACCAGAACAACGCGCTGCGAACTCGCGAGAGTGAGCCAATCGCTGAAAA

CTGGTCCCAGTTCAGATCGGAGTCTGCAACTCGACTCCGTGAAGGYGGAATCGCTAGTAATCGCGG

GTCAGCATACCGCGGTGAATACGTTCCCGGGCCTTGTACACACCGCCCGTCACACCATGGGAGTGC

ATGGCAGCTGAAACCACCGGGAGCTTGACGGCAGGTGTCTAGGCTGTGGTGCATGACTGGGGTGA

AGTCGTAACAAGGTAACTGTACCGGAAGG

Tất cả các chuỗi trên đều được cất trong 1 file text (ví dụ NotePad) với đuôi .txt. Mỗi

chuỗi đều phải có tên chuỗi với dấu > ở đầu (format FASTA).

4.1. Căn trình tự đa chuỗi bằng phần mềm ClustalX

Mở phần mềm ClustalX

Chọn chế độ ―Multiple alignment mode‖

Trong tùy chọn ―file‖, chọn ―load sequences‖ để nhập file chứa 5 chuỗi trên.

Tiếp theo, trong tùy chọn ―alignment‖ chọn ―do complete alignment‖ : chương trình sẽ

thực hiện việc căn trình tự 5 chuỗi trên và cất kết quả trong một file có đuôi là .aln.

4.2. Xác định mức đồng nhất (sequence identity) bằng phần mềm Bioedit

Mở phần mềm Bioedit

Nhập file có đuôi .aln chứa các chuỗi đã được căn trình tự bằng phần mềm ClustalX. Chú

ý là phần mềm Bioedit cũng có thể thực hiện việc căn trình tự đa chuỗi như ở phần mềm

ClustalX.

Trong tùy chọn « Alignment », chọn « Sequence Identity Matrix ». Chương trình sẽ yêu

cầu đặt tên file chứa kết quả so sánh mức đồng nhất trình tự. Sau khi đặt tên file, bấm

« save » và chương trình sẽ ngay lập tức thực hiện việc xác định mức đồng nhất trình tự

giữa các cặp chuỗi và trình bày trên một cửa sổ text.

Copy kết quả từ cửa sổ text sang 1 file excel để thuận tiện trong việc biên tập và trình bày.

Dưới đây là kết quả xác định mức đồng nhất trình tự DNA của 5 chuỗi 16S RNA ở trên

Xo-16S-

AP008229

Xo-16S-

X95921

Dt-16S-

AJ864721

Xc-16S-

AE00892

Rs-16S-

CU914168

Xo-16S-AP008229 ID 0.969 0.716 0.371 0.371

Xo-16S-X95921 ID 0.739 0.369 0.368

Dt-16S-AJ864721 ID 0.348 0.346

Xc-16S-AE00892 ID 0.833

Rs-16S-CU914168 ID

ID = identical có nghĩa đồng nhất 100%

77

Từ kết quả trên có thể thấy 2 chuỗi 16S RNA của cùng loài vi khuẩn Xanthomonas oryzae

có mức đồng nhất nucleotide rất cao (0.969). Các chuỗi còn lại chia sẻ mức đồng nhất thấp

hơn nhiều.

Chú ý quan trọng: Mặc dù việc so sánh mức đồng nhất chuỗi rất quan trọng, nhưng các

giá trị đồng nhất chỉ được tính toán từ các sai khác hiện tại (chẳng hạn, 2 chuỗi dài 10 nts

được so sánh với nhau và phát hiện thấy có 3 vị trí sai khác thì 2 chuỗi này có mức đồng nhất

0.7 hay 70%). Chính vì vậy, giá trị đồng nhất chuỗi chỉ được sử dụng trong phân loại tác nhân

gây bệnh. Ví dụ ngưỡng phân biệt loài của chi begomovirus là 89% mức đồng nhất trình tự

DNA của phân tử DNA-A genome.

4.3. Xác định khoảng cách di truyền (genetic distance)

4.3.1 Khái niệm khoảng cách di truyền phân tử

Khoảng cách di truyền phân tử giữa 2 chuỗi là số các sự kiện tiến hóa (thường là số lượng

thay thế nucleotide/vị trí) xuất hiện kể từ khi 2 chuỗi phân tách từ một tổ tiên chung.

Có thể định nghĩa đơn giản như sau: khoảng cách di truyền giữa 2 chuỗi là số thay thế

nucleotide trên vị trí.

Như vậy khoảng cách di truyền phân tử có thể lớn hơn 1

Khoảng cách di truyền là cơ sở cho việc xây dựng cây phả hệ (phylogenetic tree) bằng các

phương pháp khoảng cách.

Tính khoảng cách di truyền khi so sánh các chuỗi DNA (và protein) cực kỳ phức tạp và

phải căn cứ vào nhiều yếu tố, đặc biệt là mô hình thay thế nucleotide (cho phân tích chuỗi

DNA) hoặc ma trận thay thế aa (cho phân tích chuỗi protein).

4.3.2 Mô hình thay thế nucleotide (subtituation model).

Có rất nhiều mô hình thay thế nucleotide đã được đề xuất. Dưới đây là 2 mô hình:

Mô hình Jukes-Cantor

Đây là một mô hình thay thế nucleotide đơn giản. Nó có các giả thiết sau:

Tốc độ thay thế nucleotide là giống nhau cho tất cả 4 loại nucleotide (A, T, G, C) (=

)

Tần số các nucleotide là giống nhau.

Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA là theo mô hình Jukes Cantor

trong trường hợp tốc độ thay thế không thay đổi theo vị trí (rate uniformity among sites) là:

Hình Sơ đồ mô hình thay thế

nucleotide Jukes - Cantor

78

)3

41(log

4

3 d pe

Trong đó, p là tỷ lệ các vị trí có nucleotides khác nhau

Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Jukes Cantor

trong trường hợp tốc độ thay thế có thay đổi theo vị trí (rate variation among sites) là:

]1)3

41[(

4

3 d /1 apa

Trong đó, p là tỷ lệ các vị trí có nucleotides khác nhau, a là tham số của phân bố sác xuất

gamma

Mô hình Kimura 2 tham số (Kimura – 2 paameter model)

Đây là một mô hình thay thế phức tạp hơn (nhưng hiện thực hơn). Nó có các giả thiết sau:

Tốc độ thay thế nucleotide là không giống nhau cho tất cả 4 loại nucleotide (A, T, G,

C). Tốc độ thay thế đồng hoán vị (transition) giữa các purin (A <=> G) hoặc giữa các

pyrimidin (C <=> T) là giống nhau (= ) nhưng khác tốc độ thay thế dị hoán vị

(transvergen) giữa 1 purin và 1 pyrimidin (A hoặc G <=> C hoặc T) (=β).

Tần số các nucleotide là giống nhau.

Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Kimura 2 tham

số trong trường hợp tốc độ thay thế không thay đổi theo vị trí (rate uniformity among sites) là:

)w(log4

1)w(log

2

1 d 21 ee

Trong đó, W1 = 1- 2P – Q và W2 = 1-2Q, với P tần số các vị trí có thay thế đồng hoán vị

(transition) và Q là tần số các vị trí có thay thế dị hoán vị (transversion).

Công thức tính khoảng cách di truyền (d) giữa 2 chuỗi DNA theo mô hình Kimura 2 tham

số trong trường hợp tốc độ thay thế có thay đổi theo vị trí (rate variation among sites) là:

Hình Sơ đồ mô hình thay

thế nucleotide Kimura 2

tham số

79

a aa

2

3)W(

2

1)W(

2 d /1

2

/1

1

Trong đó, W1 = 1- 2P – Q và W2 = 1-2Q, với P tần số các vị trí có thay thế đồng hoán vị

(transition) và Q là tần số các vị trí có thay thế dị hoán vị (transversion), a là tham số của

phân bố sác xuất gamma.

4.3.3 Ví dụ tính khoảng cách di truyền dựa trên 5 chuỗi 16S RNA vi khuẩn dùng phần

mềm MEGA

Mở phần mềm MEGA

Dùng tùy chọn ―Convert to MEGA format‖ để chuyển số liệu chuỗi DNA của file Clustal

(có đuôi .aln) thành số liệu mà chương trình MEGA có thể đọc được. Trình tự là:

Trong ―File‖, chọn ―Convert to MEGA format‖

Định vị file Clustal (có đuôi .aln) trong folder lưu trữ

Bấm ―OK‖ và chương trình sẽ chuyển các chuỗi trong file sang format MEGA. Bấm

tiếp OK

Chuyển con trỏ xuống cuối file và xóa hết các ký tự không cần thiết gồm 1 ký tự # và

nhiều ký tự * (là các ký tự được tạo ra từ chương trình Clustal X).

Bấm ―save‖ để cất chuỗi. Chương trình sẽ mặc nhận tên file giống như tên file Clustal

nhưng đuôi đã được chuyển thành .meg.

Quay trở lại cửa sổ chính của chương trình MEGA

Trong ―File‖, chọn ―Open‖ để mở file có đuôi .meg

Trong cửa sổ hỏi ―M4: Input Data‖, chọn ―Nucleotide sequences‖ và bấm ―OK‖

Trong cửa sổ hỏi ―Confirm‖, bấm ―No‖ vì các chuỗi 16S rDNA không mã hóa protein.

Chương trình sẽ mở cửa sổ ―M4: Sequence Data Explorer‖: là cửa sổ trình bày các chuỗi

đã được căn trình tự đa chuỗi từ chương trình ClustalX. Đóng cửa sổ này để quay về cửa sổ

chính của chương trình MEGA. Mặc dù đóng cửa sổ này nhưng file MEGA ở trạng thái kích

hoạt (xem ở cuối màn hình) và sẵn sàng cho các phân tích.

Trong cửa sổ chính của chương trình MEGA, chọn ―Distances‖, chọn tiếp ―Computer

pairwire‖ và một cửa sổ ―M4: Analysis Preferences‖ sẽ hiện thị.

Trong cửa sổ ―M4: Analysis Preferences‖, ở cột ―option‖, chọn ―model‖ => ở cột

―selection‖, bấm vào ô xanh lá mạ tương ứng => trong ―nucleotide‖ chọn ‗Kimura 2-

Parameter‖. Các tùy chọn khác để ở chế độ mặc nhận.

Bấm nút ‖Compute‖ để tính khoảng cách. Chương trình sẽ ngay lập tức tính và hiển thị

kết quả khoảng cách di truyền (d) cho từng cặp chuỗi dưới dạng ma trận. Các kết quả này có

thể copy sang một bảng tính Excel để tiện việc biên tập và trình bày.

Dưới đây là kết quả tính toán khoảng cách di truyền. Kết quả này được kết hợp với kết

quả tính mức đồng nhất chuỗi ở trên.

80

Bảng. So sánh trình tự DNA chuỗi 16S rDNA của 5 loài vi khuẩn

Mức đồng nhất chuỗi DNA

Xo-16S-AP008229

Xo-16S-X95921

Dt-16S-AJ864721

Xc-16S-AE00892

Rs-16S-CU914168

Khoảng cách

di truyền (d):

phần phủ đậm

Xo-16S-AP008229 ID 0.969 0.716 0.371 0.371

Xo-16S-X95921 0.000 ID 0.739 0.369 0.368

Dt-16S-AJ864721 0.285 0.285 ID 0.348 0.346

Xc-16S-AE00892 1.277 1.277 1.335 ID 0.833

Rs-16S-CU914168 1.233 1.233 1.328 0.175 ID

Vài bình luận:

Có thể thấy khoảng cách di truyền của 2 mẫu Xo là bằng 0.

Để có được 2 trình tự hiện tại chuỗi Dt và chuỗi Xc đã phải trải qua trung bình 1.335

thay thế (đột biến) / vị trí kể từ khi chúng tiến hóa từ 1 chuỗi tổ tiên chung.

Khoảng cách di truyền không phải = 1- mức đồng nhất (so sánh với công thức D = 1 –

S ở phân tích băng điện di).

5. Xây dựng cây phả hệ

“Chẳng có gì trong sinh học có ý nghĩa ngoại trừ dưới ánh sáng của tiến hóa” -

Dobzhansky (1973). Nhưng tiến hóa cũng có ít ý nghĩa nếu không xây dựng được mối quan

hệ phả hệ.

Nghiên cứu mối quan hệ tiến hóa giữa các sinh vật, các chuỗi gen....có thuật ngữ tiếng

Anh là Phylogenetics (từ này có gốc rễ từ tiếng Hy Lạp: Phylon = tribe/race, genetikos =

relative to birth)

Khi so sánh các chuỗi gen, cần chú ý là các chuỗi gen này có thể cùng nguồn gốc

(homologous) có nghĩa là tiến hóa từ một tổ tiên chung hoặc khác nguồn gốc (analogous) có

nghĩa là tiến hóa từ các tổ tiên khác nhau. Các chuỗi gen cùng nguồn gốc lại được chia làm 2

loại là:

Orthologs là các chuỗi gen hình thành do sự biệt hóa loài dẫn tới chúng xuất hiện ở các

loài khác nhau nhưng có chức năng giống nhau. Loại chuỗi gen này là thích hợp nhất trong

nghiên cứu tiến hóa.

Paralogs là các chuỗi gen tương tự nhau của cùng loài, hình thành do sự lặp lại gen (gene

duplication).

Có 3 phương pháp để xây dựng mối quan hệ phả hệ (phylogenetic) là: maximum

parsimony, maximum likelihood và distance.

5.1. Maximum parsimony

Đây là phương pháp dựa trên đánh giá sai khác nucleotide tại từng vị trí trên chuỗi chứ

không phải dựa trên khoảng cách di truyền Phương pháp sẽ tìm tất cả các cây có thể và đánh

giá các cây này bằng cách cho điểm mỗi cây dựa vào số thay đổi tiến hóa cần có để giải thích

số liệu hiện tại. Cây tốt nhất là cây có tổng số thay đổi tiến hóa (số thay thế nucleotide) ít nhất

đối với tất cả các chuỗi phân tích hiện tại khi tiến hóa từ một tổ tiên chung.

Triết lý: ―cái tốt nhất là cái đơn giản nhất‖

81

Đây là phương pháp phổ biến trong xây dựng cây phả hệ. Phương pháp đặc biệt tốt khi so

sánh các chuỗi có mức tương đồng cao.

Nhược điểm là: (2) phương pháp thường không cho các cây đúng khi so sánh các chuỗi có

mức đa dạng cao; (1) tốc độ phân tích rất chậm.

Vi dụ: Xét 4 chuỗi (1,2,3,4)

Đầu tiên phải thực hiện căn trình tự đa chuỗi

Xác định các vị trí sai khác có ý nghĩa (informative sites). Đây là các vị trí sẽ cho điểm

khác nhau giữa các cây. Cụ thể, chúng ta chỉ xét các vị trí (cột) có ít nhất 2 nucleotide khác

nhau và mỗi nucleotide này xuất hiện ở ít nhất 2 chuỗi. Ví dụ dưới là cột 5 (GGAA), cột 7

(GGCC) và cột 9 (AGAG).

Bốn chuỗi trên sẽ tạo 3 cây không rễ

Xét các cây ở mỗi vị trí sai khác có ý nghĩa (cột 5, 7, 9, hình dưới đặt lại là cột 1, 2, 3) và

cho điểm (số thay thế). Có thể thấy cây số 1, 2 và 3 sẽ có tổng số thay thế nucleotide lần lượt

là 4, 5, 6. Như vậy cây số 1 giải thích tốt nhất mối quan hệ của 4 chuỗi.

82

5.2. Maximum likelyhood

Là một phương pháp thống kê chính xác nhất.

Yêu cầu một mô hình thay thế rõ ràng (giống như phương pháp khoảng cách)

Giống phương pháp parsimony ở chỗ đánh giá cây cũng dựa trên các vị trí nucleotide.

Đối với mỗi một cây, độ dài cành được kiểm định theo mô hình thay thế và các tham số

lựa chọn.

Xác xuất của một cây là tích tỷ lệ đột biến của mỗi nhánh. Cây đúng nhất là cây có xác

xuất lớn nhất (có khả năng nhất).

Phương pháp yêu cầu mức độ tính toán rất cao dẫn tới là một trong các phương pháp xây

dựng cây chậm nhất.

Phương pháp thường chỉ được áp dụng cho các phân tích có số lượng chuỗi ít (và độ dài

chuỗi ngắn) hoặc có thể được sử dụng để kiểm tra một cây phả hệ được xây dựng bằng các

phương pháp khác.

5.3. Phương pháp khoảng cách (Distance)

Phương pháp khoảng cách là phương pháp xây dựng cây dựa vào khoảng cách di truyền

giữa các cặp chuỗi (xem phần tính khoảng cách di truyền).

Có 2 phương pháp khoảng cách phổ biến là phương pháp liên kết lân cân (NJ, Neighbor –

Joining) và phương pháp ghép cặp chuỗi dùng khoảng cách trung bình số học ngang bằng

(UPGMA, Unwaited Pair Group Method using Arithmetic Averages).

Các phương pháp khoảng cách đều dựa trên nguyên lý tiến hóa tối thiểu (minimum

evolution). Cây tốt nhất là cây tiến hóa tối thiểu có nghĩa nó tổng độ dài cành (khoảng cách di

truyền) nhỏ nhất

5.3.1 Phương pháp UPGMA

Là phương pháp đơn giản nhất trong số các phương pháp xây dựng cây phả hệ dựa trên

khoảng cách.

Phương pháp sẽ tạo ra một cây không rễ.

83

Điểm yếu nhất nhất của phương pháp là thuật toán của phương pháp dựa trên giả thiết là

tốc độ tiến hóa của các chuỗi giống nhau (giả thuyết đồng hồ sinh học) mà điều này thường

không đúng đối với các số liệu sinh học. Do vậy trong phân tích chuỗi DNA hay protein,

chúng ta không nên dùng phương pháp UPGMA.

5.3.2 Phương pháp NJ

Phương pháp NJ là phương pháp phổ biến nhất trong xây dựng cây phả hệ dựa trên các

các chuỗi DNA/protein. Phương pháp có các đặc điểm sau:

Không dựa trên giả thuyết đồng hồ sinh học

Tạo ra một cây không rễ

Khoảng cách di truyền có tính cộng (additivity) có nghĩa khoảng cách giữa bất kỳ 2 nodes

bằng tổng chiều dài các cạnh dẫn tới chúng.

Cây được xây dựng bằng cách tìm một cặp chuỗi lân cận mà chúng giảm thiểu độ dài của

cây.

Các bước có thể được minh họa qua ví dụ sau:

Ví dụ cách xây dựng cây dùng phương pháp NJ

Giả sử chúng ta có 4 chuỗi A, B, C, D với khoảng cách di truyền đã được tính trước. Các

bước để xây dựng cây phả hệ gồm:

Bước 1. Tính khoảng cách

n

ij

ij

in

du

2 cho mỗi chuỗi trong đó n là số chuỗi trong ma

trận khoảng cách

Bước 2. Lấy một cặp chuỗi (lá) i và j sao cho khoảng cách của chúng dij – ui – uj là nhỏ

nhất (nếu chúng bằng nhau thì lấy ngẫu nhiên). Trong ví dụ này, chúng ta chọn cặp AB với

giá trị dAB = -21

Bước 3. Nối các lá A và B với 1 node v1. Tính độ dài các cạnh từ A tới v1 và từ B tới v1

A B C D Bước 1: tính ui

A 0 8 7 12 =(8+7+12)/(4-2) = 13,5

B 8 0 9 14 =(8+9+14)/(4-2)=15,5

C 7 9 0 11 =(7+9+11)/(4-2)=13,5

D 12 14 11 0 =(12+14+11)/(4-2)=18,5

A B C D

A 0 8 7 12

B 8-(13,5+15,5)=-21 0 9 14

C 7-(13,5+13,5)=-20 9-(15,5+13,5)= -20 0 11

D 12-(13,5+18,5)=-20 14-(15,5+18,5)=-20 11-(13,5+18,5)=-21 0

84

32

5,155,13

2

8

2

)(

2

BAAB

A

uudv

52

5,135,15

2

8

2

)(

2

ABAB

B

uudv

Bước 4. Tính khoảng cách từ node v1 tới các lá còn lại (C, D)

92

81412

2

)(

42

897

2

)(

),(

),(

ABBDADDAB

ABBCACCAB

dddd

dddd

Bước 5. Xóa A và B khỏi ma trận khoảng cách và thay chúng bằng cụm AB

Bước 6. Lặp lại bước 1

AB C D Bước 1 (lặp lại) = ui

AB 0 4 9 (4+9)/1=13

C 4 0 11 (4+11)/1=15

D 9 11 0 (9+11)/1=20

Bước 7. Lặp lại bước 2. Trong ví dụ này là lá C (lá D cũng được vì chúng đều có giá trị =

-24)

AB C D

AB 0 4 9

C 4-(13+15)=-24 0 11

D 9-(13+20)=-24 11-(15+20)=-24 0

Bước 8. Lặp lại bước 3. Nối lá C và node v1 với một node mới v2. Tính độ dài các cạnh

từ C tới v2 và từ v1 tới v2.

v1

B 5

3 A

85

3

2

1315

2

4

22

12

1513

2

4

2

)(

21

ABCABCC

CABABC

uudv

uudv

Bước 9. Lặp lại bước 4. Tính khoảng cách từ node v2 tới lá D còn lại

82

4119

2

)(),(

ABCCDABD

DABC

dddd

Bước 10. Lặp lại bước 5. Xóa A, B và C khỏi ma trận khoảng cách và thay chúng bằng

cụm ABC.

Bước 11. Vì chỉ còn 2 node còn lại nên ta chỉ việc nối chúng lại và được một cây NJ

5.4. Ví dụ xây dựng cây phả hệ của chuỗi các chuỗi 16S RNA vi khuẩn dùng phần mềm

MEGA

Mở chương trình MEGA

Trong cửa sổ ―open data‖, mở file chứa 5 chuỗi đã được căn trình tự đa chuỗi và đã được

chuyển sang định dạng của chương trình MEGA (file có đuôi .meg)

ABC D

ABC 0 8

D 8 0

v1

B 5

3 A

v2

C

1

3

D 8

v1

B 5

3 A

v2

C

1

3

86

Trong tùy chọn ―phylogeny‖, chọn ―Contruct phylogeny‖ và chọn tiếp ―Neighbor-Joining

(NJ)‖ và một cửa sổ ―M4: Analysis Preferences‖ sẽ hiện thị.

Trong cửa sổ ―M4: Analysis Preferences‖:

Ở cột ―option‖, chọn ―model‖ => ở cột ―selection‖, bấm vào ô xanh lá mạ tương ứng =>

trong ―nucleotide‖ chọn ‗Kimura 2-Parameter‖.

Ở cột ―option‖, chọn ―Test of phylogeny and option‖, bấm vào ô xanh lá mạ tương ứng

=> chọn ―Boostrap‖ với ―replications‖ được chỉnh lên 1000. Chọn các tùy chọn này, chương

trình sẽ tính giá trị boostrap với số lần lặp lại =1000.

Các tùy chọn khác để ở chế độ mặc nhận.

Bấm nút ‖Compute‖ để xây dựng cây phả hệ. Chương trình sẽ ngay lập tức tính và hiển

thị 1 cây phả hệ. Chương trình có rất nhiều tùy chọn để trình bày cây.

Dưới đây là một dạng cây từ kết quả trên.

Hình. Cây phả hệ đối với các chuỗi 16S RNA của 4 loài vi khuẩn. Cây được xây dựng từ

các chuỗi được căn trình tự đa chuỗi bằng phầm mềm Clustal. Khoảng cách di truyền được

tính dựa trên mô hình thay thế Kimura 2 tham số. Cây được xây dựng bằng phương pháp

khoảng cách Neighbor-Joining. Thanh bar trình bày khoảng cách di truyền (số thay thế

nucleotide / vị trí). Các số in đậm là giá trị boostraps tính theo % (1000 lần lặp) và chỉ hiển thị

các giá trị có boostrap >50%.

Xo-16S-AP008229

Xo-16S-X95921

Dt-16S-AJ864721

Xc-16S-AE00892

Rs-16S-CU914168

99

100

0.0000

0.0000

0.1809

0.1030

0.0716

0.1046

0.4925

0.5704

0.1

87

Chương 6. Công nghệ microarray (chip gen)

1. Giới thiệu

Tới nay, một số lượng khổng lồ các gen của nhiều đối tương sinh vật đã được giải trình tự

và chúng ta đang ở thời kỳ hậu genome. Microarray, với khả năng đánh giá đồng thời hàng

chục ngàn gen chỉ trên một lam kính, đang trở thành một công cụ quan trọng trong nghiên cứu

sinh học.

Công nghệ microarray đã được phát triển đầu tiên bởi Schena et al. (1995) nhằm kiểm tra

sự biểu hiện đồng thời của nhiều gen (45 gen) trên cây Arabidopsis.

Nguyên lý của công nghệ microarray khá đơn giản: dựa vào lai hóa DNA:DNA ở mật độ

cao. Microarray DNA (còn gọi là chip gen, chip DNA…) bao gồm một số lượng lớn các phân

tử DNA (gọi là dò) được phân bố thành hàng trên một diện tích rất nhỏ của một giá đỡ

(thường là lam kính). Các chuỗi cần phát hiện như mRNA, virus (gọi là mục tiêu) được gán

nhãn với chất phát huỳnh quang. Sau khi được lai hóa với dò, các chuỗi mục tiêu được phát

hiện và lượng hóa nhờ huỳnh quang được phát xạ bởi tia laser (hình).

Viruses: PVYN, PVS-O,

PVS-A, PVA, PVX

PVY + PVX

cDNA được

gán nhãn Cy3

Cy3 Scan microarray

Cy3 được kích hoạt

bằng tia laser (532 nm)

Tạo dò:

RT-PCR bằng mồi

chung và mồi đặc hiệu Gán nhãn cDNA (mục tiêu)

- Tạo cDNA dùng hỗn hợp

dCTP và Cy3-dCTP

Hybridization

Fluorescence emission

Số liệu:

Cường độ huỳnh

quang Dò

Tạo microarray

- In dò dung robot - Cố định dò bằng UV

- Khóa các vị trí còn lại

- Biến tính dò ở 95OC

Lam kính được

phủ với poly-

lysine

Microarray

Một đốm của microarray

Hình. Sơ đồ chẩn đoán các virus hại khoai tây dùng công nghệ microarray.

Các bước chính được in đậm và gạch chân (Boonham et al., 2003)

88

2. Các loại microarray DNA

Dựa trên độ dài và nguồn gốc dò, người ta chia microarray làm 3 loại:

2.1. Microarray với các dò oligonucleotide ngắn

Loại microarray này sử dụng các dò oligonucleotide ngắn với kích thước khoảng 20

nucleotide. Các dò này thường được tạo ra bằng công nghệ in quang (photolithography). Ví

dụ ―chip gen‖ của công ty Affymetrix chứa trung bình 20 đoạn ngẫu nhiên có chiều dài 25

nucleotide của mỗi gen nghiên cứu.

2.2. Microarrays với dò oligonucleotide dài

. Các dò điển hình có kích thước 40 – 80 nucleotide và thường được sử dụng với

microarray có mật độ dò thấp (chỉ chứa vài trăm dò khác nhau). Microarray loại này dùng kỹ

thuật in phun (spotting) để cố định dò do giá tổng hợp dò khá cao và công ty Afimetrix đang

giữ bản quyền công nghệ cố định dò oligonucleotide ngắn. Ví dụ dò loại này là một

microarray do Wang et al. (2002) thiết kế gồm 1600 dò oligonucleotide, mỗi dò có kích thước

khoảng 70 nucleotide dùng để phát hiện nhiều loại virus trên người.

2.3. Microarrays với dò cDNA

Các dò có kích thước 50-5000 bp (http://www.gene-chips.com/) được tao ra từ các sản

phẩm clon, PCR. Microarray loại này thường dùng kỹ thuật in phun để cố định dò trên giá đỡ.

3. Các phương pháp cố định dò trong microarray DNA

Có 2 phương pháp chế tạo microarray chính

3.1. Tổng hợp trực tiếp ngay trên giá đỡ (in situ)

Phương pháp này chỉ áp dụng để tổng hợp các dò oligonucleotide ngắn và tạo ra các chip

microarray có mật độ dò cao. Phương pháp này kết hợp 2 kỹ thuật là in quang

(photolithography) và tổng hợp DNA trên pha rắn. Các bước, theo Lipshutz et al.(1999) như

sau:

Cố định linker có nhóm bảo vệ ở một đầu vào bề mặt của một giá đỡ (thường là lam kính).

Nhóm bảo vệ có thể bị loại bỏ bằng một phản ứng quang hóa.

Chu trình tổng hợp đầu tiên gồm 2 bước: (1) Loại bỏ nhóm bảo vệ và hoạt hóa các vị trí

chọn lọc bằng ánh sáng. (2) Ủ các deoxynucleotide có nhóm hydroxyl được bảo vệ. Hậu

quả liên kết hóa học giữa linker được loại bỏ nhóm bảo vệ và dNTPs được bảo vệ sẽ xuất

hiện tại các vị trí chọn lọc.

Chu trình sẽ lặp lại để liên kết các dNTPs cũ bị loại bỏ nhóm bảo vệ với các dNTP mới

(được bảo vệ) cho tới khi đạt được kích thước của oligonucleotide. Ví dụ để tạo một chip

với các oligonucleotide có kích thước N thì cần 4xN chu trình.

Phương pháp này có thể tổng hợp khoảng 300000 đốm dò oligonucleotide trên một diện

tích 1.28x1.28 cm. Các chip mới nhất có thể có 450000 đốm dò để phân tích hơn 20000 gen.

Tuy nhiên phương pháp này rất phức tạp về mặt kỹ thuật và do công ty Affimetrix giữ bản

quyền. Do vậy phương pháp này nhìn chung không phổ biến trong các cơ sở nghiên cứu đại

học.

3.2. Tạo microarray bằng spotting

Để tự chế tạo các microarray, người ta có thể sử dụng các thiết bị tự động gọi là arrayer

(tự chế tạo hoặc có bán tại một số hãng như OmniGrid hay TeleChem. Các thiết bị này sử

89

dụng các tube mao dẫn + thiết bị in phun hoặc các kim rắn để cố định (in, chấm) dung dịch dò

lên bề mặt giá đỡ (thường là lam kính) đã được phủ chất gắn kết trước. Phần lớn các thiết bị

tạo chip dùng các kim thép nhọn cõ rãnh để chuyển dịch dò. Ví dụ, Cheung et al (1999) đã sử

dụng một arayer (AECOM arrayer) để tạo chip. AECOM arrayer là một thiết bị điều khiển tự

động bằng máy tính, có 12 kim bằng thép (đường kính 1.6 mm thót nhọn ở đầu với đường

kính khoảng 100µm diameter). Mỗi kim có thể hút 250-500 nl dung dịch dò DNA và cố định

0.25-1 nl /chấm với đường kính 100-150 µm.

Ba loại dung dịch thường dùng để pha dò DNA là 50%DMSO, 3xSSC, hoặc đệm

phosphate. Tuy nhiên DMSO thường được ưa thích hơn vì (1) nó không bị khô trong quá

trình chế tạo chip, thường phải mất nhiều giờ và (2) tạo các chấm dò khá đồng nhất.

4. Gán nhãn dò

Đối với một thử nghiệm microarray điển hình, chuỗi mục tiêu, thường là dạng cDNA, sẽ

được gán nhãn huỳnh quang trước khi lai. Nhiều loại nhãn huỳnh quang đã được được thử

nghiệm nhưng 2 nhãn phổ biến nhất trong công nghệ microarray là Cy3 và Cy5. Đây là 2 chất

cyanin có khả năng hòa tan trong nước. Cặp thuốc nhuộm này được ưa thích hơn các loại

thuốc nhuộm huỳnh quang khác vì (theo Amesharm‘s microarray handbook):

Chúng có tính ổn định quang hóa cao hơn

Chúng sáng hơn, do vậy tạo dấu hiệu huỳnh quang mạnh hơn.

Ít bị ảnh hưởng bởi các yếu tố như pH và sự có mặt của DMSO

Có thể chịu nhiệt độ cao.

Có khả năng tách phổ tốt có nghĩa mỗi thuốc nhuộm phát huỳnh quang ở các bước song

khác nhau (điển hình 532nm đối với Cy3 và 633nm đối với Cy5). Nhờ vậy, sự phát huỳnh

của chúng có thể được phát hiện đồng thời. Đây là đặc tính quan trọng cho phép các thử

nghiệm gán nhãn kép trong nghiên cứu biểu hiện gen.

Có 3 phương pháp gán nhãn DNA mục tiêu

4.1. Gán nhãn trực tiếp

Trong phương pháp này, cDNA được gán nhãn trực tiếp bằng cách bổ sung một lượng

nucleotide liên kết nhãn huỳnh quang (ví dụ Cy3-dCTP, Cy3-dUTP) vào thành phần tổng

hợp cDNA. Hạn chế của kỹ thuật này là nửa thuốc nhuộm của phức hợp nucleotide – thuốc

nhuộm huỳnh quang khá cồng kềnh dẫn tới hiệu quả tổng hợp cDNA kém hơn so với dùng

dNTPs tự nhiên.

4.2. Gán nhãn gián tiếp

Ở phương pháp này, nhãn được gán sau khi tổng hợp cDNA. Trong quá trình tổng hợp

cDNA, người ta bổ sung và hỗn hợp phản ứng một dẫn xuất amin hoạt hóa của dUTP gọi là 5,

(3-aminoallyl)-2‘-deoxyuridine 5‘-triphosphate (cũng được gọi là amino-allyl dUTP). Kết quả

là cDNA hình thành chứa amino-allyl UTPs và tiếp theo được liên kết với Cy3 hoặc C5 dyes

(Manduchi et al., 2002).

Mặc dù hiệu quả gán nhãn của phương pháp gián tiếp cao hơn phương pháp trực tiếp thì

cả 2 phương pháp đều có một nhược điểm là số phân tử thuốc nhuộm được tổng hợp vào

cDNA phụ thuộc trình tự của cDNA; do vậy không thể lượng hóa được số cDNA liên kết vào

dò nếu chỉ dựa vào cường độ phát huỳnh quang (Manduchi et al., 2002).

90

4.3. Gãn nhãn dùng dendrimer

Stears et al., (2000) đã phát triển một kỹ thuật gán nhãn huỳnh quang mới gọi kỹ thuật

gán nhãn dendrimer. Điểm khác của kỹ thuật dendrimer so với 2 kỹ thuật kể trên là: (1)

cDNA được tổng hoàn dùng dNTPs tự nhiên, (2) mồi oligodT dùng để tổng hợp cDNA chứa

một chuỗi ―bẫy‖ ở đầu 5‘ tương đồng với chuỗi dendrimer, và (3) việc phát hiện cDNA liên

kết vào array được thực hiện qua một bước lai bổ sung giữa chuỗi ―bẫy‖ và các phân tử

dendrimer gán nhãn huỳnh quang.

Kỹ thuật dendrimer có nhiều ưu điểm: (1) nhậy hơn vì yêu cầu ít vật liệu RNA khởi đầu

hơn (16 lần) để tổng hợp cDNA, (2) cho phép lượng hóa số lượng cDNA liên kết vào array,

và (3) tạo ―phông‖ thấp hơn cũng như tỷ số dấu hiệu ổn định /‖phông‖ cao hơn.

Tuy nhiên, nhược điểm của kỹ thuật dendrimer là phức tạp và tốn thời gian để tổng hợp

dendrimer – một cấu trúc phân nhánh của olygonucleotide.

5. Vật liệu để cố định dò

Vật liệu ưa thích và phổ biến nhất để tạo microarray là lam kính do nó có nhiều ưu điểm

hơn so với nilon hay các vật liệu khác (Cheung et al., 1999):

Không bị biến dạng nên dễ cố định dò tự động => cho phép tạo các microarray mật độ dò

cao.

Bền, chịu được nhiệt độ cao và nồng độ ion cao (ở các bướ rửa)

Là vật liệu không chứa lỗ (khác với các vật liệu màng dùng trong các kỹ thuật lai phân tử)

nên giảm thể tích dung dich lai và tăng hiệu quả lai.

6. Các phương pháp gắn dò vào lam kính

Trước khi cố định dò vào lam kính, bề mặt lam kính cần phải được phủ một lớp vật liệu

đặc biệt.

Vật liệu phổ biến và kinh tế nhất là poly-L-lysine. Chất này sẽ liên kết phi hóa trị vào bề

mặt lam kính qua các gốc amine của lysine. Các gốc amin cũng cung cấp các nhóm tích điện

dương để tạo các liên kết tĩnh điện với các nhóm chứa phosphate (tích điện âm) của DNA.

Ngoài ra, các gốc amine cũng tạo liên kết hydro với DNA. Một trong các ưu điểm của poly-L-

lysine là nó tao bề mặt ghét nước dẫn tới quá trình cố định (in) dò dễ dàng hơn. Tuy nhiên,

nhược điểm của poly-L-lysin là không bền sau nhiều tháng bảo quản.

Vật liệu phổ biến thứ hai là amine-silane. Chất này liên kết hóa trị vào bề mặt thủy tinh,

và tương tự như polylysine, nó cung cấp nhóm amine tích điện dương ở pH trung tínhcho

phép hình thành các liên kết ion với các nhóm phosphate tích điện âm của DNA. Quá trình cố

định được hỗ trợ bằng xử lý UV hay nhiệt nhằm tạo ra các liên kết hóa trị giữa nhóm amin

của silane và gốc thymine (T) của DNA.

Loại vật liệu thứ ba là aldehyde-silane. Vật liệu này liên kết đồng hóa trị vào bề mặt lam

kính. Phân tử amin bậc một (linker) NH2 của DNA tấn công nhóm aldehyde của silane để

hình thành liên kết đồng hóa trị. Quá trình liên kết được ổn định nhờ phản ứng khử nước (làm

khô ở điều kiện ẩm độ thấp) dẫn tới hình thành Schiff base (-CHN-).

Hiệu quả cố định DNA lên lam được tăng cường nhờ sử dụng hỗn hợp 2 silane 2 silane

(N,N-diethyl-3-amino-propyl) trymethoxysilane (một amine-silane bậc 3) và (3-glycidyl-

oxypropyl) trimethoxysilane (một epoxy-silane) (Chiu et al., 2003). Dùng 2 silane này ở tỷ lệ

1/1 thấy (1) 1% của mỗi silane trong hỗn hợp tạo kết quả cố định tối đa, (2) có ảnh hưởng

cộng hợp của 2 silanes lên quá trình cố định và lai hóa về sau, (3) microarray có thể tái sử

dụng ít nhất 3 lần mà không làm giảm đáng kể hiệu quả lai hóa, (4) không cần xử lý (cross-

91

linking) bằng UV mà chỉ cần ủ ở 42oC / 25 giờ, (5) hiệu quả cố định DNA tốt hơn so với dùng

poly-L-lysine, 3D polymer và chỉ amine-silane, và (6) tạo tỷ lệ dấu hiệu/ nhiễu cao nhất.

7. Ứng dụng microarray DNA

Công nghệ microarray có thể được áp dụng vào 2 lĩnh vực chính:

7.1. Nghiên cứu biểu hiện gen “gene expression profiling”

Nguyên lý đằng sau ―gene expression profiling‖ là ở chỗ một gen thường chỉ phiên mã

(transcribed) đúng nơi (loại tế bào) và đúng lúc mà chức năng của nó yêu cầu. Về mặt kỹ

thuật, mức độ biểu hiện của hàng chục ngàn gen tương ứng với một trạng thái sinh lý của một

sinh vật có thể được phát hiện và lượng hóa chỉ với một lần thử microarray.

Do vậy ―gene expression profiling‖ trong bệnh cây có thể được sử dụng để:

a) Phân tích sự tương tác giữa tác nhân gây bệnh và ký chủ qua thử microarray cả tác nhân

gây bệnh và ký chủ.

b) Phân tích phản ứng phòng thủ cây. Ví dụ, dùng microarray, Schenk et al., (2000) đã

phát hiện thấy thay đổi mức độ phiên mã của 2375 ETS của cây Arabidopsis sau khi được

lây nhiễm với loại nấm không tương hợp là Alternaria brassicicola hoặc sau khi được xử

lý với Salicylic acid (SA), methyl jasmonate (MJ) hay ethylene (các chất cảm ứng tính

kháng tập nhiễm hệ thống SAR). Trong số này, 705 gen có mức độ biểu hiện >= 2.5 lần so

với đối chứng (106 gen chưa hề được mô tả trước đó).

c) Chẩn đoán. Vì một ―gene expression profile‖ phản ánh một trạng thái bệnh lý của cây bị

bệnh do tác nhân sinh vật hoặc môi trường nên ngườ ta có thể dùng hồ sơ biểu hiện gen

để chẩn đoán cả bệnh truyền nhiễm và bệnh không truyền nhiễm.

8. Chẩn đoán và nghiên cứu kiểu gen (genome typing)

Do bản chất đa mục tiêu của microarray kết hợp với một số lượng lớn các tác nhân gây

bệnh đã được giải trình tự toàn bộ hoặc từng phần nên microarray đang trở thành một công cụ

chẩn đoán bệnh tuyệt vời.

Áp dụng ấn tượng nhất trong lĩnh vực chẩn đoán là công trình của Wang et al. (2002) với

đối tượng là các virus gây bệnh trên người. Bộ gen của một họ virus hại người được chia

thành các đoạn dài 70 nucleotides gối lên nhau khoảng 25 nucleotides. Sau khi so sánh chuỗi,

các đoạn đặc hiệu cho họ và chi đã được lựa chọn. Bằng cách này, các tác giả đã thiết kế một

microarray chứa 1600 chuỗi oligonucleotides dài 70 nucleotides được lấy từ khoảng 140 bộ

gen virus riêng biệt bao gồm cả các virus DNA sợi đơn, sợi kép lẫn các virus RNA cực (+),

cực (-). Các virus được phát hiện và xác định entero-, rhino-, adeno-, orthomyxo-, nido-,

retro-, hepadna- and papillomaviruses..

Tương tự, microarrays cũng đã được dùng để phát hiện các virus gây bệnh cây. Một số ví

dụ là microarrays để phát hiện và xác định các virus khoai tây (Boonham et al., 2003) như

potexvirus (PVX) và 3 potyviruses (PVY, PVS, PVA) kể cả 2 chủng PVS (PVS-O, PVS-A)

và 3 chủng PVY (PVYO, PVY

N, PVY

NTN). Các dò này được tạo ra bằng PCR có kích thước

700 - 1200 nucleotides. Kết quả lai hóa với cDNA virus được gán nhãn Cy3 cho thấy

microarray này có thể phát hiện và xác định các virus ở mức loài và chủng (nếu mức tương

đồng đoạn lai hóa nhỏ hơn 80%.

Ví dụ 2 là microarray cũng để phát hiện đồng thời nhiều virus khoai tây là Potato virus A

(PVA), Potato virus S (PVS), Potato virus X (PVX), Potato virus Y (PVY), Potato mop top

virus (PMTV) và Potato leaf roll virus (PLRV). Tuy nhiên, một điểm khác là cả chuỗi dò và

chuỗi đích của một virus đều được tạo ra bằng cùng bộ mồi. Điều này tạo điều kiện để phát

92

hiện PLRV và PMTV vì chúng không có chuỗi poly A ở đaauf 3‘ của bộ gen (Bystricka et al.,

2003)

Tương tự, Lee et al., (2003) đã phát triển một microarray để phát hiện và phân biệt 4

tobamoviruses nhiễm trên cây bầu bí là Cucumber green mottle mosaic virus (CGMMV),

Cucumber fruit mottle mosaic virus (CFMMV), Kyuri green mottle mosaic virus (KGMMV)

and Zucchini green mottle mosaic virus (ZGMMV).

93

Chương 7. Công nghệ RNA interference

1. Lịch sử phát hiện

1.1. Hiện tượng đồng ức chế

Hiện tượng RNAi đã được quan sát thấy đầu tiên trên thực vật vào năm 1990 bởi Napoli

et al. trên cây hoa dã yên thảo (Petunia hybrid, họ cà). Để tăng cường độ đậm của hoa (vốn có

màu tím), các tác giả đã chuyển thêm gen chalcone synthase (chsA), một gen chịu trách nhiệm

tạo sắc tố anthocianine của hoa. Kết quả, thay vì nhận được hoa có màu đậm hơn, các tác giả

chỉ thu được các cây có màu sắc hoa nhạt hơn, từ nhạt từng phần tới hoàn toàn trắng. Các tác

giả đã không thể xác định được nguyên nhân mặc dù phát hiện thấy hàm lượng mRNA của cả

gen chsA được chuyển lẫn gen chsA nội tại đều giảm và gọi hiện tượng này là đồng ức chế

(co-suppression).

1.2. Hiện tượng chế ngự (quelling)

. Ngay sau đó, một hiện tượng ức chế tương tự cũng được quan sát thấy trên nấm

Neurospora crassa (Romano và Macino, 1992). Các tác giả đã chuyển gen albino-3 (al-3) và

albino-1 (al-1) chịu trách nhiệm tổng hợp carotenoid vào nấm N. crassa và đã quan sát thấy

tới 36 % cá thể chuyển gen biểu hiện màu sắc tản nấm là màu trắng (kiểu hình hoang dại có là

màu vàng sáng). Như vậy ở các cá thể màu trắng này, gen al đã không được biểu hiện. Các

tác giả gọi hiện tượng này là chế ngự (quelling).

1.3. Hiện tượng câm gen cảm ứng bởi virus

Trong cùng thời gian, các nhà virus học thực vật đã áp dụng kỹ thuật gọi là tính kháng từ

tác nhân gây bệnh (PDR, pathogen derived resistance) để tạo giống chuyển gen kháng bệnh

virus. Lúc đầu, họ cho rằng tính kháng là do protein virus được biểu hiện trong cây gây ra,

nhưng về sau họ quan sát thấy nếu cây được chuyển các đoạn genvirus ngắn lấy ở vùng không

mã hóa cũng tạo ra tính kháng hay chịu bệnh virus. Các nhà virus học phát hiện thấy RNA

hình thành từ gen chuyển (gen virus) có thể ức chế gen virus xâm nhiễm. Hiện tượng này

được gọi là ―sự câm gen cảm ứng bởi virus‖ (virus-induced gene silencing, VIGS) (Covey và

CS, 1997).

1.4. RNA Interferrence

Năm 1998, Craig Mello và Andrew Fire (và 4 tác giả khác) đã công bố trên tạp chí

Nature một công trình nghiên cứu nhằm tìm hiểu vai trò của RNA đến sự biểu hiện gen. Các

tác giả đã sử dụng một số gen của tuyến trùng Caenorhabditis elegens như unc-22 (mã hóa

protein myofilament có nhiều nhưng không cần thiết), unc-54 (mã hóa protein myosin liên

quan đến co cơ), fem-1(mã hóa protein chứa ankyrin liên quan đến sinh sản), hlh-1 (mã hóa

protein họ myoD cần cho di chuyển và biệt hóa hình dạng), và mex (mã hóa cho 1 protein có

nhiều ở phôi). Ba phát hiện quan trọng từ công trình này là

Các đoạn dsRNA tương ứng với vùng intron hoặc promoter không tạo ra hiện tượng câm

(silencing) của gen tương ứng. Như vây sự can thiệp (interfering) của RNA là ở mức hậu

phiên mã (post-transcriptional level).

Khi tiêm các RNA ở dạng cùng chiều (sense) hay ngược chiều (antisense) vào tuyến trùng

đã không ảnh hưởng tới lượng mRNA của gen tương ứng tức không làm ảnh hưởng tới sự

biểu hiện của gen. Tuy nhiên khi tiêm các RNA ở dạng sợi kép dsRNA (hỗn hợp của

RNA cùng chiều và ngược chiều) đã làm câm (silence) gen tương ứng. Như vậy hiện

tượng câm gen (gene silencing) được thực hiện thông qua trung gian là RNA sợi kép

(dsRNA).

94

Khi tiêm dsRNA vào một vị trí thì hiện tượng câm gen xuất hiện ở các vị trí khác trong cơ

thể tuyến trùng. Như vậy dấu hiệu câm gen có thể di truyển hệ thống.

Hiện tượng câm gen do dsRNA đã được các tác giả đặt tên là RNA interfering (sự can

thiệp của RNA). Vì nghiên cứu này, Craig Mello và Andrew Fire đã được trao giải Nobel y

học năm 2006.

2. Small interfering RNA (siRNA) và microRNA (miRNA)

2.1. miRNAs - khám phá

Năm 1991, Lee và CS đã phát hiện thấy gen lin4 (điều khiển thời điểm lột xác của tuyến

trùng C. elegans) đã không tạo ra protein Lin4 mà hình thành 2 loại phân tử RNA có kích

thước 22 và 61 nts. Phân tử RNA lớn (61 nts) đã gấp lại thành cấu trúc kẹp tóc và là tiền chất

để tạo phân tử RNA nhỏ (22 nts). Phân tử RNA nhỏ 22 nts đã liên kết tại nhiều vị trí trên

vùng 3‘UTR của mRNA của gen lin14 dẫn tới hậu quả là lượng protein lin14 giảm đáng kể

(nhưng lượng mRNA không thay đổi).

Cho tới nay, hàng ngàn phân tử RNA nhỏ có kích thước khoảng 22 nts (21 – 28 nts) đã

được phát hiện thấy ở nhiều sinh vật (thậm chí cả virus) có chức năng điều hòa biểu hiện gen.

Các phân tử này được gọi là các microRNA và miRNA. lin4 là phân tử đầu tiên của nhóm

này. Một cơ sở dữ liệu cho các miRNA đã được phát hiện là:

http://www.sanger.ac.uk/Software/Rfam/mirna/index.shtml).

2.2. miRNAs - định nghĩa

miRNAs là các phân tử RNA sợi đơn nhỏ, kích thước khoảng 22 nts, có chức năng điều

hòa biểu hiện gen, và được hình thành từ một phân tử RNA tiền chất (precursor miRNA).

Phân tử RNA tiền chất có kích thước lớn khoảng 70 nts, có cấu trúc kẹp tóc và được phiên mã

từ vùng không mã hóa của gen.

2.3. miRNAs – nguồn gốc

Ngoại trừ một phần nhỏ gen miRNA (chẳng hạn khoảng ¼ số lượng miRNA của bộ gen

người) nằm ở vùng intron của gen mục tiêu thì phần lớn các gen miRNA nằm ở các vị trí cách

xa gen mục tiêu. Chúng có thể biệt lập hoặc phân bố thành cụm và được phiên mã thành các

đơn vị phiên mã riêng biệt. Như vậy miRNA có nguồn gốc khác với gen mục tiêu.

2.4. miRNAs – sinh tổng hợp

Quá trình tạo ra các phân tử miRNA có thể được tóm tắt qua các bước sau:

Hình thành phân tử phiên mã sơ cấp pri-miRNA (primary transcripts). Đầu tiên, gen mã

hóa miRNA được phiên mã nhờ RNA endonuclepolymerase II (pol II) ở trong nhân thành

các phân tử phiên mã (transcript) có kích thước từ vài trăm tới hàng ngàn nts. Các

transcript này được gọi là các phân tử phiên mã sơ cấp pri-miRNA (primary transcripts)

chứa môt mũ (cap) đầu 5‘ và một chuỗi poly-A đầu 3‘. Pri-miRNA của thực vật thường

dài hơn và phức tạp hơn (chứa nhiều cấu trúc thân – thòng lọng hơn).

Hình thành các phân tử tiền chất pre-miRNA (precusor miRNA). Tiếp theo, các phân tử

pri-miRNA được cắt bởi một RNA endonuclease nhóm III là Dicer (ở động vật là Drosa)

thành các phân tử RNA có kích thước khoảng 70 nts gọi là các phân tử tiền chất pre-

miRNA (precusor miRNA).

Hình thành miRNA thành thục. Có sự khác nhau về vị trí hình thành các phân tử mi thành

thục giữa động vật và thực vật. Ở thực vật, các phân tử pre-miRNA ở trong nhân sẽ được

95

được Dicer cắt thành các phân tử RNA nhỏ sợi kép có kích thước khoảng 22 nts. Do bị cắt

bởi Dicer, các phân tử này có đầu so le với gốc phosphat ở đầu 5‘ và 2-3 phân tử nts đầu

3‘ (overhang). Tiếp theo, phân tử RNA nhỏ sợi kép này được vận chuyển từ nhân ra tế bào

chất. Tại tế bào chất, chúng được tách bởi helicase thành 2 phân tử sợi đơn: một sợi là

phân tử miRNA thành thục (gọi là sợi hướng dẫn) sẽ tham gia hình thành phức hợp RISC;

còn sợi kia sẽ bị phân hủy. Trái lại, ở động vật, các phân tử pre-miRNA sẽ được vân

chuyển ra ngoài tế bào chất để được xử lý tiếp theo thành các phân tử miRNA thành thục.

2.5. siRNAs - khám phá

siRNA đã được khám phá bởi Hamilton và Baulcombe năm 1999. Các tác giả đã chuyển

gen aco, gus vào cây cà chua và thuốc lá. Trên các cây biểu hiện hiện tượng PTGS, các tác

giả đã phát hiện được các phân tử RNA nhỏ, kích thước khoảng 25 nts, đặc hiệu nhưng ngược

chiều với gen chuyển (chứng tỏ không phải là sản phẩm phân hủy của mRNA của các gen

trên). Ngoài ra các tác giả cũng phát phát hiện thấy sau khi lây nhiễm potato virus X (PVX) 4

ngày, trên cây cũng hình thành các phân tử kích thước khoảng 25 nts, đặc hiệu nhưng ngược

nghĩa với PVX.

2.6. siRNAs - định nghĩa

siRNAs là các phân tử RNA sợi kép nhỏ, kích thước khoảng 21-25 nts, được tạo ra bởi

Dicer, một RNA endonuclease nhóm III, là thành phần quan trong của phức hợp RISC gọi là

siRISC có chức năng phân hủy mRNA đồng dạng của nó.

2.7. siRNAs – nguồn gốc

Phần lớn siRNA có nguồn gốc từ mRNAs, các yếu tố di động (transposons), virus hoặc

DNA dị nhiễm sắc thể (heterochromatic DNA). Như vậy siRNA có cùng nguồn gốc với gen

mục tiêu.

2.8. siRNAs – sinh tổng hợp

Quá trình tạo ra các phân tử siRNA có thể được tóm tắt qua các bước sau:

Hình thành phân tử phiên mã sợi kép dài (dsRNA). Đầu tiên là hình thành các sản phẩm

RNA sợi kép. Các sản phẩm sợi kép này có thể là các gen chuyển được thiết kế ngược

chiều nhau, hoặc là các sản phẩm trung gian trong quá trình tái sinh của virus.

Hình thành siRNA thành thục. Các phân tử dsRNA được Dicer cắt thành các phân tử RNA

nhỏ sợi kép có kích thước khoảng 22 nts. Do bị cắt bởi Dicer, các phân tử này có đầu so le

với gốc phosphat ở đầu 5‘ và 2-3 phân tử nts đầu 3‘ (overhang). Tiếp theo, phân tử RNA

nhỏ sợi kép này được được tách bởi helicase thành 2 phân tử sợi đơn. Các phân tử siRNA

thành thục sợi đơn này sẽ tham gia hình thành phức hợp RISC.

3. So sánh miRNA và siRNA

Mặc dù cả 2 loại phân tử can thiệp có kích thước nhỏ này, siRNA và miRNA, được khám

phá riêng rẽ thì chúng đều có quan hệ với nhau về đường hướng hình thành và vai trò sinh

học.

3.1. Giống nhau

Đều là các phân tử RNA sợi kép (hoac don) nhỏ (miRNA = 21-22 bp; siRNA = 21- 25

bp).

96

Đều được tạo ra bởi Dicer (một endonuclease nhóm III). Dicer cắt các sợi dsRNA dài

thành siRNA và cắt tiền chất của miRNA (pre-miRNA) với cấu trúc thân-thòng lọng

không hoàn chỉnh thành miRNA.

Các siRNA và miRNA mới hình thành đều ở dạng sợi kép và trước khi lắp ráp thành

RISC, chúng phải tách ra thành sợi đơn.

Hoạt động của siRNA và miRNA sau khi đã lắp ráp thành phức hợp siRISC và miRISC là

giống nhau: đều nhằm để cắt các RNA sợi đơn mục tiêu.

3.1.1 Khác nhau

Mặc dù giống nhau về tính chất hóa học, sinh hóa và cơ chế hoạt động thì miRNA và

siRNA vẫn có các điểm khác nhau cơ bản về nguồn gốc, đường hướng hình thành, vai trò sinh

học và mức độ bảo thủ về mặt tiến hóa:

miRNAs có nguồn gốc (được mã hóa) tại các vị trí genome khác biệt với gen mục tiêu của

nó. Trái lại, siRNAs có nguồn gốc từ mRNAs, transposons, viruses.

miRNAs được xử lý (cắt) từ các phân tử tiền chất (pre-miRNA) có độ dài và cấu trúc kẹp

tóc khá xác định.. Trái lại, siRNAs được xử lý (cắt) từ các phân tử dsRNA dài hoặc các

cấu trúc kẹp tóc khá dài.

Từ một phân tử pre-miRNA sẽ chỉ tạo một loại phân tử miRNA. Trái lại, một phân tử

dsRNA hoặc một cấu trúc kẹp tóc dsRNA sẽ tạo nhiều phân tử siRNA khác nhau. siRNA

gồm 2 nhóm: (1) nhóm đối xứng với 2 đầu đều có tính ổn định tương đương nên cả 2 sợi

đơn sau khi tách ra đều lắp ráp hiệu quả thành siRISC và (2) nhóm không đối xứng do chỉ

có một đầu ổn định nên chỉ có 1 sợi lắp ráp hiệu quả thành siRISC. Trái lại, phần lớn

miRNA thuộc nhóm không đối xứng => tạo chỉ 1 loại miRISC.

Trình tự miRNA gần như luôn luôn bảo thủ ở các sinh vật có quan hệ với nhau; trái lại

trình tự chuỗi siRNA hiếm khi bảo thủ giữa các sinh vật có quan hệ.

RNA silencing thông qua miRNA là một cơ chế điều hòa gen, đảm bảo sự sinh trưởng và

phát triển của sinh vật. Trái lại RNA silencing thông qua siRNA là (i) một cơ chế phòng

thủ chống virus, (ii) ngăn chặn sự biểu hiện quá mức hoặc không cần thiết của các mRNA,

và (iii) bảo vệ bộ gen khỏi bị gián đoạn bởi transposon

4. Công nghệ RNAi trong tạo giống kháng bệnh virus

4.1. Giới thiệu

Virus là nhóm tác nhân gây bệnh quan trọng ảnh hưởng đến nhiều loại cây trồng khắp hế

giới. Vì virus trong cây không thể bị tiêu diệt trực tiếp bởi các thuốc hóa học nên sử dụng

giống kháng là một trong các chiến lược hiệu quả nhất hiện nay để phòng chống bệnh. Giống

kháng bệnh có thể có được nhờ 2 phương phps chính: (1) tính kháng với nguồn gen kháng từ

cây, và (2) tính kháng từ gen virus.

Tính kháng từ gen virus đã được thử nghiệm từ lâu. Vào năm 1986, Powell-Abel et al. đã

chứng minh rằng biểu hiện gen CP của TMV trên thuốc lá có thể kháng được virus. Ngoài

gene CP, các nhà khoa học đã chuyển nhiều gen virus khác như replicase, vận chuyển,

protease... và đã tạo ra nhiều mức kháng khác nhau (triệu chứng biểu hiện chậm, giảm mức

dữ dội của triệu chứng, miễn dịch).

Đầu tiên, các nhà khoa học cho rằng tính kháng có được là do protein của virus phải được

biểu hiện. Tuy nhiên, nhiều quan sát cho thấy, các cấu trúc chứa gen virus không có khả năng

dịch mã cũng qui định tính kháng (các cấu trúc này vẫn được phiên mã tốt trong nhân nhưng

lượng mRNA của nó ở tế bào chất giảm đáng kể).

97

Như vậy có 2 loại tính kháng nhờ chuyển gen virus là (1) thông qua protein và (2) thông

qua RNA (hay RNAi)

Tạo giống kháng thông qua RNAi có thể đạt được dựa trên siRNA hay miRNA. Đối với

virus thực vật, các nghiên cứu chủ yếu tập trung vào siRNA còn miRNA mới chỉ được chú ý

từ năm 2006.

4.2. Các đặc điểm chính trong công nghệ RNAi dựa trên siRNA

4.2.1 Thiết kế cấu trúc chuyển gen

Đây là bước quan trọng nhất, quyết định thành công của một chương trình tạo giống

kháng thông qua RNAi.

Có 3 cách để thiết kế cấu trúc chuyển gen virus

- Tạo cấu trúc chứa gen đồng nghĩa (sene).

- Tạo cấu trúc chứa gen ngược nghĩa (antisense).

- Tạo cấu trúc chứa gen theo cả 2 chiều đồng nghĩa và ngược nghĩa (cấu trúc tự bắt cặp).

Tất cả các loại cấu trúc trên muốn tạo tính kháng thì đều phải hình thành cấu trúc dsRNA

trong cây chuyển gen. Có nhiều cách để có thể hình thành cấu trúc dsRNA của gen chuyển.

Chẳng hạn, các cấu trúc đồng nghĩa và ngược nghĩa có thể (i) được chuyển đồng thời vào cây,

hoặc (ii) được chuyển riêng biệt để tạo các dòng chứa gen đồng nghĩa hoặc ngược nghĩa. Các

dòng này sẽ được lai để tạo dòng mang cả gen đồng nghĩa và ngược nghĩa, hoặc (iii) trong

trường hợp cây chỉ được chuyển với cấu trúc đồng nghĩa hoặc ngược nghĩa thì RdRp của cây

sẽ tạo ra các phân tử dsRNA từ các transcripts của gen được chuyển.

Tuy nhiên, chỉ loại cấu trúc tự bắt cặp đã được chứng tỏ là hiệu quả hơn cả trong việc tạo

ra tính kháng. Hiện nay, hầu hết các nghiên cứu tạo tính kháng thông qua RNAi trên cây đều

sử dụng các cấu trúc tự bắt cặp (hình).

Đối với cấu trúc tự bắt cặp, nếu 2 chuỗi gen virus bao quanh một chuỗi intron thì hiệu quả

PTGS sẽ tăng lên rất nhiều

4.2.2 Chọn chuỗi gen virus

Không có yêu cầu đặc biệt để chọn chuỗi gen. Các gen được lựa chọn có thể là gen CP,

gen vận chuyển, gen protease..., thâm chí cả phần không dịch mã (ví dụ như phần 3‘UTR của

các potyvirrus).

Hình. Hiệu quả PTGS với các

cấu trúc chuyển gen potato virus Y

(PVY) khác nhau. Hiệu quả được

tính là % cây chuyển gen miễn

nhiễm với PVY. Gen virus (PVY-

pro) là NIa. Chuỗi loop là chuỗi

gen unidA (GUS) dài ~800 nts.

Intron là chuỗi intron của gen Pdk

gene của cây Flaveria. (Smith et

al., 2000).

98

Các gen này thông thường được lựa chọn trên vùng bảo thủ của loài vì RNAi thông qua

siRNA mang tính đặc hiệu rất cao. Ngoài ra vùng gen lựa chọn cũng nên qui định các chức

năng sinh học chủ chốt của virus. Chẳng hạn đối với begomovirus nên chọn vùng đầu N của

gen Rep (vừa bảo thủ vừa chứa nhiều motif quan trọng); đối với potyvirus nên chọn vùng đầu

C của gen CP (bảo thủ cao) .

Độ dài của chuỗi gen thường vài trăm bp. Nghiên cứu với tomatospoted wilt virus

(TSWV) cho thấy độ dài tối thiểu để tạo tính kháng là 59 bp.

5. Ví dụ công nghệ RNAi kháng bệnh virus

5.1. Tạo cây chuyển gen kháng PVY thông qua RNA silencing

(Missiou et al., 2004. Molecular Breeding 14: 185–197, 2004)

5.1.1 Giới thiệu.

Cây khoai tây là cây trồng quân trọng đứng hàng thứ 4 trên thế giới. Cây khoai tây bị

nhiễm rất nhiều loại virus trong đó potato virus Y (PVY) là virus nghiêm trọng nhất.

PVY lan truyên qua củ giống và nhiều loài rệp muội họ Aphidiade theo kiểu không bền

vững. PVY gây hại trên nhiều loại cây trồng, đặc biệt nghiêm trọng trên cây họ cà như khoai

tây, cà chua, thuốc lá, ớt. Triệu chứng bệnh thay đổi theo loài/giống cây, chủng virus và điều

kiện ngoại cảnh.

PVY thuộc chi Potyvirus với đặc điểm bộ gen là: bộ gen RNA sợi đơn, cực (-), kích thước

9,7 kb. Bộ gen (theo chiều từ trái sang phải) gồm: 1 chuỗi 5‘NTR (UTR), một ORF lớn mã

hóa một polyprotein được xử lý sau dịch mã thành 10 protein chức năng, một chuỗi 3‘ NTR

(UTR), tận cùng là một chuỗi poly-A. Dựa trên so sánh chuỗi, hiện nay quần thể PVY gồm 4

chủng PVYO, PVY

N, PVY

NTN và PVY

W.

5.1.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen

Đoạn gen được lựa chọn là một đoạn dài 605 bp phần đầu 3‘ của gen CP. Đoạn gen được

phân lập bằng RT-PCR dùng cặp mồi

Y9100: 5‘CTGGATCCTGTCTCCTGATTGAAGTTTACAGTC3‘

YREV1: 5‘TTGAATTCAAAGGAACCATATATGCCACGATAT3‘

Hình. Đặc điểm bộ gen và 4

chủng của PVY (DPV, 2004).

P1: protein P1

HcPro: Helper component

protein

P3: protein P3

CI: Crystal Inclusion

NIa: Nuclear Inclusion a

NIb: Nuclear Inclusion b

CP: Coat protein

NTR: non translated region

(=UTR)

99

- Đoạn gen CP được clon vào vector plasmid pT3T7-lac (Stratagene).

- Chèn 1 đoạn spacer dài 1255 bp (vị trí BamHI/SalI) lấy từ bacteriophage vào giữa

đoạn CP đồng nghĩa và CP ngược chiều để tạo cassete pvyPH9100:

CP (đồng nghĩa) – spacer – CP (ngược nghĩa).

- Clone cassete pvyPH9100 vào vector plamid song cực pART7/27 để tạo cấu trúc chuyển

gen pART27HP9100. Cấu trúc này được điều khiển bởi promotor CaMV35S và terminater

ocs (của gen Octopine synthase). Cấu trúc cũng chứa marker nptII (kháng kanamycin)

- Biến nạp cấu trúc pART27HP9100 vào vi khuẩn Agrobacterium tumefaciens (chủng

LBA4404)

Hình. Bản đồ T-DNA của cấu trúc pHP9100 mang các chuỗi lặp đảo (tự ghép cặp) của

PVY. CP: chuỗi gen vỏ protein CP. RB, LB: bờ phải và bờ trái của T-DNA. CaMV35S:

promotor CaMV, OCS 3‘: chuỗi terminator của gen mã hóa Octopine synthase. nptII: kháng

kanamycine.

5.1.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây

Cây khoai tây (giống Spunta) non 1 tháng tuổi được trồng trong nhà kính.

Explant cắt từ lóng cây non được ủ với vi khuẩn A. tumefaciens chứa cấu trúc chuyển gen

pART27PH9100 trong 24 giờ và được đặt trên môi trường tạo callus (môi trường MS

chứa hormone zeatin, 2,4-D và kháng sinh kanamycin, cefotaxime). Tiếp theo, callus

được chuyển sang môi trường tạo chồi (môi trường MS chứa hormone zeatin, GA3 và

kháng sinh như trên). Tiếp theo callus được chuyển sang môi trường tạo rế (môi trường

MS chứa hormone IAA và kháng sinh như trên). Cây explants được trồng trong điều kiện

25 °C ban ngày, 18 °C tối với 16 giờ sáng (ánh sáng huỳnh quang).

5.1.4 Các phân tích chính cây chuyển gen

Southern blot nhằm phát hiện số copy của cấu trúc đã được chuyển vào bộ gen của

Cây chuyển gen 5-6 tháng tuổi được phân tích southern blot

DNA tổng số được chiết từ 0.5 – 1 mg lá tươi.

Phân cắt DNA tổng số = RE

Điện di 10 – 15 g DNA bằng agarose 0,7 %

Chuyển và cố định DNA sang màng lai

Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32

Northen blot nhằm phát hiện siRNA hình thành từ cây chuyển gen

Cây chưa lây nhiễm ở các tuổi khác nhau (khoảng 2 tháng sau khi chuyển ra nhà lưới)

được sử dụng để phát hiện siRNA

100

Chiết RNA tổng số từ khoảng 1 g lá

Điện di trên gel polyacrylamide acrylamide ở điều kiện biến tính(12% acrylamide, 0.6%

bisacrylamide, 7 M urea) với đệm TBE buffer (50 mM Tris, 41.5 mM boric acid, 0.5 mM

EDTA).

Chuyển và cố định RNA sang màng lai.

Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32

Lây nhiễm virus trên cây chuyển gen

Cây chuyển gen ở giai đoạn 4 – 5 lá được lây nhiễm nhân tạo bằng tiếp xúc cơ học.

Tất cả 4 chủng PVY và PVX đều được lây nhiễm. Các chủng này được giữ nguồn trên

thuốc lá hoặc khoai tây.

Nghiền lá (khoai tây hoặc thuốc lá) nhiễm virus với đệm phosphate 0.01 M chứa 0.4%

Na2SO3 (sodium sulphite), pH 7.5 theo tỷ lệ 1/10.

Lây nhiễm cơ học bằng bột carborandum

Cây được đánh giá sau lây nhiễm bằng 3 phương pháp ELISA, tisue printing và northen

blot

ELISA nhằm phát hiện sự có mặt của virus (dựa vào protein virus) trong cây chuyển gen

đã lây nhiễm virus

Tisue printing (lai tại chỗ) nhằm phát hiện sự có mặt của virus (dựa vào RNA virus) trong

lá cây chuyển gen đã lây nhiễm virus.

5.2. Tạo cây chuyển gen kháng TYLCV thông qua RNA silencing

5.2.1 Giới thiệu.

TYLCV là một trong nhiều loài begomovirus gây bệnh xoăn vàng lá cà chua. Các

begomovirus lan truyền ngoài tự nhiên nhờ bọ phấn (B. tabaci) theo kiểu bền vững tuần hoàn.

Các begomovirus là các virus thực vật có bộ gen DNA vòng đơn có kích thước khoảng

2.6 – 2.8 kb. Chúng hoặc có bộ gen kép gồm 2 phân tử DNA sợi vòng đơn gọi là DNA-A và

DNA-B hoặc có bộ gen đơn tương đương DNA-A

Đối với các virus có bộ gen đơn thì DNA-A của chúng chứa 6 gen được tổ chức theo 2

chiều ngược nhau.

Trên chiều kim đồng hồ (chiều virus) có 2 gen là (i) V1 mã hóa vỏ protein có chức năng

chính là tạo vỏ phân tử virus, lan truyên qua vector, vận chuyển bộ gen virus vào và ra khỏi

nhân tế bào ký chủ và vận chuyển bộ gen virus giữa các tế bào; và (ii) V2 mã hóa protein V2

có chức năng liên quan đến vận chuyển virus giữa các tế bào.

Trên chiều ngược kim đồng hồ (chiều sợi tương đồng virus) có 4 gen là (i) C1 mã hóa

protein tái sinh hay còn gọi là protein Rep có chức năng chính là cắt - nối bộ gen virus tại một

vị trí đặc biệt ở vùng nguồn gốc tái sinh và tương tác với protein ký chủ để tạo điều kiện

thuận lợi cho tái sinh virus, (ii) C2 mã hóa 1 protein hoạt hóa phiên mã, (iii) C3 mã hóa 1

protein tăng cường tái sinh và (iv) C4 mã hóa protein C4 với chức năng liên quan đén phổ ký

chủ và phát triển triệu chứng.

Giữa 2 vùng gen mã hóa ngược chiều nhau ở trên là một vùng không mã hóa chứa nguồn

gốc tái sinh (ori = origin of replication) gồm (i) các chuỗi lặp đảo (iteron) cần thiết cho sự

nhận biết và gắn kết của protein Rep và (ii) một cấu trúc thân – thòng lọng trong đó chuỗi

101

TAATACTAT trên vùng thòng lọng là giống nhau ở tất cả các begomovirus và vị trí TA cuối

cùng là nơi protein Rep cắt và nối bộ gen begomovirrus trong quá trình tái sinh.

Đối với các begomovirus có bộ gen kép thì DNA-A có tổ chức bộ genome và chức năng

các gen tương tự như DNA-A của các begomovirus có bộ gen đơn (tên các gen được thêm ký

tự A vào đằng trước thành AV1, AV2, AC1, AC2, AC3 và AC4); còn DNA-B của chúng chỉ

chứa 2 gen được sắp xếp theo 2 chiều ngược nhau và mã hóa 2 protein là (i) protein con thoi

có chức năng vận chuyển bộ gen virus vào và ra khỏi nhân tế bào và (ii) protein vận chuyển

có chức năng vận chuyển bộ gen virus giữa các tế bào.

5.2.2 Thiết kế cấu trúc chuyển gen (hình) và chuẩn bị dòng vi khuẩn chuyển gen

Đoạn gen được lựa chọn là C1 (mã hóa protein Rep) với độ dài 727 bp nằm ở đầu 5‘.

Nguồn virus là một plasmid chứa toàn bộ bộ gen virus được clone từ trước.

Đoạn gen ngược nghĩa được phân lập bằng PCR với cặp mồi A và B (bảng). Đoạn PCR

ngược nghĩa được cắt kép với 2 RE là XhoI/BamHI và được nối vào vị trí tương ứng của

vector pBPW8 để tạo ra cấu trúc pBPC1antisense

Đoạn gen đồng nghĩa được phân lập bằng PCR với cặp mồi B và C (bảng). Đoạn PCR

đồng nghĩa được cắt kép với 2 RE là KpnI/BamHI và được nối vào cấu trúc pBPC1antisense

(cũng được cắt kép bằng KpnI/BamHI) để tạo ra cấu trúc pBPC1antisense-C1sene.

Đoạn intron của Castor bean catalase được phân lập bằng cặp mồi D và E (bảng) từ

plasmid pWJKK.IN-2 (của cơ quan CSIRO, Australia).

Xử lý 2 đầu của đoạn intron được tạo ra bằng PCR với RE ClaI. Tương tự, cấu trúc

pBPC1antisense-C1sene cũng được mở bằng RE ClaI.

Nối đoạn intron (đã được cắt bằng ClaI) vào cấu trúc pBPC1antisense-C1sene (đã được mở

bằng ClaI) để tạo cấu trúc pBPC1727

antisen – intron – C1727

sene. Cấu trúc này chứa cấu trúc

kẹp tóc sau:

C1(727nt, antisense) – intron – C1 (727nt, sene)

Một đọan 3.4 kb của cấu trúc pBPC1727

antisen – intron – C1727

sene chứa cả promotor CaMV

35S và terminator tNos được giải phóng bằng HindIII và nối vào vị trí tương ứng của một

vector song cực là pZ200 để tạo ra cấu trúc chuyển gen.

Biến nạp cấu trúc chuyển gen trên vào vi khuẩn Agrobacterium tumefaciens (chủng

LBA4404)

Bảng Các mồi sử dụng trong thiết kế cấu trúc chuyển gen

Mồi Chuỗi mồi RE

A (c) TCTCTCGAGTTACGCCTTATTGGTTTC XhoI

B (v) CGCGGATCCATGCCTCGTTTTATTTAAA BamHI

C (c) CGGGGTACCTTACGCCTTATTGGTTTC KpnI

D CCATCGATCTGCAGGTAAATTTCTAGTTTTTC ClaI

E CCATCGATCTGCAGTTATCATCATCATCATAG ClaI

102

(c) mồi gắn vào chuỗi tương đồng virus; (v) mồi gắn vào chuỗi virus

5.2.3 Biến nạp cấu trúc chuyển gen vào cây khoai tây

Cây khoai tây (giống Spunta) non 1 tháng tuổi được trồng trong nhà kính.

Explant cắt từ lóng cây non được ủ với vi khuẩn A. tumefaciens chứa cấu trúc chuyển gen

pART27PH9100 trong 24 giờ và được đặt trên môi trường tạo callus (môi trường MS

chứa hormone zeatin, 2,4-D và kháng sinh kanamycin, cefotaxime). Tiếp theo, callus

được chuyển sang môi trường tạo chồi (môi trường MS chứa hormone zeatin, GA3 và

kháng sinh như trên). Tiếp theo callus được chuyển sang môi trường tạo rế (môi trường

Hình Cấu trúc chuyển gen kháng TYLCV.

(a) Tổ chức bộ gen của TYLCV

(b) Bản đồ đoạn chứa cấu trúc chuyển gie.CaMV 35S: promoter

Intron: chuỗi intron của Castor bean catalase.

LB, LR: bờ trái và bờ phải.

tNos: chuỗi terminator của nopaline synthase.

nptII: neomycin phosphotransferase II (kháng kanamycine).

pNos: chuỗi promoter của nopaline synthase.

(c) Sơ đồ hairpin RNA so khi intron bị cắt khỏi transcript

103

MS chứa hormone IAA và kháng sinh như trên). Cây explants được trồng trong điều kiện

25 °C ban ngày, 18 °C tối với 16 giờ sáng (ánh sáng huỳnh quang).

5.2.4 Các phân tích chính cây chuyển gen

Southern blot nhằm phát hiện số copy của cấu trúc đã được chuyển vào bộ gen của

Cây chuyển gen 5-6 tháng tuổi được phân tích southern blot

DNA tổng số được chiết từ 0.5 – 1 mg lá tươi.

Phân cắt DNA tổng số = RE

Điện di 10 – 15 g DNA bằng agarose 0,7 %

Chuyển và cố định DNA sang màng lai

Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32

Northen blot nhằm phát hiện siRNA hình thành từ cây chuyển gen

Cây chưa lây nhiễm ở các tuổi khác nhau (khoảng 2 tháng sau khi chuyển ra nhà lưới)

được sử dụng để phát hiện siRNA

Chiết RNA tổng số từ khoảng 1 g lá

Điện di trên gel polyacrylamide acrylamide ở điều kiện biến tính(12% acrylamide, 0.6%

bisacrylamide, 7 M urea) với đệm TBE buffer (50 mM Tris, 41.5 mM boric acid, 0.5 mM

EDTA).

Chuyển và cố định RNA sang màng lai.

Lai với dò là đoạn gen CP 605 bp được gán nhán phóng xạ P32

Lây nhiễm virus với cây chuyển gen

Cây chuyển gen ở giai đoạn 4 – 5 lá được lây nhiễm nhân tạo bằng tiếp xúc cơ học.

Tất cả 4 chủng PVY và PVX đều được lây nhiễm. Các chủng này được giữ nguồn trên

thuốc lá hoặc khoai tây.

Nghiền lá (khoai tây hoặc thuốc lá) nhiễm virus với đệm phosphate 0.01 M chứa 0.4%

Na2SO3 (sodium sulphite), pH 7.5 theo tỷ lệ 1/10.

Lây nhiễm cơ học bằng bột carborandum

Cây được đánh giá sau lây nhiễm bằng 3 phương pháp ELISA, tisue printing và northen

blot

ELISA nhằm phát hiện sự có mặt của virus (dựa vào protein virus) trong cây chuyển gen

đã lây nhiễm virus.

Tisue printing (lai tại chỗ) nhằm phát hiện sự có mặt của virus (dựa vào DNA virus)

trong cây chuyển gen đã lây nhiễm virus.

6. Sử dụng công nghệ microRNA trong phòng chống bệnh virus

Công nghệ RNAi dùng miRNA mới được nghiên cứu gần đây trong phòng chống bệnh

virus thực vật. Một số ưu điểm dùng miRNA là:

Ít bị hiệu ứng không đặc hiệu (off-target). Đây là hiệu ứng không mong muốn khi RISC

(thông qua liên kết không đặc hiệu của sRNA) cắt các phân tử không phải mRNA mục

tiêu. Hiện nay, việc chọn các miRNA với trình tự không tương đồng với bộ gen ký chủ là

hoàn toàn khả thi nếu bộ gen ký chủ đã được giải trình tự toàn bộ.

104

Mức độ tương thích promoter RNA cao.

An toàn với môi trường (an toàn sinh học) do giảm thiểu khả năng tái tổ hợp giữa virus tự

nhiên và gen virus được chuyển vào trong cây/

6.1. Dùng công nghệ miRNA tạo tính kháng CMV

6.1.1 Giới thiệu

(CPC, 2006)

Cucumber mosaic virus (CMV) là môt trong những virus thực vật quan trọng nhất, gây

hại hơn 800 loài cây 1 và 2 lá mầm thuộc 85 họ thực vật. Virus có thể lan truyền bằng 80 loài

rệp muội theo kiểu không bền vững. Virus có thể và lan truyền bằng tiếp xúc cơ học và có thể

truyền qua hạt giống của nhiều loài cây. Virus phân bố khắp thế giới.

Phân tử virus có hình cầu, khoảng 29 nm (đường kính). CMV là một virus đa thành phần

với bộ gen gồm 3 phân tử RNA gọi là RNA1, RNA2 và RNA 3; mỗi phân tử RNA genome

được lắp ráp thành các phân tử riêng biệt (có vỏ protein riêng). Ngoài ra, CMV còn có 2 phân

tử RNA subgenomic (hình thành trong quá trình tái sinh virus) là RNA4 được lắp ráp cùng

với RNA3 trong cùng một phân tử và RNA4A.

CMV là một virus RNA sợi đơn, mạch thẳng, cực dương. Tất cả 3 phân tử RNA của CMV

đều có đầu 5‘ chứa cap (7-methyl guanosine) và đầu 3‘ có cấu trúc giống tRNA.

RNA1 có kích thước khoảng 3.4 kb, mã hóa 1 protein là 1a có chức năng giống như một

helicase và methyl transferase.

RNA2 mã hóa 2 protein là 2a và 2b. Protein 2a là một polymerase. Protein 2b được biểu

hiện từ RNA4 có chức năng liên quan đến di chuyển hệ thống, biểu hiện triệu chứng và ức

chế PTGS của cây.

RNA3 mã hóa 2 protein là 3a (liên quan đên di chuyển virus) và protein vỏ CP.

Ngoài RNA subgenomic (RNA4 ), phân tử CMV cũng chứa một số phân tử RNA vệ tinh

có kích thước từ 332 – 386 nts và có ảnh hưởng đến tính gây bệnh của virus. Các phân tử vệ

tinh này phụ thuộc CMV để tái sinh.

6.1.2 Thiết kế cấu trúc miRNA chuyển gen

(JOURNAL OF VIROLOGY, June 2007, p. 6690–6699)

Cấu trúc chuyển gen chứa chuỗi miRNA nhằm vào gen b2 của CMV.

Cấu trúc được xây dựng dựa trên bộ khung một chuỗi pre-miRNA ký hiệu là miR171a của

cây A. thaliana. Chuỗi pre-miRNA này nằm trên nhiễm sắc thể sô 2, 3 và 4 của cây A.

thaliana với chuỗi mục tiêu là các mRNA mã hóa các yếu tố phiên mã liên quan đến ra rễ.

Chuỗi pre-miRNA này đã được chứng minh từ trước là có tạo chuỗi miRNA trong cây.

Cấu trúc chuyển gen được xây dựng bằng cách thay thế chuỗi miRNA của miR171a bằng

một chuỗi tương ứng vị trí 178 tới 198 của gen b2 của CMV. Chuỗi này dài 21 nt và có trình

tự (5‘-GUAGAUGGUUCGGAACUGAUA-3‘).

Các bước để xây dựng cấu trúc chuyển gen tạo miRNA nhằm vào gen b2 của CMV bao

gồm :

Thiết kế 2 mồi lớn tương ứng với phần 5‘ (đồng nghĩa) và 3‘ (ngược nghĩa) của chuỗi pre-

miR171a. Mỗi mồi chứa 1 chuỗi 21 nt đặc hiệu gen 2b của CMV (phần in béo và gạch chân)

tại vị trí vốn là trình tự chuỗi miRNA của pre-miR171a. Ngoài ra đầu 5‘ của mỗi mồi cũng

chứa thêm 1 chuỗi chứa vị trí BamHI và SacI để tạo điều kiện cho clone.

5’-CGGGATCCATGAGAGAGTCCCTTTGTAGATGGTACGGAACTTATAGATCTTACCTGACCACACACG-3’

105

5’-GCGAGCTCACGAGAGAGT-ACTGAGTAGATGGTTCGGAACTGATAGATAATCTAGAGAGAATAAT-3’

Dùng 2 mồi trên để chạy PCR với template là một plasmid chứa chuỗi pre-miR171a.

Đoạn PCR hình thành là một cấu trúc lai gồm khung là pre-miR171a còn chuỗi miRNA là của

gen b2 của CMV. Cấu trúc lai này chính là một pre-miRNA và được ký hiệu là miR2bprec

Đoạn PCR được xử lý 2 đầu với BamHI/SacI và được nối vào vị trí tương ứng của vector

pBI221. Vector này có chứa chuỗi promotor CaMV 35S (35Spro) và terminator của nopaline

synthase gene (NOS Ter). Kết quả tạo ra vector pBI-35S-miR2bprec chứa một cassette biểu

hiện : 35S Pro - miR2bprec – NOS Ter.

Cassette biểu hiện được chuyển sang một vector song cực pCAMBIA 1300 để tạo ra

vector p35S-miR2bprec. Chú ý là pCAMBIA 1300 chứa 1 marker chọn lọc là hygromycin

phosphotransferase (hpt) dưới sự điề khiển của CaMV 35S.

Vector p35S-miR2bprec được biến nạp vào vi khuẩn A. tumerfaciens (chủng EH105).

6.1.3 Chuyển gen vào cây thuốc lá

(J. of virology, June 2007, p. 6690–6699)

Vector p35S-miR2bprec được biến nạp vào cây thuốc lá Nicotiana tabacum cv. SR1 bằng

phương pháp đĩa lá dung vi khuẩn A. tumerfaciens để tạo cây thế hệ T0. Các cây To được thử

PCR để kiểm tra sự có mặt của gen chuyển.

Cây T0 được tự thụ và hạt thế hệ T1 được gieo trên môi trường chứa hygromycin để chọn

cây chuyển gen.

cc uu c c cuuaccugaccacacacguag

augagagagu cu gauauuggc ugguuca ucagau a

|||||||||| || ||||||||| ||||||| ||||||

ugcucucuca ga cuauaaccg gccgagu agucua u

-u cu c u uuagaucucucuuauuacaua

Hình Cấu trúc pre-miR171a của A. thaliana (từ cơ sở dữ miRBase)

Hình Các cấu trúc pre-miRNA

Hình trên cùng là sơ đồ cassette biểu

hiện miRNA của gen b2 của CMV:

promoter 35S (35S Pro) – miR2b –

terminator của nopaline synthase (NOS Ter).

Hình giữa: chuỗi kẹp tóc pre-miR171a

của A. thaliana chứa chuỗi miR171

(màu đỏ).

Hình dưới: chuỗi kẹp tóc miR2bpre

chứa chuỗi miRNA là 21 nts của gen b2

của CMV (màu đỏ).

106

6.1.4 Lây nhiễm nhân tạo

Lá cây thuốc lá nhiễm CMV được nghiền trong đệm phosphate với tỷ lệ 1/10 và lây nhiễm

bằng tiếp xúc cơ học trên 2 lá phía trên của cây thuốc lá chuyển gen thế hệ T1 ở giai đoan 5-6

lá.

6.1.5 Đánh giá cây chuyển gen được lây nhiễm CMV dựa trên triệu chứng

Triệu chứng biểu hiện được đánh theo thang phân cấp thứ tự gồm 5 cấp:

Cấp 0: không triệu chứng.

Cấp 1: khảm nhẹ chỉ trên 1 lá ngọn.

Cấp 2: khảm nhẹ, biểu hiện trên hơn 2 lá.

Cấp 3: khảm rõ ràng trên lá già hơn và biến dạng nhẹ trên 2 lá ngọn.

Cấp 4: triệu chứng tương tự cấp 3 nhưng cây còi cọc.

Cấp 5: lá biến dạng rõ ràng và cây còi cọc mạnh.

6.1.6 Phân tích miRNA trên cây chuyển gen

Sự hình thành miRNA trên cây chuyển gen được đánh giá dựa trên kỹ thuật Northen blot.

Các công đoạn tinh chiết, xây dựng dò và phát hiện RNA đều dùng các kít thương mại của

hãng Ambion.

Tinh chiết RNA (dùng kít mirVanaTM

miRNA Isolation Kit).

250 mg mô lá được nghiền trong đệm chiết.

Các phân tử RNA nhỏ (sRNA) được xử lý bằng cồn.

Cố định sRNA qua màng lọc sợi thủy tinh.

Rửa màng và giải hấp (elute) sRNA

Thiết kế dò gán nhãn bức xạ (dùng kít mirVana™ miRNA Probe Construction Kit).

Thiết kế một mồi oligo 5‘-TCAGTTCCGAACCATCTACCCTGTCTC-3‘. Mồi này có

phần 5‘ tương đồng với 19 nts của miR2b và phần 3‘ (8 nt được gạch chân) tương đồng

với phần 3‘ của mồi T7 promotor (mồi T7 có sẵn trong kít).

Mồi oligo và mồi T7 được ủ với enzyme Klenow để tạo sợi dsDNA. Tiếp theo, đoạn

dsDNA được phiên mã trong hỗn hợp phiên mã chứa UTP-P32

dùng T7 RNA

polymerase để tạo dò RNA dài 19 nt gãn nhãn bức xạ.

Phát hiện miRNA (dùng kít mirVana™ miRNA Detection Kit). Kỹ thuật lai hóa ở đây là

lai hóa trong dung dịch.

sRNA được trộn dò RNA gán nhãn bức xạ trong đệm lai hóa. Sau khi biến tính nhiệt, hỗn

hợp được ủ qua đêm ở 42OC.

Tiếp theo, hỗn hợp ủ được xử lý với RNAse A và RNAseT1 để loại bỏ dò thừa và RNA

không lai hóa.

Sản phẩm lai hóa (dạng sợi kép, rất bền) được điện di trên gel polyacrylamide biến tính

15% và kết quả được xác định bằng bức xạ đồ.

6.1.7 Phân tích RNA của CMV trên cây lây nhiễm

Phát hiện và lượng hóa RNA của CMV bằng kỹ thuật Northen blot (lai RNA:RNA) trên

cây sau lây nhiễm nhằm đánh giá tính kháng.

107

Tinh chiết RNA. RNA tổng số từ mô lá được chiết từ cây sau lây nhiễm dùng kit Trizol

của hãng Invitrogen

Chuẩn bị dò gán nhãnbức xạ. Dùng kit mirVana™ miRNA Probe Construction (hãng

Ambion) tương tự như trên nhưng đoạn dò tương đồng với RNA virus là khoảng 200 nt đầu

3‘ của RNA 2 của CMV.

Phát hiện RNA virus bằng kỹ thuật northen blot chuẩn

20 g RNA được điện di qua gel agarose 1.2% chứa 1% formaldehyde.

Chuyển và cố định RNA sang màng Hybond-N (của hãng Amersham).

Kiểm tra băng trên màng bằng nhuộm methylene blue (chú ý sản phẩm RNA 18S

được sử dụng làm đối chứng nhằm kiểm tra lượng RNA điện di).

Lai, rửa và phát hiện bằng bức xạ đồ băng RNA 2 của CMV bằng kỹ thuật northen

blot chuẩn.

6.1.8 Phân tích virion CMV trên cây lây nhiễm

JOURNAL OF VIROLOGY, June 2007, p. 6690–6699

Phát hiện và lượng hóa sự có mặt của CMV trên cây lây nhiễm nhằm đánh giá tính kháng

bằng ELISA. Kỹ thuật ELISA sử dụng là PTA-ELISA

Nghiền lá cây bệnh trong đệm carbonate (pH9.6), nhỏ vào giếng của bản ELISA. Ủ bản

ELISA ở 37OC/4giờ.

Xử lý giếng với kháng thể thỏ đặc hiệu protei CP của CMV. Ủ bản ELISA ở 37OC/4giờ

Xử lý giếng với kháng thể dê (liên kết enzyme HRP = horseradish peroxidase) đặc hiệu

kháng thể thỏ. Ủ bản ELISA ở 37OC/4giờ.

Thực hiện phản ứng tạo màu bằng xử lý giếng với cơ chất TMB (tetramethylbenzidine).

Đánh giá kết quả bằng máy đọc ELISA ở 450 nm.

Tham khảo

1. CMV- compendium of Plant Protection, 2006, CABI

2. Qu, J., Ye, J. and Fang, R. 2007. Artificial MicroRNA-Mediated Virus Resistance in Plants. Journal of virology, Vol.81: 6690–6699.

3. Các kit thương mại để chiết sRNA, tạo dò gán nhãn bức xạ và phát hiện sRNA của hãng Ambion.

http://www.ambion.com/catalog/CatNum.php?1552.

4. Cơ sở dữ liệu miRNA tại website của trung tâm Sangger: http://microrna.sanger.ac.uk/sequences/

108

Chương 8. PCR trong chẩn đoán tác nhân gây bệnh

1. Tóm tắt kỹ thuật

PCR là một trong các phát minh quan trọng nhất của thế kỷ 20 trong sinh học phân tử.

PCR là một kỹ thuật đơn giản nhưng được sử dụng trong hầu hết các nghiên cứu CNSH. Có

vô số tài liệu tiếng Việt và tiếng Anh về kỹ thuật PCR. Dưới đây là tóm tắt kỹ thuật

Tùy thuộc khuôn là DNA hay RNA mà có tên phản ứng là PCR hay RT-PCR

Khuôn là DNA => PCR (polymerase chain reaction)

Khuôn là RNA => RT-PCR (Reverse transcription – PCR)

Các bước cơ bản trong 1 phản ứng PCR gồm 3 bước :

Biến tính. Hỗn hợp phản ứng được đặt ở nhiêt độ cao (92 – 94 ) trong thời gian ngắn

(khoảng 20 – 60 giây). Ỏ nhiệt độ này, khuôn DNA dạng sợi kép tách thành sợi đơn.

Gắn mồi. Hỗn hợp phản ứng được đặt ở nhiêt độ gắn mồi (Ta) trong thời gian ngắn. Ta

được tính toán tùy thuôch đặc điểm mồi, thường trong khoảng 40 – 60 . Ỏ nhiệt độ này, mồi

gắn vào khuôn sợi đơn ở vị trí đặc hiệu.

Tổng hợp sản phẩm PCR. Hỗn hợp phản ứng được tăng tới nhiệt độ tối ưu cho phản ứng

tổng hợp chuỗi (72 hoặc 68 tùy DNA polymerase chịu nhiệt).

Trong trường hợp RT-PCR, trước khi thực hiện PCR, cần phải có thêm một bước chuyển

khuôn RNA thành cDNA bằng enzyme phiên mã ngược (reverse transcriptase). Hai bước RT

và PCR có thể được thực hiện riêng rẽ hay trong cùng một tube phản ứng.

Các bước trong chẩn đoán bệnh cây bằng PCR/RT-PCR

Thiết kế mồi (primer)

Chiết acid nucleic tổng số (DNA hoặc RNA) từ mô cây; dùng các kỹ thuật chiết thông

thường (rẻ) hoặc kit chiết thương mại (đắt)

Chạy PCR hoặc RT-PCR

Kiểm tra và đánh giá kết quả bằng điện di

2. Thiết kế và lựa chọn mồi (primer)

Mồi là một chuỗi oligonucleotide sợi đơn ngắn (kích thước thường từ 18 – 24 nts). Có hai

loại mồi được sử dụng cho chẩn đoán bệnh cây

Mồi chung (universal/degenerate primers): được thiết kế trên các vùng bảo thủ cao, có khả

năng phát hiện các đối tượng khác hẳn nhau (thường các đối tượng của một chi, một họ).

Mồi đặc hiệu (specific primers): được thiết kế trên các vùng có thể phân biệt được loài,

thậm chí dưới loài như chủng/nòi/type sinh học…

Có được các mồi tốt là bước quan trọng nhất trong chẩn đoán bệnh cây. Có 2 cách để có

thể nhận được các mồi tốt.

Tham khảo và lựa chọn từ các nghiên cứu đã được công bố.

Tự thiết kế mồi.

2.1. Tự thiết kế mồi

Để tự thiết kế mồi dựa trên các chuỗi gen sẵn có trên Genbank, người ta cần sử dụng một

phần mềm có khả năng căn trình tự đa chuỗi (multiple sequence alignment), chẳng hạn

109

ClustalX, Bioedit. Ngay sau khi các chuỗi DNA đã được căn trình tự, chúng ta có thể thiết kế

các mồi chung hay mồi đặc hiệu tùy theo yêu cầu.

2.1.1 Các chú ý khi thiết kế mồi

Độ dài mồi. Nên nằm trong khoảng 18-22 nts. Độ dài này đủ dài để đảm bảo tính đặc hiệu

và đủ ngắn để mồi gắn đễ dàng vào khuôn.

Nhiệt độ tách chuỗi (Tm = Melting Temperature). Tm là nhiệt độ mà tại đó 1/2 số sợi

DNA kép tách thành sợi đơn. Tm của mồi nên nằm trong khoảng 52-58 oC.

Nhiệt độ gắn mồi (Ta = annealing temperature). Ta được tính dựa trên Tm. Ta quá cao

làm mồi khó gắn vào khuôn dẫn tới năng xuất PCR thấp. Ta quá thấp làm mồi dễ gắn không

đặc hiệu vào khuôn dẫn tới tạo các sản phẩm không đặc hiệu. Ta của 2 mồi xuôi và ngược

dòng nên tương đương. Có nhiều cách tính Ta

Ta = 0.3 x Tm(mồi) + 0.7 Tm (sản phẩm) – 14.9

Hàm lượng GC. Số các gốc G và C nên nămg trong khoảng 40-60%.

Chuỗi GC đầu 3’. Đầu tận cùng 3 ‗ nên là G hoặc C hoặc GC hoặc CG. Đầu 3‘ không

nên có nhiều hơn 3 gốc liên tục G/C.

Cấu trúc thứ cấp. Cấu trúc thứ cấp có thể hình thành trong cùng một mồi hoặc giữa 2

mồi. Mồi chứa cấu trúc thứ cấp xấu thường dẫn tới năng suất PCR bị giảm, thậm chí không có

sản phẩm. Tính ổn định của cấu trúc thứ cấp được đo bằng ΔG (là năng lượng cần để phá vỡ

cấu trúc thứ cấp, được tính từ các phần mềm thiết kế mồi). Các loại cấu trúc thứ cấp là:

Hairpins. Là cấu trúc thứ cấp hình thành trong nội bộ mồi. Giá trị ΔG của các hairpin đầu

3‘ không nên <-2 kcal/mol và của các hairpin ở giữa không nên <-3 kcal/mol.

Tự mồi (Self Dimer). Là cấu trúc hình thành giưã các phân tử của cùng loại mồi. Giá trị

ΔG của các hairpin đầu 3‘ không nên <-5 kcal/mol và của các hairpin ở giữa không nên <-

6 kcal/mol.

Tự mồi chéo (Cross Dimer). Là cấu trúc hình thành giưã các phân tử của 2 mồi khác nhau

(cặp mồi trong phản ứng PCR). Giá trị ΔG của các hairpin đầu 3‘ không nên <-5 kcal/mol

và của các hairpin ở giữa không nên <-6 kcal/mol.

Các chuỗi lặp. Mồi không nên chứa nhiều chuỗi lặp kép (ví dụ TATATATA) hoặc chuỗi

lặp đơn (ví dụ TTTT) vì có thể gây ra hiện tượng bắt cặp nhầm (misprime). Trong một mồi,

chỉ nên có tối đa 4 chuỗi lặp. Các chuỗi lặp cũng không nên xuất hiện nhiều lần trong 1 mồi

Độ ổn định đầu 3 ‗. Tận cùng đầu 3‘ (khoảng 5 nts) không nên chứa toàn gốc G hoặc C vì

có giá trị ΔG cao dễ dẫn tới bắt cặp không đặc hiệu vào khuôn. Trái lại nếu đầu 3‘ chứa quá

nhiều gốc T hoặc A sẽ khó bắt cặp.

Vùng thiết kế mồi của khuôn. vùng thiết kế mồi của khuôn không nên chứa quá nhiều

cấu trúc thứ cấp. Nếu các cấu trúc thứ cấp này ổn định ở nhiệt độ gắn mồi thì mồi sẽ không

thể bắt cặp được.

110

2.1.2 Thiết kế mồi chung (degenerate primer)

Mồi chung là một mồi được thiết kế trên vùng bảo thủ. Nếu vùng bảo thủ là đồng nhất thì

mồi chung sẽ chỉ là một chuỗi mồi duy nhất. Nếu vùng bảo thủ chứa các vị trí sai khác thì mồi

chung thực chất là một hỗn hợp các mồi, mỗi mồi tương ứng với một sai khác nucleotide.

Trong thiết kế mồi chung, người ta sử dụng các mã suy biến tại các vị trí sai khác, ví dụ R

là A hoặc G (số suy biến = 2); Y là C hoặc T (số suy biến bằng 2); N là A hoặc T hoặc G hoặc

C (số suy biến bằng 4). Số sai khác nucleotide tại mỗi vị trí của mồi được gọi là các số suy

biến. Tổng số mồi trong hỗn hợp sẽ bằng tích của tất cả các số suy biến tại mỗi vị trí. Để làm

giảm số lượng mồi trong hỗn hợp, người ta thường sử dụng một nucleotide đặc biệt là inosine.

Inosine có thể ghép cặp với bất kỳ nucleotide nào trong số 4 nucleotide A, T, G, C.

Bảng Mã suy biến trong thiết kế mồi chung

Viết tắt Nucleotide tương ứng Số suy biến

R A hoặc G 2

Y C hoặc T 2

M A hoặc C 2

K G hoặc T 2

W A hoặc T 2

S C hoặc G 2

B C hoặc G hoặc T 3

D A hoặc G hoặc T 3

H A hoặc C hoặc T 3

V A hoặc C hoặc G 3

N A hoặc C hoặc G hoặc T 4

i Inosine 1

2.1.3 Phần mềm

Các phần mềm thiết kế mồi và phân tích mồi có thể tải hoặc thực hiện trực tuyến tại

website sau: http://primer3.sourceforge.net/webif.php.

2.2. Ví dụ mồi chung

Một ví dụ mồi chung là mồi CIFor được thiết kế trên vùng bảo thủ của gen CI của các

potyvirus. Mồi này có trình tự là: 5‘-GGiVViGTiGGiWSiGGiAARTCiAC-3‘. Mồi CIFor có

khả năng phát hiện hầu hết các virus thuộc chi Potyvirus. Hình dưới minh họa vị trí mồi trên

bộ gen virus, trình tự mồi cũng như trình tự chuỗi gen CI của một số virus đại diện tại vị trí

mồi. Mồi này đã xử dụng inosine tại các vị trí có số suy biến bằng 4, do vậy đã giảm số lượng

mồi đơn trong hỗn hợp mồi từ 524288 xuống còn 32 mồi.

111

Tham khảo

http://www.premierbiosoft.com/tech_notes/PCR_Primer_Design.html

Virus Trình tự nucleotide

Mồi CIFor (5’ – 3’) GGi VVi GTi GGi WSi GGi AAR TCi AC

Zucchini yellow mosaic virus GGA GCA GTG GGT TCT GGA AAA TCA AC

Dasheen mosaic virus GGT GCT GTC GGG TCT GGT AAG TCG AC

Potato virus A GGA GCA GTT GGT TCT GGC AAA TCA AC

Clover yellow vein virus GGG GCT GTT GGA TCA GGA AAA TCG AC

Lily mottle virus GGT GCT GTT GGA TCT GGA AAG TCG AC

Papaya ringspot virus GGA GCT GTT GGT AGT GGT AAA TCA AC

Lettuce mosaic virus GGT GGT GTC GGC TCC GGC AAG TCT AC

Potato virus Y GGA GCT GTT GGG TCT GGA AAG TCA AC

Maize dwarf mosaic virus GGA GCA GTC GGT TCG GGA AAA TCA AC

Sugarcane mosaic virus GGA GCT GTT GGA TCA GGA AAA TGC AC

Johnsongrass mosaic virus GGC AAC GTA GGA TCT GGG AAA TCA AC

Cocksfoot streak virus GGA CCG GTC GGT TCC GGT AAA TCG TC

Số suy biến 3 3 2 2 2

Tổng số mồi trong hỗn hợp

mồi (dùng inosin2) 3 x3 x 2 x 2 x 2 = 54

Tổng số mồi trong hỗn hợp

mồi (nếu không dùng inosin) 4x2x2x4x4x4x2x2x4x4x2x4 = 524288

HcPro VPg 6K1 P1 P3 CI NIb NIa CP 6K2

3‘ UTR 5‘ UTR

poly A

CIFor

112

Chương 9. Công nghệ huyết thanh học trong chẩn đoán

1. Cơ sở của phản ứng huyết thanh học

2.3. Các khái niệm

Cơ sở của phương pháp huyết thanh học là dựa vào sự tương tác đặc hiệu giữa kháng

nguyên và kháng thể đặc hiệu với kháng nguyên đó

2.3.1 Kháng nguyên (antigen):

Kháng nguyên thường là các đại phân tử chứa protein hoặc polysaccharide. Kháng nguyên

phải có hai đặc tính quan trọng: (1) hoạt tính sinh miễn dịch tức khả năng kích thích động vật

máu nóng hình thành kháng thể đặc hiệu và (2) tính đặc hiệu tức khả năng liên kết với kháng

thể đặc hiệu tương ứng. Một số chất có trọng lượng phân tử thấp như các amino acid, một số

loại polysaccharide... không có hoạt tính sinh miễn dich nhưng lại có khả năng liên kết với

kháng thể đặc hiệu với kháng nguyên có chứa các chất này. Các chất đó được gọi là bán

kháng nguyên (hapten).

2.3.2 Nhóm quyết định kháng nguyên (epitope)

Trên bề mặt kháng nguyên có các vùng đặc biệt có chức năng cảm ứng hình thành kháng

thể và là vị trí liên kết kháng thể. Các vùng này được gọi là các nhóm quyết định kháng

nguyên (epitope).

Một nhóm quyết định kháng nguyên chỉ kích thích hệ miễn dịch của động vật máu nóng

hình thành một dòng phân tử kháng thể. Kháng nguyên chứa một nhóm quyết định kháng

nguyên gọi là kháng nguyên đơn giá, chứa nhiều nhóm quyết định kháng nguyên gọi là kháng

nguyên đa giá.

Các epitope có thể được chia thành:

epitope trình tự: chỉ phụ thuộc trình tự amino acid

epitope hình thái: phụ thuộc vào cả cấu trúc không gian

epitope liên tục: là một chuỗi amino acid liên tục

epitope không liên tục: là các amino acid không liền nhau (trên chuỗi cấp 1) nhưng do sự

gấp của protein nên xắp xếp gần nhau dẫn tới cùng nhau tạo thành 1 epitope

2.3.3 Kháng nguyên của tác nhân gây bệnh cây

Virus. Đối với vi rusTrừ một vài ngoại lệ, phần có hoạt tính sinh miễn dich của virus thực

vật là vỏ protein. Các virus thực vật là các kháng nguyên đa giá do vỏ protein của chúng có

chứa nhiều điểm quyết định kháng nguyên.

Vi khuẩn. Tế bào vi khuẩn có thể có nhiều loại kháng nguyên như protein, polysacaride.

Lông roi của vi khuẩn là một loại kháng nguyên tốt gọi là kháng nguyên H. Các chất từ vách

tế bào vi khuẩn có hoạt tính kháng nguyên được gọi là kháng nguyên O.

2.3.4 Kháng thể (antibody)

Sự hình thành kháng thể: Hệ thống miễn dịch của cơ thể động vật máu nóng bao gồm

các cơ quan có thẩm quyền miễn dịch và các tế bào có thẩm quyền miễn dịch. Các cơ quan có

thẩm quyền miễn dịch (tuyến ức, lách, tủy...) là nơi sản sinh, duy trì, biệt hoá và điều khiển sự

hoạt động của các tế bào có thẩm quyền miễn dịch. Các tế bào có thẩm quyền miễn dịch (chủ

yếu gồm 2 loại là lympho bào B và lympho bào C) tham gia vào quá trình đáp ứng miễn dịch

của cơ thể nhằm chống lại các tác nhân lạ xâm nhập. Có 2 kiểu đáp ứng miễn dịch:

113

Kiểu đáp ứng miễn dịch dịch thể: Khi kháng nguyên xâm nhập vào cơ thể, bị đại thực bào

vây bắt, xử lý và trình diện cho lympho bào B. Lympho bào B được biệt hoá thành tế bào

plasma sản xuất ra kháng thể dịch thể. Kháng thể dịch thể tồn tại trong dịch cơ thể (huyết

tương) và sẽ kết hợp đặc hiệu với kháng nguyên.

Kiểu đáp ứng miễn dịch tế bào: Khi kháng nguyên xâm nhập vào cơ thể, bị đại thực bào

vây bắt, xử lý và trình diện cho lympho bào T. Lympho bào T được biệt hoá thành lympho

bào T mẫn cảm kháng nguyên và chính bản thân chúng là kháng thể tế bào. Kháng thể tế

bào tồn tại trên bề mặt tế bào và cũng kết hợp đặc hiệu với kháng nguyên.

Như vậy, theo nghĩa rộng, kháng thể là bất kỳ phân tử nào có khả năng liên kết đặc

hiệu với kháng nguyên. Tuy nhiên, kháng thể sử dụng trong chẩn đoán bằng kỹ thuật

huyết thanh học chính là các kháng thể dịch thể

Kháng thể dịch thể là các globulin miễn dịch (Immunoglobulin-Ig). Có 5 lớp Ig là

IgG, IgM, IgA, IgD và IgE nhưng trong chẩn đoán huyết thanh học, thường chỉ sử dụng

IgG.

Cấu tạo của IgG (xem hình vẽ): gồm 4 phân tử polypeptid (2 chuỗi nặng, 2 chuỗi nhẹ)

liên kết với nhau bằng các cầu nối disulfide. Phân tử IgG có 3 vùng chức năng chính (có

thể tách được bằng một enzym protease là papain)

Hai mảnh Fab (antigen binding fragment) giống nhau về cấu trúc và mang tính chất

kháng thể do chứa vị trí liên kết với kháng nguyên. Các mảnh Fab, khi được tách ra

bằng papain, sẽ vẫn giữ nguyên hoạt tính kháng thể nhưng không thể tạo ra phản ứng

kết tủa hoặc phản ứng ngưng kết.

Một mảnh Fc (cristallizable fragment) không có hoạt tính kháng thể nhưng chứa nhóm

quyết định kháng nguyên của phân tử IgG do vậy khi tiêm phân tử IgG nguyên vẹn

hoặc chỉ cần mảnh Fc từ 1 loài (chẳng hạn thỏ) sang 1 loài khác (chẳng hạn dê) thì loài

thứ 2 sẽ vẫn tạo ra kháng thể đặc hiệu kháng thể của loài thứ nhất (anti-antibody). Đây

là cơ sở cho các kiểu ELISA gián tiếp.

2.4. Kháng thể đơn dòng và kháng thể đa dòng

Kháng thể đơn dòng (Monoclonal antibody (MAb)

Hình. Cấu trúc kháng

thể IgG

114

Là kháng thể được hình thành chỉ từ một dòng lympho bào B

Nhận biết và liên kết với chỉ 1 epitope

Sản xuất phức tạp

Kháng thể đa dòng (Polyclonal antibody (PAb)

Là một hỗn hợp của các kháng thể đơn dòng

Sản xuất đơn giản. Việc sản xuất chỉ bao gồm tiêm kháng nguyên (phân tử virus, protein

virus, protein vi khuẩn, nấm…) vào động vật máu nóng (như thỏ, dê, chuột…) và thu

kháng huyết thanh. Kháng huyết thanh sẽ chứa một hỗn hợp nhiều loại kháng thể, mỗi loại

đặc hiệu cho 1 epitope.

3. Sản xuất kháng thể đơn dòng

3.1. Các bước chính để sản xuất kháng thể đơn dòng gồm

1. Gây miễn dịch trên chuột. Bước này giống như sản xuất kháng thể đa dòng.

2. Dung hợp (lai) tế bào myeloma chuột và tế bào lá lách chuột đã gây miễn dịch.

Nuôi cấy một dòng tế bào myeloma chuột. Tế bào myeloma là một loại tế bào bạch

cầu bị ung thư nên có 2 đặc điểm: (1) không thể sản xuất kháng thể và (2) có thể sinh

trưởng vô hạn định. Ngoài ra, vì chúng bị mất chức năng của gen HGPRT

(hypoxantine guanine phosphoribosyl transferase) nên không thể sống được trên môi

trường HTA (Hypoxanthine Aminopterin Thymidine) vì aminopterin trong môi trường

ức chế một đường hướng sinh hóa liên quan đến biểu hiện gen HGPRT.

Tinh chiết tế bào lá lách của chuột đã gây miễn dịch. Dịch tế bào lá lách sẽ chứa

lympho bào B sản xuất kháng thể. Loại tế bào miễn dịch này có thời gian sống ngắn

và không thể sống được trên môi trường nuôi cấy nhân tạo.

Dung hợp các tế bào lá lách với các tế bào myeloma nhờ PEG (polyethylene glycol)

để tạo ra các tế bào lai (hybridoma). Tế bào lai kết hợp đặc điểm của lympho bào B

(tạo kháng thể) và đặc điểm của tế bào myeloma (sinh trưởng vô hạn định trên môi

trường nhân tạo).

Nuôi cấy tế bào lai trong môi trường chọn lọc. Môi trường chọn lọc chứa HTA

(Hypoxanthine Aminopterin Thymidine) không cho phép sự sinh trưởng của các tế

bào không lai.

3. Kiểm tra sự có mặt của Mabs trong dịch nuôi cấy của từng dòng tế bào lai bằng ELISA

4. Nuôi cấy phục hồi từng dòng tế bào lai có kháng thể mong muốn (ELISA +)

5. Tạo kháng thể từ các dòng tế bào lai có kháng thể mong muốn bằng invitro (trên môi

trường nhân tạo hoặc in vivo (trong cơ thể chuột).

115

3.2. Qui trình tạo kháng thể đơn dòng

(của Đại học Cornell, 2008)

3.2.1 Gây miễn dịch trên thỏ

Sử dụng chuột cái, 8-10 tuần tuổi

Gây miễn dịch trên thỏ 3 lần (ngày 0, 14, 21): tiêm 100 uL dịch protein (1-100 ug kháng

nguyên) + 100 uL adjuvant hoàn toàn (complete adjuvant). Lượng kháng nguyên tiêm lần

đầu gấp đôi lượng kháng nguyên tiêm ở các lần sau.

Lấy máu và thu kháng huyết thanh (~100 uL) trước mỗi lần tiêm.

Kiểm tra sự có mặt của kháng thể trong kháng huyết thanh = ELISA sau ngày 21. Giá trị

ELISA nên tăng trong khoảng 100-1000 sau 21 ngày.

Khi chuột đã hình thành đủ kháng thể (thường sau 3 lần tiêm, đôi khi sau 4 lần), tiêm tiếp

kháng nguyên 3 lần (ngày 28, 29,30) nhưng không hòa với adjuvant.

Thực hiện dung hợp vào ngày 31

3.2.2 Dung hợp (lai)

Làm ấm các môi trường và Polyethylen glycol (PEG) 1500 (hãng Roche) tới 37 OC. Các

môi trường gồm:

o Môi trường HAT (Hypoxanthine Aminopterin Thymidine), hãng Sigma

o Môi trường Hyb-SFM (Hybridsoma Serum-Free Medium). Đây là môi trường chứa

insulin, transferrin và chất kháng sinh đỏ phenol) (hãng Invitrogen)

Hình. Sơ đồ qui trình tạo

kháng thể đơn dòng

116

o Môi trường Hyb-SFM +10 % FBS (foetal bovine serum = huyết thanh bào thai bò).

Môi trường này là môi trường nuôi cấy tế bào (hãng Invitrogen)

Chuẩn bị tế bào myeloma. Tế bào myeloma dòng X63-Ag8.653 được nuôi cấy trong môi

trường Hyb+10% FCS (foetal calf serum) khoảng 1 tuần trước khi dung hợp. Tế bào được

nuôi cấy trong đĩa petri (loại 15 cm) chứa 60 mL môi trường nuôi cấy Hyb+10% FCS

trong tủ ấm.

Thu thập – tinh chiết tế bào lá lách chuột đã gây miễn dịch. Giết chuột và đặt trong cốc

thủy tinh chứa ~200 mL Betadine 80% chứa 20% ethanol 70%. Giải phẫu trong điều kiện

vô trùng để lấy lá lách chuột. Lá lách được chuyển sang đĩa Petri chứa 1 mL môi trường

Hyb SFM + 10%FCS. Cắt lá lách thành các mảnh nhỏ và dùng panh vô trùng ép để giải

phóng tế bào lá lách. Rửa tế bào + tàn dư với 2- 3 mL môi trường (~ 4 lần) và chuyển toàn

bộ sang tube 50 mL. Để tube khoảng 1 phút để lắng tàn dư và hút dịch tế bào sang tube

mới. Ly tâm tube 900-1000 rpm trong 5 phút. Loại bỏ dịch trên tủa và hòa cặn tế bào lá

lách trong 20 mL đệm HYB-SFM + 10% FBS.

Đếm tế bào lá lách (cả hòa loãng 1:10 và không hòa loãng).

Đếm số tế bào myeloma X63 (số lượng yêu cầu = 1/2 số lượng tế bào lá lách).

Trộn trực tiếp tế bào lá lách với tế bào X63

Dung hợp

Ly tâm hỗn hợp tế bào 900-1000 rpm /5 phút.

Rửa tế bào với 25 ml môi trường Hyb-SFM medium. Ly tâm, giữ lại cặn tế bào.

Búng nhẹ ống ly tâm để tách rời tế bào. Cho từ từ1.5ml PEG (cho khoảng 3x108 tế bào

hỗn hợp) vào thành ống, tốc độ khoảng 1 mL/phút (cho từ từ để tế bào khỏi bị phồng).

Sau khi cho PEG xong, trộn đều ống bằng lắc nhẹ.

Ủ ống ở 37 OC / 1 phút.

Dùng pipets cho rất từ từ 20 mL môi trường Hyb-SFM (1mL / phút đầu tiên, 3 mL / phút

thứ 2 và 16 mL/phút thứ 3).

Ly tâm.

Hoà cặn tế bào lai trong môi trường HAT và cho vào các đĩa nuôi cấy tế bào loại 24

giếng. Lượng cho là 2 mL /giếng với nồng độ 106 tế bào / giếng.

Bọc các đĩa với màng Saran và ủ trong tủ định ôn với điều kiện 37°C, 5% CO2.

Dòng hóa

Sau khi ủ khảng 10-14 ngày, các dòng tế bào có thể quan sát thấy bằng mắt và môi trường

ở một số giếng bắt đầu chuyển màu vàng nhạt.

Kiểm tra sự hình thành kháng thể bằng ELISA

Ở các giêngs có phản ứng ELISA (+), chuyển từng dòng tế bào sang giếng của đĩa nuôi

cấy loại 96 giếng chứa 150 uL môi trường

Sau khoảng 3 ngày, thử tiếp ELISA cho từng clone

Các clone + sẽ được nuôi cấy lần lượt trên môi trường HAT => HT => Hyb + 10%FCS.

3.2.3 Sản xuất

Kháng thể có thể được sản xuất bằng 2 cách:

Nuôi cấy các dòng tế bào lai trên môi trường nuôi cấy như Hyb-SFM => tạo số lượng ít

117

Nuôi cấy trong cơ thể chuột bằng cách tiêm tế bào lai vào xoang bụng => tạ số lượng

nhiều

4. Kỹ thuật chẩn đoán bằng ELISA

ELISA (Enzyme Linked Immunosorbent Assay) là một kỹ thuật chẩn đoán quan trọng và

phổ biến nhất hiện nay so với các kỹ thuật huyết thanh học khác. Trong bệnh cây, ELISA

được sử dụng chủ yếu để chẩn đoán virus và một số vi khuẩn. Một trong số các hãng nổi tiếng

có bán các kít ELISA chẩn đoán bệnh cây là Agdia (http://www.agdia.com/).

4.1. Vật liệu chính cho ELISA

Bản ELISA: bằng nhựa (polystyrene), 96 giếng, liên kết không đặc hiệu các loại protein

Các loại dung dich đệm: Đệm nghiền mẫu, đệm pha kháng thể, đệm rửa, đệm pha chất

nền (cơ chất).

Kháng thể các loại

Chất nền: nhiều loại, tùy thuộc enzyme, phổ biến nhất là NPP (nytrophenyl phosphate)

Enzyme: nhiều loại, cần cơ chất tương ứng, phổ biến nhất là alkaline phosphatase (cơ chất

tương ứng là NPP)

Máy đọc ELISA: là một loại thiết bị so màu vi phiến nhằm lượng hóa màu phản ứng.

Dụng cụ nghiền, chiết mẫu cây: chày, cối sứ…

4.2. Các kỹ thuật ELISA.

Có rất nhiều kỹ thuật ELISA khác nhau. Dựa vào quan hệ của kháng thể liên kết enzyme

với kháng nguyên, ELISA có thể được chia làm 2 nhóm (xem hình) là:

Nhóm trực tiếp (direct ELISA): Kháng thể liên kết enzyme là kháng thể phát hiện kháng

nguyên (ví dụ các kỹ thuật I, VIII và IX trong sơ đồ).

Nhóm gián tiếp (indirect ELISA): Kháng thể liên kết enzyme không phải là kháng thể

phát hiện kháng nguyên (ví dụ các kỹ thuật II, III, IV, V, VI, VI trong sơ đồ).

ELISA cũng gồm rất nhiều kiểu khác nhau. Hai ví dụ đang được sử dụng tại BM Bệnh

cây là;

Kẹp kép kháng thể (double antibody sandwich = DAS) (tất cả các kỹ thuật ngoài trừ kỹ

thuật II trong sơ đồ)

Bẫy kháng nguyên trước (plate-trapped antigen = PTA) như kỹ thuật II trong sơ đồ.

Hình Các kỹ thuật ELISA khác nhau.

118

Dưới đây là qui trình thử 2 kiểu phản ứng ELISA đại diện cho mỗi nhóm.

4.2.1 Kỹ thuật ELISA trực tiếp kiểu kẹp kép kháng thể (DAS-ELISA)

Cố định IgG đặc hiệu virus vào bản ELISA: IgG được hoà trong dung dịch đệm phủ

(thường là đệm carbonate) và được cho vào giếng với lượng 100l/giếng. Bản ELISA

được ủ trong hộp ẩm ở 37OC khoảng 2-4 giờ. Bản ELISA, thường cấu tạo bằng

polystirene có khả năng liên kết không đặc hiệu với protein do vậy sẽ liên kết với các

phân tử IgG (là protein miễn dịch). Sau khi ủ, giếng được rửa bằng đêm rửa và nước.

Cố định dịch cây vào bản ELISA: Nghiền mẫu cây đệm chiêt mẫu thành dịch cây. Dịch

cây được cho vào giếng với lượng100l/giếng. Bản ELISA được ủ ở 37OC khoảng 2-4 giờ

hoặc qua đêm ở 4-6OC. Nếu trong dịch cây có chứa virus thì virus sẽ liên kết đặc hiệu với

IgG có sẵn trong giếng còn protein của cây hoặc các virus khác sẽ không liên kết. Sau khi

ủ, bản ELISA được rửa như bước 1.

Cố định IgG liên kết enzim: Hoà IgG liên kết enzim (IgG-E) trong đệm liên kết và cho

vào giếng với lượng 100l/giếng. IgG này giống như IgG của bước 1 nhưng chỉ khác là

nó được liên kết từ trước với 1 enzim là Alkaline Phosphatase (AP). Bản ELISA được ủ

và rửa như bước 1.

Cố định chất nền và đánh giá kết quả: Hoà chất nền trong đệm chất nền theo tỷ lệ

0.6mg/ml) và cho giếng với lượng100l/giếng. Chất nền ở đây là Nitrophenyl phosphate

(NPP). Bản ELISA được ủ ở nhiệt độ phòng trong hộp ẩm trong tối 60 phút. Phản ứng hoá

học ở đây là NPP sẽ bị thuỷ phân thành Nitrophenol phosphate dưới sự xúc tác của enzim

AP. Nitrophenol phosphate là chất có màu vàng, do vậy có thể nhận biết được bằng mắt

hoặc bằng máy đọc ELISA (máy so màu). Hiển nhiên, do nồng độ NPP đều giống nhau ở

các giếng nên giếng nào có màu vàng càng đậm chứng tỏ nồng độ enzim càng cao tức

nồng độ virus trong mẫu thử càng cao. Có thể ngừng phản ứng thuỷ phân bằng cách bổ

sung dung dịch NaOH 3M với lượng 25-50 l/giếng.

4.2.2 Phản ứng ELISA gián tiếp kiểu bẫy kháng nguyên trước (PTA-ELISA)

Cố định dịch cây vào bản ELISA: Nghiền mẫu cây trong đệm phủ và cho 100l/giếng. ủ

bản ELISA qua đêm ở 4-6OC trong hộp ẩm. Sáng hôm sau, rửa 3 lần bằng đệm rửa.

Protein của cây và virus trong dịch cây (nếu có) sẽ liên kết không đặc hiệu vào thành

giếng.

Cố định IgG thỏ đặc hiệu virus vào bản ELISA: Hoà IgG đặc hiệu virus trong đệm huyết

thanh và cho 100l/giếng. ủ bản ELISA ở 25OC 1-2 giờ trong hộp ẩm. Rửa bản ELISA

như bước 1.

Cố định IgG đặc hiệu IgG thỏ liên kết AP vào bản ELISA: Hoà IgG đặc hiệu IgG thỏ

liên kết AP trong đệm liên kết và cho 100l/giếng. ủ bản ở 25OC 1-2 giờ. IgG liên kết AP

thứ 2 này là IgG được tạo ra khi tiêm IgG của thỏ vào 1 loài động vật khác thỏ (chẳng hạn

dê) nên không liên kết với virus mà liên kết với IgG thỏ đặc hiệu virus ở bước 2. Sau khi

ủ, rửa bản như bước 1

Cố định chất nền vào bản ELISA: Thực hiện tương tự như ở DAS-ELISA.