sẢn xuẤt protein trong y hỌc -...

251
Trường Đại Học Nguyễn Tất Thành Khoa Công Nghệ Sinh Học SẢN XUẤT PROTEIN TRONG Y HỌC TS. TRẦN HOÀNG DŨNG Tháng 04/2012

Upload: dinhhanh

Post on 07-Feb-2018

255 views

Category:

Documents


15 download

TRANSCRIPT

Page 1: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Trường Đại Học Nguyễn Tất ThànhKhoa Công Nghệ Sinh Học

SẢN XUẤT PROTEINTRONG Y HỌC

TS. TRẦN HOÀNG DŨNG

Tháng 04/2012

Page 2: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

1

Chương 1DNA - CẤU TRÚC VÀ CHỨC NĂNG

Những khái niệm chính Các thông tin di truyền được chứa trong các axit nucleic.DNA là một sợi đôi xoắn song song ngược chiều nhau. Cặp base (A với T và G để C) giữ hai sợi xoắn lại với nhau. Sự sao chép DNA xảy ra thông qua việc tháo xoắn của các sợi DNA và sao

chép trên mỗi chuỗi. Các nguyên lý trung tâm của sinh học phân tử:DNA phiên mã RNA dịch mã Protein Phiên mã là việc sản xuất một bản sao RNA của một trong các sợi DNA.Dịch mã là giải mã của một phân tử RNA để sản xuất protein.Mỗi sinh vật sở hữu các thông tin cần thiết để xây dựng và duy trì một bản sao

sống của chính nó. Các khái niệm cơ bản về di truyền và kết quả cho thấy các gen cóthể được truy hồi trở lại năm 1865 và các nghiên cứu của Gregor Mendel được thảoluận bởi Orel (1995). Từ những kết quả của thí nghiệm của ông với đậu Hà Lan,Mendel kết luận rằng mỗi cây đậu Hà Lan có hai alen cho mỗi gen nhưng chỉ hiển thịmột kiểu hình đơn lẻ. Có lẽ thành tích xuất sắc nhất của Mendel là khả năng xác địnhđúng một hiện tượng phức tạp mà không có sẵn những kiến thức về các quá trình phântử liên quan đến việc hình thành các hiện tượng đó. Sự di truyền qua tinh dịch và trứngđược biết cùng một thời điểm và Ernst Haeckel ghi nhận tinh trùng bao gồm phần lớncác vật liệu từ nhân, mặc nhiên đã công nhận rằng nhân đóng vai trò về tính di truyền.1.1. Acid nucleic là vật chất của di truyền

Ý tưởng cho rằng vật chất di truyền là chất truyền từ cha mẹ sang con theo quyluật tự nhiên đã được thừa nhận như là các khái niệm về sự di truyền đã được kế thừatrước đây. Cả hai protein và axit nucleic được xem là chất có vai trò quan trọng trongvật chất di truyền. Cho đến những năm 1940, nhiều nhà khoa học nghiên cứu vềprotein. Có hai lý do chính cho việc này. Thứ nhất, protein có nhiều ở các tế bào, mặcdù số lượng của một protein riêng biệt thay đổi đáng kể từ các loại tế bào khác nhau,hàm lượng protein tổng thể của tế bào nhất chiếm trên 50% trọng lượng khô. Thứ hai,axit nucleic có thể dễ dàng để vận chuyển các thông tin phức tạp, cần thiết để truyềnđạt những đặc điểm của tính di truyền. DNA (deoxyribonucleic acid) lần đầu tiên đượcxác lập vào năm 1869 bởi nhà hóa học Thụy Sĩ Johann Friedrich Miescher. Ông táchnhân từ tế bào chất của tế bào và sau đó nó được tách bởi một chất có tính axit từ cácnhân mà ông gọi là nuclein. Miescher cho thấy nuclein có chứa một lượng lớnphosphorus và không có lưu huỳnh, đặc tính mà có thể phân biệt chúng với protein. Từnhững gì đã được chứng minh cho ta có một cái nhìn tổng thể, ông cho rằng "nếumuốn giả định rằng một chất đơn lẻ. . . là nguyên nhân của sự thụ tinh thì chúng ta nênchắc chắn rằng tất cả các suy nghĩ đầu tiên là về nuclein.

Năm 1926 dựa trên ý tưởng về DNA bao gồm bốn nhóm nucleotide khác nhau,bằng cách xác định các loại hình liên kết mà nó đã tham gia liên kết với các

Page 3: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

2

nucleotide, Levene và Simms đề xuất một cấu trúc của bốn nucleotide (Hình 1.1) đểgiải thích trình tự sắp xếp hóa học của nucleotide trong axit nucleic (Levene vàSimms, 1926). Họ tìm thấy một nucleotide đơn của bốn loại đã được lặp đi lặp lạinhiều lần để tạo thành phân tử acid nucleic dài. Bởi vì cấu trúc của bốn nucleotide làtương đối đơn giản, axit nucleic không có khả năng làm biến đổi tính chất hóa học củacác vật chất di truyền. Protein có chứa 20 acid amin khác nhau.

Hình 1.1. Đề xuất của Levene Simms năm 1926 về các mô hình bốn nucleotidecủa cấu trúc axit nucleic. Vào thời gian đó mô hình này đã được đề xuất, người ta chorằng acid nucleic của thực vật và động vật có thể là khác nhau và sự khác biệt giữaDNA và RNA chưa hoàn toàn được hiểu rõ.

Năm 1928, Frederick Griffith tiến hành thí nghiệm bằng cách sử dụng một vàichủng vi khuẩn Streptococcus pneumoniae khác nhau (Griffith 1928). Một số các dòngsử dụng được gọi là dòng độc hại, chúng gây ra viêm phổi ở cả người và chuột. Một sốdòng khác thì không gây độc và không gây bệnh. Cả hai dòng này có hình thái riêngbiệt trong đó các dòng gây bệnh có một lớp vỏ polysaccharide bao quanh vi khuẩn vàhình dáng bên ngoài mượt mà, tạo bề mặt nhẵn khi được nuôi cấy trên các tấm thạch.Vi khuẩn không độc thì không có lớp vỏ và tạo một vùng nhám trên cùng một mẫu.Các vi khuẩn dòng nhẵn thì nguy hiểm vì các viên đường cấu tạo từ lớp vỏ sẽ loại bỏhệ thống miễn dịch của động vật nhiễm bệnh và do đó chúng có thể nhân rộng và gâyra bệnh viêm phổi. Các vi khuẩn gặp khó khăn khi không có các viên nangpolysaccharide nên sẽ không có sự bảo vệ này, do đó chúng dễ dàng xâm nhập và pháhuỷ hệ thống miễn dịch của vật chủ.

Griffith biết rằng chỉ có vi khuẩn độc sống sẽ tạo ra bệnh viêm phổi khi tiêm vàochuột. Nếu giết chết vi khuẩn gây độc bởi nhiệt sau đó tiêm vào chuột, kết quả chothấy không có bệnh viêm phổi cũng giống như vi khuẩn sống không độc, không gâybệnh khi tiêm vào chuột. Thí nghiệm quan trọng của Griffith (hình 1.2) liên quan đếnviệc tiêm vào chuột vi khuẩn sống không độc (avirulent) kết hợp với vi khuẩn độc xửlý nhiệt. Không có loại tế bào gây ra tử vong ở chuột khi họ tiêm, nhưng tất cả nhữngcon chuột thu được kết hợp tiêm thuốc thì sẽ bị chết. Các phân tích máu của những conchuột đã chết cho thấy một số lượng lớn các vi khuẩn độc sống khi nuôi trên các tấmthạch. Griffith đã kết luận rằng nhiệt giết chết vi khuẩn nhẵn và bằng cách nào đó chúngđóng vai trò chuyển vi khuẩn nhẵn vào vi khuẩn sống. Ông gọi hiện tượng này là hiệntượng biến nạp và cho rằng nguyên tắc biến nạp có thể là do một số thành phần của viênnang hay hợp chất polysaccharide là nguyên nhân để tổng hợp nên tác nhân gây bệnh,mặc dù ông lưu ý rằng các viên đường một mình nó không gây ra bệnh viêm phổi.

Page 4: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

3

Hình 1.2. Các tính năng chính của thí nghiệm của Griffith, kết hợp với dữ liệucủa Avery, MacLeod và McCarty để xác định DNA là nguyên tắc chuyển đổi từStreptococcus pneumoniae. Griffith lưu ý rằng tiêm vi khuẩn nhẵn sống vào chuột dẫnđến sự hình thành của bệnh viêm phổi và cuối cùng đến cái chết của chuột. Xử lý nhiệttrước khi tiêm vi khuẩn không gây ra sự hình thành của bệnh. Không độc đối vớichủng vi khuẩn, mà không gây ra các bệnh riêng của chúng, có thể được chuyển đổibằng cách tiêm kết hợp với xử lý nhiệt vi khuẩn độc hại. Avery, MacLeod và McCartyxác định DNA là nguyên tắc chuyển đổi.

Như vậy tác nhân nào đó từ phế cầu khuẩn đã biến nạp và làm cho phế cầu khuẩntừ R chuyển sang S. Người ta chứng minh được rằng :DNA tách từ vi khuẩn S nếuđược đưa vào vi khuẩn R thì gây nên sự biến đổi kiểu R sang S, phát hiện này khẳngđịnh DNA là vật chất di truyền. Trong hơn 10 năm trời kể từ sau thí nghiệm của ông,Oswald Avery cùng với Macleod và McCarty đã tiến hành trở lại thí nghiệm biến nạpnày nhưng dùng trong in vitro.

Năm 1944, Oswald Avery, Colin MacLeod và Maclyn McCarty xuất bản tácphẩm của họ cho thấy rằng các phân tử đóng vai trò là yếu tố cơ bản chuyển đổi làDNA (Avery, MacLeod và McCarty, 1944). Họ bắt đầu bằng cách nuôi số lượng lớn tếbào Streptococcus pneumoniae nhẵn. Các tế bào được thu nhận từ các môi trường nuôicấy và sau đó giết chết bởi nhiệt. Sau đó đồng nhất và sử dụng chất tẩy rữa, họ thuđược một phần chiết được kiểm tra bằng cách tiêm vào vi khuẩn sống theo nhữngnguyên tắc biến nạp. Protein đã được gỡ bỏ từ dịch chiết của chloroform vàpolysaccharides được nhiều enzyme tiêu hóa và loại bỏ. Cuối cùng, những phần kếttuả với ethanol đã tạo ra một khối lượng xơ mà vẫn giữ lại khả năng gây ra biến nạpcủa các tế bào vi khuẩn sù sì (avirulent). Từ 75 lít môi trường nuôi cấy của các tế bào

Page 5: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

4

vi khuẩn, sau quá trình thu được 10-25 mg từ các yếu tố hoạt động. Những thí nghiệmđược thiết lập qua một nghi ngờ rằng nguyên tắc biến nạp là DNA. Khối lượng các sợisơ được phân tích dựa trên tỷ lệ nitơ / phốt pho, được biểu hiện trùng khớp với tỷ lệ dựkiến với DNA. Để loại bỏ tất cả các chất gây ô nhiễm có thể xảy ra từ chúng khi giảiphóng, họ tiến hành xử lí với nó với enzym thủy phân protein trypsin và chyomtrypsinvà sau đó họ dùng phương pháp xử lí bằng cách tiêu hóa nó với một RNA enzyme tiêuhóa ribonuclease, nó sẽ bị phá hủy bất kỳ hoạt động còn lại của protein và RNA nhưngvẫn giữ lại các hoạt tính chuyển đổi. Việc xác nhận cuối cùng DNA đã được chuyểnđổi bằng cách tiêu hóa dịch chiết với deoxyribonuclease, chúng sẽ bị phá hủy hoạtđộng chuyển đổi.

Năm 1944, O.T Avery Mc Carti đã chứng minh được rằng tác nhân biến nạp làDNA. Phế cầu khuẩn bị xử lí bằng protease hoặc RNA-aza thì hoạt tính biến nạp vẫncòn: nhưng nếu phế cầu khuẩn S bị xử lí bởi DNA-aza thì hoạt tính biến nạp không cònnữa (Cơ sở và phương pháp phân tích sinh học phân tử, T.s Chu Hoàng Mậu, trang 9).

Việc thứ hai chứng minh bằng chứng rằng ADN là vật liệu di truyền đã đượccung cấp bởi các nghiên cứu về sự lây nhiễm của vi khuẩn Escherichia coli bởi mộttrong những virus phage T2 . Thường gọi đơn giản là thể thực khuẩn, virus bao gồmmột lớp vỏ protein bao quanh một lõi của DNA (xem hình 1.3).

Hình 1.3. Vòng đời của thể thực khuẩn T2. Trong quá trình xâm nhiễm, vi khuẩnbám vào các bề mặt của tế bào Escherichia coli. Truyền các thông tin di truyền nhưngkhông phải là toàn bộ nhân thể thực khuẩn được chèn vào trong vi khuẩn, nơi nó đượcnhân rộng. Các thể thực khuẩn được sao chép, lớp vỏ protein vẫn còn ở bề mặt của vikhuẩn. Sau khi tổng hợp các nhân thể thực khuẩn mới được sản xuất, ly giải tế bào vikhuẩn và các nhân thể thực khuẩn được giải phóng vào môi trường xung quanh.

Trong những năm 1950 chúng ta ít được biết về thể thực khuẩn lây nhiễm. Thểthực khuẩn được biết là hấp thụ vào bề mặt của vi khuẩn, sau đó có một giai đoạn tiềm

Page 6: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

5

ẩn của chúng khoảng mười phút trước khi các virus lây nhiễm bắt đầu được thực hiện,cuối cùng dẫn đến ly giải tế bào và phóng thích thể thực khuẩn. Alfred Hershey vàMartha Chase lý luận rằng nếu họ biết bản chất của các protein thể thực khuẩn và acidnucleic vào đầu của quá trình xâm nhiễm, họ sẽ hiểu hơn về bản chất của những bướcđầu tiến trình.

Hình 1.4. Hershey -Chase thử nghiệm cho thấy acid nucleic là vật chất di truyền.Hershey và Chase tăng bacteriophages T2 là vi khuẩn có khả năng truyền tải P32trongmôi trường (để đánh dấu phốt pho của axit nucleic) hoặc S35(để đánh dấu lưu huỳnhcủa các protein trong các chuỗi bên của các axit amin methionine và cysteine chứalưu huỳnh). Họ sử dụng phóng xạ đánh dấu bacteriophages của chúng để lây nhiễmmột môi trường nuôi cấy mới của vi khuẩn không đánh dấu. Sau khi ủ bệnh ngắn, vikhuẩn đã được thu nhận bằng cách ly tâm và đưa vào máy khuấy để tách các vi khuẩnđi từ thể thực khuẩn gắn liền với bề mặt của nó. Họ thấy rằng, khi DNA đã được đánhdấu, các chất đánh dấu được chuyển vào các tế bào vi khuẩn, trong khi các proteinđánh dấu vẫn được gắn phage thực khuẩn. Họ kết luận là vật chất di truyền -tức làcác vật chất truyền cho con cái - là nucleic acid.

Họ sử dụng đồng vị phóng xạ P32và S35 để thực hiện theo các thành phần phân tửcủa các thực khuẩn trong xâm nhiễm (Hình 1.4). Vì DNA có chứa phốt pho nhưngkhông chứa lưu huỳnh, P32 hiệu quả với DNA và bởi vì các protein có chứa chứa lưuhuỳnh nhưng không phốt pho, S35 được đánh dấu lên protein. Nếu E. coli tế bào đượcnuôi cấy trong sự hiện diện của P32 hoặc S35 và sau đó bị nhiễm virus T2, các tổng hợpthực khuẩn mới sẽ có cả một lõi DNA được đánh dấu phóng xạ hoặc protein vỏ đánh

Page 7: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

6

dấu phóng xạ tương ứng. Những thực khuẩn có đánh dấu có thể được phân lập từ môitrường nuôi cấy bị nhiễm bệnh và được sử dụng để lây nhiễm vi khuẩn khác không đượcđánh dấu. Hershey và Chase đánh dấu các thực khuẩn T2 với một trong hai chất phóngxạ S35 hoặc P32 và cho phép chúng hấp thu vi khuẩn không được đánh dấu. Các tế bàonày sau đó được tách ra bằng cách ly tâm. Các tế bào được tạo huyền phù và việc dừngpha trộn để tách phần bên trong của thể thực khuẩn từ vi khuẩn bị nhiễm bệnh. Nhữngphần không chứa các vật chất di truyền, mà được nhân rộng trong các vi khuẩn chủ.Hershey và Chase thấy rằng khoảng 80% của S35 đánh dấu đã được gỡ bỏ từ các vikhuẩn trong khi chỉ khoảng 20% của P32 đánh dấu đã được gỡ bỏ. Họ kết luận rằng hầuhết các DNA thể thực khuẩn xâm nhập vào tế bào và một dư lượng có ít nhất 80%protein có chứa lưu huỳnh của thể thực khuẩn vẫn còn ở bề mặt tế bào. Điều này chothấy cùng với lúc đó Avery, MacLeod và McCarty cung cấp bằng chứng rằng DNA làphân tử có vai trò về tính di truyền học. Hershey và Chase hơi nghi nghờ về những pháthiện của họ và sau đó họ kết luận protein không có chức năng trong nhân thể thực khuẩnvà DNA có một số chức năng (Hershey và Chase, 1952).1.2 Cấu trúc của acid nucleid

Như chúng ta đã thấy trong phần trên, các vật chất di truyền là DNA hay đúnghơn axit nucleic. Trong hầu hết các sinh vật, vật chất di truyền là DNA. Tuy nhiên,một số virus sử dụng RNA (ribonucleic acid) là những khối vật chất xây dựng cho hệgen của chúng. DNA và RNA là những phân tử cao phân tử được tạo thành từ chuỗituyến tính của các tiểu đơn vị nucleotide. Mỗi nucleotide có ba phần: một gốc basenitơ, 5 nguyên tử carbon, đường và một nhóm phosphate (Hình 1.5). Sự kết hợp củacác base và đường được gọi là một nucleoside, trong khi các base-phosphate- đườngđược gọi là một nucleotide. Chúng bao gồm đường 2’-deoxyribose, các nucleotide củaDNA được gọi là deoxyribonucleotides, trong khi những thành phần của RNA có chứacác đường ribose được gọi là ribonucleotides. Các base của nucleotide có thể là baogồm một vòng purine hoặc một pyrimidine . DNA và RNA được xây dựng từ hai vòngpurine và hai vòng pyrimidine có chứa nucleotide. Cácvòng purin của cả DNA vàRNA là như nhau bao gồm adenine (A) và guanine (G). Các vòng pyrimidine gồmcytosine (C) cũng được tìm thấy ở cả hai loại axit nucleic, trong khi pyrimidine gồmthymine (T) được giới hạn trong DNA, nó được thay thế bởi uracil (U) trong RNA.

Hệ thống đánh số cho nucleotide được sử dụng rộng rãi trong các văn bản nàyđược thể hiện trong hình 1.5. Mỗi nguyên tử carbon và nitơ trong vòng pyrimidine củacả hai và vòng purine được đánh số tương ứng 1-6 hoặc 1-9. Các nguyên tử cacboncủa vòng đường hoặc là ribose hoặc deoxyribose được đánh số từ 1 đến 5. Như vậy,2’-deoxyribose thiếu một nhóm hydroxyl thuộc carbon 2 của vòng đường.Cácnucleotide riêng biệt được kết nối với nhau trong cả DNA và RNA thông qua gốcphosphate- đường kết nối từ các nhóm hydroxyl trên carbon số 3 của một nucleotidevới nhóm phosphate vào carbon số 5 trên một nucleotide khác. Xem (Hình 1.6. )Hainucleotide liên kết với nhau được gọi là một dinucleotide, ba được gọi là trinucleotidevà nhiều kết nối trong một chuỗi dài được gọi là một polynucleotide.

Page 8: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

7

Hình 1.5. Cấu trúc của các purin và pyrimidine các axit nucleic. Các base đượcđánh dấu bằng màu da cam và các nhóm đường được đánh dấu bằng màu xanh. Bêndưới là hệ thống đánh số được sử dụng trong văn bản này. Các nguyên tử của vòngpurine được đánh số từ 1 đến 9 và các thành phần của vòng pyrimidine được đánh sốtừ 1 đến 6. Các nguyên tử của các đường được đánh số từ 1 đến 5.

Hình 1.6. Việc liên kết của các nucleotide như adenine và guanine của mộtnucleotide. Các phosphate gắn với đường trên vòng của guanine được chỉ định là α, βhay γ. Trong sự hình thành của các dinucleotide, pyrophosphate (đại diện cho β và γphosphate) là bị mất và các liên kết trong đó liên kết phosphodiester các hydroxyl 3’

Page 9: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

8

đến phosphate về các bon 5‘nguyên tử của đường. Các phân tử DNA luôn có mộtphosphate 5’tự do và hydroxyl 3’.

Trong những năm 1950, nhà hóa học Erwin Chargaff thực hiện thí nghiệm tìm racấu trúc, thành phần hóa học của axit nucleic và ông nhận ra rằng axit nucleic chứa cácthành phần tỷ lệ không bằng nhau của mỗi nucleotide. Chargaff tách DNA từ một sốsinh vật, cả hai sinh chất và nhân điển hình (Chargaff, Lipshitz và Green, 1952, vàcộng sự Chargaff, 1951; Zamenhof, Brawerman và Chargaff, 1952). Ông thủy phânDNA vào thành phần nucleotide của nó bằng cách xử lý với axít mạnh và sau đó táchcác nucleotide bằng sắc ký giấy. Thí nghiệm của ông cho thấy các tỷ lệ tương đối của4 base không bằng nhau nhưng cũng không phải ngẫu nhiên. Số lượng adenine (A)(residues )dư lượng trong tất cả các mẫu DNA đã bằng với số thymine (T) dư lượng,trong khi số lượng guanine (G) dư lượng ngang bằng với số cytosine (C) dư lượng(Bảng 1.1). Chargaff quy định rằng đối với bất kỳ loài nào thì:

A = T và G = CTổng các purin = Tổng các pyrimidineTỷ lệ phần trăm (C + G) không nhất thiết phải bằng tỷ lệ phần trăm (A+T).Những phát hiện này mở ra khả năng cho sự sắp xếp chính xác của các

nucleotide trong một phân tử DNA, nhưng ý nghĩa cơ bản của các T = A và G = C sựtương quan giữa C đã không được đầy đủ nhận thấy cho đến khi cấu trúc ba chiều củaDNA được tìm ra . Như chúng ta sẽ thấy sau này, trong DNA thì A luôn cặp với T vàG luôn cặp với C.

Bảng 1.1 Nguyên tắc Chargaff’s. Tỷ lệ của các loại nucleotide được tách từ DNAcủa các nguồn vi sinh vật khác nhau.Trong khi tỷ lệ của các vòng của purine: purinevà pyrimidine: pyrimidine biến thiên rộng, tỷ lệ của purine:pyrimidine được tìm thấylà hằng số không đổi.

Giữa năm 1940 và 1953 nhiều nhà khoa học quan tâm trong việc tìm kiếm cấutrúc của DNA. Nhiễu xạ tia X như là một phương pháp xác định cấu trúc protein đã trởthành một kỹ thuật xác định. Nhiễu xạ tia X liên quan đến việc bắn một tia X tại mộtchuỗi chính xác của các phân tử hoặc tinh thể hoặc một sợi. Khi chùm tia X va chạm

Page 10: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

9

vào một nguyên tử trong chuỗi đó chúng sẽ được nhiễu xạ và các chùm tia nhiễu xạđược phát hiện như những đốm trên phim của tia X. Phân tích các mẫu nhiễu xạ thìcho biết các thông tin về cấu trúc và hình dạng của các phân tử trong chuỗi. Đầu năm1938 William Astbury áp dụng các kỹ thuật lên các sợi DNA. Tới năm 1947, ông đãphát hiện một chu kỳ trong DNA dài khoảng 0,34 nm. Giữa năm 1950 và 1953,Rosalind Franklin được cải tiến dữ liệu tia X từ các mẫu DNA tinh khiết cao. Côngviệc của bà khẳng định có tính chu kỳ và cho rằng cấu trúc của DNA bao gồm một sốdạng xoắn. Franklin đã không đề xuất một mô hình cho cấu trúc của DNA. Thay vàođó, Linus Pauling và Robert Corey sử dụng dữ liệu của Franklin, cùng với điều đó củamột người khác và đã đề xuất rằng DNA là một chuỗi xoắn ba với phosphate gần trungtâm của trục và các base ở bên ngoài (Pauling và Corey, 1953).1.3 Sợi xoắn kép

Franklin đã lưu ý rằng các sợi DNA có thể cho hai loại hình ảnh nhiễu xạ khácnhau và chúng phụ thuộc vào cách chuẩn bị và lưu trữ các mẫu. Điều đầu tiên (cấu trúcA) là các sợi tương đối mất nước, thứ hai (Cấu trúc B) đã được phổ biến trên một loạtcác ghi nhận. Bà nhận thấy rằng sự thay đổi từ cấu trúc A đến cấu trúc B được đảongược, tùy thuộc vào mức độ mẫu hydrat hóa (Franklin và Gosling, 1953). Người tacho rằng các dạng B của DNA là quan trọng trong cấu tạo sinh học. Dạng DNA (hìnhdạng A xoắn phải và hình dạng Z xoắn trái) chắc chắn vẫn tồn tại nhất định trong cácđiều kiện và có thể đóng vai trò quan trọng trong quá trình vận chuyển của các tế bào.Ví dụ, một loại của các protein liên kết đặc biệt với Z-DNA gần đây đã được mô tả(Schwartz và cộng sự năm 2001). Ở đây chúng tôi sẽ tập trung vào các đặc tính và sựtương tác của hình dạng cấu trúc B của DNA.

Năm 1953, James Watson và Francis Crick đã cố gắng để xây dựng mô hìnhphân tử của ADN và nhận ra rằng các cấu trúc Pauling -Corey là không chính xác, mộtsố nguyên tử cần phải xích lại gần nhau hơn. Bằng cách kết hợp mẫu nhiễu xạ tia Xcủa Franklin cùng với nguyên tắc Chargaff, Watson và Crick đã đề xuất mô hình xoắnkép vào năm 1953 (Watson và Crick, 1953a). Mô hình này thể hiện trong hình 1.7, nócó các tính năng chủ yếu dưới đây và một trong số đó đã được cập nhật một ít từ môhình ban đầu trong ánh sáng của độ phân giải cao trong dữ liệu nhiễu xạ tinh thể tia X.

(A) Hai chuỗi polynucleotide dài cuộn quanh một trục trung tâm, tạo thành mộtchuỗi xoắn kép hướng xoắn phải, điều này có nghĩa rằng các các vòng xoắn theo chiềukim đồng hồ khi nhìn từ trên xuống trục xoắn ốc.

(B) Hai chuỗi được xoắn đối song song, có nghĩa là mỗi chuỗi có một hướngxoắn đặc trưng và chạy ngược chiều nhau.

(C) Các base của cả hai chuỗi là những cấu trúc phẳng, nằm vuông góc với trục.Chúng được "xếp chồng lên nhau", cách nhau 0,34 nm và hướng vào bên trong củađường xoắn ốc này.

(D) Base nitơ của các sợi ngược chiều nhau được liên kết với nhau bởi liên kếthydro.

Page 11: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

10

(E) Mỗi vòng xoắn hoàn chỉnh có chiều dài là 3,4 nm. Điều này có nghĩa là chỉcó hơn 10 cặp base từ mỗi sợi (10,4 bp) tạo thành một vòng hoàn chỉnh của đườngxoắn ốc này.

(F) Theo chiều dài của một phân tử, các khe lớn thì rộng và các khe nhỏ thì hẹpđược phân biệt rõ ràng trong cùng đường xoắn ốc.

(G) Kích thước đường kính của đường xoắn được tăng gấp đôi khoảng 2 nm.Các liên kết của các base nitơ ở trung tâm của đường xoắn ốc là tính năng quan

trọng nhất của mô hình của Watson và Crick. Tuy nhiên, một số tính năng khác cũngrất quan trọng để hiểu được chuỗi xoắn kép.1.3.1 Các sợi xoắn đối song song

Bản chất của các sợi xoắn đối song song của hai chuỗi polynucleotide là mộtphần quan trọng của chuỗi xoắn kép. Do hạn chế của các góc liên kết của các cặp basevà phosphate , đường, các chuỗi xoắn kép có thể không được hình thành một cách dễdàng nếu cả hai chuỗi chạy song song cùng chiều. Một chuỗi xoắn chạy bắt đầu từ đầu3’đến 5’ và các chuỗi khác chạy bắt đầu từ đầu 5’ đến 3’. Điều này được minh họatrong hình 1.8.

Hình 1.7. Các Watson và Crick mô hình của DNACác danh pháp đầu 5’ và 3’ là bắt nguồn từ hệ thống đánh số của vòng đường mà

chúng ta đã thấy trong hình 1.5. Theo quy ước, trình tự DNA được viết theo hướng 5’đến 3’. Điều này có nghĩa là một chuỗi DNA duy nhất bắt đầu với một nhómphosphate tự do trên carbon 5 của một vòng deoxyribose. Nucleotide bổ sung đượctham gia vào chuỗi thông qua liên kết phosphodiester, mà liên kết các nhóm hydroxyltrên nguyên tử cacbon 3 của một đường với các phosphate trên nguyên tử cacbon 5 củamột đường liền kề. Chuỗi kết thúc bằng một nhóm hydroxyl tự do trên các nguyên tửcacbon 3 của đường cuối cùng.

Page 12: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

11

Hình 1.8. Các cặp base của DNA liên kết và bổ sung. Hai chuỗi xoắn này, mũitên trong hướng 3 đến 5, được xoắn đối sog song. Các cặp base trên một sợi xoắnđược bổ sung cho nhau trên sợi đối diện, một cặp base A luôn luôn cặp với T và cặpbase G luôn luôn cặp với C.1.3.2 Cặp Base và cách sắp xếp

Các base của cả hai chuỗi DNA là những cấu trúc phẳng nằm gần vuông góc vớitrục xoắn ốc. Các base của chính nó được xếp chồng lên nhau trong mỗi chuỗi. Sắpxếp này là minh họa tốt nhất qua sự kiểm tra của một mô hình mà máy tính đưa ra đểkiểm tra độ phân giải cao dữ liệu của nhiễu xạ tia X (hình 1.9). Nó có thể được lưu ýrằng không phải tất cả các cặp base là đều vuông góc với trục xoắn và một số vị tríxoắn cho thấy các cặp base của các vòng purine và pyrimidine không nằm bằng phẳngvới nhau nhưng chúng xoắn đối với mỗi vị trí khác, như các cánh trong cùng một cánhquạt (Dickerson, 1983). Các liên kết của một vòng purine (A hoặc G) với mộtpyrimidine (T, C) trong vòng xoắn này là quan trọng đối với sự hoàn chỉnh của cácđường xoắn ốc.

Page 13: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

12

Hình 1.9. Máy tính tạo ra mô hình của DNA. Cấu trúc của dạng DNA sợi B gấpđôi bắt nguồn từ nhiễu xạ tia X có độ phân giải cao của các tinh thể DNA. Nguyên tửoxy được tô màu đỏ, phosphorus là màu cam, màu trắng carbon và nitơ là màu xanh.

Độ dài liên tục của vòng purine-pyrimidine ghép nối sẽ bị phá vỡ nếu xảy ra cáccặp purine-purine (quá lớn) hoặc pyrimidine-pyrimidine (quá nhỏ). Các cặppyrimidine- purine được bổ sung cho nhau và hai sợi của một phân tử ADN đơn lẻ bổsung cho nhau. Như vậy, nếu trình tự 5’-ATGATCAGTACG-3’ xảy ra trên một sợiAND thì các sợi khác phải có trình tự 5’-CGTACTGATCAT-3’. Hai chuỗi được bổsung cho nhau:

Chúng ta sẽ thấy trong nhiều chương sau, những ý tưởng của sự phân bổ giữa haisợi DNA là cơ sở của nhiều thí nghiệm trong kỹ thuật di truyền. Các liên kết của haisợi DNA rất cụ thể, chính xác phù hợp giữa hai sợi DNA. Giống như những liên kếtở trên có tính ổn định cao và dễ dàng hình thành xoắn. Như chúng ta sẽ thấy sau này,hai sợi DNA mà không bổ sung cho nhau nhưng có vẫn còn ở mức bổ sung cao vẫngiữ lại khả năng tương tác với nhau.

Page 14: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

13

1.3.3 Các thông tin có được truyền đến nhau hay không khi mà chúng ta phá vởcác sợi xoắn kép ra xa nhau

Làm thế nào để thông tin có thể tổ chức trong chuỗi DNA được đọc mà khôngcần phải làm sáng tỏ các chuỗi xoắn kép? Bản chất bất biến của liên kết giữa đường -phosphate dường như không thể bị phá vở các trình tự cơ bản DNA. Các khe dọc theotrục xoắn ốc đã cung cấp một cơ chế mà trong đó các base có thể được phân biệt vớinhau. Như chúng ta có thể thấy trong hình 1.7

Hình 1.10. Sự tương tác giữa các gen ức chế-λ của vi khuẩn λ và DNA. Máy tínhtạo ra mô hình của sự tương tác giữa DNA, chúng được thể hiện bằng cách sắp xếpmàu như trong hình 1.9 và gen ức chế λ, có α-xoắn được thể hiện trong màu xanh lácây và được liên kết bởi các axit amin mà không thông qua cấu trúc thứ. Hai phân tửcủa gen ức chế λ (một dimer) tương tác với một phân đoạn bp 17 của-DNA chuỗi xoắnkép. (B) chuỗi xoắn 5 của gen ức chế λ. Mỗi monomer gen ức chế của DNA ràng buộcmiền λ có sợi xoắn 5, đánh số 1-5 từ cuối amin của protein. Đường xoắn 3 nằm trongrãnh lớn và các chuỗi bên (không hiển thị) mở rộng đến các cạnh của các rãnh lớn,tiếp xúc với các cơ sở DNA. Hình dạng xoắn 2 và 3 xoắn cuộn ràng buộc motif DNAđược tìm thấy trong nhiều loại protein liên kết ADN. Sợi xoắn 3 là chuỗi xoắn nhậndạng và có hình dạng chuỗi đặc trưng trình tự ADN trong các khe lớn, trong khi xoắn2 là chuỗi xoắn ổn định tương tác không đặc trưng với các trục chính của sợi DNAđể cung cấp ổn định cho các protein tương tác DNA.

DNA bao gồm các khe được xếp chủ yếu và một số khe nhỏ dọc theo trục của nó.Đây là kết quả của các liên kết glycosidic có đính kèm một cặp base với đường trongvòng của nó, chúng không nằm trực tiếp đối diện nhau qua trục xoắn ốc. Kết quả làtrục chính của các chuỗi xoắn kép liên kết giữa đường- phosphate không đều nhau dọctheo trục xoắn và các khe hình thành giữa các trục chính không bằng nhau. Các khelớn rộng (~ 0,22 nm) và nông, trong khi các khe nhỏ hẹp (~ 0,12 nm) và sâu. Cácnhóm chính bao gồm chủ yếu là nitơ và oxy nguyên tử của mỗi cặp base.

Ngược lại, khe nhỏ được che lấp bởi nguyên tử nitơ và oxy nói chung hoặc là cácvòng purines hoặc pyrimidine. Như vậy, khả năng tương tác các rãnh lớn cho cho thấy

Page 15: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

14

nó phụ thuộc nhiều vào trình tự cơ bản của các rãnh nhỏ. Phát hiện này đã dẫn tới sựsuy đoán rằng trình tự ADN cụ thể nhận ra các protein liên kết DNA bằng cách hìnhthành liên kết hydro chủ yếu giữa các nhóm cụ thể ở vị trí bên trong và dọc theo cácđường rãnh lớn. Một trong những cách phổ biến nhất trong đó các protein có thể nhậnra các chuỗi ADN cụ thể là bằng cách chèn các protein xoắn α vào các rãnh chính củaADN. Các chuỗi xoắn α, ban đầu được mặc nhiên công nhận bởi Pauling và Coreynăm 1951. Nó là một protein cấu trúc thứ cấp, trong đó một vòng xoắn phải được hìnhthành bởi các axit amin trên một chuỗi polypeptide (Pauling và cộng sự năm 1951).Mỗi axit amin trong chuỗi xoắn chiếm một khoảng cách 0,15 nm, và có 3,6 amino acidcủa các chuỗi xoắn (xem phụ lục 1). Đường kính của trục polypeptide trong một xoắnα là khoảng 0,5 nm, tuy nhiên acid amin chuỗi có kích thước xa trục xoắn ốc. Kết quảlà protein xoắn α có thể để phù hợp với hầu như chính xác vào các rãnh chính DNAsợi đôi. Acid amin kích thước chuỗi đi từ xoắn α có thể hình thành liên kết hydro vớicác cặp base của ADN trong chính các rãnh. Các loại protein-DNA tương tác được thểhiện trong hình 1.10.1.3.4 Liên kết hydrogen

Các mô hình Watson và Crick cấu trúc DNA dự đoán rằng hai chuỗipolynucleotide được giữ với nhau bằng liên kết hydro không cộng hóa trị hơn là tươngtác cộng hóa trị. Điều này đặt ra một số câu hỏi quan trọng như liên kết hydro là gì vànó đủ mạnh để duy trì tính toàn vẹn của chuỗi xoắn kép?

Để giải quyết câu hỏi đầu tiên, một liên kết hydro là một sự tương tác tĩnh điệnyếu giữa liên kết cộng hóa trị của nguyên tử hydro và một nguyên tử khác với một cặpđiện tử không có ái lực, một đặc tính của liên kết cộng hóa trị giữa nguyên tử oxy vànitơ. Các nguyên tử hiđrô giả định tích điện dương, trong khi các cặp điện tử không cóái lực giả định tích điện âm. Các nguyên tử này tích điện trái dấu thì hút nhau bằngliên kết hóa học yếu.

Nói chung, một liên kết hóa học là một lực hấp dẫn để giữ các nguyên tử vớinhau. Sự hình thành ngẫu nhiên của một liên kết giữa hai nguyên tử tự do liên quanđến việc giải phóng năng lượng nội bộ của các nguyên tử không liên kết và chuyển đổisang một hình thức năng lượng, ví dụ như nhiệt. Lực của một liên kết cụ thể được đobằng lượng năng lượng giải phóng theo sự hình thành của liên kết. Các liên kết mạnhhơn, năng lượng nhiều hơn được giải phóng. Sự thay đổi năng lượng ( G) đi kèm vớisự hình thành liên kết được sử dụng để mô tả lực của một liên kết. Giá trị của Gđược tính theo phương trình sau đây:

G = −RT ln KeqTrong đó R là hằng số khí (8,314 JK-1 mol-1), T là nhiệt độ tuyệt đối và ln Keq là

log tự nhiên của các hằng số cân bằng giữa các liên kết hoặc không liên kết các phântử với nhau.Liên kết cộng hóa trị ngắn (0,095 nm) và rất mạnh, với G giá trị trongkhoảng -100 đến -500 kJ mol-1. Liên kết hydrogen là dài hơn (khoảng 0,3 nm) và làyếu hơn nhiều với giá trị G trong phạm vi từ -10 đến-30 kJ mol-1.

Page 16: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

15

Khi tìm thấy trong các chuỗi xoắn kép, hình thức adenine hình thành 2 liên kếthyđrô với thymine, và các hình thức cytosine ba liên kết hydro với guanine (xem hình1.8). Trong khi một liên kết hydro duy nhất giữa chính nó là rất yếu 2500 hay như vậyliên kết hydro mà giữ lại với nhau mỗi kilobase DNA cung cấp mức độ bất thường củasự ổn định để xoắn. Điều này cũng có nghĩa là, như chúng ta sẽ thấy dưới đây và trongcác chương sau, có một cặp base AT là kém ổn định hơn về mặt nhiệt động lực họchơn là một cặp cơ sở GC.1.4 Biến tính thuận nghịch của DNA

Mạch đôi DNA là một phân tử rất bền. Trong một mẫu mất nước, nó có thể tồntại gần như nguyên vẹn trong hàng ngàn năm. Những đoạn DNA đã được phân lập từxác ướp Ai Cập cách đây khoảng 3.000 năm. Trong những mẫu này, chuỗi xoắn képvẫn còn nguyên vẹn, nhưng DNA đã bị đứt gãy. Hiện tại một chuổi gồm hàng triệunucleotide được ghép lại kề nhau thì tạo được một đoạn DNA ngắn, dài khoảng 500-1000 (bp), với một số mối liên kết đồng hóa trị tạo thành khung phosphodiester bị gãyvụn.

Tác dụng chủ yếu của liên kết không cộng hóa trị là giữ chặt hai sợi xoắn kép,đồng thời nó cũng làm cho sợi đôi DNA có thể bị tách ra (biến tính) đơn giản bằngcách nung nóng. Nhiệt năng được cung cấp cho một đoạn DNA bằng cách nung nóngsẽ phá vỡ liên kết hydro, nhưng sẽ không ảnh hưởng đến các liên kết đồng hóa trị màgiữ mỗi chuỗi với nhau (Lin và Chargaff, 1966). Việc tách hai sợi DNA trong một cấutrúc xoắn được kèm theo những thay đổi về tính chất vật lý của DNA. Một trongnhững thay đổi này là sự hập thụ tia UV của DNA. DNA hấp thụ ánh sáng ở bướcsóng 260 nm do sự hiện diện của các liên kết đôi và liên kết đơn xen kẽ trong cácbases DNA (hình 1,5). Mỗi một bases của bốn loại nucleotid có phổ hấp thụ khác nhaukhông nhiều, và quang phổ hấp thụ tổng thể của DNA là trung bình cộng của chúng.Một dung dịch DNA tinh khiết được nhìn thấy trong suốt bằng mắt, và sự hấp thu trởnên không thể đo được đến khoảng 320 nm. Giảm bước sóng dần xuống thì có mộtđỉnh hấp thụ vào khoảng 260 nm, tiếp theo được giảm xuống giữa 220 và 230, và sauđó dung dịch trở nên mờ đi về bản chất trong tia cực tím. Một dung dịch sợi đôi, DNAtự nhiên,với nồng độ là 0,05 mg/ml, có độ hấp thụ (hoặc mật độ quang học, OD)khoảng 1,0 at ở đỉnh cao 260nm.

Khi một chuỗi xoắn DNA được biến tính để trở thành sợi đơn duy nhất, ví dụbằng cách nung nóng, tăng hấp thụ. Cùng một nồng độ 0,05 mg/ml dung dịch sợi đôiDNA mà chúng tôi sử dụng trên sẽ có một mức hấp thụ là 1,5 khi ở dạng sợi đơn. Đâylà số liệu hấp thụ thường được thể hiện dưới dạng hiển thị dưới đây:

1.0 A260nm sợi đôi DNA = 50 μg/mL1.0 A260nm sợi đơn DNA = 33 μg/mLSự gia tăng hấp thụ như sợi DNA kép trở thành sợi đơn, gọi là hiệu ứng

hyperchromic (Thomas, 1993), cho thấy sự tương tác giữa các điện tử lưỡng cực trongviệc xếp chồng các bases sợi đôi xoắn kép và được trình bày sơ lược trong hình 1.11.Việc xếp chồng của các cặp bases trong sợi đôi DNA có tác dụng làm giảm sự hấp thucủa riêng nucleotide do sự tương tác cạnh tranh của các cặp bases liền kề trong ngăn

Page 17: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

16

xếp. Ở dạng sợi đơn, không có cạnh tranh như vậy xảy ra và kết quả là DNA sợi đơnhấp thụ ánh sáng với mức độ lớn hơn so với sợ đôi của nó.

Hình 1.11. Ảnh hưởng của việc nung nóng sợi đôi DNA. Như là một phân tửDNA sợi kép được đốt nóng trên nhiệt độ môi trường xung quanh, các liên kết hydrokhông cộng hóa trị giữ hai sợi với nhau bắt đầu bị phá vỡ. Điều này được đi kèm vớisự gia tăng hấp thụ ở 260 nm. Ở nhiệt độ cao trên 90 0C hai sợi DNA sẽ hoàn toàntách biệt nhau. Quá trình này có thể thuận nghịch. Nếu nhiệt độ giảm tương đối chậm,hai sợi DNA bổ sung sẽ sửa đổi để tạo ra một phân tử DNA sợi kép kết hợp một cáchchính xác. Nhiệt độ nóng chảy (Tm) là nhiệt độ mà tại đó một nửa số sợi được tách

Khi một mẫu DNA được đun nóng, cấu trúc xoắn bắt đầu tách ra, trong một quátrình đôi khi được gọi là nóng chảy. Cặp bases A-T chỉ có hai liên kết hyđrô giữ chúnglại với nhau, các vùng DNA với mật độ A và T cao sẽ tách ra trước. Khi nhiệt độ tiếptục tăng, và tăng cao liên tục thì DNA sẽ mang tích chất của một sợi đơn tự nhiên, chođến khi hai sợi tách ra hoàn toàn. Nhiệt độ mà tại đó một nửa là DNA sợi đơn được gọilà nhiệt độ nóng chảy (Tm). Nhiệt độ nóng chảy của toàn bộ phân tử DNA thì khônggiống nhau, và được quyết định dựa trên chiều dài của DNA, và tỉ lệ các cặp bases G-C và A-T. Thông thường những phân tử DNA ngắn có giá trị Tm thấp, như bao gồm tỉlệ cao của các cặp bases A-T. Nhiệt độ nóng chảy của phân tử DNA dài được tính toándựa theo phương trình:

Tm = 16.5(log[Na+]) + 0.41(%GC) + 81.50CỞ đây [Na+] là nồng độ của các ion natri trong các dung dịch DNA và (% GC) là

tỷ lệ phần trăm của G-C còn lại trong mạch đôi. Vì vậy, đối với một phân tử DNA cóchứa 40% GC còn lại (điển hình cho một bộ gen động vật có vú) trong một dung dịchNaCl có nồng độ 50 mM NaCl, nhiệt độ nóng chảy là 76,40C. Như chúng ta sẽ thấytrong chương sau, các phân tử DNA ngắn (15-30 bases) thường được sử dụng trong

Page 18: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

17

các thí nghiệm kỹ thuật di truyền. Vì những trình tự bổ sung ngắn, phương trình trênkhông còn đúng nữa, và theo dự toán (đôi khi được gọi là quy tắc Wallace) được sửdụng để xác định Tm (Wallace và cộng sự năm 1979.,):

Tm = 2(AT) + 4(GC)Trong đó, cứ mỗi cặp bases A-T ở cấu trúc mạch kép đóng góp 20C ổn định của

sợi đôi xoắn kép, trong khi mỗi cặp G-C đóng góp 40C ổn định. Do đó, mộtoligonucleotide của 20 bases của sợi đơn DNA có chứa năm chất thừa, còn lại 6 T, 3 Cvà 6 G sẽ có một nhiệt độ ủ bổ sung vào chuỗi ADN xấp xỉ 2 (11) + 4 (9) = 58 0C.Tầm quan trọng của nhiệt độ ủ sẽ trở nên rõ ràng khi chúng ta nhìn vào phản ứng dâychuyền polymerase (PCR) và lai tạo acid nucleic trong các chương sau.

Việc làm nóng các chuỗi DNA xoắn kép để tạo ra sợi đơn là cả một quá trìnhngược. DNA sợi đơn được thực hiện bằng cách đun nóng duplex sẽ thay đổi khi nhiệtđộ giảm. Khi nhiệt độ giảm xuống, năng lượng nhiệt đã được sử dụng để phá vỡ cácliên kết hydro giữa các sợi bị giảm theo, và va chạm ngẫu nhiên giữa các sợi sẽ giúpcác sợi gắn lại theo nguyên tắc bổ sung. Nhiệt năng cung cấp giảm tương đối chậm (1-20C / giây), sự tạo thành mạch kép sẽ hoàn tất. Hai sợi đơn phân tử DNA bổ sung sẽđến với nhau và sửa đổi chính xác mạch kép (duplex) ban đầu trước khi mẫu được đunnóng. Nếu nhiệt độ giảm xuống nhanh chóng, ví dụ như nhúng chìm một mẫu DNA tại940C trực tiếp vào nước đá, sự điều chỉnh các cặp bases sẽ không xảy ra và các DNAsẽ được giữ lại ở dạng một đơn tương đối.1.5 Cấu trúc của DNA trong các tế bào

Các loại axit nucleic được sử dụng để hình thành hệ gen của sinh vật phụ thuộcvào chính sinh vật đó. Ví dụ, virus có bộ gen gồm hai sợi DNA kép, sợi DNA đơnhoặc RNA, tùy thuộc vào loại virus. Nhiễm sắc thể của hầu hết các sinh vật nhânchuẩn bao gồm các sợi đôi DNA. Các bộ gen của các sinh vật prokaryote thường baogồm một phân tử DNA vòng tròn. Nghĩa là, thay vì phải có đầu 5’ tự do và đầu kếtthúc 3’, các đầu được nối với nhau để tạo thành một vòng liên tục của chuỗi xoắn képADN. Một số nhiễm sắc thể bổ sung phân tử DNA, gọi là plasmid, được tìm thấy trongcác tế bào prokaryote. Như chúng ta sẽ thấy trong chương 3, hiểu biết như thế nào vềsự phân chia các tế bào với những plasmids có vai trò hoạt động then chốt trong sinhhọc phân tử và kỹ thuật di truyền tiên tiến. Phân tử DNA plasmid thường đóng vòngcủa sợi đơn hay sợi đôi DNA.Khi nhìn vào cấu trúc của DNA được trình bày tronghình 1.7, nó rất dễ nhằm lẫn là chuỗi xoắn kép, đúng hơn là một chất rắn thiếu linhhoạt hơn. Tuy nhiên, không chỉ đơn giảm là vậy. Hình ảnh dưới kính hiển vi điện tửcủa các phân tử DNA (hình 1.12) cho thấy DNA có dạng chuỗi nhiều hơn dạng que, vàbao xung quanh chính nó để tạo thành một loạt các cấu trúc bất thường. Bên trong mộttế bào nhân chuẩn, DNA được liên kết với một loạt các protein. Ví dụ, protein cầnthiết cho nhân bản của nó, sao chép nó vào RNA và bao bọc của nó trong tế bào. Nhiềuprotein cuốn quanh DNA của chính nó, hoặc bằng cách nhốt hoặc bẻ cong phân tửDNA. Đối với các phân tử DNA thẳng ngắn, loại hạn chế này không phải là một vấn đềnghiêm trọng. Điểm stress được đặt trong một phần của một phân tử DNA, ví dụ, chuỗixoắn kép có thể được thuyên giảm bởi sự tháo xoắn một phần khác của DNA.

Page 19: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

18

Hình 1.12. Hình ảnh của sợi DNA kép được tìm ra bởi kính hiển vi điện tử. DNAvòng phân lập từ polyoma virus cho thấy nhiều crossings của sợi DNA đôi, chỉ ra rằngDNA là xoắn cực đại. Sao chép từ Vinograd và cộng sự (1965)

Đầu kết thúc tự do của đoạn DNA dài cho phép quay tương đối tự do quanh sợiDNA. Đối với các phân tử DNA dạng vòng. Tuy những stress có thể rất khó để chứngminh. Khi những đầu tận cùng của DNA không tự do, nó không thể lơi lỏng ra vàchống lại sự xoắn tại một nơi nào đó trong phân tử. Kết quả của các phân tử DNAxoắn trong sự hình thành của DNA xoắn cựcđại (Hình 1,13).

Năm 1965 Jerome Vinograd và các đồngnghiệp cho rằng các phân tử DNA vòng kín cóthể chấp nhận một hình thức xoắn tròn'(Vinograd và cộng sự năm 1965.,). Như mộthình thức sẽ có kết quả nếu, trước khi tham giakết thúc của một sợi đôi DNA dài thành mộtvòng tròn kép kín, một đầu được xoắn tươngđối khác để mở đầu cho một số khuynh hướngtrong phân tử. Như cuộn xoắn DNA của chínhnó được gọi là supercoil. Supercoil chỉ có thểđược hình thành hoặc phá vỡ từ một phân tửDNA vòng tròn kín bằng cách phá vỡ ít nhấtmột trong những khung xương phosphodiester.

Hình 1.13. Sự hình thành của DNA xoắncực đại. Một phân tử DNA vòng không chứa supercoil được hiển thị. Hai nửa của phântử này đã được đánh dấu màu đỏ và màu xanh để giúp dễ phân biệt. Một lần xoắn trongphân tử sẽ dẫn đến việc hình thành một cực dương (+) và supercoils cực âm(-). Quátrình này không dẫn đến một thay đổi số lượng kết nối. Tuy nhiên, khung xương DNA bị

Page 20: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

19

phá vỡ và sau đó được đóng kín lại sau khi một đoạn của DNA đã bị rạn nứt, sau đó làsố liên kết được giảm thành 2. Phân tử bây giờ là không còn xoắn cực đại.

Mức xoắn cực đại trong một phân tử DNA đặc trưng có thể được mô tả bởi sốlượng kết nối của nó (Lc). Con số này tương ứng với số vòng đôi xoắn trong phân tửtuyến tính ban đầu. Quá trình đưa sự xoắn cực đại vào một phân tử DNA làm giảmhoặc tăng số vòng xoắn ốc bị mắc kẹt khi vòng tròn được hình thành, và kết quả trongnhững thay đổi trong các số liên kết với các loài có vòng khép kín cuối cùng. Sự khácbiệt liên kết (Lc) chỉ thị của các mức độ của cấu trúc xoắn cực đại trong một phân tửcần quan tâm (Hình 1,13). Các độc giả quan tâm cần tham khảo các tài liệu phổ biếncho một mô tả đầy đủ hơn của DNA cấu trúc liên kết và các vấn đề liên kết của nó(Bates và Maxwell, 1993).

Vòng DNA khép kín được phân lập từ tế bào prokaryote thì không có cấu trúcxoắn cực đại. Nghĩa là, DNA tương đối không được tốt so với trạng thái tuyến tính củanó. Mặc dù tế bào Eukaryotic có chứa các phân tử DNA tuyến tính, độ dài của DNAtrong nhiễm sắc thể có nghĩa là những điểm hạn chế trong một phần của phân tử DNAkhông thể dễ dàng làm giảm bằng cách chuyển sự căng thẳng đến một trong nhữngđoạn kết thúc. Tương tự thích hợp ở đây là để suy nghĩ về cách bạn sẽ mở gu t mộtô ng nươ c vườn xoắn. Bạn sẽ tháo xoắn bằng cách chuyển xoắn đến hết đường ống.Cuối cùng, sự quay của ống chính nó sẽ dẫn đến việc giải phóng cho nút thắt này. Đâylà loại hành động để tháo một xoắn hoặc xoắn trong một phân tử DNA tuyến tính sẽtương đối đơn giản nếu DNA bị ngắn. Chiều dài phân tử DNA nhiễm sắc thể, tuynhiên, gặp một số khó khăn mà làm cho loại hình này tách ra hạn chế không thực tế.Chiều dài của DNA có liên quan sẽ làm cho nó khó khăn để di chuyển xoắn từ giữaDNA để kết thúc, và sự kết hợp của các DNA với các protein sẽ tạo nên một rào cảnđối với loại hình chuyển động này. Trở lại với ô ng nươ c, một cách khác để loại bỏcác nút thắt (mặc dù ít thực tế hơn trong vườn) các đường ống sẽ được cắt để tạo ra kếtthúc mới gần các đoạn của đoạn xoắn. Các đường ống sau đó có thể là không xoắn tạiđịa vị trí và chuẩn bị mẫu để loại bỏ các xoắn và cải cách các đường ống. Đó là trongthời trang còn đối với việc giải quyết các tế bào với các chủng trong DNA. Họ có cácenzym, được gọi là topoisomerases DNA, làm cho các vết cắt trong các phân tử DNAđơn hoặc sợi đôi phá vỡ khung phosphodiester để cho phép các vị trí và sự tháo xoắncủa chuỗi DNA. Các enzyme topoisomerase sau đó đánh dấu khung xương DNA đểcải cách các phân tử DNA.1.6. Thể nhân eukaryote

Mỗi tế bào trong cơ thể chúng ta chứa một lượng lớn DNA. Những nhiễm sắc thểkhác nhau của bộ gen người chứa khoảng 3.2 x 109 cặp base của DNA. Vì chúng ta lànhững sinh vật lưỡng bội, có hai bộ nhiễm sắc thể, tổng số lượng DNA lớn nhất trongtoàn bộ tế bào của chúng ta là 6.4 x 109 cặp base. Tại 0.33 nm cặp base (hình 1.7),tương ứng với toàn bộ chiều dài ở trên khoảng 2.1 m. Kết hợp của các protein bênngoài quấn quanh DNA tạo nhân. Trong kỳ giảm phân, các vật liệu di truyền (cùng vớicác protein liên kết) tương đối duỗi thẳng và phân tán khắp trong nhân giống như

Page 21: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

20

nhiễm sắc thể. Khi bắt đầu nguyên phân, nhiễm sắc thể co lại rất nhiều, trong kỳ trướccó thể nhận biết nhiễm sắc thể. Độ dài của chúng co lại khoảng 10 000 lần.

Các vật chất di truyền khi phân lập từ vi khuẩn và vurus bao gồm sợi DNA vàRNA hầu như không có protein. Tuy nhiên, ở sinh vật nhân chuẩn, số lượng đáng kểcủa protein kết hợp với DNA để hình thành hình dáng chất nhiễm sắc thể. Quan sátbằng kính hiển vi điện tử ta thấy rằng cấu trúc sợi nhiễm sắc thể được kết hợp cácmảng tuyến tính của các hạt hình cầu. Các hạt này xuất hiện thường xuyên dọc theotrục của một nhiễm sắc thể và giống các hạt trên chuỗi. Các hạt, ban đầu gọi là v –bodies (olins và olins, 1974), ngày nay gọi là thể nhân.

Digestion của sợi nhiễm sắc thể với những nuclease cố định, chẳng hạn như phântử nuclease, số lượng các đoạn DNA dài khoảng chừng 200 bp, hoặc nhiều hơn nữa(Wingert và Von Hoppel, 1968). Nếu digestion của DNA nhiễm sắc thể là ngẫu nhiên,sau đó các các đoạn có kích thước khác nhau được tạo ra. Do đó điều này đã chứngminh rằng DNA của nhiễm sắc thể được che chở (bảo vệ) từ sự phân cắt của cácenzyme. Từ DNA chúng sẽ bắt đầu và cắt bởi nulease, và tại hai hay nhiều vị trí đượcnối lại với nhau. Các protein kết hợp với ADN trong nhiễm sắc thể được chia thành cơbản, histon tích điện dương và ít tích điện dương khi không histones. Protein kết hợpvới DNA, việc sử dụng histone có vai trò cấu trúc quan trọng nhất. Histone chứa mộtlượng lớn điện tích dương axit amin lysine và arginine (xem phụ lục1), làm cho nó cóthể liên kết thông qua tương tác tĩnh điện với nhóm phosphate tích điện âm của cácnucleotide DNA. Có năm loại protein histone khác nhau: H1, H2A, H2B, H3 và H4.Một hạt nhân bao gồm hai bản sao của mỗi histone H2A, H2B, H3 và H4 để tạo thànhmột octamer xung quanh histone khoảng 150 cặp base của DNA được bao bọc trongmột chuỗi xoắn kép trái, hình thành khoảng 1,7 vòng xoắn trong nhân (hình 1.14). Gầnđây, để hiểu biết về cấu trúc của các thể nhân, vào năm 1997 Richmond và các đồngnghiệp đã có thể làm sáng tỏ được cấu trúc tinh thể tia X của phức hợp DNA thể nhânở cấp độ phân tử. Tại cấp độ phân tử này, hầu hết các nguyên tử của mỗi histone đềucó thể nhìn thấy, và các chiều chuỗi xoắn DNA rõ ràng vì nó bao quanh các octamerhistone có thể được nhìn thấy (hình 1.15). Cấu trúc ở cấp độ cao phân tử cho biết rằngamino kết thúc cuối cùng của một số các histon nhô ra từ octamer các và project đi từnhân. Ý nghĩa của các amino cuối cùng ở doạn cuối thì có khả năng tương tác với cácthể nhân bên cạnh tạo contacts (sự tương tác, mối quan hệ). Chúng sẽ cạnh tranhsignficance các histone cuối cùng ở xa hơn nữa khi look của biểu hiện gen.

Mở rộng nghiên cứu về cấu trúc của nhân đã cung cấp cơ sở để dự đoán sự hìnhthành các sợi chất nhiễm sắc trong nhân tế bào, và chúng cuộn thành các nhiễm sắc thểmitotic. Mô hình này được minh họa trong hình 1.16. Có 2 nm chuỗi DNA xoắn képcuộn ban đầu thành một lõi trong nhân khoảng đường kính 10 nm. Khoảng 200 cặpbase của mỗi DNA liên kết hạt nhân để hình thành "hạt trên dây” có thể nhìn thấy hìnhảnh trong kính hiển vi. Histone H1, nó không phải là một phần của lõi octamer, có thểđược nằm ở vị trí mà DNA hình thành và rời khỏi nhân và có thể chức năng để xácdịnh các DNA trên thể nhân.

Page 22: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

21

Hình 1.14. DNA bao xung quanh lõi nhân. thể nhân gồm hai phân tử của histoneH4, H3, H2A và H2B. Trong các hình đại diện ở đây chỉ là một monomer của H2A vàH2B có thể quan sát được, các monome khác được đặt ở mặt sau của octamer này.Gần 150 bp của DNA quấn quanh lõi octamer, tạo thành khoảng hai lần.

Hình 1.15. Cấu trúc của phức hợp DNA-nhân được làm sáng tỏ bằng cáchcrystallography X-quang ở cấp độ phân tử. Trong cả hai hình trên, các sợi của DNA(thể hiện trong màu xanh lá cây và màu da cam) bọc quanh octamer histone. Các lõiprotein là hầu như chỉ nằm bên trong, ngoại trừ phần đuôi histone amino cuối cùngđược mở rộng ra từ cái phức tạp. Điều này được cung cấp bởi Tim Richmond (ETHZurich) và được tái bản với sự cho phép từ thiên nhiên (Luger và cộng sự, 1997) bảnquyền (1997) Các nhà xuất bản Macmillan Ltd.

Sự hình thành của nhân đại diện cho mức độ bao quanh, như vậy chiều dài DNAđược giảm xuống còn khoảng một phần ba chiều dài ban đầu. Tuy nhiên, trong hạt nhân,chất nhiễm sắc không tồn tại trong hình thức duỗi thẳng. Thay vào đó, trong sợi nhiễm

Page 23: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

22

sắc 10 nm đã dược xoắn cuộn từ một sợi dài 30 nm, sợi nhiễm sắc thề ban đầu đó đượcgọi là solenoid. Không hiểu rỏ các quá trình chuyển đổi giữa sợi 10 nm và cac1 sợi 30nm biểu hiện cho đặc tính sinh lý hoặc cho dù điều đó chỉ xảy ra trong ống nghiệm xemnhư là kết quả của sự thay đổi nồng độ muối. Tuy nhiên, các sợi 30 nm, gồm nhiều nhânđược kết hợp (đóng gói) chặt chẽ với nhau, nhưng các định hướng chính xác và chi tiếtcủa cấu trúc không rõ ràng. Gần đây, người ta có thể chấp nhận rằng trong một sợi 30nm compact xoắn zig-zag mẫu với khoảng bốn nhân cho mỗi 10 nm (Beard và Schlick,

2001). Sự hình thành các sợi 30 nm tạo ra một cấp độ thứ hai của việc đóng gói, khi đóchiều dài tổng thể của DNA được giảm một nửa so với ban đầu

Hình 1.16. Packaging của DNA trong nhiễm sắc thể nhân chuẩn. Các chuỗi xoắnkép DNA 2 nm được gói thành nucleosome như minh họa trong hình 1.15. Tại một sốđiểm histone H1 ở trong phức tạp, có thể ở DNA / điểm xuất từ nhân. Các thể nhân cóthể hình thành sợi dài 10 nm trong nhân. Các thể nhân có thể tiếp tục kết hợp để tạothành một sợi nm 30. tạo ra đường zig-zag trong nhân. Các sợi 30 nm sau đó được bọctạo một proteins caffold, chúng có thể gấp cuộn để hình thành các nhiễm sắc thể trongphân bào, được quan sát dưới kính hiển vi điện tử.1.7. Sự sao chép DNA

Vào năm 1953, Watson và Crick đã hoàn thành bài viết nổi tiếng của mình về cơchế sao vật chất di truyền. Từ việc sắp xếp và tính chất của các base mà mỗi mạch củacác chuỗi xoắn kép ADN có thể làm một khuôn để tổng hợp của một mạch bổ sung(hình 1.17). Họ cho rằng nếu chuỗi xoắn kép đã unwound, mỗi nucleotide dc tạo ra từ

Page 24: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

23

nột mạch gốc ban đầu theo nguyên tắc bổ sung sẽ có các nucleotide giống với cácnucleotide của mạch còn còn lại (Watson và Crick, 1953b). Như vậy, mỗi mạch DNAgốc có thể làm một khuôn để tổng hợp một mạch DNA mới, vì thế có thể dẫn đến việchình thành hai mạch đôi DNA giống như nhau. Trong mô hình này, DNA mới đượctổng hợp bao gồm một mạch gốc ban đầu và một sợi mới được tổng hợp theo nguyêntắc bổ sung, do đó, quá trình được gọi là sao chép semi-conservative.

Hình 1.17. Các bản sao của mạch đôi DNA theo đề nghị của Watson và Crick.Việc tách mạch DNA gốc xoắn kép (màu đen), mỗi sợi có thể làm một khuôn mẫu chosự tổng hợp hình thành một chuỗi ADN mới (màu xanh). Điều này được gọi là saochép semi-conservative, phân tử DNA mới gồm một chuỗi cũ và một sợi mới.

Hai phương thức khác của bản sao này cũng dựa vào các sợi gốc ban đầu conhiệm vụ làm mẫu cho sự tổng hợp DNA mới. Trong nhân bản conservative, nhữngđường xoắn ốc của mạch gốc ban đầu sẽ được tháo xoắn, một chuỗi xoắn mới tổnghợp sẽ được hình thành theo nguyên tắc bắt cặp bổ sung. Hai mạch DNA mới tổng hợpsẽ kết hợp với nhau sẽ tạo thành một đường xoắn ốc và xoắn của mạch gốc sẽ đượcsửa đổi. Trong cơ chế khác, gọi là nhân bản dispersive, mạch DNA gốc từ một sợi cóthể được tách ra và kết hợp một trong các mới sợi tổng hợp, tạo ra những mạch hỗnhợp giữa ADN mới và cũ.

Matthew Meselson và Franklin Stahl đã cung cấp bằng chứng thực nghiệm chorằng nhân bản semi-conservative đã được sử dụng bởi vi khuẩn từ việc sản xuất cácphân tử DNA mới (Meselson và Stahl, 1958). Các kết quả thí nghiệm của tác giả đượcmô tả trong hình 1,18. Ông đã đã tăng trưởng các tế bào E. coli cho nhiều thế hệ trongmột môi trường, trong đó các nguồn nitơ duy nhất dẫn xuất của amoni clorua(15NH4Cl). Điều này có nghĩa rằng DNA của những tế bào E. coli, ở 15N được kết

Page 25: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

24

hợp với thành phần của base, nặng hơn so với ADN từ các tế bào phát triển về bìnhthường amoni clorua (14NH4Cl). Các dạng bình thường và nặng của DNA có thể đượctách sau khi ly tâm, bằng gradient nồng độ của caesium chloride. Trong điều kiện đó,các DNA nặng hơn sẽ đi xa hơn các ADN nhẹ hơn. Điều này giúp theo dõi các cấp độcủa mỗi nitơ đồng vị trong việc nha6 bản DNA của vi khuẩn như nó đã được sao chép.Meselson và Stahl đã đưa vi khuẩn có chứa DNA nặng và chuyển chúng thành phươngpháp di truyền có chứa amoni clorua vào ADN bình thường và sau đó cô lập mỗi thếhệ kế tiếp. Sau một vòng duy nhất của quá trình sao chép DNA trên phương pháp ditruyền bình thường, hiện nay ông tìm thấy rằng DNA của vi khuẩn có mật độ trunggian giữa các vị trí dự kiến chứa toàn bộ 15N và 14N DNA. Kết quả này phù hợp vớinhân bản semi-conservative, nhưng không phải với nhân bản conservative. Sau khi tếbào phên chia, Meselson và Stahl đã quan sát sự hiện diện của hai mạch của các mậtđộ ban đầu khác nhau tương ứng với vị trí của một loài 14N/15N DNA và lần thứ hai,các bằng cường độ ánh sáng, tương ứng với vị trí dự kiến của 14N/14N DNA. Chu kỳtiếp theo của quá trình nhân đôi DNA dẫn đến một tỷ lệ tăng các 14N/13N mạch DNA.

Các thí nghiệm mô tả ở trên cho thấy rằng nhân bản conservative không xảy ra,nhưng không thể loại trừ nhân rộng dispersive. Tuy nhiên, Meselson và Stahl, bác bỏcơ chế sao chép này trong việc tách các mạch riêng lẻ của DNA sao chép. Họ đunnóng DNA (hình 1.11) và được cho thấy rằng có sợi riêng lẽ hoặc cường độ 15N hoặc14N chứa DNA sợi đơn, nhưng không phải là của một cường độ trung bình mà có thểđã được kết hợp nếu một sợi DNA mới tổng hợp có chứa các mạch hỗn hợp của mạchgốc và mạch vừa được tổng hợp trình tự. Sao chép semi-conservative có cũng đượcbiểu hiện ở sinh vật nhân chuẩn (Taylor, Woods và Hughes, 1957), và bây giờ đượccoi như là cơ chế chung cho nhân đôi DNA.

Page 26: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

25

1.8 DNA PolymeraseCả ở tế bào vi khuẩn và tế bào eukaryotic đều có nhiều enzyme DNA Polymerase.

E. coli chứa 3 loại enzyme này ( bảng 1.2 ). DNA polymerase I chủ yếu tham gia vàoquá trình sửa chữa DNA hơn là tham gia tái bản. DNA polymerase II củng tham giavào sửa chữa DNA, trong khi đó DNA polymerase III chủ yếu tham gia vào quátrình tái bản (Kornberg and Baker, 1992). DNA polymerase III là một enzyme đa cấutử có chức năng như là chất nhị trùng (dimer) của nhiều tiểu đôn vị. Nhiều enzymeDNA polymerase đã được nghiên cứu ở các cấp cấu trúc, trong đó kết hợp với phântích sinh hóa đã dẫn đến sự giải thích cơ chế hoạt động của chúng. Enzyme DNApolymerase có 3 hoạt động riêng biệt.

Tất cả các enzyme DNA polymerase tổng hợp trực tiếp đoạn DNA theo hướng 5’ -3’.Nhiều DNA polymerase có hoạt động exonuclease từ đầu 3’- 5’. Điều này cho

phép cắt bỏ các nucleotide ở đầu 3’ của sợi mới tổng hợp. Hoạt động này được xem làhoạt động đọc sửa (proof-reading activity ) mà có thể để cắt bỏ các nucleotide sai hỏngtrước khi nó thay thế các base đúng.

Một số DNA polymerase củng hoat động exonuclease theo hướng 5’- 3’. Điềunày cho phép enzyme loại bỏ các trình tự đã được tổng hợp và tham gia đến việc nốicác đoạn DNA được tổng hợp dựa trên sợi muộn trong thời gian tái bản DNA.

DNA polymerase không có khả năng tự bắt đầu tổng hợp . Chúng cần một yêucầu tuyệt đối là có đầu 3’ tự do mà enzyme có thể nối thêm các nucleotide mới. Điềunày có nghĩa rằng cần phải có hai mồi để khởi đầu sự sao chép DNA theo mỗi hướngtừ điểm gốc, mỗi mồi sẽ bổ xung cho một sợi DNA được sao chép. Như đã nêu ở trên,sự tổng hợp DNA chỉ diển ra theo hướng 5’- 3’, các nucleotide mới sẽ được nối vàođầu 3’ của chuỗi polynucleotide. Điều này dẫn đến một vấn đề, cả hai sợi gốc đều phảiđược tái bản nhưng chỉ có một sợi được định hướng 5’ – 3’từ điểm gốc của sự saochép. Sợi này được gọi là sợi sớm, nó được sao chép một cách liên tục. Sự tái bản ởsợi muộn không thể xảy ra theo hướng 3’ – 5’. Sợi muộn được tái bản một cách khôngliên tục ( hình 1.19). Sự tổng hợp các doạn ngắn không liên tục theo hướng 5’ – 3’

(Okazaki 1968) mà sau đó được nối lại với nhau thành một sợi hoàn chỉnh.

Page 27: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

26

Còn có một loại enzyme mà chúng ta sẽ được tìm hiểu trong chương sau là DNApolymerase phụ thuộc RNA gọi là enzyme phiên mã ngược (reverse transcriptase).Enzyme được tìm thấy ở một số virus gọi là retrovirus có vật chất di truyền là RNA thayvì DNA. Sau khi nhiễm vào tế bào chủ các RNA này được dùng làm khuôn cho sự tổnghợp phân tử DNA bổ xung (cDNA). Các DNA sau đó được đưa vào hệ gen vật chủ , nếuDNA được biểu hiện thì bộ gen virus được tạo ra. Việc sử dụng enzyme phiên mã ngượctrong ống nghiệm để sản xuất DNA từ RNA được thảo luận trong chương 5.1.9 Quá trình tái bản

Làm thế nào để bắt đầu và kết thúc sự sao chép DNA? Như chúng ta đã biết cácDNA trong tế bào là rất quan trọng và cần phải được kiểm soát chặt chẽ sự tái bản DNAlà điều hiển nhiên. Quá trình tái bản gồm 3 giai đoạn : khởi đầu, kéo dài và kết thúc.

Hinh 1.19: Tái bản DNA bởi DNA polymerase III. Sợi DNA gốc (đen) được tháoxoắn bởi helicase tại chạc ba tái bản. Sợi sớm và sợi muộn sau đó được tổng hợp bởiDNA polymerase III. Tái bản DNA trên sợi chính xảy ra theo hướng 5’ – 3’ bằng cáchkéo dài mồi RNA đơn. Trên sợi muộn đòi hỏi cần phải có nhiều mồi để tổng hợp cácđoạn ngắn (đoạn okazaki), sau đó các đoạn được nối lại bởi DNA ligase

Giai đoạn khởi đầu: Việc khởi đầu tái bản DNA không xảy ra ở các vị trí ngẫunhiên trong bộ gen mà được bắt đầu tại một điểm cụ thể gọi là điểm gốc tái bản. Khisự tổng hợp DNA được bắt đầu, hai chạc ba tái bản đươc tách dài theo hai hướng từđiểm gốc tái bản, điều này cho phép tái bản toàn bộ genome. Ở vi khuẩn chẳng hạn Ecoli. Chỉ có một điểm gốc tái bản (gọi là Ori C). Nhưng ở tế bào eukaryote thì lại cónhiều điểm gốc tái bản ví dụ ở nấm men Saccharomyces cerevisiae có khoản 300 điểmgốc tái bản, ở tế bào người có khoản 20000 điểm trong bộ gen. Ori C là một đoạnDNA có 245 bp , đoạn DNA này chứa các vị trí liên kết với một số protein ( cụ thể làDnaA, B and C). Các liên kết của protein này thúc đẩy sự nóng chảy của chuổi DNAxoắn, một quá trình cần thiếc để enzyme đọc trình tự base. Sự nhân đôi ở prokaryotes vàeukaryotes có thể đáp ứng cùng một chức năng tổng thể nhưng điểm gốc tái bản của tếbào prokaryotes sẽ không thay thế cho eukaryotes và ngược lại. Khi xoắn được tháo ra

Page 28: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

27

thì DNA polymerase có thể tiến đến và tổng hợp sợi DNA bổ xung. Tuy nhiênpolymerase chỉ hoạt động khi đầu 3’ có nhóm OH tự do. Nhóm OH được cung cấp bởimột mồi RNA (liên kết bổ xung với sợi DNA gốc) có chiều dài khoản 5 – 15 nucleotide.Sự tổng hợp mồi được thực hiện bởi RNA polymerase (còn gọi là primase) mà khôngcần đầu 3’ tự do để bắt đầu tổng hợp. Sự tái bản DNA sau đó được thực hiện đồng thờitrên cả hai sợi. Các protein khác cũng cần thiết để quá trình tái bản được xảy ra. Các sợiđơn DNA không bắt cặp trở lại là nhờ sự kéo căng của các protein (SSBs) khi chúngliên kết với sợi đơn DNA và khi đó DNA tháo ra tạo thành phức hợp với polymerasevới sự giúp đỡ của enzyme helicase (hình 1.19). Ngoài ra, enzyme topoisomerase cầnthiết để làm giảm độ căng trong cấu trúc xoắn để đi đến quá trình tháo xoắn.

Giai đoạn kéo dài: DNA polymerase III chỉ có thể sao chép theo hướng 5’– 3’,vậy làm thế nào để cả hai sợi đều được sao chép đồng thời? Cơ chế về sự tổng hợp cácsợi DNA sớm và muộn đươc biểu diển ở hình 1.19. Trong mô hình này DNApolymerase III có khả năng sao chép một cách liên tục trên sợi sớm. Ở sợi muộn để sựsao chép DNA xảy ra theo hướng 5’ – 3’ thì quá trình sao chép xảy ra theo từng đoạnngắn (gọi là đoạn Okazaki) tạo nên các vòng lặp. Sau khi tổng hợp 1000 – 2000 cặpbase, các monomer của enzyme sẽ gặp đoạn Okazaki được bổ xung, lúc này enzyme sẽtách ra khỏi sợi muộn. Một vòng lặp mới sau đó được hình thành và quá trình được lặplại như vậy. Sự hoạt động exonuclease theo hướng 5’ – 3’ có thể hổ trợ để tạo thànhcác đoạn okazaki hoàn chỉnh. Sau đó enzyme ligase sẽ tham gia hình thành các liên kếtphosphodiester nối các đoạn okazaki hoàn thành quá trình tổng hợp ở sợi muộn.Chúng ta sẽ thảo luận cơ chế hoạt động của DNA ligase và cách sử dụng nó trong kĩthuật di truyền ở chương 2.

Giai đoạn kết thúc: Cũng quan trọng như việc bắt đầu tổng hợp, sự kết thúcphải được kết thúc chính xác. Đối với vi khuẩn chẳng hạn như E coli.chúng chứa bộgen vòng, nếu sự khởi đầu tái bản xảy ra tại một điểm duy nhất thì sau đó sự kết thứcxảy ra tại một điểm nằm dối diện với điểm khởi đầu. Sự kết thúc không phải là mộtquá trình thụ động mà xảy ra ở các trình tự DNA xác định ( gọi là trình tụ kết thúc ) ởđó có sự hoạt động liên kết với các protein gọi là Tus. Tus liên kết với trình tự kết thúcbất đối xứng. cho phép chạc ba tái bản đi theo một hướng để vượt qua nhưng khốiDNA được tái bản theo hướng ngược lại (Kamada và cộng sự, 1996). Giai đoạn kếtthúc ở eukaryotes chưa được biết rõ.

Page 29: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

28

Hình 1.20. Chu kì tế bào eukaryotes. Sau khi phân chia xong, tế bào phát triểntrong phase G1. Sự tổng hợp DNA sau đó xảy ra (S) trước khi bước qua phase G2.Cuối cùng, nhiễm sắc thể nhân đôi và tách ra riêng biệt sau đó xảy ra phân chia tếbào. Các giai đoạn của chu kì được điều khiển bởi proteins – cyclins và cyclin-dependent kinases (CDKs). Đây gọi là các trạm kiểm soát.

Trong tế bào eukaryotes sự tái bản phải được phối hợp với chu kì tế bào để khiphân chia tế bào có sẳn hai bản sao của bộ gen. Chu kì tế bào trải qua 4 giai đoạn dựatrên quan sát sự phân chia tế bào dưới kính hiển vi ( hình 1.20 ). Những quan sát nàycho thấy tế bào phân chia thông qua các chu kì lặp đi lặp lại của pha giữa khi sự phânchia nhân và tế bào xảy ra, ở kì trung gian có một vài thay đổi có thể phát hiện đượcdưới kính hiển vi. Sự tái bản DNA xảy ra trong kì gian phân. Bốn giai đoạn của chu kìtế bào là:

M-phase (mitosis): thời kì nhân và tế bào phân chia. G1-phase (gap 1): pha tăng trưởng, sự phiên mã, dịch mã và các hoạt động

chung của tế bào xảy ra. S-phase (synthesis): xảy ra sự tổng hợp DNA và tái bản bộ gen. G2-phase (Gap 2): Giai đoạn tăng trưởng chuẩn bị cho sự phân chia tế bào.Tế bào người trong môi trường nuôi cấy mất khoảng 20h để hoàn thành chu kì tế

bào , trong đó, phase G1 cần hơn 9h, phase S mất khoản 8h và G2 kéo dài khoảng 2h.Thời gian thực tế để phân chia tế bào (phase M) chỉ mất khoảng 45 phút. Rõ ràng,phase S và phase M là hai phase rất quan trọng nó điều phối quá trình tái bản bộ gentrước khi sự phân chia tế bào xảy ra. Các giai đoạn trước khi vào phase S và phase Mcó vai trò là các trạm kiểm soát chu kì tế bào. Proteins, cyclins và cyclin-dependentkinases (CDKs) hoạt động kiểm soát trong mỗi giai đoạn của chu kì tế bào. Cyclins làmột họ protein mà chúng liên kết và kích hoạt một số thành viên trong họ CDK.Cyclin có nồng độ thay đổi đột ngột trong chu kì tế bào làm tạo ra các dao động trongsự hoạt động của CDK hình thành cơ sở cho sự kiểm soát chu kì tế bào. Các trạm kiểmsoát khác cung tồn tại chủ yếu trong phase S, ví dụ DNA bị sai được sữa chữa trướckhi sự tái bản hoàn thành. Lee Hartwell, Paul Nurse và Tim Hunt được trao tặng giảiNobel sinh lý y học cho những khám phá về sự kiểm soát chu kì tế bào.

Page 30: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

29

1.10 Tái tổ hợpDNA thì không bao giờ được xem như là một phân tử tĩnh. Nó thay đổi liên tục

và một cơ chế được tạo bởi sự thay đổi này được mang lại là tái tổ hợp (recombination).Sự tái tổ hợp là sự sắp xếp lại trên quy mô lớn các phân tử DNA. Kiểu sắp xếp lại nàyxảy ra như là một hệ quả của việc chia sẻ hai phân tử DNA hay những khu vực rộnglớn của chuỗi tương đồng (Sự tái tổ hợp tương đồng) hoặc những khu vực rất ngắn cótính tương đồng (Sự tái tổ hợp vùng đặc trưng). Các tế bào lưỡng bội có nhiều cơ hộiđể tìm những phần tương đồng khi xuất hiện sự tái tổ hợp. Sự tái tổ hợp ở vi khuẩn thìđược giải thích đầu tiên bởi Alfed Hershev và Max Delbruck năm 1947. Họ nghiêncứu sự xâm nhiễm của E.coli với những thể thực khuẩn. Nếu một tế bào E.coli đượcxâm nhiễm cùng lúc với hai thể thực khuẩn T2 khác nhau về mặt di truyền, kết quả làquần thể thể thực khuẩn kể cả kiểu thể thực khuẩn tái tổ hợp cũng như các kiểu thểthực khuẩn gốc ban đầu (Hershey, 1947).

Sự tái tổ hợp tương đồng xảy ra giữa hai phân tử DNA có trình tự chuỗi tươngđồng về bản chất. Thông tin bộ về gen thì được trao đổi và hòa hợp giữa hai bản DNAsao cho những phân tử DNA được tái tổ hợp là một hỗn hợp của những DNA ban đầu.Một vài cơ chế đã được đề xuất để giải thích cơ sở phân tử của những vấn đề này.Nguyên tắc để hiểu được quy trình phân tử phức tạp trong sự tái tổ hợp nêu ra vào năm1964 bởi Robin Holliday (Holliday, 1964). Mẫu tái tổ hợp của ông đòi hỏi phải có mộtđiểm cắt (phân cắt tại liên kết phosphodiester giữa hai nucleotide) xuất hiện tại cùngmột vùng trong hai phân tử DNA tương đồng (được gọi là DNA cho và nhận). Tươngtác trao đổi trên sợi DNA sau đó xảy ra, tiếp theo đó DNA ligase sẽ hàn gắn lại nhữngchỗ đó. Sự trao đổi trên sợi DNA cho và nhận dẫn đầu để tạo ra sự hình thành của mộtHolliday junction- một cấu trúc mà trong đó những chuỗi DNA lai kết hợp với phân tửDNA cho và nhận. Holliday junction có thể trải qua sự di động trong phân chia, dẫnđầu để tái tổ hợp nhiều hơn giữa hai sợi từ hai phân tử DNA khác nhau. Cuối cùng,chức năng xoắn cuộn cung cấp nhiều phân tử DNA tái tổ hợp. Ở đó, mặc dù, chúng tôitập trung vào cơ chế biến đổi được đề xuất bởi Meselson và Radding (1975) kể từ khisự kiện tái tổ hợp được công bố là có thể tạo ra một vết cắt đơn lẻ trên sợi DNA hay nóđúng hơn là những mẫu sớm hơn, dựa vào hai vết cắt DNA đã tái tổ hợp trước đó cóthể xảy ra. Một mẫu đơn giản chỉ ra ở hình 1.21(a). Cùng với sự hình thành Hollidayjunction và sự xoắn cuộn của nó, với một vài protein E. coli biết được tiến trình xoắncuộn, được chỉ ra bên dưới.

Vết cắt được tạo bởi RecBCD endonuclease, chất mà sẽ tách sợi của chuỗiDNA được gọi là chi ( ) ở vị trí (5’-GCTGGTGG-3’).

Sự xâm nhập vào chuỗi được xúc tác bởi RecA protein, dọc theo sợi đơn DNAliên kết với protein (SSB), là chất sẽ làm duỗi thẳng sợi DNA.

‘D-loop’ là được tạo thành sau khi sợi bị cắt một lần nữa bởi RecBCDendonuclease.

Xuất hiện và kết thúc sự thay đổi trên sợi và được nối lại sử dụng DNA ligase.Hình thức này được gọi là Holliday junction.

Page 31: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

30

Hình thức của Holliday junction tiếp theo là sự vận chuyển nhánh được xúc tácbởi protein RuvA và RuvB.

Sự chuyển hóa của Holliday junction đòi hỏi phải có RuvC protein, chứa hai vếtcắt trên sợi DNA. DNA ligase sau đó nối các sợi sau khi nó đã bị cắt.

Hình 1.21 Tái tổ hợp tương đồng và tại những vị trí riêng biệt. (a) MẫuMeselson-Radding của tái tổ hợp tương đồng. (b) Sự hòa hợp của DNA bên tronghệ gen E.coli. Xem nội dung để hiểu rõ hơn.

Tại thời điểm cuối của tiến trình, tế bào sẽ có hai phân tử là DNA được biến đổi.Tiến trình tương tự được chỉ ra ở trên cũng diễn ra ở Eukaryotes, sử dụng loài enzymeđã được hoạt hóa tương tự. Gần đây cấu trúc chuyển hóa cấp cao của Holliday junctionđược giữ ổn định bởi RuvA protein đã được giải quyết (Hargreaves và cộng sự, 1998).Không giống như tái tổ hợp tương đồng, tái tổ hợp trên vị trí riêng biệt xảy ra khi cómột DNA đặc biệt, nó không phải là tất cả các điểm tương đồng của DNA khác, có

Page 32: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

31

một chuỗi hoạt động có mục đích khi xảy ra sự tái tổ hợp DNA khác. Ở Prokaryotes,khi các nhóm DNA cuả bacterriophagae bên trong NST của E. coli, nơi mà nó sẽ tồntại trạng thái phóng thích vi khuẩn. Chúng tôi sẽ chỉ ra chu kỳ sống của rõ hơn ởchương 3. Sự tái tổ hợp xảy ra giữa các vị trí ở DNA bacteriophage (attP) có sự tươngđồng chuỗi với các vị trí trong DNA vi khuẩn (attB), thậm chí ở cả hai phân tử DNAkhác nhau hoàn toàn trong tất cả các chuỗi khác. Sự tái tổ hợp này được chỉ ra ở hình1.21(b). Enzyme xúc tác cho những quá trình này được gọi là enzyme integrase (Int),cùng với protein chủ yếu tố chủ đính vào (integration host factor- IHF). Khi DNA củathể thực khuẩn được cắt bỏ từ hệ gen của E.coli để bắt đầu cho sự hình thành mộtlượng thể thực khuẩn mới, một protein của thể thực khuẩn được gọi là Xis. Tái tổ hợptrên vị trí riêng biệt vẫn đòi hỏi cặp baze của vùng tương đồng (vị trí attP với attB),không bao gồm bất kỳ protein nào của chuỗi phản ứng hóa sinh tái tổ hợp tương đồng.1.11 Gen và genome

Thông tin di truyền bao gồm trình tự trên chuỗi DNA chỉ ra sản phẩm protein vàenzyme xây dựng nên tế bào. Acid nucleic được sắp xếp thành các đơn vị được gọi làgen, tổng hợp tất cả các gen là genome. Hầu hết tất cả các gen thì được sử dụng như làkhuôn để sản xất các loại protein. Protein bổ sung trong một loại tế bào riêng biệt thìđặc biệt một nang lông sẽ sản xuất keratin và một tế bào tuyến tụy sẽ sản xuấtinsulin nhưng hàm lượng protein của tế bào cũng có thể thay đổi một cách đáng kể,như tính sẵn có của các chất dinh dưỡng. Điều này có nghĩa là những loại tế bào riêngbiệt, những gen riêng biệt sẽ được thể hiện và một số khác sẽ không và tế bào phải cókhả năng hoạt hóa những gen riêng biệt này để đáp ứng lại những tín hiệu từ bênngoài. Và những gen này sẽ làm tăng các tín hiệu đó. Làm thế nào để tế bào có khảnăng nhận biết được những gì bên trong hệ gen của nó, cái nào là gen cái nào không,làm thế nào tế bào có khả năng mở những gen riêng biệt trong khi tại cùng một thờiđiểm đó nó không có tác động đến sự thể hiện của gen khác.1.12. Gennome

Gen là gì? Nhưng chưa có câu trả lời nào thỏa đáng nhất. Gen được coi là mộtđơn vị di truyền bao gồm các acid nucleotic. Trong di truyền học cổ điển, một genđược mô tả như một phần rời rạc của nhiễm sắc thể xác định một đặc tính đặc biệt. Ởđây chúng tôi sẽ mô tả khung đọc mở (ORF – khu vực của gen sẽ được phiên mã vàdịch mã thành protein) cùng với các yếu tố kiểm soát phiên mã (promoter andterminator). Vì vậy, một gen không chỉ là trình tự mã hóa chính nó mà nó còn chứacác thông tin cần thiết cho sự biểu hiện của các trình tự mã hóa đó. Hầu hết các ORFsđều có một dạng chung ( Hình 1.22). Chúng đều bắt đầu với một bộ ba riêng biệt củaDNA (ATG) và kết thúc dựa vào tín hiệu dừng, một lần nữa một bộ ba căn cứ vàoDNA (TGA, TTA, TAG). Các trình tự ở giữa sẽ trực tiếp mã hóa cho các protein (sinhvật nhân sơ) hoặc được chia thành một loạt các exon và intron (sinh vật nhân chuẩn).Chúng ta sẽ thảo luận về exon và intron sau, nhưng với sự ra đời của bộ gen đầy đủtrình tự (Chương 9), một gen được định nghĩa như là một chuỗi DNA có ít nhất 100codon ở giữa, có mã mở đầu và mã kết thúc. Với các trình tự đơn, tuy nhiên là không

Page 33: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

32

đủ để sản xuất trực tiếp protein. Mỗi gen đòi hỏi các trình tự DNA khác nhau liên kếtvới nhau tạo thành các protein như RNA polymerase, các yếu tố điều hòa phiên mã vàdịch mã. Khi kết hợp, các thành phần mã hóa gen, các promoter và terminator củamẫu gen chức năng, đôi khi được gọi là đơn vị phiên mã.

Làm thế nào để nhiều gen có mặt trong một bộ gen, làm thế nào để có nhiều gencần thiết cho tế bào và nó được thể hiện cùng một lúc trong cơ thể. Sự ra đời của mộtbộ gen hoàn chỉnh (Chương 9) đã giải quyết được một phần câu hỏi trên.

Hình 1.22. Các hình dạng đặc thù của gen prokaryotes và eukaryotes mã hóa protein.Ở prokaryotes tập hợp các gen cần thiết, ví dụ tạo ra các enzyme cần thiết trong

quá trình phiên mã. Operon gồm các liên kết RNA polymerase (promoter) và các yếutố kích thích quá trình phiên mã như cAMP gắn vào kích hoạt protein (CAP). Khi gắnlên protein được kích hoạt quá trình phiên mã diễn ra nhanh hơn. Ngoài ra, các operoncòn chứa các liên kết với với các protein bị ức chế, khi liên kết với DNA, đểpolymerase liên kết và dừng quá trình phiên mã. Quá trình phiên mã dừng lại với mãkết thúc tại đầu 3’ của operon. Hình dưới đây là trình tự của vùng kiểm soát của lacoperon. Ở sinh vật eukaryotes, gen được sản xuất đơn lẻ và theo quy định riêng. Chúngchứa các chất hoạt hóa và các chất ức chế ở đầu 5’. Nó cũng chứa vài nghìn base ởđầu gen để biểu hiện gen đầy đủ. Kích hoạt lắp ráp phức hợp polymerase RNAholoenzyme II tại hộp TATA và quá trình phiên mã bắt đầu một khoảng ngắn về phiađầu 3’. Một lần nữa kết thúc quá trình phiên mã xảy ra tại điểm vào cuối gen tại đầu3’. Có sự khác biệt lớn giữa sinh vật prokaryotes và sinh vật eukaryotes là sự hiện diệncủa đoạn intron và extron. Ở eukaryotes, các đoạn intron bị cắt bỏ, nối các đoạn exonlại với nhau trước khi đi vào quá trình dịch mã. Các trình tự DNA của vùng khởi độngcủa gen β-globin chuột cũng được biểu diễn.

Page 34: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

33

Làm thế nào nhiều gen có thể chứa trong cùng một bộ gen? Các bộ gen của vikhuẩn E.coli ( dài 4.6 Mb) có khoảng 4.200 gen. Độ dài trung bình của một gen trongE.coli là khoảng 950 bp, sự tách biệt trung bình của các gen là 118 bp, do đó phần lớnmã hóa cho RNA hoặc protein. Các Saccharomyces cerevisiae, một eukaryote đơnbào, có kích thước bộ gen lớn hơn (13.5 Mb) và có khoảng 6000 gen. Con người, bộgen lớn gấp 250 lần bộ gen của nấm men (3300 Mb), nhưng có khoảng 30000 gen –đại diện cho sự gia tăng gấp 5 lần.

Làm thế nào để có nhiều gen cần thiết trong cơ thể? Để xác định một gen cầnthiết cho cơ thể thì chức năng của gen đó phải suy yếu một mức độ nào đó. Điều nàythường đạt được bằng sự loại thải gen, nơi mà gen được lấy ra từ hệ gen và các biểuhiện của nó trên tế bào xác định tính khả thi. Phân tích như thế này cho thấy rằngkhoảng một nữa bộ gen của vi khuẩn E.coli và nấm men cần thiết cho khả năng tồn tại.Nhiều gen dường như không cần thiết. Tỷ lệ phần trăm của các gen có thể phản ảnhsuy biến chức năng giữa các bộ nhất định của gen.

Làm thế nào nhiều gen được biểu hiện cùng một lúc? Các gen được thể hiệntrong một tế bào đặc biệt. Một số gen biểu hiện trong tế bào gan phải khác với nhữnggen biểu hiện trong tế bào da. Phân tích toàn bộ bộ gen của tất cả các gen trong sinh vậtcó đầy đủ trình tự như nấm men cho thấy rằng khoảng 90% gen được biểu hiện cùngmột lúc, nhưng 80% trong số này được thể hiện với mức độ phong phú thấp theo thứ tựlà 0.1 – 2. Mức độ biểu hiện của các gen cũng sẽ rất khác nhau. Rất nhiều protein đượcsản xuất từ các gen có mức biểu hiện cao, trong khi các protein khác biểu hiện ở mức độthấp hơn nhiều thường được sản xuất từ gen được thể hiện ở mức độ thấp.

Sản phẩm trung gian giữa DNA và protein là RNA. Quá trình chuyển đổi chuỗiDNA thành các protein xảy ra qua hai giai đoạn. DNA được phiên mã ra RNA sau đóđược dịch mã ra các chuỗi polypeptide của protein. Như chúng ta đã nhìn thấy (Hình1.5) RNA khác với DNA ở chỗ nó có chứa một đường ribose thay vì một đườngdeoxyribose. Ngoài ra, Uracil thay thế cho Thymine như là base bổ sung cho Adeninetrong RNA. Phiên mã cũng tương tự như quá trình tự sao mã DNA chỉ khác là mộttrong hai sợi DNA được sao chép. Có hai loại RNA được tạo ra từ sự phiên mã, RNAthông tin (mRNA) và RNA cấu trúc (ribosome RNA (rRNA) và RNA vận chuyển(tRNA)). Mặc dù cho đến nay, hình thức phong phú nhất của RNA trong hầu hết các tếbào đại diện cho một vài phần trăm trong tổng số RNA là mang thông tin di truyền.1.13. Quá trình phiên mã

Phiên mã là quá trình tạo ra bản sao RNA từ một sợi trong chuỗi xoắn kép DNA.Các sợi antisense của AND được dùng để tổng hợp một phân tử RNA theo nguyên tắcbổ sung. Phân tử RNA được tạo ra giống với sợi có chiều từ 5’ đến 3’ của DNA chỉkhác là nó chứa U thay vì T. Có sự khác biệt cơ bản trong sự phiên mã ở sinh vật nhânsơ và sinh vật nhân chuẩn. Ở đây, điều quan trọng là hiểu được các quy trình liên quanđến từng trường hợp. Trong nhiều thí nghiệm chúng tôi nhận thấy có nhiều vấn đềkhi sử dụng các tế bào nhân chuẩn, nhưng các vi khuẩn E.coli vẫn đóng một vai tròquan trọng trong hầu hết các thí nghiệm kỹ thuật di truyền.

Page 35: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

34

Quá trình phiên mã bắt đầu từ trình tự DNA đặc trưng được goi là mã mở đầu.Giống như nhân đôi DNA, phiên mã xảy ra trong ba giai đoạn : bắt đầu, kéo dài, kếtthúc. Bắt đầu phiên mã thường xảy ra ở đầu 3/ cuả mã mở đầu, chấm dứt dựa vào trìnhtự kết thúc. Thoạt nhìn, các cấu trúc tổng thể của gene prokaryotic and geneeukaryotic tương tự nhau. Tuy nhiên, vùng kiểm soát các gen nhân chuẩn sẽ khônghoạt động trong tế bào prokaryote và ngược lại.

Hầu hết các gen mã hóa protein ở sinh vật nhân sơ hoạt động phiên mã mộtcách tự động. Khi vắng mặt các yếu tố khác, RNA polymerase có thể nhận ra vùngmở đầu, liên kết với nó và tạo ra RNA. Các RNA polymerase của sinh vật nhân điểnhình khi tham gia vào việc mã hóa protein (pol II) không nhận biết được các trình tựcủa vùng mở đầu của riêng mình. Vì vậy, ở các gen sinh vật nhân chuẩn quá trìnhphiên mã không diễn ra trong trường hợp không có các yếu tố khác. Ở Prokaryotes vàEukaryotes phiên mã là một quá trình có quy định. Đúng thời gian và mức độ biểuhiện gen cần thiết cho hầu hết các qúa trình của tế bào.1.13.1. Quá trình phiên mã ở Prokaryotes

Francois Jacob and Jacques Monod là những người đầu tiên đã xây dựng một môhình gene điều hòa trong tế bào vi khuẩn. Họ thực hiện trên hệ thống trao đổi chấtlactoza trong vi khuẩn đường ruột (E.coli). Lactoza là một disaccharit của galactozavà glucoza. Khi vi khuẩn sống trong môi trường chứa đường lactose nó biểu thị nhữnggen cấu trúc sau: β-galactosidase: enzyme xúc tác sự phân giải lactose thành glucosevà galactose. Nó được mã hóa bởi gene lac Z. Lactose permease: enzyme khoangmàng tế bào và mang lactose vào tế bào. Nó được mã hóa do gen lac Y.

Thiogalactoside transacetylase: các chức năng của enzyme này không được biếtrõ. Nó được mã hóa do gen lac A. Ba enzyme nằm liền kề nhau trong hệ gen của vikhuẩn E.coli (Hình 1.23) và một vùng của DNA có trách nhiệm phiên mã quy địnhnằm ở đầu 5/ của gen cấu trúc . Nó được gọi là operon lac. Để chuyển hóa đườnglactose, các gen cấu trúc phải được biểu hiện và protein phải được tạo ra. Nguồnđường để cung cấp cho E.coli là đường glucose, vì nó không cần phải chuyển đổi khivào cơ thể. Vì vậy, nếu cả glucose và lactose có sẵn, vi khuẩn sẽ ngừng quá trìnhchuyển hóa đường lactose thành glucose.Các operon lac gồm các thành phần sau:

Operator (lacO) – vùng vận hành, protein ức chế có thể liên kết làm ngăn cảnsự phiên mã.

Promoter (lacP) – vùng khởi động, nơi mà RNA polymerase bám vào và khởiđầu phiên mã.

Repressor (lacI) gene – vùng ức chế protein. Pi vùng mở đầu của lac I. CAP liên kết cAMP/CAPTrong trường hợp không có lactose, RNA polymerase liên kết với vùng khởi

động, nhưng nó ngăn cản sự phiên mã của các gen cấu trúc bởi các protein ức chếliên kết với vùng vận hành (Lee and Goldfarb, 1991). Do đó, không có RNA được tạora, không tạo ra protein. Các chất ức chế được sinh ra từ lac I do RNA polymerase liênkết với vùng khởi động (Pi). Khi môi trường có lactose, nó hoạt động như một operon

Page 36: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

35

cảm ứng. Một số phân tử lactose liên kết với protein ức chế làm biến đổi cấu hìnhkhông gian ba chiều của nó làm cho protein ức chế không liên kết được với vùng vậnhành. Khi đó RNA polymerase có thể lên kết với vùng khởi động và RNA có thể đượctạo ra từ 3 gen cấu trúc. Lactose có thể được chuyển hóa.

Một câu hỏi đặt ra ở đây là cách chuyển hóa lactose được quay về như ban đầu.Như đã nêu ở trên, các gen cấu trúc dịch mã tạo ra các enzyme phân giải đường khi môitrường có lactose, khi không có đường lactose quá trình phiên mã bị dừng lại. Vì vậy, cóvẻ như không thể đạt được kích hoạt, kể cả kích hoạt là cần thiết để phân giải đườnglactose trong cơ thể. Tuy nhiên đây là một quá trình đơn giản. Mỗi gen cấu trúc đượcphiên mã ở mức độ thấp, trung bình (khoảng 5 bản sao mỗi tế bào) trong trường hợpkhông có lactose. Có nghĩa là vi khuẩn khi gặp một nguồn lactose nó có thể vận chuyểnmột vài phân tử vào trong tế bào gây cảm ứng tác động lên gen cấu trúc. Sau khi gâycảm ứng lên các gen cấu trúc khoảng 5000 bản sao của protein có mặt trong tế bào.

Hình 1.23:Việc kích hoạt của operon lac trong E.coli. Trong trường hợp khôngcó lactose, các protein ức chế liên kết với vùng vận hành (O) và ngăn không cho RNApolymerase liên kết với vùng khởi động để tiến hành phiên mã. Khi môi trường cólactose, một số phân tử lactose liên kết với protein ức chế làm biến đổi cấu hình khônggian ba chiều của nó làm cho protein ức chế không thể liên được với vùng vận hành.Bây giờ, ARN polymerase có thể liên kết được với vùng khởi động để tiến hành phiênmã từ 3 gen cấu trúc (lacZ, lacA and lacY). Việc kích hoạt các gen lac chỉ xảy ra khikhông có glucose catabolite activator protein (CAP) liên kết với vùng vận hành và đểcho RNA polymerase liên kết với vùng khởi động.

Quá trình kiểm soát vùng vận hành phức tạp hơn vì nó cần dừng lại nếu cóglucose, không cần biết lactose trong môi trường có hay không. Khi glucose trong cơthể cao, sản xuất theo chu kỳ AMP (cAMP) bị ức chế, khi nồng độ đường giảm, mộtchất liên lạc là AMP vòng được sản xuất. cAMP gắn vào và hoạt hóa CAP (cataboliteactivator protein), sau đó gắn lên DNA tại vùng vận hành. Điều này kích hoạt cho sựphiên mã của các gen cấu trúc diễn ra nhanh hơn bằng cách tăng ái lực cho các RNA

Page 37: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

36

polymrase gắn vào vùng khởi động để tiến hành phiên mã. Hiện tượng này gọi làcatabolite repression, khi đường ức chế sự phiên mã của operon lac bằng cách khôngcho kích hoạt đầy đủ. Giống như operons ở prokaryotes, ba gen cấu trúc được phiênmã như là một mRNA. Mỗi ORFs chứa ribosome của riêng nó trong mRNA được mãhóa độc lập với các gen khác.

Chúng ta xem quá trình phiên mã diễn ra như thế nào, và quá trình phiên mã kếtthúc như thế nào? Một RNA polymerase bắt đầu quá trình phiên mã, di chuyển dọctheo DNA, tổng hợp RNA, cho đến khi nó kết thúc. Ở đây, các polymerase dừng lạinối thêm nucleotide vào chuỗi RNA, tạo các sản phẩm hoàn chỉnh và tách ra khỏichuỗi DNA. Kết thúc quá trình phiên mã dựa vào 2 yếu tố sau:

Rho-dependent termination: các protein rho liên kết với các chuỗi RNA mớiđược tổng hợp và nó xuất hiện để kết thúc quá trình phiên mã khi polymerase dừng ởcác trình tự DNA nhất định.

Rho-independent termination: kết thúc độc lập. Hình thức kết thúc độc lập nàykhông phụ thuộc các yếu tố khác và là hình thức phổ biến nhất kết thúc quá trình phiênmã trong E.coli.1.13.2 Quá trình phiên mã ở Eukaryotes

Quá trình kích hoạt biểu hiện gen ở sinh vật nhân chuẩn (eukaryotes) phức tạphơn nhiều so với sinh vật nhân sơ (prokaryotes). Có sự khác biệt nhiều giữa các sinhvật eukaryotes và sinh vật prokaryotes là các va chạm khi kích hoạt gen và quá trìnhtạo ra RNA.

Sinh vật eukaryotes có nhiều enzyme RNA polymerase.Việc đóng gói DNA vào thể nhân đại diện cho một rào cản đối với sự phiên mã.Việc tách biệt của nhân (nơi xảy ra phiên mã) và tế bào chất (nơi diễn ra dịch

mã) ở eukaryotes có nghĩa là phải có cơ chế để bảo vệ mRNA khỏi suy thoái trong tếbào chất trước khi hoàn thành quá trình dịch mã.

Gen ở sinh vật eukaryotes là monocistronic, mỗi gen được phiên mã theo từngđoạn riêng bắt đầu với phần khởi động riêng của nó.

Gen ở sinh vật eukaryotes không liên tục và được chia thành các vùng mã hóavà các vùng không mã hóa.

Chúng ta sẽ xem xét từng vấn đề làm thế nào một gen có thể phiên mã được vàRNA được tạo ra như thế nào?

Eukaryotes chứa ba RNA polymerase khác nhau, chịu trách nhiệm phiên mãcho từng gen nhất định. Mỗi polymerase là tập hợp các protein có liên quan, giữanhiều thứ khác, điều chỉnh hoạt động polymerase. Hoạt động của polymerase II (mãhóa cho protein) được gắn trên vùng khởi động của đoạn DNA để tiến hành phiên mã.Khi không có các yếu tố kích hoạt quá trình phiên mã không diễn ra. Vai trò của cácchất hoạt hóa được tập trung nhiều. Tuy nhiên, nó xuất hiện để đơn giản các phức hợpprotein để tìm gen mục tiêu. Kiểm soát biểu hiện gen thông qua các chất kích hoạt.Những chất hoạt hóa có hai chức năng riêng biệt. Đầu tiên, nó phải có khả năng liênkết với DNA để tìm thấy gen mục tiêu trong trình tự DNA. Thứ hai, tham gia vào các

Page 38: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

37

liên kết protein- protein để RNA polymerase thông qua miền kích hoạt. Một trongnhững chức năng này có thể được điều chỉnh biểu hiện gen để đáp ứng các tín hiệu cụthể.

RNApolymerase

Đơn vị Sản phẩm

I Nucleolus 28S, 18S, và 5.8S rRNAII Nucleus mRNA, và một vài snRNA

III NucleustRNA, 5S rRNA và một vài

snRNA

Hình 1.24. Vai trò của những chất kích hoạt làm tăng khả năng biểu hiện ở geneukaryotes. Các liên kết của các chất hoạt hóa protein thông qua miền liên kết trênDNA (DBD) có thể xảy ra ở một phần thể nhân hoặc trên DNA.

Một vấn đề bổ sung cho quá trình phiên mã của các gen ở sinh vật eukaryotes làphần lớn các DNA được đóng gói tại thể nhân, là rào cản để lắp ráp các phức hợpphiên mã. Nhiều chất hoạt hóa có thể liên kết với các trình tự trên DNA. Sau khi liênkết DNA, kích hoạt một hoặc nhiều hơn những phức hợp gen.

Chromatin-modifying complexes: protein histone tạo thành lõi của thể nhân.Tuy nhiên, như đã thấy ở hình 1.15, các acid amin ở trình tự kết thúc của histone nhôra ngoài. Những phần nhô ra đó có thể sửa đổi được, bởi các tiên tố, phosphoryl hóa và

Page 39: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

38

methyl hóa của các acid amin cụ thể (Figure 1.25(a)), và việc thay đổi đóng vai tròquan trọng trong quá trình phiên mã. Mặc dù các đuôi đó không cần thiết để duy trì sựtoàn vẹn cấu trúc nucleosome, nó không có vai trò trong cấu trúc nhiễm sắc thể bậccao và trong các tương tác với các non-histone chromosomal proteins. Sự acety hóacủa histone được thực hiện bởi các enzyme histone acetyltransferases (HATs) trongkhi các phản ứng ngược lại được xúc tác bởi enzyme histone deacetylases (H-DACs).Sự acelty của lysine trong việc loại bỏ các điện tích dương từ protein (Hình 1.25 (b)).Những đuôi histone acelty hóa có thể tương tác với DNA lỏng lẻo hơn để các phứchistone – DNA linh động và có thể dễ dàng phân ly để quá trình phiên mã xảy ra.

Hình 1.25. Sửa đổi các “đuôi” histoneNhiễm sắc thể tái hợp: những phức hợp chẳng hạn như SWI/SNF proteins sử

dụng năng lượng có nguồn gốc từ ATP để di chuyển thể nhân. Cơ chế chính xác thìkhông rõ ràng, nhưng chúng có chức năng như ATP điều khiển chuyển động dọc theoDNA và phá vỡ liên kết protein- DNA khi di chuyển.

Các tương tác giữa các chất hoạt hóa và protein mô tả ở trên dẫn đến một môhình để kích hoạt gen phải liên kết với DNA. Các chất hoạt hóa làm thay đổi cấu trúcnhiễm sắc thể và sau đó tái hợp lại để loại bỏ thể nhân từ promoter, và cuối cùng PolII được đưa đen vùng khởi động để quá trình phiên mã có thể bắt đầu. Cấu trúc thểnhân các điện tích dương (lysine và arginines) của histone được đặt liền kề với chuỗixoắn DNA âm tính.

Page 40: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

39

Hình 1.26 Cấu trúc của enzyme RNApolymerase II. (a) Mô hình chung cho 10 tiểuđơn vị của RNA polymerase. Các hình cầu lớnmàu đỏ trong khe ở trung tâm của phân tử đạidiện cho các ion magiê. Một sơ đồ sắp xếpcủa tiểu đơn vị trong cấu trúc protein, đượcbiểu hiện trong bảng (b) và protein vòng vớicả cấu trúc DNA xoắn lại (màu xanh dươngvà xanh lá cây) và RNA (màu đỏ) trong hình(c).Những thông tin này được cung cấp từPatrick Cramer (Đại học Munich) và được táibản với sự cho phép bộ khoa học (Cramer vàcộng sự, 2000;. Gnatt và cộng sự, 2001.). Bảnquyền thuộc Hiệp hội Khoa học Mỹ vì sự tiếnbộ khoa học.

Hình 1.27. Cấu trúc của một phân tử mRNA ở sinh vật nhân chuẩn. Sau khi đượcphiên mã, đầu 7 methyl-guanosine được gắn vào đầu 5’ của đoạn mRNA tại vị trínhóm đường ribose đầu tiên, đôi khi là thứ 2, nucleotide được methyl hóa ở vị trí 2’.Đầu 3’ được polyadenin hóa do gắn thêm 100-200 adenin.

Thật vậy, bằng chứng gần đây cho thấy các enzyme và các chất tham gia vàophiên mã, RNA được phiên mã và dịch mã có thể rộng rãi cùng với sự biểu hiện hìnhthức tối đa hóa hiệu quả và đặc trưng của mỗi giai đoạn của biểu hiện gen (Maniatis vàReed, 2002).1.14. Quá trình hình thành RNA

Có lẽ sự khác nhau rõ rệt nhất giữa bộ gene của sinh vật nhân nguyên thủy vàsinh vật nhân chuẩn đó là bộ gene của loài tiến hóa hơn được chia thành exon (vùng

Page 41: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

40

mã hóa) và introns (vùng không mã hóa). Trong những năm giữa thập kỉ 70, PhilipSharp và Richard Rorberts đã độc lập lai tạo được một mRNA được sao chép từ DNA,và xem đoạn lai được này dưới kính hiển vi điện tử. Họ đã phát hiện ra lai RNA xuấthiện các trình tự gián đoạn trong DNA. Đó là mối liên hệ giữa mRNA với cấu trúcDNA, nơi nó xuất phát sẽ dẫn đến sự hình thành cấu trúc vòng trong mạch DNA,tương ứng với trình tự trong DNA mà không có mặt trong mRNA (theo Chow và cáccộng sự năm 1977; Berget, Moore và Sharp, năm 1977). Walter Gilbert đã đặt tên chonhững vùng khác nhau này. Đoạn gene được tái hiện lại ở mRNA và vì thế là nhữngphần của vùng giống hệt, được gọi là exon. Đoạn gene có trình tự xen vào gọi làintrons. Cơ chế tiền RNA chuyển đổi thành mRNA hay nói cách khác, làm thế nào cácđoạn introns được loại bỏ, đã trở thành chủ đề được nghiên cứu sôi nổi từ phát hiệncủa họ. Trước khi đề cập đến vấn đề này, chúng ta cần tìm hiểu một phân tử mRNA đãđược hình thành như thế nào.

Ngay khi một gene được phiên mã, mRNA được tạo ra có nhiều sửa chữa. Hầuhết là ngay khi quá trình tổng hợp mRNA bắt đầu, cuối đầu 5’ của đoạn mRNA đượcthêm vào gốc 7-methyl guanosine. Phần đầu được gắn vào điểm cuối 5’ của đoạnmRNA bằng cách trùng ngưng 5’-5’ của guanosine với mRNA để tạo thành cấu trúcbao gồm 3’-G-5’ppp5’-N-3’p. Sau khi hình thành đầu 5’, 1 nhóm methyl được gắn vàogốc guanine và đến nucleotide đầu tiên và/hoặc nu thứ hai liền kề (hình 1.27). Chứcnăng của đoạn mở đầu không rõ ràng. Người ta dự đoán rằng phần đầu, và protein liênkết với nó, điều khiển ribosome liên kết và khởi đầu dịch mã một cách chính xác.Cùng với đoạn đầu, phần đuôi 3’ của mRNA được cắt từ chuỗi mở rộng và được gắnchuỗi Adenin.

Tín hiệu từ một polyA có trong RNA điều khiển sự chia tách bản sao RNA và sựgắn chuỗi Adenin (hình 1.28). Tín hiệu từ trung tâm của chuỗi Adenin ở tiền mRNAcủa động vật có xương sống bao gồm 2 đơn vị nhận biết phía bên vùng chia tách-gắnchuỗi Adenin. Một cách đặc trưng, một lượng lớn không đổi 5’-AAUAAA-3’ hexamerđược tìm thấy từ 20-50 nucleotide ngược dòng của các đơn vị thay đổi hơn giàu Uhoặc GU. Sự chia tách sợi sớm xảy ra giữa những cặp đơn vị này và được kết hợp vớiviệc gắn thêm khoảng chừng 200 adenosine ở đầu 3’ hoặc 5’ của sản phẩm đã táchđược. Hai yếu tố protein yêu cầu cho quá trình này là sự phân cắt và yếu tố gắn chuỗiAdenin đặc biệt (CPSF), nó liên kết với chuỗi được lặp đi lặp lại AAUAAA, và yếu tốkích thích sự phân cắt (CStF), liên quan đến các đơn vị xuôi dòng giàu GU. Khi tínhiệu của polyA được phát ra từ enzyme polymerase, nó nhận biết các yếu tố phân cắtvà gắn chuỗi polyA vừa được thêm vào từ RNA polymerase CTD. Sau đó quá trìnhhợp thể tiếp tục với nhiều yếu tố tham gia vào phức hợp. Cuối cùng sự phân cắt xảy ra,tiếp theo quá trình gắn một đoạn khoảng 200 Adenine vào đầu 3’ của mRNA. Quátrình gắn polyA chỉ xảy ra ở mRNA nhưng không phải tất cả mRNA, ví dụ, mRNAđặc biệt mã hóa protein histone thì không có quá trình gắn chuỗi adenine. Quá trìnhgắn chuỗi Adenin được thực hiện bởi enzyme polyA molymerase (PAP), và nó khôngchỉ giữ ổn định cho quá trình sao mã mà nó còn cần thiết cho quá trình di chuyểnmRNA ra khỏi nhân, vào tế bào chất, nơi quá trình dịch mã diễn ra. Như chúng ta sẽ

Page 42: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

41

thấy ở những chương sau, việc gắn thêm chuỗi Adenin vào mRNA có một kết quảthực tế quan trọng. Sự lai chuỗi polyT chỉ để chỉ mRNA, không phải các RNA khác, làmột công cụ quan trọng cho các kỹ sư di truyền.1.14.1 Nối RNA

Có một vài kỹ thuật nối RNA khác nhau, có chức năng trên các dạng RNA khácnhau. Tuy nhiên, ở đây chúng tôi chỉ tập trung vào kỹ thuật nối mRNA từ sự hiểu biếtnó, tầm quan trọng của nó, là được áp dụng nhiều nhất trong kỹ thuật di truyền. Phầnđầu và phần đc gắn chuỗi A của mRNA được nối với nhau nhằm tách đoạn introns vànối các đoạn exons với nhau thành 1 đơn vị duy nhất được dịch mã. Điều cần thiết đểsản xuất các sản phẩm ghép một cách chính xác là rõ ràng. Khi hợp nhất các đoạnexon với nhau bị trượt bất kì cũng gây ra hậu quả tai hại cho protein vừa được tạo racuối cùng. Có bao nhiêu ranh giới giữa một đoạn intron và exon được đánh dấu, và sựghép nối thực sự diễn ra bởi kỹ thuật phân tử nào? Đáng ngạc nhiên, có tương đối íttrình tự RNA bảo tồn ở ranh giới intron-exon. Phần lớn introns bắt đầu với chuỗidinucleotide 5’- GU-3’ và kết thúc bằng các trình tự dinucleotide 5’-AG-3’ (Hình1,29). Tuy nhiên, có một số ít trình tự bảo tồn được thể hiện ở vùng introns mà hoạtđộng như là vùng liên kết cho phức hợp, cần thiết cho việc ghép nối. Những phức hợpnày, được gọi chung là spliceosome, mà thành phần bao gồm RNA và proteins, và chỉthấy duy nhất trong nhân. Phân tử RNA tìm thấy trong spliceosome rất nhỏ ( khoảng100-200 nucleotides) và được kết hợp với proteins tạo thành thể nhân nhỏribonucleoproteins (snRNPs, hay snurps). Phân tử RNA có trong những phức hợp nàychứa nhiều Uridine, do đó mà snRNPs được mô tả dưới các tên U1, U2, U4, U5 và U6.Một mô hình về chu trình nối tổng thể được enzyme spliceosome xúc tác thể hiện quahình 1.29. Cơ chế nối exon và đẩy introns phụ thuộc vào hai phản ứng ester, mà kết quảlà hình thành dạng lariat của introns và hợp nhất các exon. Các nhánh liên kết với nhómAdenin có trong intron của thể lariat chứa 2 liên kết phosphodiester nối 2’ và 3’ củaAdenin. snRNP đóng vai trò trong quá trình xúc tác và trong duy trì cấu trúc 2 exon kếnhau như là chất bắt đầu cho phản ứng gắn 2 exon kề nhau. Người đọc quan tâm đến cơchế nối chuyển hướng tới nội dung đặc biệt trong chủ đề ( theo Sharp, 1994).1.14.2 Nối thay thế

Mỗi một exon trong bộ gene của eukaryout mã hóa một phần protein, chúng ta cóthể tưởng tượng rằng điều này là có thể, bằng cách biến đổi tiền mRNA như thế nàotrước khi nó được ghép lại, để tạo ra những kiểu mRNA khác nhau và cuối cùng là cácprotein khác nhau. Nối thay thế là một hiện tượng xảy ra rộng rãi, với các ước tính gầnđây cho thấy rằng có ít nhất 30% gene ở người được xem là đối tượng của loại chutrình này ( Sorek và Amitai, 2001). Làm thế nào để nối ghép các biến thể khác với cáctrình tự ban đầu, mà từ đó tìm thấy được nguồn gốc của chúng? Các hoạt động sinh lýcủa các protein được tạo ra từ ghép nối các biến thể có thể là giống nhau, ngược nhauhoặc hoàn toàn khác nhau và không có liên quan với nhau. Do đó nối thay thế làm giatăng một cách đáng kể số lượng hoạt động của các protein khác nhau, chúng có thểđược tạo ra từ các gene được chỉ định có trong bộ gene.

Page 43: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

42

Một trong những ví dụ nổi bật nhất của nối thay thế có lẽ được thấy trong cácgene xác định giới tính trong ruồi giấm Drosophila melanogaster. CÓ 3 gene liên quanđến quá trình xác định giới tính: sxl ( sex lethal), tra( transformer) và dsx ( double sex)( Chabot, 1996). Mỗi loại gene này sản sinh ra một tiền mRNA, tiền mRNA này có 2kiểu nối có thể, tùy thuộc vào ruồi có giới tính đực hay cái. Hình 1.30 thể hiện 3 loạigene này và các mô hinh nối của chúng. Đối với ruồi đực, với 2 exon ( exon 3 trongsxl và exon 2 trong tra) tạo ra các phân tử mRNA có các condon kết thúc và kết quả làtạo ra các protein bất hoạt. Protein được tạo ra ở ruồi đực chỉ hoạt động khi được dịchmã từ gene dsx. Protein này bất hoạt tất cả các gene đặc biệt của con cái. Mặt khác ởruồi cái, tạo ra mRNA không có condon kết thúc trong exon. Trong trường hợp genesxl và tra, protein được tạo ra có 1 ảnh hưởng tích cực về mô hình nối được quan sát,kiểm soát việc lựa chọn loại bỏ introns nào trong các phản ứng spliceosome.1.15. Dịch mã

Dịch mã là quá trình mà qua đó các cấu trúc RNA và các protein liên quan, giảimã chuỗi thông tin chứa trong mRNA để tạo ra các chuỗi amino acid , gọi làpolypeptide, tạo thành protein. Trình tự nucleotide của mRNA được đọc với 3 nu 1 lần( một codon). Mỗi một condon gắn 1 amino acid đặc biệt vào chuỗi peptide đang đượctạo ra. Dịch mã bắt đầu tại một codon khởi đầu, AUG, và kết thúc tại một trong 3condon kết thúc khác nhau, UÂ, UGA hoặc AUG ( xem phụ lục 1). Mỗi một bộ 3được đọc lần lượt từ condon mở đầu trở đi ( hình 1.31). Có 20 loại amino acid khácnhau được tìm thấy trong protein. Các bộ ba mã di truyền, tuy nhiên, lại cho tới 64codon khác nhau ( Phụ lục 1). Như vậy, có hiện tượng thoái hóa trong mã di truyền,với hấu hết các amino acid được mã hóa bởi hơn 1 codon. Ví dụ, methionine được mãhóa bởi một codon duy nhất (AUG), trong khi đó leucine và arginine được mã hóa bởi6 codon. Mã di truyền rất phổ biến. phần lớn các gene của tất cả sinh vật tuân theo cácmã giống nhau, tuy nhiên, một số gene mã hóa ty thể đi chệch khỏi các mã. Ví dụ, tythể người và nấm men sử dụng codon kết thúc UGA để them amino acid tryptophanvào chuỗi polypeptide đang kéo dài.

Sự biến đổi trong chuỗi DNA có thể gây ảnh hưởng mạnh kẽ đến trình tự proteinđược tạo ra. Trong ví dụ được thể hiện ở hình 1.31, đột biến ở chuỗi DNA làm biếnđổi T trên chuỗi xuôi thành G kết quả làm thay đổi codon mã hóa serine (UCU) thànhcodon mã hóa alanine (GCU). Việc thêm, bớt nucleotide gây ảnh hưởng lớn lênprotein được mã hóa. Ví dụ cho thấy, đột biến thêm base GC làm biến đổi cấu trúc đọctrong dịch mã dẫn đến kết quả protein có trình tự hoàn toàn khác với trình tự ban đầusau vị trí đột biến. Đột biến dạng này được gọi là đột biến khung đọc (frame-shiftmutation). Không phải tất cả đột biến DNA đều làm thay đổi trình tự protein. Ví dụ,nếu codon mã hóa serine được nói ở trên bị đổi từ UCU thành UCG thì codon mới nàyvẫn sẽ mã hóa serine. Các đột biến này được gọi là đột biến câm (silent mutation), vìchúng không gây đột biến trình tự protein.

Các tRNA làm trung gian trong quá trình dịch mã. Nó vận chuyển một aminoacid đặc trưng đến bộ 3 mRNA mã hóa nó. Emzyme được gọi là cặp aminoacyl-tRNAsynthetases được mã hóa từ codon liên quan đến tRNA chứa anticodon thích hợp. Cặp

Page 44: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

43

codon-anticodon chỉ đạo việc bổ sung chính xác các amino acid vào chuỗi polypeptideđang hình thành. RNA được dịch mã nhờ ribosomes. Những cấu trúc hai phía gồmmột tiểu đơn vị lớn và tiểu đơn vị nhỏ. Mỗi tiểu đơn vị chứa RNA cấu trúc (rRNAs)liên kết với protein thực hiện các phản ứng hóa học đa dạng liên quan đến dịch mã.

Cơ chế dịch mã có thể giống với sao chép và phiên mã DNA, được chia làm 3bước: bắt đầu, kéo dài và kết thúc. Ở vi khuẩn, giai đoạn bắt đầu khi ribosome tập hợptrên chuỗi Shine-Dalgarno giàu purine ( 5’-AGGAGGU-3’) 4-8 base xuôi dòng củacodon mở đầu ( Shine và Dalgarno, 1975). Trình tự này được bổ sung đầu 3’ củarRNA 16S (5’-ACCUCCU-3’) của tiểu đơn vị ribosome 30S, và vị trí các ribosomebắt đầu dịch mã. Ở sinh vật nhân chuẩn, ribosome tập hợp xảy ra ở trình tự Kozak ( vịtrí tối ưu 5’-ACCAUGG-3’) bao quanh codon bắt đầu (Kozak, 1986). Sau đó ribosomedi chuyển dọc mRNA từ đầu 5’ đến đầu 3’. Dịch mã bắt đầu tại mã mở đầu AUG vàtiếp tục dọc theo chuỗi mRNA đến khi ribosome tách khỏi mRNA khi nó gặp codonkết thúc. Không có tRNA tồn tại ở codon kết thúc, và thay vào đó là protein RF(release factor) liên kết để tách ribosome. Dưới điều kiện tối ưu khoảng 20-25 aminoacd có thể được trùng hợp trên 1 giây ( Crowleshmith và Gamon, 1982) Tuy nhiên, tốcđộ thực tế của dịch mã có thể cao hơn mức này nhờ có hơn một ribosome có thể liênkết với duy nhất một mRNA tại cùng một thời điểm, tạo thành một polysome.

Số lượng ribosome liên kết với một mRNA nhất định sẽ ảnh hưởng đến tốc độdịch mã của nó: lượng ribosome liên kết càng cao, số lượng chuỗi protein được tạo racàng cao. Sử dụng codon của một đơn mRNA cũng ảnh hưởng đáng kể đến tốc độ kéodài. Các phân tử tRNA vận chuyển cho codon nào đó nhiều hơn các codon khác, dẫnđến sự khác nhau trong sử dụng codon để gene biểu hiện cao.

Dịch mã đã được chứng minh là đặc biệt quan trọng đến kỹ thuật di truyền từ đómục tiêu về thuốc kháng sinh như nó có thể ức chế vi khuẩn phát triển. Chức năng củacác kháng sinh sau đây trong ức chế dịch mã:

Chloramphenicol- ứng chế enzyme vận chuyển peptidyl trên tiểu đơn vịribosome 50S.

erythromycin- ức chế sự chuyển vị của tiểu đơn vị ribosome 50S fusidic acid- ức chế chuyển vị bằng cách ngăn chặn sự phân tách của nhân tố

kéo dài từ các ribosome puromycin – một tRNA tương tự aminoacyl là nguyên nhân gây ra kết thúc

chuỗi sớm. Streptomycin- nguyên nhân gây nhầm lẫn đọc và ức chế khởi đầu chuỗi tetracycline – ức chế nối aminoacyl-tRNA với vùng Adenin của ribosomeChuỗi protein chức thông tin điều khiển chu trình sau dịch mã và phân chia vách

tế bào ở sinh vật nhân chuẩn. Quá trình dịch mã protein bắt đầu với gốc methionine tạiamino kết thúc của sợi sớm ( dịch mã bởi codon AUG). Nhiều protein, ở cả sinh vậttiền nhân và nhân chuẩn, có gốc này được loại bỏ nhờ 1 enzyme có tên methionineaminopeptidase như trình tự protein cuối cùng bắt đầu với amino acid được mã hóa bởicodon thứ 2 (Bradshaw, Briday và Walter,1998). Protein Cytosolic tan được giảiphóng một cách đơn giản khỏi ribosome trước khi quá trình tổng hợp polypeptide hoàn

Page 45: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

44

tất, và có vị trí chính xác để thực hiện chức năng cụ thể của chúng. Tuy nhiên, nhiềuprotein của sinh vật nhân chuẩn được giành riêng cho những ngăn riêng biệt của tếbào. Bản than polypeptide tự mã hóa những thông tin cần thiết giành cho nó cuối cùng.Protein của sinh vật nhân sơ được giành để tích lũy trong nhân tế bào chứa 1 tín hiệunhân định vị (NLS), bao gồm 1 đoạn ngắn các amino acid cơ bản ( ví dụ PKKKRLV),nó chỉ đạo protein vào trong nhân ( Goldfarb và cộng sự, 1986). Protein đi ra khỏi tếbào, hoặc kết hợp với vách tế bào, được vận chuyển vào các mạng lưới nội chất (ER)trong suốt quá trình dịch mã. Protein chứa phần lớn amino acid kỵ nước ở nhữngamino acid kết thúc, goi là chuỗi tín hiệu, nó chỉ đạo phức hợp polypeptide-ribosomeđến ER, nơi chuỗi sớm amino acid được tổng hợp được đưa qua màng ER. Bên trongmàng ER, tín hệu được chia thành các chuỗi peptide kéo dài được lưu giữ trong màngER. Sau đó Protein này được vận chuyển nhờ bộ máy Golgi đến vị trí cuối cùng củanó, hoặc nó chứa tín hiệu duy trì ER ( amino acid KDEL) tại vị trí nhóm carboxy cuốicùng của nó, nó được giữ lại trong màng ER của chính nó ( Munro và Pelham, 1987).

Page 46: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

45

Chương 2Các kỹ thuật cơ bản trong phân tích gen

Một trong những vấn đề chính trong phân tích gen là bản chất của các phân tửDNA gần giống nhau. Như chúng ta đã biết, các DNA trong hệ gen người rất dài, mỗiDNA có 6,4 × 10 cặp base trong hầu hết các tế bào, và bao gồm bốn loại nucleotidekhác nhau. Với kích thước và cấu trúc tương đối ít phức tạp gây khó khăn cho việc côlập và nghiên cứu các đoạn DNA mạch đơn hoặc các gen. Chúng ta biết rằng trình tựcác base của DNA rất quan trọng trong mã hóa gen, nhưng để biết chức năng của mộtgen đơn thì gen đó cần được nghiên cứu trong sự cô lập và tách khỏi những thành phầnkhác của hệ gen ban đầu. Ý tưởng nảy sinh là chúng ta sẽ cắt một trong gen đơn lẻ rakhỏi hệ gen. Cho đến những năm 1970, vẫn không có phương pháp nào có thể cắtDNA tại những trình tự cụ thể. Khả năng phân đoạn DNA tại các vị trí cụ thể đã trởthành nền tảng của sinh học phân tử. Việc phát hiện ra các enzym có khả năng táchDNA tại những trình tự cụ thể, các enzyme giới hạn, giúp các nhà khoa học WernerArber, Nathans Daniel và Hamilton O. Smith nhận giải Nobel năm 1978.

Khi suy nghĩ làm sao chúng ta có thể phân tách một đoạn DNA cụ thể thì có mộtsố yếu tố quan trọng cần chú ý. Chúng ta cần phải cô lập đoạn DNA mà chúng ta quantâm, và nhân bản nó để nó có thể được sao chép và khuếch đại với điều kiện không cómặt các gen khác của người. Làm thế nào điều này có thể đạt được? Các phương phápđược ưa chuộng nhất để nghiên cứu chức năng của gen là nhân bản nó bên trong vikhuẩn Escherichia coli. E. coli có một số điều kiện thuận lơi giúp điều khiển gen đónhân bản vô tính - các tế bào phát triển nhanh chóng, các đặc trưng cũng được ditruyền đầy đủ, chủng vi khuẩn được thiết kế sao cho tương đối vô hại cho chính vậtchủ mang chúng. Tuy nhiên, có nhiều khó khăn liên quan đến việc chèn trình tự DNAngoại lai vào cơ thể vi khuẩn. Nhìn chung, trình tự DNA sẽ chỉ được sao chép nếuchúng chứa một replicon. Các bộ gen của vi khuẩn và virus thường chứa duy nhất mộtreplicon. Vì vậy, nếu đơn giản chỉ cần đặt một đoạn DNA ngoại lai vào tế bào vikhuẩn thì sẽ không nhân bản được DNA đó. Thật vậy, hầu hết các DNA ngoại lai đượcđưa vào trong vi khuẩn đều bị suy thoái. Quay lại những năm 1950, có một điều đáng

Những khái niệm chính

- Việc nhiều phát hiện trùng lặp về enzyme giới hạn, thể chuyển vi khuẩn, và kĩ

thuật điện di dùng gel agarose là cơ sở hình thành sự bùng nổ sinh học phân tử vào

những năm 1970.

- Cắt DNA tại những vị trí xác định và chèn các phân tử DNA ngoại lai vào hình

thành DNA tái tổ hợp.

- Nhân dòng - việc nghiên cứu các gen đơn dòng bằng cách cô lập - giờ đây đã

thực hiện được

- Phân tích DNA với độ phân giải cao nhờ sử dụng gel.

- Dùng các kỹ thuật “blotting”để phát hiện những trình tự nucleotide tương đồng.

- Nhanh chóng tinh sạch DNA.

Page 47: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

46

lưu ý rằng nếu thể thực khuẩn đã được phân lập từ các tế bào của một chủng E. coliđặc biệt (gọi là chủng C) thì nó cũng có khả năng lây nhiễm hiệu quả các đặc trưng củacùng một chủng vi khuẩn E. Coli đó. Tuy nhiên các thể thực khuẩn sẽ lây nhiễm đặctrưng từ các chủng vi khuẩn E. coli khác (gọi là chủng K) với hiệu suất rất thấp. Cóđiều thú vị là với cùng thể thực khuẩn được phân lập từ một chủng E. coli K sẽ lâynhiễm hiệu quả đặc trưng của cả chủng E. coli K và C. Các thể thực khuẩn sản xuất từchủng E. coli C sẽ ngăn chặn sự xâm nhập từ chủng E. Coli K. Werner Arber có lưu ýrằng DNA của thể thực khuẩn được phân lập từ chủng E. coli C nhanh chóng suy thoáikhi đưa vào chủng E. coli K (Arber, 1965). Sự suy thoái xảy ra do các vi khuẩn có hệthống sửa đổi – giới hạn được thiết kế để bảo vệ chúng khỏi các trình tự DNA ngoại lai.2.1 Các enzyme giới hạn

Hệ thống sửa đổi – giới hạn của vi khuẩn có hai thành phần – một enzymeendonuclease giới hạn và một enzyme methyl hóa DNA. Các enzyme giới hạn (hoặcenzyme endonuclease giới hạn) cắt mạch DNA tại những trình tự cụ thể. Thuật ngữ“endonuclease” áp dụng cho các enzyme cắt tại trình tự đặc biệt bằng cách phá vỡchuỗi acid nucleic trong phân tử DNA, chứ không phải ở cuối phân tử. Enzyme giớihạn đầu tiên được phân lập từ các chủng E. coli K trong phòng thí nghiệm vàonăm1968 (Meselson và Yuan, 1968). Enzyme này đã có thể tách DNA, nhưng sự phâncắt tại các vị trí chính xác của DNA vẫn còn chưa rõ. Các enzyme biểu hiện một sốhoạt tính phức tạp gây khó khăn trong nghiên cứu (Bảng 2.1).Bảng 2.1. Đặc tính của các enzyme giới hạn endonucleases theo Dryden, Murray vàRao (2001)Đặc tính Loại I Loại II Loại IIIHệ thống sửa đổivà giới hạn

Enzyme đa chứcnăng

Phân biệt nucleasevà methylase

Phân biệt cácenzyme chung nhau1 tiểu phân thườngdùng

Cấu trúc tiểu phânenzyme nuclease

heterotrimer homodimer Heterodimer

cofactors ATP, ,SAM (SAM)

Các yếu tố cần chosự phân cắt DNA

2 vị trí nhận biếttheo bất kì hướngnào

1 vị trí nhận biết 2 vị trí nhận biếttheo hướng từ 2 đầu

Vị trí phân cắtDNA

Ngẫu nhiên, khoảng1000 bp từ vị trínhận biết

Gần hoặc ngay tạivị trí nhận biết

24-26 bp từ đầu 3’của vị trí nhận biết

Tính tái sử dụngcủa enzyme

không có có

Sự dịch chuyểnDNA

có không không

Page 48: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

47

Vị trí methyl hóa Tại vị trí nhận biết Tại vị trí nhận biết Tại vị trí nhận biết

Năm 1970, Hamilton Smith và đồng nghiệp của ông đã cô lập được một enzymegiới hạn có hoạt tính từ chủng vi khuẩn Haemophilus influenzae Rd và chứng tỏ nó vẫncó thể cắt DNA tại các vị trí cụ thể. Các enzyme, được gọi là HindII, nhận thấy có 6 cặpbase trên mạch đôi DNA theo trình tự 5’ – G – T – pyrimidine – purine – A – C -3’:

và sẽ tách DNA trên cả hai sợi ở giữa trung tâm của chuỗi (tại vị trí có đường các dấuchấm ngăn cách trên hình). Smith phát hiện ra rằng enzyme ông tìm được không thểtách được DNA trong hệ gen vi khuẩn Haemophilus influenzae, nhưng nó cắt hệ gencủa thể thực khuẩn T7 (chiều dài 39 937 bp) tại hơn 40 điểm, để có mô hình các đoạnngắn DNA cụ thể. Các enzyme giới hạn HindII luôn nhận ra trình tự ở trên (5’ – 3’) vàluôn cắt trực tiếp ở giữa của mạch. Trình tự này được biết đến như vị trí nhận biếtHindII. Bất cứ nơi nào trên phân tử DNA có trình tự của sáu cặp base này, HindII sẽ cắtDNA đó. Trong thực tế, Smith đã rất may mắn trong các thí nghiệm của mình. Vi khuẩnHaemophilus influenzae có hai enzyme giới hạn khác nhau, HindII và HindIII, có lẽ cảhai enzyme này đều còn hoạt tính sau khi ông đã tinh sạch được chúng. HindIII nhậnbiết và sẽ tách chuỗi 5’ AAGCTT-3’, nhưng trình tự này không có trong hệ gen của thểthực khuẩn T7, và do đó sẽ không ảnh hưởng đến các mẫu ông thu được.

Ngay sau phát hiện của Smith, một enzyme giới hạn khác, EcoRI, được cô lập vàmang đặc trưng từ chủng vi khuẩn Escherichia coli RY13 (Hedgpeth, Goodman vàBoyer, 1972). enzyme này được tìm thấy là có thể nhận biết trình tự 5’-GAATTC-3’.Hơn 900 enzyme giới hạn hiện nay đã được cô lập từ hơn 230 loài vi khuẩn. Cácenzym giới hạn được đặt tên theo nguồn gốc của chúng - chữ cái đầu tiên của tên là tênloài vi sinh vật, các chữ cái thứ hai và thứ ba là tên chủng vi khuẩn từ mà chúng đượccô lập. Theo quy ước, các chữ cái được viết in nghiêng, nhưng gần đây đã thay đổi làviết chữ thường (Roberts và cộng sự, 2003.). Các con số sau tên các nulease chỉ ra thứtự mà các enzym này bị cô lập từ các chủng vi khuẩn. Con số được viết theo chữ số LaMã. Ví dụ, các enzyme giới hạn đầu tiên được phân lập từ các vi khuẩn Providenciastuartii được đặt tên là PstI, và lần thứ hai để được phân lập từ vi khuẩn Bacillusstearothermophilus chủng ET được đặt tên là BstEII.

Một câu hỏi thích hợp để hỏi ở đây là tại sao các DNA của các sinh vật sản xuấtenzyme giới hạn mà các enzyme này lại không tấn công chính nó. Trong các thínghiệm của Smith đã mô tả ở trên, ông có thể quan sát sự phân cắt DNA di truyền củaT7 bằng HindII, nhưng DNA di truyền trong chính vi khuẩn Haemophilus influenzaemà HindII được cô lập thì enzyme này lại không cắt được mặc dù trong DNA của vikhuẩn có nhiều trình tự enzyme có thể nhận biết để phân cắt,. Câu trả lời nằm ở phầnsửa đổi của hệ thống sửa đổi – giới hạn. Haemophilus influenzae, giống như tất cả cácsinh vật sản xuất các enzyme giới hạn khác, chúng còn sản xuất các enzyme sửa đổiDNA của mình để không bị cắt bởi enzyme giới hạn do chúng tạo ra. Ví dụ, chủng E.

Page 49: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

48

Coli RY13, sản xuất enzyme EcoRI, cũng sản xuất ra EcoRI ethylase (enzyme methylhóa EcoRI). Giống như nhiều enzyme giới hạn khác, các gen mã hóa cả enzymenuclease và enzyme sửa đổi nằm kề nhau trong hệ gen. EcoRI methylase gắn cácnhóm methyl vào vị trí N6 (Hình 1.5) của adenine thứ hai còn lại trong trình tự nhậnbiết của EcoRI, và tạo liên kết cộng hóa tri làm cho EcoRI không thể nhận biết điểmphân cắt (Hình 2.1). Thật vậy, sự methyl hóa chỉ ở một vị trí trên mạch DNA làm thayđổi trình tự nhận biết của EcoRI cũng đủ để ngăn chặn sự phân cắt của enzyme giớihạn này. Sự kháng lại của các vị trí đã bị bán methyl hóa trên DNA (chỉ bị methyl hóatrên một mạch DNA) bằng cách phân cắt nhằm bảo vệ DNA vi khuẩn khỏi suy thoáingay sau khi sao chép đầy đủ các trình tự DNA bán bảo toàn (DNA đã được nhân đôi1 lần, vẫn còn giữ lại 1 mạch gốc) đã bị methyl hóa, cho đến khi EcoRI methylase cóthể khôi phục trạng thái methyl hóa đầy đủ một lần nữa.

Hình 2.1. Bảo vệ DNA tách bằng cách biến đổi. Các enzyme giới hạn EcoRInhận biết và sẽ cắt chuỗi tại vị trí 5’-GAATTC-3’. Chủng E. coli R, nơi tách chiếtenzyme này, bảo vệ chính DNA của chúng khỏi sự phân cắt bằng cách sản xuất mộtenzyme methyl tại vị trí cụ thể. EcoRI methylase mang một nhóm methyl từ S-adenosylmethionine và gắn nó tại vi trí N6 của adenine thứ hai trong trình tự nhậnbiết của EcoRI. Enzyme giới hạn không thể cắt những DNA đã bị methyl hóa.

Sự methyl hóa các base trong adenine tại trình tự nhận biết EcoRI không ảnhhưởng đến toàn bộ cấu trúc DNA, nhưng ức chế sự phân cắt bởi các enzyme (Jen-Jacobson và cộng sự, 1996.). Các enzyme DNA methylase (đôi khi gọi làmethyltransferases DNA – enzyme vận chuyển nhóm methyl) hoạt động bằng cáchthêm nhóm methyl vào các vị trí cụ thể trong chuỗi DNA mạch kép. Một số các enzymnày đã được nghiên cứu cấu trúc (Hình 2.2). Gắn kết enzyme methylase vào DNA thì

Page 50: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

49

kết quả là các base lộ ra bên ngoài sẽ bị methyl hóa và các base còn lại trong xoắn củacác thành phần khác của protein vẫn ổn định. Base lộ ra ngoài liên quan đến việc xoaychiều của các liên kết trong cấu trúc DNA mạch kép để lộ ra một nucleotide không sắpxếp cùng hướng – out of stack, nuclotide đó có thể một cơ chất cho các phản ứng hóahọc xúc tác của enzym (Cheng và Roberts, 2001).

Hình 2.2. Cấu trúc của enzyme methylase HhaI gắn với DNA. Các enzyme (màutrắng) chèn một acid amin (màu xanh đen) vào trong chuỗi xoắn kép tại vị trí nhậnbiết của nó (5’ - GCGC-3’) và lật C đầu tiên trong phần còn lại (màu xanh lá) ra khỏitrục xoắn hoàn toàn(Blumenthal và Cheng, 2001). Phần còn lại bị methyl hóa bằngcách sử dụng S-adenosylmethionine (phần màu vàng). Các base bị methyl hóa có lẽquay trở lại vào chuỗi xoắn ốc sau khi enzyme phân ly. Sao chép từ Blumenthal vàCheng (2001) với sự cho phép của Xiaodong Cheng (Emory University).

Vì vậy, sinh vật có khả năng bảo vệ DNA của riêng mình trong khi DNA ngoạilai bị suy thoái chính xác là do nó không bị methyl hóa. Như chúng ta sẽ thấy sau đây,các enzyme methylase là công cụ quan trọng cho các kỹ sư di truyền, những ngườimuốn bảo vệ trình tự DNA hiện tại không bị phân cắt bởi các enzyme giới hạn trongống nghiệm.2.1.1 Các loại hệ thống Sửa đổi – giới hạn

Hệ thống sửa đổi – giới hạn được chia thành ba loại dựa trên cơ sở tính phức tạpenzyme, yêu cầu các cofactor và vị trí của sự phân cắt DNA, mặc dù hệ thống mớiđang được phát hiện ra rằng sự phân loại này không phù hợp. Các đặc tính của từngloại được tóm tắt trong Bảng 2.1. Các enzyme giới hạn EcoK, được phân lập lần đầutiên vào năm 1968, là một loại endonuclease nhận biết trình tự DNA 5’-AACN6GTGC-3’, nơi mà N có thể là bất kỳ nucleotide nào, nhưng dường như enzymesẽ cắt DNA tại vị trí ngẫu nhiên cách xa điểm nhận biết. Enzyme giới hạn Loại I cầnATP, S-adenosylmethionine (SAM) và các ion magie ( ) để hoạt động. Các

Page 51: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

50

enzyme gồm ba tiểu đơn vị, một tiểu đơn vị đặc trưng xác định vị trí nhận biết trênDNA, tiểu đơn vị sửa đổi và tiểu đơn vị giới hạn. Với sự hiện diện của SAM, enzymliên kết với trình tự nhận biết của mình không kể khu vực có sự methyl hóa. Nếu vị trínhận biết của enzyme bị methyl hóa, thì ATP sẽ thủy phân để kích thích phân ly cácenzyme ra khỏi DNA. Nếu vị trí nhận biết chỉ bị methyl hóa trên một sợi(hemimethylated), thì ATP kích thích methyl hóa của các sợi khác, nên SAM là một yếutố xúc tác sự methyl hóa. Nếu vị trí nhận biết chưa bị methyl hóa, thì xảy ra sự phân cắtDNA. Sự phân cắt xảy ra ở vài kilobases xa vị trí nhận biết, các trình tự DNA ở giữa saukhi cắt sẽ ra khỏi enzyme. Sự phân cắt DNA tương đối ngẫu nhiên làm cho các loạienzyme này không đặc biệt hữu ích cho các thí nghiệm trong kỹ thuật di truyền.

HindII, HindIII và các enzyme giới hạn EcoRI là những ví dụ của enzyme loại II.Chúng nhận biết trình tự DNA đối xứng nhau trên 2 mạch - trình tự hướng 5’ đến 3’trên một mạch DNA là giống như trình tự hướng 5’ đến 3’ trên mạch kia. Chẳng hạnnhư trình tự DNA thường được nói đến là palindromic. Palindromic gắn vào vị trí mộtcách liên tục (ví dụ như KpnI nhận chuỗi 5’-GGTACC-3’) hoặc bị gián đoạn (ví dụnhư BstEII nhận chuỗi 5’-GGTNACC-3’, trong đó N có thể là bất kỳ nucleotide nào).Enzyme giới hạn loại II chỉ cần ion magiê để hoạt động và thường cắt DNA trong vị trínhận biết hoặc rất gần với vị trí đó. Các enzyme giới hạn loại II khác sẽ nhận ra và cắttại các vị trí nhận biết khác nhau, nhưng có một enzyme giới hạn sẽ luôn luôn cắt trìnhtự base đặc trưng theo cùng cách thức, bất chấp nguồn gốc của DNA. Các enzyme giớihạn khác được phân lập từ các nguồn khác nhau thường nhận ra cùng trình tự DNA,mặc dù chúng có thể cắt DNA theo nhiều cách khác. Như vậy các enzyme được gọi làisoschizomers của nhau. Ví dụ, các enzym giới hạn SmaI và XmaI cả hai đều nhận ranhững trình tự DNA tương tự (5’-CCCGGG-3’). Và do đó isoschizomers, nhưng SmaIsẽ tách ở vị trí giữa C trung tâm và nucleotide G, trong khi XmaI sẽ cắt sau nucleotideđầu tiên trên mỗi sợi DNA.

Các enzyme giới hạn loại III hoạt động nhờ hai tiểu đơn vị phức tạp khác nhau:một tiểu đơn vị (M) chịu trách nhiệm nhận biết trình tự DNA và sửa đổi, và các tiểuđơn vị khác (R) hoạt hoá nuclease. Để cắt được DNA cần có ion magiê, ATP, và SAMxúc tác. Việc nhận biết các trình tự gần như đối xứng, và sự phân cắt xảy ra bằng cáchcắt trên một sợi DNA với khoảng cách xác định so với trình tự nhận biết của sợi kia.Hai trình tự nhận biết theo hướng đối diện cần thiết để phá vỡ DNA mạch kép.2.1.2. Các hệ thống sửa đổi khác

Hầu hết các chủng E. coli được sử dụng trong phòng thí nghiệm để tách chiếtDNA chứa hệ thống methyl hóa tại 3 vị trí cụ thể trên trình tự DNA (Hình 2.3). Các hệthống sửa đổi này có thể bảo vệ khả năng nhận biết trình tự phân cắt của enzyme giớihạn. Do đó, mức độ nhận biết của enzyme giới hạn edonuclease để methyl hóa DNAcũng bị hạn chế nhờ các hệ thống trong vi khuẩn E. coli. Hệ thống này có tầm quantrọng to lớn trong kỹ thuật di truyền.

a) Sự methyl hóa Dam. Các enzyme methylase xác định vị trí cụ thể nhờ cácgen Dam methyl hóa tại các vị trí N6 (xem hình 1.5) của adenine nằm ngoài trình tự5’-GATC-3’. Sự methyl hóa adenine ở vị trí này không ảnh hưởng đến khả năng bắt

Page 52: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

51

cặp base với thymine. Sự methyl hóa bằng gen Dam liên quan đến các chức năng khácnhau của tế bào, bao gồm cả chức năng sao chép DNA. Enzyme methylase Dam làmột enzyme tương đối chậm chạp, và kết quả là DNA vừa được tổng hợp sẽ bị bánmethyl hóa – mạch DNA cũ sẽ bị methyl hóa còn mạch DNA vừa mới tổng hợp thìkhông (Campbell và Kleckner, 1988). Tuy nhiên, sau đó cả hai mạch đều sẽ đượcmethyl hóa. Điều này trở nên quan trọng khi xảy ra sự methyl hóa tại vùng bắt đầu saochép của vi khuẩn E. coli (oriC), vùng này sẽ điều khiển sự sao chép có được tiến hànhhay không. Nếu vùng oriC trên trên cả hai mạch DNA đều bị methyl hóa, thì các vị trínày có thể phục vụ cho việc bắt đầu sự sao chép và quá trình tổng hợp DNA sẽ đượctiến hành. Tuy nhiên, nếu vị trí oriC trên mạch DNA bị bán methyl hóa, oriC khônghoạt động và quá trình sao chép DNA sẽ không được bắt đầu. Sự tái methyl hóa mộtcách chậm chạp của oriC sau một lượt sao chép kéo theo sự trì hoãn các lượt khác chođến khi hoàn thành lượt đầu tiên (von Freiesleben và cộng sự, 2000.).

Hình 2.3. Các hệ thống sửa đổi – giới hạn tìm thấy ở các chủng E.coli K trongphòng thí nghiệm. Vị trí di truyền của các hệ thống sửa đổi – giới hạn trong chủng E.coli K12. Vòng tròn đại diện cho các hệ gen của vi khuẩn E. coli, với những con sốtrên chỉ ra vị trí bên trong hệ gen. E. coli có hai hệ thống kiểu sửa đổi loại II (Dam vàDcm) và hai hệ thống sửa đổi – giới hạn loại I (MCR và EcoKI). Các enzymemethylase khác xác định vùng giới hạn và các tiểu phần đặc hiệu được đánh dấu sựmã hóa qua màu sắc trên hình.

(b) Sự methyl hóa Dcm. Các enzyme methylase được quy định bởi gen Dcmmethyl hóa vị trí C5 của cytosine không nằm bên trong trình tự 5’-CCWGG-3’ - W làmột A hoặc T. Vai trò chính xác của quá trình methyl hóa Dcm trong tế bào vẫn cònmơ hồ cho đến khi loại bỏ các gen Dcm của E. coli mà vẫn không có biểu hiện thayđổi rõ ràng ra ngoài kiểu hình (Palmer và Marinus, 1994).

(c) Hệ thống Mcr. Trong những năm 1980 có một điều rõ ràng rằng DNA từ cácnguồn vi khuẩn và sinh vật nhân chuẩn khác nhau mới có thể nhân lên với hiệu suất rất

Page 53: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

52

thấp trong một số chủng E. coli, vấn đề hiện nay là các tế bào chủ ngăn không cho DNAvào. Hiện tượng này do methylcytosine trong DNA, và được gọi là sự giới hạn cáccytosine đã biến đổi (Mcr). Một hệ thống Mcr được mã hóa bởi hai gen, McrB và McrC,từ bên trong hệ gen E. coli, gần vị trí của hệ thống giới hạn – sửa đổi của chủng EcoKI(hình 2.3). Các protein được mã hóa bởi các gen này nhận ra trình tự DNA 5’-R-MC-N40-80-R-MC-3’, trong đó R là A hoặc G, N là bất kỳ nucleotide nào và mC được methylhóa bởi cytosine. Sự phân cắt xảy ra ở nhiều vị trí trên cả hai mạch giữa các cytosine đãmethyl hóa, và cần có GTP để dịch chuyển DNA giữa hai vị trí liên kết 5’-RmC-3’(Panne, Raleigh và Bickle, 1999, Stewart và cộng sự, 2000;. Panne và cộng sự, 2001).

Sự methyl hóa Dam và Dcm –có thể phụ thuộc vào ảnh hưởng sự phân cắt củacác enzyme giới hạn endonuclease với vị trí nhận biết trùng nhau một phần hoặc hoàntoàn như các vị trí methyl hóa. Ví dụ, MboI (nhận dạng chuỗi 5’-GATC-3’) không cắtDNA bị methyl hóa bởi enzyme methylase Dam, trong khi các isoschizomer Bsp143Icủa enzyme đó nhạy cảm với sự methyl hóa Dam. Tương tự như vậy, chủng EcoRII(5’- CCWGG-3’ – W là A hoặc T) không cắt DNA bị methyl hóa Dcm, trong khi đóisoschizomer MvaI của nó vẫn cắt được.

Tính chất phân cắt chính xác của các enzyme giới hạn loại II làm cho chúng đượcứng dụng nhiều nhất trong kỹ thuật di truyền. Các hệ thống khác cũng quan trọng, tuynhiên chúng được loại khỏi tế bào chủ để chèn các DNA ngoại lai vào nếu DNA bị cắtđúng các vị trí tương ứng.2.1.3 Enzyme cắt giới hạn loại II hoạt động như thế nào

Hình 2.4. cấu trúc của enzyme cắt giới hạn BamHI gắn với DNA.ezyme nhận rasợi DNA đôi của trình tự 5’-GGATCC-3’, và cắt liên kết phosphodiester phần dư làhai G.dẫn đến hình thành hai đoạn DNA có đầu so le 5’- gọi là đầu dính.protein làmột dimer của các tiểu đơn vị giống hệt nhau ( màu xanh lá và lục lam)

Page 54: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

53

Mặc dù có rất ít trình tự tương đồng, nếu có thì ở mức độ amino acid, tất cả cácenzyme cắt giới hạn loại II được nghiên cứu ở mức độ cấu trúc có khả năng xúc tácmạnh ở trung tâm hoạt động gồm 5 sợi β hai bên 2 xoắn (hình 2.4) (Kovall vàMatthews, 1999). Enzyme endonuclease lướt dọc phân tử DNA bằng cách liên kết vớinó theo một kiểu không cụ thể (Pingoud và Jeltsch, 2001). Khi gặp một trình tự nhậndạng cụ thể của nó, enzyme cắt giới hạn sẽ thay đổi hình dạng để hoạt hóa trung tâmhoạt động.enzyme sẽ cắt hai khung đường photphate của chuỗi DNA kép để tạo ra đầuhydroxyl 3’ và đầu photphate 5’ (hình 2.4). vị trí của hai vết cắt liên quan đến nhau ,và sự nhận ra vị tri cắt, được xác định bởi enzyme cắt giới hạn riêng biệt. khi bị cắt,phân tử DNA sẽ bị tách thành nhiều đoạn.không phải tất cả các enzyme cắt giới hạnđều cắt đối xứng và tạo ra đầu bằng như HindII mô tả ở trên.nhiều khung DNA bị táchtại những vị trí không đối diện trực tiếp nhau do đó tạo ra đầu so le tại vị trí 5’ hoặc 3’của phân tử DNA (hình 2.5).

Hình 2.5. DNA được tách bởi enzyme cắt giới hạn loại II. Các enzyme cắt giớihạn khác nhau nhận ra các trình tự DNA khác nhau và có thể tách và cho ra đầu dínhhoặc đầu bằng. vị trí nhận biết của mỗi enzyme được thể hiện cùng với vị trí tách,đánh dấu bằng đường màu xanh. Sau khi tách, các liên kết hydro giữ đầu dính sẽ bịphá vỡ, và hình thành hai đầu DNA mới.

Ví dụ enzyme cắt giới hạn EcoRI.trình tự nhận biết cho enzyme này là 5’-GAATTC-3’. Khi enzyme bắt gặp trình tự này, nó tách mỗi khung giữa G và A gầnnhất (Mertz và Davis, 1972).khi các vết vắt được thực hiện, kết quả là các đoạn cắtliên kết với nhau chỉ bằng liên kết hydro yếu giữ bốn bases bổ sung với nhau.nhữngliên kết yếu này cho phép các đoạn DNA tách ra.kết quả là mỗi đoạn có đầu lồi 5’ củabases đơn. Những enzyme khác, ví dụ PstI, tạo ra các vết cắt trên DNA mà kết quả là

Page 55: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

54

đầu lồi 3’.đầu lồi 5’ và 3’ thỉnh thoảng được gọi là đầu dính bởi vì chúng sẽ liên kếtvới các trình tự bổ sung. Nói cách khác, nếu một đoạn bases đơn (5’-AATT-3’) bắtgặp một đoạn đơn khác với trình tự (3’-TTAA-5’),. Chúng sẽ liên kết với nhau- chúngdính với nhau.mặc dù đầu dính của đoạn DNA có thể liên kết với các cặp base bổ sungkhác,chúng sẽ không hình thành khung đường phosphate DNA liên tục. có thể cónhững điểm đứt trong khung DNA của cặp đầu dính, tuy nhiên sử dụng enzyme ligaseđể sửa chửa. nguồn gốc tế bào, hoặc thậm chí nguồn gốc các loài của đầu dính khôngảnh hưởng đến khả năng dính kết của chúng. Những cặp của các trình tự bổ sung sẽ cókhuynh hướng liên kết, thậm chí những trình tự của DNA người và DNA vi khuẩn.

Vị trí nhận biết của các enzyme cắt giới hạn xảy ra với một trình tự DNA cụ thểnhư thế nào? hầu hết các enzyme cắt giới hạn được biết cho đến nay nhận biết trình tựDNA dài sáu cặp base. Một số enzyme cắt giới hạn khác nhận biết trình tự DNA dàihơn (bảy hoặc tám cặp base) hoặc ngắn hơn ( bốn hoặc năm cặp base). Chiều dài củavị trí nhận biết đóng vai trò trong việc quyết định tần số sự phân cắt DNA của mộtphân tử DNA cụ thể. Chúng tôi mong rằng bất kì enzyme cắt giới hạn nào nhận biếttrình tự 4bp mục tiêu sẽ cắt 44 (256) bp ở một trình tự DNA ngẫu nhiên, giả sử cácbases xảy ra thường như nhau. Bất kì 6 bp mục tiêu mong đợi sẽ xảy ra 46(4096) bp,và 8 bp mục tiêu 48 (65 536) bp. Vì vậy, xử lý bộ DNA với EcoRI nên cho kết quả làhình thành một chuỗi các đoạn DNA có kích cỡ xấp xỉ khoảng 4 kb. Các tần số thực tếvà tách DNA bởi bất kì enzyme cắt giới hạn cụ thể rõ ràng phụ thuộc vào tần số màcác bases tạo ra vị trí nhận biết trong DNA đó như chúng ta thấy ở chương 1, Chargaffchú ý rằng số lượng G + C dư ở các sinh vật khác nhau thì khác số lượng A + T. nhưvậy sự khác nhau thường thể hiện qua GC của hệ gen-đại diện phần trăm nucleotidestrong hệ gen là G hoặc C.vị trí tách của enzyme giới hạn chứa sự cân xứng cao G và Csẽ cắt DNA ít liên quan nếu lượn GC của hệ gen thấp. ngoài ra, bộ gen của sinh vậtnhân chuẩn cao hơn có khuynh hướng chứa ít cặp dinucleotide 5’-CG-3’ hơn được dựđoán tốt hơn(Bird, 1980). Do đó, enzyme cắt giới hạn tách các trình tự nhận biết dạngnày sẽ cắt DNA từ các sinh vật nhân chuẩn với tần số thấp hơn dự đoán.2.2.Nối các phân tử DNA

Việc phát hiện ra các enzyme cắt giới hạn có nghĩa là việc tách các phân tử DNAở những vị trí đặc hiệu dọc theo chiều dài của họ bây giờ đã có thể thực hiện được.Vấn đề tiếp theo phải đối mặt với một kỹ sư di truyền là nối hai phân tử DNA vớinhau. Các giải pháp cho vấn đề của nối DNA được thực hiện cuối những năm 1960.Một số phòng thí nghiệm cùng lúc phát hiện ra DNA ligase, một enzyme có chất xúctác hình thành một kết phosphodiester giữa hai chuỗi DNA (Weiss và Richardson,1967;. Zimmerman và cộng sự, 1967). Enzyme DNA ligase cần một nhóm hydroxyl tựdo ở đầu 3’ của một chuỗi DNA và một nhóm phosphate ở đầu 5’ của một chuỗi khác.Việc hình thành một kết phosphodiester giữa các nhóm này đòi hỏi năng lượng. TrongE. coli và các vi khuẩn khác NAD + phục vụ vai trò này, trong khi ở các tế bào độngvật và vi khuẩn ATP thúc đẩy phản ứng. DNA ligases chỉ có thể nối các phân tử DNAlà một phần của một chuỗi xoắn kép - chúng không thể nối hai phân tử của chuỗi DNAđơn. Như chúng ta đã thấy ở chương 1, vai trò của ligases DNA là nối các điểm đứt

Page 56: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

55

trong khung của DNA sợi kép sau khi nhân lên. Quá trình nối này là cần thiết cho sựtổng hợp bình thường của DNA và sửa chữa ADN bị hư hại, và đã được khai thác bởicác kỹ sư di truyền để nối các chuỗi ADN để tạo thành phân tử DNA tái tổ hợp.

Hình 2.6. cơ chế nối DNA bằng ligase. Hình này được chuyển thể từ Doherty (1996)Cơ chế tác động của ligases DNA đã được nghiên cứu cụ thể (Timson, Singleton

và Wigley, 2000). ATP, hay NAD +, phản ứng với các enzyme ligase để tạo thành mộtphức hợp cộng hóa trị enzym-AMP trong đó AMP được liên kết với một nhóm ε-amino của một phần của lysine tại vị trí hoạt động của enzym trong việc hình thành liênkết phosphoamide (hình 2.6). Các nửa AMP hoạt hóa các nhóm phosphate ở đầu 5’ củaDNA để được tham gia. Bước cuối cùng là phản ứng ái lực hạt nhân của nhóm 3’hydroxyl trên phân tử phosphor đã hoạt hóa. Một liên kết phosphodiester được hìnhthành và AMP được phóng thích. Chuỗi các phản ứng này được điều khiển bởi sự thủyphân của pyrophosphate đã được phóng thích trong sự hình thành các phức hợp enzyme-adenylate. Như vậy, các liên kết có năng lượng lớn phosphate được sử dụng trong việchình thành một liên kếtphosphodiester trong khung DNA nếu ATP là nguồn năng lượng.

Nhiệt độ tối ưu cho các thắt của DNA mẻ là 37 ◦ C, nhưng nhiệt độ này các liên

Page 57: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

56

kết hydro giữa hai đầu so le của các DNA được cắt bởi enzyme cắt giới hạn phân cắtlà không ổn định. Ví dụ, EcoRI tạo ra các đầu ADN liên kết thông qua chỉ có bốn cặpbaso AT, và chúng không đủ để chống lại sự phá vỡ nhiệt ở nhiệt độ cao như vậy.Nhiệt độ tối ưu cho việc nối các đầu dính của enzyme giới hạn tạo ra các đoạn DNA làdo một sự điều hòa giữa tốc độ của hoạt động enzyme và sự liên kết giữa các đoạnADN. Nhiệt độ tối ưu cho các phản ứng như vậy đã được tìm ra là trong khoảng 4-20C(Sgaramella và Ehrlich, 1978). Các DNA ligase từ vi khuẩn E. coli sẽ chỉ nối các đoạnADN có đầu bằng nếu chúng đang ở một nồng độ rất cao. Nồng độ cao được cho làtăng cường liên kết của các đoạn DNA để các phản ứng nối có thể xảy ra. Các enzymeligase từ vi khuẩn T4 sẽ nối các đoạn ADN có đầu bằng, mặc dù với hiệu suất thấphơn so với hiệu quả nối các đầu so le của các đoạn DNA (Ferretti và Sgaramella,1981). Một sự sắp xếp phối hợp chung cho cắt và nối lại của các phân tử DNA đượcthể hiện trong hình 2.7.2.3 Cơ sở của tạo dòng

Khả năng phá vỡ và phục hồi phân tử DNA sẽ dẫn đến những thí nghiệm đầu tiêntrong việc tạo dòng năm 1972 (Jackson, Symons và Berg, 1972).

Có thể tách DNA từ một nguồn và chèn hoặc nhân bản vô tính nó vào một DNAkhác. Có lẽ loại phổ biến nhất của thí nghiệm nhân bản vô tính là chèn một mảnhDNA ngoại lai vào một vector phù hợp để DNA ngoại lai có thể nhân bản trong E.coli.trong chương 3 sẽ thảo luận một số loại vector khác nhau có sẵn,nhưng ở giai đoạnnày có thể xem vector như một phân tử plasmid DNA sợi đôi.nếu ta muốn chèn cácchuỗi DNA lạ vào vector này ta cần cắt nó để tạo DNA thẳng để có thể gắn chuỗiDNA khác bằng cách sử dụng ligase.

Chúng ta hãy xem xét việc chèn DNA vào vector sử dụng hai enzyme cắt giớihạn khác nhau (hình 2.7).sử lý hai vector và chèn các trình tự DNA bằng enzyme cắtgiới hạn sẽ tạo ra các đoạn DNA. Trong vector vị trí nhận biết enzyme cắt giới hạnnằm gần nhau. Chúng ta sẽ thấy trong chương 3, việc này phổ biến trong thiết kếplasmid. Cắt một vector với BamHI và EcoRI sẽ thu hai đoạn-một lớn bao gồm phầnlớn vector, một nhỏ, đại diện DNA giữa vị trí nhận biết của enzyme cắt giới hạn. vớisự có mặt của DNA ligase, các đoạn này không thể tự nối lại bởi vì các đầu DNAkhông tương thích với nhau. Sự tiêu hủy trình tự DNA chèn thẳng với BamHI vàEcoRI kết quả là tách thành ba đoạn DNA. Chỉ có một đoạn trong đó chứa một đầuBamHI và EcvoRI tương thích; những đoạn khác chứa ở cuối đoạn. trộn vector DNAvà chèn DNA tương thích với nhau kết quả là hình thành hai phân tử DNA. Nếu cácđầu không tương thích, sẽ không hình thành liên kết hydro.việc bổ sung DNA ligase đểhình thành liên kết hydro trung gian kết quả là hàn kín khung DNA và hình thành mộtvector chèn chứa phân tử DNA ngoại lai. Nếu một cái khác chèn những đoạn DNA hìnhthành liên kết hydro đến vector, qua đầu tương thích BamHI, tiếp theo việc nối lại kếtquả sẽ không hình thành một vector vòng tròn khép kín. Chúng ta sẽ tìm hiểu ở phầntiếp theo, các phân tử DNA không được nhân bản khi được chuyển vào vi khuẩn.

Page 58: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

57

Hình 2.7. cắt và nối DNA sử dụng enzyme cắt giới hạn và DNA ligase. DNA thẳng(chèn) và một vòng tròn khép kín plasmid DNA (vector) mỗi cái chứa một vị trí nhậnbiết cho BamHI và EcoRI.trộn các đoạn DNA với các đầu tương ứng với nhau với sự cómặt của DNA ligase sẽ hình thành một vector chèn chứa các phân tử DNA lai.

Nhân bản vô tính loại này được nghiên cứu bởi vì vetor DNA được cắt vớienzyme cắt giới hạn chứa các đầu DNA không bổ sung. Nếu vector bị cắt sử dụng mộtenzyme cắt giới hạn hoặc hai enzyme cắt giới hạn mà cho ra hai đầu dính, vector đó cóthể nối lại dễ dàng với enzyme ligase. Sử lí vector với enzyme phosphatase sau khi cắtbằng các enzyme cắt giới hạn. Tuy nhiên có thể ngăn cản điều này. Phosphatase xúctác loại bỏ nhóm phosphate 5’ từ nucleid acid và nucleid triphosphate. Bởi vìphosphatase xử lí các đoạn DNA thiếu đầu phosphate 5’ ma DNA ligase yêu cầu, việcxử lí sẽ ức chế vector tự nối và sẽ thúc đẩy hình thành vector chèn DNA lai, chươngtrình nhân bản vô tính được thể hiện sơ lược trong hình 2.8.

Page 59: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

58

Hình 2.8. cơ sở của nhân bản vô tính thành một plasmid chứa duy nhất một vị trínhận biết enzyme cắt giới hạn. vector chứa một vị trí nhận biết EcoRI, trong khi vectorchèn có hai. Cắt cả hai với enzyme tách thành các đoạn như trên.thêm ligase vào cắtvector có thể sẽ hình thành lại nó.điều này có thể sẽ bị ngăn cản bằng cách xử lívector cắt với phophatase để loại đầu phosphate 5’ của DNA. Việc cắt chèn có thểcung cấp thiếu phosphate mà DNA ligase yêu cầu, vì thế trộn vector và chèn sẽ dẫnđến kết quả hình thành các phân tử DNA lai.

Page 60: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

59

Hình 2.9. Nối vector DNA đã được xử lí với phosphatase để chèn tương ứng.vector được cắt bằng enzyme cắt giới hạn EcoRI và xử lí với photphatase để loạiphosphate từ đầu tự do 5’của DNA cắt.nối một đoạn chèn tương ứng vào vector nàykết quả là chỉ nối đầu 5’ của đoạn chèn với vector. Đầu 3’ của đoạn chèn (một nhómhydroxyl) và đầu 5’ của vector (cũng là nhóm hydroxyl) sẽ không thể nối lại. chuyểnvector chèn lai vào vi khuẩn , tuy nhiên kết quả sẽ sữa chữa các sợi DNA bị phá vỡ đểhình thành vector hoàn chỉnh cộng với plasmid chèn.

Khi vector được xử lí với phosphatase, DNA ligase sẽ có thể đánh dấu các điểmđứt trong khung phosphodiester chỉ trên một sợi DNA (hình 2.9).tuy nhiên, khi cácphân tử này được chuyển vào vi khuẩn, sợi DNA hư hỏng khác được sửa chửa sử dụnghệ thống sửa chữa DNA của vi khuẩn.

Trong quá trình nhân bản vô tính đoạn DNA có nhiều lí do khi vị trí nhận biếtcủa enzyme cắt giới hạn không có hoặc không xảy ra đúng nơi trong đoạn bạn đangnhân bản. vấn đề này có thể được khắc phục bằng nhiều cách

Page 61: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

60

Nhân bản vô tính vào vị trí cắt giới hạn đầu bằng. nếu enzyme cắt giới hạntrong vector để lại đầu bằng ( như EcoRV ở hình 2.5) và rồi bất kì đầu bằng nào củacác đoạn DNA khác đều có thể được nối vào vector cắt. một số enzyme cắt giới hạnlàm tăng đầu bằng sau khi cắt DNA. Các vị trí khác có thể được làm bằng bằng cáchtách khỏi các đầu so le với nuclease hoặc lắp vào các đầu so le sử dụng DNApolymerase. Chẳng hạn phản ứng lắp vào thường được thực hiện với đoạn Klenow củaDNA polymerase I với sự hiện diện của deoxynucleotides thích hợp. ví dụ: việc lắpcác đầu DNA bị cắt bởi EcoRI (hình 2.5) yêu cầu cả dATP và dTTP,và lắp vào cácđầu bị cắt bởi BamHI yêu cầu cả bốn loại deoxynucleotide triphosphates. Hạn chế lớncủa nhân bản vô tính đầu bằng là DNA ligase hoạt động không hiệu quả

Sử dụng cầu nối oligonucleotide. Nếu muốn nối các đoạn DNA với nhau, có thểtổng hợp một lượng nhỏ phân tử DNA để liên kết hai đầu với nhau. DNA ligase có thểsẽ nối hai đầu dính không tương thích bằng cách liên kết như một cầu nối giữa hai đầu

Sợi liên kết đơn:

Đột biến để tạo ra các vị trí cắt giới hạn mới. Trình tự của DNA có thể bị thayđổi để tạo ra hoặc phá hủy các vị trí cắt giới hạn. Chúng ta sẽ thảo luận thêm trongChương 7.

Bây giờ đã có thể tạo các phân tử DNA lai, vấn đề tiếp theo là cố gắng đưanhững phân tử ADN lai vào tế bào sống để DNA có thể được nhân rộng và các gen màchúng mã hóa có thể được thể hiện.2.4. Sự chuyển gen ở vi khuẩn

Trước năm 1970, có rất nhiều cố gắng để chuyển DNA ngoại lai vào các tế bàoE.coli. Nhìn chung là chỉ có những tiến triển nhỏ. Quay lại với các thí nghiệm củaGriffith và Avery, MacLeod và McCarty (Chương 1), chúng ta đã biết việc chuyển genmột số vi khuẩn có thể xảy ra với các DNA trần, nhưng nó rất hiếm xảy ra. Ngoài ra,

Page 62: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

61

như chúng ta đã thấy, các thể thực khuẩn có thể tiêm nhiễm hiệu quả một vào dòngE.Coli, nhưng nếu các thí nghiệm đó được thực hiện trên DNA trần, hiệu quả của việcbiến đổi là rất thấp. Đây là một vài lí do.

(a) Đưa DNA trần vào trong các tế bào là một vấn đề ít quan trọng. DNA mangđiện tích cao và sẽ không dễ để vượt qua màng bao quanh vi khuẩn. Tuy nhiên, trongnhững năm 1970, các phương pháp được đưa ra để làm cho các tế bào E. coli có khảnăng tiếp nhận các DNA trần - phương pháp như vậy sẽ được thảo luận dưới đây.

(b) Số phận của DNA ngoại lai một khi nó đi vào tế bào ? Các DNA ngoại laikhông thay đổi và được nhân lên cùng với vi khuẩn, nó phải được kết hợp vào trongchromosome của vi khuẩn, và sau đó nó sẽ được nhân lên như một phần của genomevi khuẩn, hoặc là được sao chép độc lập. Cơ chế chính xác mà nhờ đó sự hòa nhập xảyra là không trọn vẹn và nó thường là một trường hợp hiếm. Nếu DNA ngoại lai khôngđược đưa vào, thì chắc chắn nó sẽ không còn tồn tại trong suốt quá trình lớn lên củacác tế bào vi khuẩn. Lí do cho việc này rất dễ hiểu, để có sự nhân lên của phân tửDNA cần phải có một điểm bắt đầu của sự sao chép. Các đoạn DNA thiếu điểm bắtđầu của sự sao chép-ngay cả khi chúng tồn tại trong các hệ thống tâm giới hạn – sẽ bịgiảm xuống trong các tế bào chủ sau khi các tế bào phân chia và cuối cùng là sẽ khôngcòn nữa. Ngay cả khi các DNA ngoại lai có điểm khởi đầu sao chép, nó có thể khôngcó chức năng trong các tế bào vi khuẩn mà DNA được chuyển vào. Nếu các đoạnDNA không có khả năng sao chép độc lập, giải pháp là gắn chúng vào đơn vị sao chépthích hợp. Các đơn vị sao chép này các vector hoặc các cloning vehicle. Các plasmidnhỏ và các thể thực khuẩn là các vector thích hợp nhất vì chúng là các đơn vị sao chépthích hợp của riêng chúng, để duy trì không nhất thiết chúng phải hợp lại với genomecủa tế bào chủ và DNA của chúng có thể dễ dàng được phân lập nguyên vẹn. Cácplasmid và các thể thực khuẩn khác đã được sử dụng như các vector và được mô tả chitiết ở chương 3.

(c) Sự kiểm tra định lượng (sự kiểm tra) quá trình chuyển gen. Giả sử rằng bạncó thể đưa DNA ngoại lai vào tế bào vi khuẩn và nó duy trì ổn định, làm sao bạn cóthể nhận biết được các tế bào được biến đổi với các tế bào không được biến đổi? DùDNA ngoại lai mã hóa 1 gen sản phẩm, các khác biệt giữa sự biểu hiện gen của tế bàonhân sơ và nhân chuẩn (Chương 1) có nghĩa là nó không chắc rằng các gen ngoại lai sẽđược sao chép và nhân lên trong các tế bào được chuyển gen. Giải pháp cho vấn đềnày là chèn các DNA ngoại lai vào các cloning vector có các marker có thể chọn sẽđược thể hiện trong các tế bào nó chuyển vào. Các marker này, thường có các genkháng kháng sinh, sẽ được trình bày cụ thể hơn trong chương 3.

Trong năm 1970, người ta đã tìm ra cách xử lí các tế bào E.coli với canxi clo(CaCl2) cho phép chúng tiếp nhận các thể thực khuẩn DNA trần (Mandel và Higa,1970). Xứ lí chuyển gen bằng phương pháp hóa học cho phép các plasmid đi vào trongcác tế bào vi khuẩn, ở các mức độ hiệu quả khác nhau. Hiệu quả chuyển gen tăng đượcquan sát thông qua việc sử dụng điện áp cao trong một quá trình được gọi là điện biếnnạp, và sử dụng súng bắn gen. Các quá trình chuyển gen giúp đưa phân tử DNA vào tếbào chủ. Tất cả thường được sử dụng các plasmid và các vectơ thể thực khuẩn được

Page 63: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

62

dùng để sao chép các đoạn DNA ngoại lai cho phép chèn của một phân tử vector đơnvào các tế bào chủ. Các phân tử đơn được khuếch đại nhiều lần bên trong tế bào chủ,nhưng tất cả các phân tử tạo thành đều giống hệt nhau. Một hệ quả của việc này là nếumật độ pha trộn của các đoạn DNA được gắn với một vector thông thường và đượcchuyển vào E. coli, sau đó mỗi cụm vi khuẩn tạo thành sẽ bao gồm một, và chỉ một,loại phân tử DNA tái tổ hợp. Mật độ pha trôn của các đoạn DNA được tách biệt thànhcác thành phần riêng lẻ của nó trong quá trình chuyển đổi và tăng trưởng tế bào. Điềunày đặc biệt quan trọng trong việc tách của loài DNA tái tổ hợp từ các thư viện DNAphức tạp (Chương 5).2.4.1.Sự chuyển gen bằng phương pháp hóa học

Sự chuyển gen bằng phương pháp hóa học trong các tế bào E.coli là một quytrình đơn giản. Về cơ bản, các tế bào gia tăng kích thước(số lượng) đến phase mid-log,bị ảnh hưởng bởi sự li tâm và lơ lửng trong dung dịch calcium chloride. DNA ngoạilai- thường chứa trong 1 plasmid-và các tế bào thích hợp sau đó được ủ trong đá rồisau đó chịu sốc nhiệt ngắn ở 37-45ºC. Sau đó đưa chúng vào môi trường dinh dưỡngvà nuôi trong một thế hệ để chúng thể hiện các đặc tính kiểu hình của plasmid. Cuốicùng, các tế bào được đưa vào môi trường chọn lọc nên chỉ có những tế bào có DNAngoại lai mới tiếp tục phát triển. Vai trò của calcium chloride là không rõ ràng. Nóđược cho là ảnh hưởng đến vách tế bào vi khuẩn, và cũng có thể chịu trách nhiệm vềDNA liên kết với các bề mặt tế bào. Sự hấp thụ DNA trên thực tế được cho là đượckích thích bởi các cú sốc nhiệt ngắn (hình 2.10).

Hình 2.10. Ba cách chuyển gen vào tế bào. a)Sự biến đổi hóa học. Xử lí các tếbào với các ion canxi có thể làm cho các tế bào có khả năng tiếp nhận DNA. DNA cóthể bám vào bề mặt tế bào và sự hấp thụ được tạo ra bằng cách sốc nhiệt. b)Điện biếnnạp. Các tế bào được xử lí với xung điện, từ đó hình thành nên các lỗ . DNA có thểvào tế bào trước khi các lỗ tự động đóng lại. c)Súng bắn gen. Các phân tử DNA baobọc quanh một hạt được bắn vào các tế bào và có thể đi vào tế bào chất. Ở đây, cáchạt và DNA tách nhau ra.

Page 64: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

63

Từ đó sự chuyển gen ở E.coli là một bước cần thiết trong các thí nghiệm nhân bản,các quá trình nên được tối ưu nhất có thể. Hiệu quả của quá trình biến được quy định bởimột số vật chủ đặc hiệu và các yếu tố khác, nhưng các quá trình phân tử bằng sự biếnđổi xảy ra không được hiểu rõ, các điều kiện bằng hiệu quả quá trình biến đổi có thể xảyra có thể xác định bằng thực nghiệm. Các hiệu quả biến đổi thường tăng nếu:

Các tế bào được biến đổi được lấy từ các dòng thiếu hệ thống giới hạn để giảmkhả năng phân mảnh của DNA ngoại lai,

Các exonuclease cố định (ví dụ recBC) bị đột biến trong tế bào chủ E. coli vàCác tế bào E.coli thích hợp được xử lí không chỉ với các ion calcium, nhưng

cũng với một các cation khác ho a trị hai khác nhau (ví dụ như rubidi và mangan)(Hanahan, 1983).

Các biện pháp chuyển gen hóa học có thể dùng được cho hầu hết các dòng E.coliK12, với các hiệu quả chuyển gen đặc trưng của 107-109 tế bào mang DNA ngoại laiđược biểu hiện trên một microgram cua DNA được đưa vào có được, tùy thuộc vàochủng E. coli cụ thể được sử dụng (Liu và Rashidbaigi, 1990).2.4.2.Điện biến nạp

Điện biến nạp sử dụng xung điện trường để tạo ra các lỗ cực nhỏ trên màng sinhhọc. Các lỗ này, được gọi là các “lỗ điện”, cho phép các phân tử, các ion và nước từbên ngoài màng đi vào bên trong. Nếu một xung điện trường phù hợp được sử dụng,sau đó các tế bào được điện biến nạp có thể khôi phục lại, với các lỗ điện tự động đónglại, và tế bào có thể tiếp tục phát triển. Sự hình thánh các lỗ rất nhanh (khoảng 1 µs),trong khi các lỗ đóng lại chậm hơn, và được đo theo thứ tự các phút. Sử dụng điệnbiến nạp để chuyển gen ở vi khuẩn và các tế bào ở mức độ cao hơn trở nên rất phổbiến suốt những năm 80. Cơ chế mà điện biến nạp xảy ra thì vẫn chưa được tìm hiểukỹ và do đó, như sự chuyển gen bằng phương pháp hóa học, sự phát triển của các đềcương cho các ứng dụng cụ thể thường có được bằng thực nghiệm thông qua việc điềuchỉnh điều chỉnh các thông số xung điện (biên độ, thời gian xung, số và thời gian giữamỗi xung).

Hai yếu tố chính ảnh hưởng đén sự hình thành các lỗ điện – các dạng tế bào đượcdùng, biên độ thời gian của xung điện được áp dụng. Một vài dạng tế bào phản ứng tốtvới các xử lí này trong khi các dạng khác kháng lại – nói chung, hầu hết các tế bào chỉcó thể tiếp nhận DNA khi mà chúng được điện biến nạp với các mức ảnh hưởng khácnhau. Biên độ và mức độ kéo dài của xung rất quan trọng nếu các lỗ điện sẽ được tạora trong một tế bào đặc biệt. Kết quả của các biên độ xung và thời gian phải được trênmột ngưỡng giới hạn thấp hơn trước khi lỗ chân lông sẽ hình thành, sau đó số lượngcác lỗ và đường kính các lỗ tăng với kết quả của biên độ và thời gian. Một ngưỡnggiới hạn trên cuối cùng được đạt tới, ở các biên độ cao và các thời gian, khi đườngkính lỗ và tổng diện tích lỗ quá lớn cho các tế bào để sửa chữa. Kết quả là sự hư hạikhông thay đổi được trên các tế bào. Trong xung điện biến nạp, điện trường gây radòng điện chạy qua các tế bào đó sẽ được chuyển gen. Các đệm và môi trường các loàivi khuẩn phát triển chứa các dạng ion (ví dụ như Na +) ở nồng độ đủ cao để gây ra

Page 65: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

64

dòng điện cao chạy. Những dòng điện có thể dẫn đến làm nóng kịch tính của các tếbào có thể dẫn đến cái chết của tế bào. Do đó các hiệu ứng nhiệt được giảm thiểu bằngcách sử dụng một biên độ tương đối cao khoảng thời gian ngắn xung hoặc bằng cáchsử dụng hai khoảng thời gian rất ngắn các xung (Sukharev và cộng sự, 1992.). Ngoàira, các tế bào được điện biến nạp được rửa trong nước cất để loại bỏ bất kỳ dấu vếtcủa muối mà có thể tạo ra các "tia lửa" khi sử dụng các xung điện trên chúng.2.4.3. Súng bắn gen

Súng bắn gen là kĩ thuật đưa DNA vào các tế bào đích. Các DNA được chuyênvào trong các tế bào được bao bọc lên trên các vi đạn làm bằng vàng hoặc tungsten.Các vi đạn này sau đó được gắn lên đầu của một viên đạn bằng nhựa và nạp vào trongổ đạn của sung bắn gen. Một lực nổ đẩy viên đạn ra khỏi nòng súng hướng về phía cáctế bào đích nằm ở bên kìa đầu nòng súng. Khi viên đạn tới đầu của nòng sung, nó đượcgiữ lại và dừng lại, nhưng các vi đạn được bao bọc quanh bởi các DNA tiếp tục hướngvề các tế bào chủ. Một vài vi đạn vượt qua được vách tế bào và đi vào trong tế bàochất của tế bào chủ. Ở đây, các vi đạn và các DNA tách nhau ra và các DNA đượcchuyển vào tế bào. Các súng bắn gen đặc biệt hữu ích cho chuyển chuyển DNA vàocác tế bào mà khó có thể chuyển bằng các phương pháp khác, ví dụ như tế bào thựcvật. Nó cũng được sử dụng như một cách để chuyển các DNA cấu trúc vào toàn bộDNA động vật. Ví dụ, một vacxin được phát triển chống lại căn bệnh lở mồm longmóng, một virus độc lực cao nhiễm vào động vật nuôi. Vacxin này bao gồm một sốgen của virus mà khi khi được thể hiện ở lợn sẽ cung cấp cho động vật đề kháng với sựgây nhiễm của vrus tự nhiên (Benvenisti và cộng sự, 2001).2.5. Điện di gel

Tiến triển của những thí nghiệm đầu tiên về cắt và nối các phân tử DNA đượctheo dõi qua tốc độ lắng đọng trong gradient sucrose. Dạng kỹ thuật này, dựa vào sựphân tách dựa trên kích thước sau khi ly tâm thông qua một ống có chứa hàm lượng caosucrose, yêu cầu tương đối số lượng lớn DNA, và không có khả năng phân biệt các thayđổi nhỏ trong kích thước của một phân tử DNA. Kỹ thuật tách cần vật liệu ít hơn và yêucầu có một mức độ phân tách cao hơn để theo dõi hiệu quả các thí nghiệm kỹ thuật ditruyền. Như chúng ta đã thấy, DNA là một phân tử có điện tích cao. Các phosphat hìnhthành nên liên kết đường-phosphate của mỗi chuỗi DNA tạo nên một điện tích âm lớncủa phân tử DNA. Một đoạn DNA nhỏ sẽ có điện tích âm ít hơn một đoạn DNA lớn vìnó chứa ít gốc phosphate hơn. Điện tích tổng trên một đơn vị chiều dài của cả một nhỏvà các phân tử DNA một lớn, tuy nhiên, giống hệt nhau. Vì vậy, nếu một dòng điệnđược gây ra cho một mẫu của các đoạn DNA nhỏ và lớn trong môi trường trung tính, cảhai di chuyển đến các điện cực dương (anode) ở cùng tốc độ, giả sử rằng ma sát làkhông đáng kể trong môi trường trung tính. Vì vậy, một cơ chế mà theo đó các phân tửDNA có thể được tách ra bằng cách tăng độ ma sát sao nên các phân tử DNA nhỏ sẽ dichuyển đến cực dương nhanh hơn nhờ có ma sát thấp hơn so với các phân tử DNA lớnhơn. Chạy đoạn ADN thông qua một chất gel có thể tạo ma sát cần thiết để tách cácđoạn ADN dựa vào sự khác nhau khác về kích thước của chúng.

Page 66: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

65

2.5.1. Gel polyacylamideĐiện di sử dụng gel polyacylamide (PAGE) được giới thiệu vào năm 1959 như

một cách để tách các protein. (Raymond và Weintraub, 1959). Kỹ thuật này đồng thờicũng có thể sử dụng để tách các acid nucleic. Kích thước các lỗ được tạo nên bởi loạigel này có thể khác nhau, bằng cách thay đổi tỉ lệ polyacrylamide sử dụng để tạo gel (từ3 đễn 30 phần trăm), để tách các phân tử có kích thước khác nhau. PAGE là một kỹthuật rất hữu ích trong việc phân tích các phân tử DNA, và có thể rất có hiệu quả táchcác phân tử DNA khác nhau về kích thước của ít nhất là một cặp base. Mức độ phân giảicao làm PAGe lí tưởng cho phân tích các chuỗi DNA. Giời hạn của kỹ thuật này là dùngcho các phân tử DNA tương đối nhỏ (có chiều dài nhỏ hơn 1000 cặp base). Các phân tửDNA lớn không thể đi vào các lỗ của polyacrylamide và vì vậy không thể được phântách bằng loại gel này. Từ khi hầu hết các vector thường được sử dụng cho chuyển gencó thể được phân tích bằng PAGE lớn hơn, cần thiết phải có một kỹ thuật thay thế.

2.5.2. Gel agaroseAgarose là dung dịch keo tự nhiên được chiết xuất từ rong biển. Nó là một

polysaccharite mạch thẳng được tạo nên từ các đơn vị agarobiose lặp lại. Nó bao gồmcác đơn vị galactose và 3,6-anhydrogalactose xen kẽ. Gel agarose được tạo thành bằngcách khuấy agarose khô, trong khoảng nồng độ giữa 1 và 3 phần trăm, trong đệm cónước, sau đó đun sôi hỗn hợp đến khi môi trường có dạng trong suốt. Nó được rót vàomột khung gel phù hợp bao gồm 1 lược để tạo các giếng, có thể để ở nhiệt độ phòng đểlàm gel cứng lại (Hình 2.11). Sau khi gel được sếp đặt, lược được tháo ra và các mẫuDNA được đưa vào trong giếng. Gel sau đó được đưa vào một điện trường không đổi(trong phạm vi 10V/cm gel) và DNA sẽ di chuyển tới cực dương (anode).

Độ phân tách của gel agarose thấp hownn so với PAGE. Các dãi được tạo thànhtrên gel agarose tương đối mờ bởi vì kích thước các lỗ không thể được điều chỉnhchính xác. Một phần trăm agarose gel bao gồm nhiều kích thước lỗ khác nhau, trongkhi 2 phần trăm gel trung bình bao gồm các lỗ nhỏ hơn nhưng chúng vẫn có thể thayđổi rộng. Trước kia, các đoạn DNA được phân tách thông qua gel agarose, chúng phảiđược nhuộm để DNA có thể được hiển thị. Cách nhuộm thông thường nhất bao gồmgel ướt trong môi trường có ethidium bromide. Ethidium bromide là một phân tử cócấu trúc phức tạp có thể xen vào giữa các kiên kết giữa các cặp base của DNA (Hình2.12). Sự gắn của ethidium bromide vào DNA dẫn đến những biến dạng trong cấu trúcxoắn kép. Ethidium bromide sẽ kết hợp rất tốt với chuỗi kép DNA, nhưng kém hơn đốivới sợi DNA đơn và RNA vì sự thiếu đối xứng của sự sắp xếp các baso. Ngâm DNAtrong gel với ethidium bromide sẽ tạo sự tập trung hóa học quanh DNA. Chiếu sángbản gel dưới tia tử ngoại (260-300nm) kết quả của fluorescence của ethidium bromide,và DNA sẽ hiện ra trên gel dưới dạng một dải của fluorescence.

Như chúng ta đã biết, điện tích trên mỗi đơn vị chiều dài của DNA là không đổi,và trên gel bạn mong chờ ma sát tăng tỷ lệ thuận với chiều dài của DNA - một đoạn2000 bp nên kinh nghiệm hai lần thì ma sát nhiều như một đoạn 1000 bp . Vì vậy đâynên là một hướng dẫn và mối liên hệ ngược giữa khối lượng của ADN và tốc độ dichuyển của nó thông qua gel.

Page 67: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

66

Hình 2.11. Điện di gel agarose. Agarose nấu chảy được rót vào trong khuôn baogồm một lược. sau khi gel đã được xếp đặt lược đươc tháo rời để tạo giếng để DNAmẫu có thể được đưa vào. Một dòng điện được đưa vào để di chuyển DNA mang điệntích âm thông qua gel hướng về cực dương. Các phân tử DNA nhỏ hơn thường dichuyển trong gel với tốc độ nhanh hơn các đoạn DNA ngắn.

Hình 2.12. sự kết hợp của Ethidium bromide vào DNA. Ethidium bromide là mộtphân tử có cấu trúc phức tạp, nó có thể xen vào giữa các base của chuỗi kép DNA. Sựkết hợp của ethidium bromide làm biến dạng chuỗi kép và tăng tổng chiều dài củaphân tử DNA.

Sản xuất protein trong y học

66

Hình 2.11. Điện di gel agarose. Agarose nấu chảy được rót vào trong khuôn baogồm một lược. sau khi gel đã được xếp đặt lược đươc tháo rời để tạo giếng để DNAmẫu có thể được đưa vào. Một dòng điện được đưa vào để di chuyển DNA mang điệntích âm thông qua gel hướng về cực dương. Các phân tử DNA nhỏ hơn thường dichuyển trong gel với tốc độ nhanh hơn các đoạn DNA ngắn.

Hình 2.12. sự kết hợp của Ethidium bromide vào DNA. Ethidium bromide là mộtphân tử có cấu trúc phức tạp, nó có thể xen vào giữa các base của chuỗi kép DNA. Sựkết hợp của ethidium bromide làm biến dạng chuỗi kép và tăng tổng chiều dài củaphân tử DNA.

Sản xuất protein trong y học

66

Hình 2.11. Điện di gel agarose. Agarose nấu chảy được rót vào trong khuôn baogồm một lược. sau khi gel đã được xếp đặt lược đươc tháo rời để tạo giếng để DNAmẫu có thể được đưa vào. Một dòng điện được đưa vào để di chuyển DNA mang điệntích âm thông qua gel hướng về cực dương. Các phân tử DNA nhỏ hơn thường dichuyển trong gel với tốc độ nhanh hơn các đoạn DNA ngắn.

Hình 2.12. sự kết hợp của Ethidium bromide vào DNA. Ethidium bromide là mộtphân tử có cấu trúc phức tạp, nó có thể xen vào giữa các base của chuỗi kép DNA. Sựkết hợp của ethidium bromide làm biến dạng chuỗi kép và tăng tổng chiều dài củaphân tử DNA.

Page 68: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

67

Sự phân tách các đoạn DNA trong phân tử DNA tốt nhất có số cặp base nằmtrong khoảng 200-15000bp được hoàn thiện bằng cách sử dụng gel agarose. Hai nhântố chính quyết định đến tốc độ DNA nào sẽ đi qua gel agarose khi đưa dòng điện vào -đó là cấu trúc khối lượng phân tử (độ dài) và hình dạng của nó.Nhìn chung nhữngđoạn DNA nhỏ sẽ đi xuyên qua gel agarose nhanh hơn những đoạn DNA lớn (hình2.13(a)). Tuy nhiên, nếu chúng ta quan sát kỹ cách di chuyển của những đoạn DNAnhỏ trong 1 đoạn DNA đã biết trước chạy xuyên qua chiều dài gel agarose,chúng ta sẽthấy ỏ đó có sự tỉ lệ nghịch trong mối liên hệ giữa kích thước và khoảng cách dichuyển (hình 2.13)

Figure 2.13. Sự di chuyển của những đoạn DNA trên gel agarose.(a)gel agarose chothấy sự phân chia các đoạn DNA đã biết kích thước .(b)Kích thước của những đoạn DNA vàkhoảng cách di chuyển của chúng trên gel.(c)1 biểu đồ thể hiện kích cỡ của các đoạn đốinghịch với khoảng cách di chuyển được lấy từ dữ liệu thể hiện ở bên hình (b).Điều này chỉ rarằng mối liên quan giữa kích thước và khả năng di chuyển không nằm trên đường thẳng.(d) 1biểu đồ logarit cho thấy kích thước các đoạn trái ngược với khoảng cách di chuyển.Điều nàycho thấy tỉ lệ trái ngược nhau,liên quan giữa khoảng cách di chuyển và hàm log của kíchthước các đoạn DNA.

Nếu chúng ta ước tính được khoảng cách di chuyển trên gel agarose của nhũngphân tử DNA đã biết kích thước,qua một biểu đồ dữ liệu thể hiện sự trái ngược giữakích thước những đoạn DNA với khoảng cách di chuyển,chúng ta thấy rằng khoảngcách di chuyển thì tỉ lệ nghịch đối với hàm logarit của kích thước(Figure 2.13(d)). Kết

Page 69: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

68

quả này được kiểm nghiệm 1 cách dễ dàng bằng cách kiểm tra khoảng cách của nhữngđoạn DNA riêng biệt di chuyển từ điểm tối ưu sau hiện tượng chuyển điện.Những đoạnDNA có kích thước từ 500 và 1000 bp được tách ra riêng rẻ trên gel.Còn những đoạncó kích thước từ 8000 đến 10000 bp di chuyển khó khăn trên từng loạigel(hình 2.13(a)).Một kết quả trái ngược của hàm log liên quan đến đoạn DNA nào cókích thước lớn hơn 30 kbp sẽ di chuyển trong khoảng vị trí giống nhau như nhiều đoạnlớn hơn trên gel agarose.Điều này cho thấy những đoạn DNA lớn sẽ không được phântách để phân biệt với 1 DNA có kích thước khác,và vì thế gel agarose không có hiệuquả trong việc phân tách các phân tử DNA lớn.1 đoạn DNA có kích thước 30kbp dichuyển trên gel agarose ỏ những điểm giống nhau như đoạn DNA 60kbp.Tất cả nhữngđoạn DNA có thể đi vào trong các lỗ gel và xuyên qua đường đua trên gel bằng kíchthích điện,nhưng sự phân ly không hoàn thiện.Sự phân ly của các đoạn DNA ở kích cỡnày không thể hoàn thiện khi chạy trên khuôn gel dài hơn hay tập trung agarose tronggel ít hơn.Để hiểu được hiện tượng này ,chúng ta cần biết làm thế nào những đoạnDNA có thể di chuyển xuyên qua những lỗ gel.

DNA là 1 chuỗi polyme dài ,mỏng manh. Để di chuyển xuyên qua nhũng lỗ gel,DNA có khuynh hướng duy trì khả năng chịu đựng ở mức nhỏ nhất và di chuyển từđầu đến cuối xuyên qua các lỗ gel(hình 2.14). Một vài mô hình lý thuyết đã được đưara trước đây để giải thích cho sự di chuyển của ADN xuyên qua gel (Slater, Mayer andDrouin, 1996). Có lẽ cách đơn giản nhất là cho rằng những phân tử DNA có tính linhđộng cao di chuyển qua gel theo hình thức trườn (hoặc bò) xuyên qua các lỗ của bề mặtgel (hình 2.15). Những đoạn DNA nhỏ có thể vượt qua các lỗ gel dễ dàng hơn cácđoạn DNA dài hơn vì hệ quả lỗ sàn trên các lỗ gel. Những phân tử DNA lớn sẽ dichuyển theo cách này,tuy nhiên nó có thể bị vướng vào hay kết chặt lại bên trong gelvà vì vậy sẽ trở nên di chuyển chậm hơn ngoại trừ các cấp độ có kích thước đơn lẻ.Những đoạn DNA có kích thước trên 30000 bp bị kết dính gây ức chế việc bòxuyên qua các lỗ gel. Những đoạn lớn hơn cũng bị tình trạng tương tự,và do đónhững đoạn DNA có kích thước trên 30 kbp di chuyển cùng 1 điểm giống nhau trêngel agarose.

Nhân tố lớn hơn thứ 2 ảnh hưởng đến sự di chuyển qua gel là hình thái và cấutrúc của đoạn DNA riêng biệt. Ví dụ, DNA plasmid được tách ra từ tế bào vi khuẩnE.Coli luôn luôn là những phân tử vòng kín có chứa kháng sinh. Những phân tử nàycó cấu thúc cuộn lại và di chuyển nhanh chóng qua gel agarose(Figure 2.16). Nếu 1phần của cấu trúc xoắn đôi của plasmid bị hư hỏng (bị sướt) sau đó các tầng bên trongplasmid sẽ mất và cấu trúc mở hơn của plasmid hư hỏng sẽ di chuyển chậm hơn xuyênqua gel agarose.

Page 70: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

69

Figure 2.14. DNA di chuyển qua các lỗ gel theo đầu mút của nó. Nếu chúngta nghĩ gel agarose là 1 mạng lưới các lỗ gel,sau đó chúng ta có thể hình dungDNA có thể xuyên qua 1 cách dễ dàng các lỗ gel nếu nó di chuyển bằng đầu múthơn là mặt bên.Những đầu mút có thể di chuyển theo kiểu bò hoặc trườn tới.

Figure 2.15. DNA đang bò qua các lỗ gel. Những phân tử DNA đang di chuyểnqua lỗ gel có thể bị vướng vào lỗ gel theo nhiều cách khác nhau. Những phân tửDNA lớn hơn dễ bị vướng hơn những phân tử nhỏ hơn. Điều này có thể là nguyênnhân làm cho tất cả những phân tử DNA lớn hơn 30 kbp di chuyển trong cùng 1 điểmtrên cùng khuôn gel agarose.

Nếu các plasmid giống nhau được xử lý với enzyme cắt giới hạn tại 1 điểm cắttrên plasmid, sau đó những đoạn DNA này sẽ di chuyển với 1 chất trung gian linh độngở giữa cấu trúc thượng tầng của chúng và những phân tử bị che khuất. Vì vậy, nhữngphân tử DNA có số lượng cặp base gần bằng nhau có thể di chuyển trên một vài điểmkhác nhau trên gel agarose phụ thuộc vào hình thái DNA.

Page 71: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

70

Figure 2.16. ảnh hưởng của hình thái lên tính linh động của DNA. 3 đoạnDNA, mỗi loại chứa đựng chính xác số lượng giống nhau và trình tự các cặp base, cóthể di chuyển đến các điểm khác nhau trên gel.DNA có cấu trúc xoắn vòng nhiều lớpđược kết lại 1 cách chắc chắn và di chuyển 1 cách nhanh chóng qua gel.Nếu chỉ 1phần trong phân tử DNA xoắn vòng bị che khuất i.e.1 cầu nối đơn giản trong liên kếtcủa gốc đường và gốc phosphat được hình thành–sau đó phân tử tạo ra 1 cấu trúcvới tính linh động thấp hơn.DNA mạch thẳng,tất cả các phần trong cấu trúc DNA bịhư hỏng,di chuyển với tốc độ trung bình trên gel.2.5.3. Kỹ thuật điện di xung

Như chúng ta thấy ở trên,tất cả những đoạn DNA có kích thước trên 30kbp dichuyển với tính linh động giống nhau cho dù kích thước của chúng là bao nhiêu.Điềunày được thể hiện trên gel khi có 1 vạch lớn khuếch tán.Để khắc phục việc vượt quágiới hạn về kích thước trong việc di chuyển trong gel,Schwartz và Cantor đã giới thiệukĩ thuật điện di trên gel bằng xung (PFGE)như là 1 phương pháp để phân tách nhữngđoạn DNA rất lớn(Schwartz and Cantor, 1984).Đúng hơn là những đoạn DNAtrên gel là để duy trì xung tĩnh điện,chúng điều khiển chiều của dòng điện để thayđổi quỹ đạo của DNA khi chúng di chuyển qua gel(Figure 2.17).Việc dùng kĩ thuậtnày giúp cho việc phân tách DNA có giới hạn kích thước lớn hơn trong gel agaroseđược tăng lên từ 30 –50 kbp đến qua 10 Mbp (10 000 kbp).

Nếu DNA bị ép buộc thay đổi sự điều khiển trong suốt quá trình phóng điện di,những đoạn với kích thước khác nhau trong phân tử DNA khuếch tán chưa đượctách ra, bắt đầu phân chia thành mỗi phần khác nhau; có lẽ việc thay đổi sự điềukhiển làm ức chế, hay làm suy yếu, ràng buộc cấu tạo. Với mỗi sự thay đổi của xungđiện liên quan đến gel, trong điều kiện mới những đoạn DNA nhỏ hơn sẽ bắt đầu dichuyển nhanh hơn những đoạn DNA lớn. Vì vậy những đoạn DNA lớn hơn chậm trễở phía sau, tạo ra 1 sự phân chia các đoạn DNA. Hệ thống điện di được dùng thay đổitrường điện từ được tạo ra từ các cực tĩnh điện. Khi đó, DNA không di chuyển theođường thẳng sẽ giúp giải thích các vấn đề trên gel. Lý tưởng hơn, DNA nên phân táchthành những đoạn nhỏ để làm đơn giản cho việc so sánh đường này với đường kia.

Page 72: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

71

Figure 2.17. hiện tượng điện di (PFGE).(a)đảo chiều dòng điện trong suốt quá trìnhPFGE.chiều dòng điện được đưa vào gel để xác định chu kì-thời gian của xung điện-thườngtừ 0.5 – 2 phút. Sau thời gian này sự vận hành chiều dòng điện được thay đổi.(b)Việc lặp lạisự chuyển mạch của chiều dòng điện làm DNA sẽ đi xuống theo hình zig-zag trên gel.

Kĩ thuật cơ bản PFGE dùng 2 dòng điện không tương đồng để thay đổi sự điều khiển sự dichuyển của DNA trong suốt quá trình điện di (Schwartz, Cantor, 1984). Việc di chuyển theohình zig-zagging cho phép phân tách những phân tử DNA lớn,nhưng dòng điện khôngđồng nhất dẫn đến những mẫu DNA mạch vòng. (c)Việc dùng dòng điện tương đồng,nhữngmẫu phân tách theo đường thẳng được thể hiện,giống như là việc phân tách toàn bộ sợi NSTđược thể hiện ở trên.

Cách tiếp cận đơn giản nhất để thu được những vạch thẳng là dung kĩ thuật(FIGE),dùng song song các cực để đảm bảo 1 dòng điện đồng nhất. FIGE chuyển đổicó chu kì chiều phân cực của các cực trong suốt quá trình điện di. Vì FIGE làm thayđổi hình thái DNA 180°, nên một số lượng DNA sử dụng được biết chắc chắn về thờigian di chuyển qua lại. Việc thay đổi góc 180° của kĩ thuật điện di xung (FIGE) ápdụng tốt nhất cho sự xắp xếp phân tách những phân tử có kích thước dưới 2000kbp.

Hơn nữa, FIGE có khả năng đảo chiều chuyển động, trong đó những phân tửDNA lớn hơn có thể di chuyển lên phía trước những phân tử nhỏ hơn trong suốt quátrình điện di. Việc dùng dòng điện đồng nhất kết hợp với kĩ thuật PFGE cũng tạo radòng DNA di chuyển theo đường thẳng.Ví dụ, trong kĩ thuật điện di đối lưu(CHEF)làm thay đổi DNA tại những góc xiên nhỏ hơn, thông thường nằm ở giữa 96 và 120°.Điều này làm cho DNA lúc nào cũng di chuyển lên phía trước theo hình zig-zag trong gel, nhưng DNA không di chuyển theo đường nhỏ và đường thẳng đã đượcthể hiện ở hình 2.18.

Page 73: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

72

Một vài thông số hoạt động liên tục trong suốt quá trình PFGE tác động đến hiệuquả của việc phân tách trên 1 khu vực gel riêng biệt.Bao gồm mẫu và sự tập trungagarose đem dùng,thành phần đệm,nhiệt độ đệm,cường độ dòng điện,sự thay đổigóc...Tuy nhiên,thời gian của xung điện chủ yếu làm nhiệm vụ thay đổi hiệu quả củaviệc phận tách, thời gian xung điện là khoảng thời gian của mỗi loại dòng điện xoaychiều. Những thời gian xung điện ngắn hơn giúp cho sự phân chia những phân tử DNAnhỏ hơn vì những đoạn DNA nhỏ hơn sẽ bắt đầu di chuyển nhanh hơn những đoạn lớnhơn phụ thuộc vào sự thay đổi ở trên. Tương tự, thời gian của nhũng xung điện dài hơngiúp cho sự phân tách những phân tử DNA lớn(Figure 2.19).

Việc tiếp cận kĩ thuật PFGE làm cho những phân tử DNA riêng biệt đặc trưngcho toàn bộ NST được phân tách dễ dàng trên gel. Những phân tử DNA lớn như nhữngsợi NST nguyên vẹn thì dịch chuyển dễ dàng và cũng khó khăn trong pipet do tínhnhớt của chúng. Sự cần thiết đối với vật liệu nguyên vẹn trong điện di là hiển nhiên. Sựthử nghiệm để phân tách rã ra từng phần hay làm mất 1 phần vật liệu có chủ ý sẽ tạo ranhững vết bị nhòe và do đó gel trở nên khó phát hiện. Cách giải quyết vấn đề này làtrước tiên phải bảo quản những TB không bị hư hỏng (e.g).

Figure 2.18. Hai kĩ thuật chính của PFGE. Đảo chiều điện trường trong điện di

trên gel (FIGE) là kĩ thuật chiều dòng điện được đảo ngược trở lại và quay 1 góc 180◦để điềukhiển sự di động của toàn bộ DNA.Kĩ thuật điện di đối lưu (CHEF) sử dụng nhiều cực tạinhững vị trí chính xác của điện trường và có thể thay đổi 1 cách chính xác.

Page 74: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

73

Figure 2.19. Ảnh hưởng của thời gian xung điện lên sự phân tách các đoạnDNA có kích cỡ khác nhau.Sợi NST của Saccharomyces cerevisiae và cách thiết lập 1DNA markers đã biết kích thước phân tử được đưa ra trong kĩ thuật PFGE với điềukiện sử dụng các thời gian xung điện khác nhau.Chú ý rằng việc tạo ra thời gian xungđiện được tăng lên để giúp cho việc phân tách những đoạn DNA có kích cỡ lớn.Kíchcỡ của các DNA marker được thể hiện dưới dạng kbp.Tái sản xuất từWrestler...(1996) được sự cho phép của Bruce Birren (Whitehead Institute)

Ở đầu agarose và sau đó xử lý những đầu này với enzyme để phân loại vách TBvới protein vì vậy DNA còn nguyên vẹn tinh khiết trên agarose. Những đầu này sau đósẽ được cắt để tạo kích thước, được xử lý với enzyme cắt nếu cần thiết và sau đó đượcđưa lên các giếng ở gel agarose (Figure 2.20).

Ở đầu agarose và sau đó xử lý những đầu này với enzyme để phân loại vách TBvới protein vì vậy DNA còn nguyên vẹn tinh khiết trên agarose. Những đầu này sau đósẽ được cắt để tạo kích thước, được xử lý với enzyme cắt nếu cần thiết và sau đó đượcđưa lên các giếng ở gel agarose (Figure 2.20).

Ở đầu agarose và sau đó xử lý những đầu này với enzyme để phân loại vách TBvới protein vì vậy DNA còn nguyên vẹn tinh khiết trên agarose. Những đầu này sau đósẽ được cắt để tạo kích thước, được xử lý với enzyme cắt nếu cần thiết và sau đó được

Page 75: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

74

đưa lên các giếng ở gel agarose (Figure 2.20).2.6 Vết nucleid acid

Khi chúng ta thấy những đoạn DNA trong thuốc nhuộm gel ethidium bromide,tấtcả các dãy DNA ở mỗi loại trên gel thì khác nhau so với loại kia.

Figure 2.20. Chuẩn bị những phân tử DNA có khối lượng phân tử lớn để phântích bởi kĩ thuật PFGE. Những TB nguyên vẹn được hòa lẫn vào nhau với agarosenóng chảy nhưng đã làm mát và được rót vào 1 khối nguyên vẹn. Khối agarose cóthể được xử lý với enzyme thủy phân loại bỏ vách TB và nhận biết DNA NST.Nếu theo yêu cầu, DNA có thể được phân hủy bởi các enzyme cắt trong khối gelagarose. Những khối được xử lý sau đó được đem vào các giếng của gel agarosetrước khi được xử lý với kĩ thuật điện di (PFGE).

Thậm chí những đoạn có chiều dài đồng nhất cũng có trình tự khác nhau.Dĩ nhiêntrình tự DNA của chính nó đóng vai trò sự sống trong chức năng của phân tử.Vào giữathập niên 1970 phương pháp này được phát triển để phân biệt các dải băng trên gel cóchứa trình tự DNA riêng biệt. Những phương pháp này phụ thuộc cách lai của trình tự

Page 76: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

75

acid nucleic để nhận biết sự có mặt của trình tự bổ sung. Phương pháp truyền thốngđược thực hiện bởi ED Southern 1975 để phát hiện phân đoạn DNA trên gel agarosemà nó bổ sung với trình tự acid nucleic.2.6.1. Southern Blotting

Hình 2.21. Southern blotting. Các phân đoạn DNA được tách ra trên gelagarose và chuyển tới màng. DNA được làm biến tính tạo chuỗi đơn trước khi cho kếthợp với mẫu dò. Sự kết hợp của mẫu dò với màng- thông qua liên kết hydrogen- đượcphát hiện bằng màng phim X-ray. Các mẫu dò có gắn phóng xạ hình thành nhữngbăng trên phim tại vị trí tương ứng với trình tự bổ sung trên màng.

Trong qui trình Southern blotting, đoạn DNA tách ra khỏi gel agarose và đượccố định trên màng. Sau khi gel được chạy, đoạn DNA bị biến tính (thành từng chuỗiriêng biệt) khi dung kiềm.. Bản chất sợi đơn của ADN trên màng tế bào là rất quantrọng cho phép các trình tự DNA bổ sung có thể gắn vào các đoạn DNA trên màng.Sau khi các DNA trong gel đã được biến tính, chúng được chuyển đến màng. Quátrình chuyển có thể là qua trung gian hoặc electrophoretically hoặc lực hút mao dẫnbằng cách đặt các gel và màng tiếp xúc với các chất khác đệm và cho đệm chảy quagel lên màng tế bào - đoạn DNA di chuyển với đệm và bị giữ trên màng. Ban đầu, sửdụng màng nitrocellulose, nhưng nó mỏng và dễ bị phá vỡ. Hiện nay người ta thường

Page 77: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

76

sử dụng màng nilon. Sau khi chuyển, các đoạn DNA cần được cố định vào màng đểchúng không tách rời ra. Một số phương pháp cố định thường dùng là đun nóng ở 80 ◦C kết hợp sử dụng ultraviolet cross-linking. Nó dựa trên sự hình thành các liên kếtchéo giữa một lượng T rất nhỏ trong DNA, các nhóm tích điện dương và amino trên bềmặt của màng nylon. Sau khi đông đặc, màng được đặt trong một dung dịch acidnucleic có đánh dấu (thường là các chất có tinh phóng xạ) một trong hai sợi đơn DNAhay RNA. Các nucleic acid đánh dấu (hoặc đầu dò) cho phép lai với các trình tự bổsung của nó trên màng. Sự tương tác giữa đầu dò đơn sợi và trình tự bổ sung của nó sẽdẫn đến sự kết hợp của các đầu dò với màng thông qua liên kết hydro không đồng hóatrị- liên kết thường giữ chuỗi ADN xoắn kép với nhau. Sau đó màng này được rửasạch để loại bỏ các đầu dò không liên kết.

Hình 2.22. Màng Washing Southern blot tại những nhiệt độ khác cho kết quảkhác nhau. Rửa màng ở nhiệt độ cao sẽ loại những phân tử DNA liên kết yếu- nhữngphân tử này giống trình tự mẫu dò. Rửa màng ở nhiệt thấp có thể loại bỏ những trìnhtự trên màng mà chỉ tương tự chứ không giống trình tự mẫu dò. Nhiệt độ phù hợp đểrửa tùy thuộc chiều dài và khả năng kết hợp chính xác với các trình tự trên màng.

Southern blotting được sử dụng để phát hiện các trình tự ADN hoặc là trùnghoặc tương tự như trình tự các đầu dò. Việc lai tạo các đầu dò với các trình tự DNA bịgiữ trên màng là yếu tố quan trọng của sự thành công trong những thí nghiệm này.Như chúng ta đã thấy trước đây, một sợi đơn DNA sẽ liên kết với trình tự bổ sung củanó bằng một ái lực cao. Cũng có những liên kết tương tự được tạo ra, nhưng khônggiống nhau và ái lực với các trình tự DNA giảm. Điều này được thực hiện bằng cáchthay đổi nhiệt độ (hoặc nồng độ muối) mà tại đó các đầu dò được rửa sau khi đã bị kết

Page 78: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

77

hợp (Hình 2,22). Rửa màng ở nhiệt độ cao sẽ gây gián đoạn nhưng các trình tự liên kếtchặt chẽ. Do đó, các băng hiển thị trên phim X-ray hoặc là trùng hoặc liên kết chặt vớiđầu dò. Rửa màng ở nhiệt độ thấp hơn sẽ làm giảm mức độ stringency, và trình tự liênkết yếu với đầu dò sẽ thể hiện điện tích dương trên phim X-ray. Cách tiếp cận này làvô cùng hữu ích khi bạn không biết chính xác trình tự của gen mà bạn muốn xác định.Điều này được thực hiện khi kiến thức về các trình tự protein được biết đến, nhưngchuỗi ADN mã hóa protein mà chưa được biết rõ. Chúng ta sẽ thảo luận về vấn đề nàyhơn nữa trong Chương 6.2.6.2 Những điểm Compass của Blotting

Từ mô tả đầu tiên của Southern và lai tạo, một số phương pháp khác đã được môtả. Những sự thay đổi này liên quan đến việc chuyển vật liệu từ gel tới màng và nhậnbiết các phân tử riêng biệt. Các kỹ thuật này cho biết tên vị trí điểm đó chứ không chỉlà mô tả.

• Northern blotting- nhận biết trình tự RNA bằng cách sử dụng các đầu dò(Thomas, 1980). RNA được tách trên gel agarose và được chuyển đến màng, giốngnhư mô tả ở trên. Cụ thể, các phân tử RNA này sau đó được nhận biết bằng cách lai sửdụng sợi đơn RNA, hoặc sợi bổ sung cho RNA có đánh dấu.

• Western blotting- nhận biết các protein cụ thể bằng cách sử dụng các kháng thể(Bur-nette, 1981). Protein được tách thông qua một gel polyacrylamide có chứa chấttẩy SDS để giữ chúng không bị cuộn lại (biến tính). Các protein được chuyển từ gel tớimàng giống như mô tả ở Southern blotting. Đặc biệt, các protein này sau đó được pháthiện bằng cách sử dụng các kháng thể. Sự tương tác cụ thể giữa các kháng thể vàkháng nguyên của nó xảy ra trên màng tế bào, và nhận biết được vị trí liên kết khángthể. Ban đầu, sử dụng kháng thể có đánh dấu, nhưng phần lớn đã được thay thế bằngkháng thể “sandwiches”. Phương pháp này giống bánh mì kẹp chả tức là khángnguyên nằm giữa và hai kháng thể nằm hai bên. . Điều này có một số ưu điểm, trướchết, bản chất của kháng thể là protein thì khả năng bắt cặp với kháng nguyên rất caolàm tăng đáng kể độ nhạy, và thứ hai, một kháng thể đơn dòng thứ cấp có thể được sửdụng để phát hiện một số kháng thể sơ cấp khác nhau. Ví dụ, các kháng thể đơn dòngsơ cấp thường sử dụng ở chuột. Nhưng kháng thể đơn dòng thứ cấp, chẳng hạnglobulins miễn dịch ở thỏ có khả năng tương tác với kháng thể sơ cấp ở chuột.

Page 79: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

78

Hình 2.23. Western blotting sử dụng kháng thể để nhận diện các protein đặctrưng. Protein được tách nhờ gel polyacrylamide, sử dụng SDS gây biến tính trước khicho thấm trên màng nitrocellulose. Các protein không liên kết mà bị dính trên màng- sửdụng bột sữa hòa tan- trước khi sử dụng kháng thể sơ cấp. Kháng thể sơ cấp kết hợp vớikháng nguyên. Một kháng thê thứ cấp khác sau đó được thêm vào để nhận biết khángthể sơ cấp. Các kháng thể thứ cấp thường được gắn nhãn với một loại enzyme có hoạtđộng, trong sự hiện diện của các cơ chất thích hợp, kết quả là thay đổi màu sắc trênmàng hoặc phát xạ ánh sáng có thể được phát hiện bằng cách sử dụng phim X-ray.

• South- Western blotting- xác định các protein liên kết với các trình tự DNA cụthể (Singh và cộng sự, 1988). Protein được tách bằng hai cách hoặc trên gel hoặc thấmtrực tiếp trên màng tế bào. Màng tế bào này sau đó được kết hợp với một chuỗioligonucleotide DNA có đánh dấu. Nếu một protein có khả năng liên kết DNA, nó sẽđược phát hiện bởi sự hiện diện của mẫu có đánh dấu này.

Page 80: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

79

2.7 Tinh sạch DNANhiều kĩ thuật được thảo luận trong chương này chủ yếu phụ thuộc vào các DNA

đã được tinh sạch. Sự cô lập vật chất di truyền từ tế bào là quá trình tương đối đơngiản. Việc phá vỡ vách tế bào làm vật chất di truyền thoát ra khỏi tế bào, nhưng DNAbị nhiễm với RNA và protein. Vì thế phương pháp này đòi hỏi phải loại hết các thànhphần tạp để tăng hiệu suất tinh sạch phân đoạn DNA. Tổng lượng DNA phân lập đượcchủ yếu dựa vào các qui trình sau đây:

• Phá vỡ vách tế bào chủ. Phương pháp phá vỡ tùy bản chất mỗi loại tế bào. Vídụ, các tế bào vi khuẩn thường được xử lí với các enzyme lysozyme để phá vỡ bớtthành tế bào trước khi sử dụng chất tẩy rửa. Mặt khác, tế bào nấm men, được xử líbằng zymolase để phá vỡ hoàn toàn thành tế bào trước khi tiến hành phân giải -thường là bằng cách nghiền các tế bào với hạt thủy tinh để phá vỡ chúng.

• Li tâm để loại các thành phần tạp của tế bào• Các thành phần hòa tan còn lại sau đó sẽ được vortexed với phenol để loại bỏ

protein sau khi đã gây biến tính. Chlorofom thường được sử dụng kết hợp với phenol,nó cũng là một chất biến tính protein nhưng tạo sự phân lớp rõ ràng giữa các dịch nướcvà phenol.

• Các acid nucleic còn lại trong lớp dung dịch nước có thể được kết tủa bằng cáchsử dụng ethanol. Khi bổ sung ethanol DNA sẽ hình thành một kết tủa trắng dạng sợi cóthể được thu bằng phương pháp ly tâm.

• RNA được loại bỏ từ việc chuẩn bị bằng cách xử lý với RNase.Đối với nhiều ứng dụng, DNA phải được tinh sạch hơn. Isopycnic centrifugation-

được sử dụng để tách DNA khỏi các tạp chất, và cũng để cô lập từng phân tử DNA.Các mẫu DNA được trộn với một chất (caseium chloride, CsCl) có khả năng hìnhthành self-generating ổn định gradient nồng độ trong quá trình ly tâm. Các phân tửDNA sẽ lắng xuống ống ly tâm khi gradient của dung dịch bằng gradient của chính nó,và nó tạo thành một băng. Sau đó, chúng được lấy ra khỏi các ống ly tâm và CsClđược loại bỏ bằng cách tủa ADN với rượu. Một ưu điểm lớn của kỹ thuật này là khảnăng riêng biệt các loại phân tử DNA khác nhau.

Page 81: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

80

Hình 2.24. Li tâm isopycnic các phân tử DNA nhờ gradient của caesiumchloride- ethidium bromide. DNA mẫu trộn với caesium chloride va ethidium bromidevà li tâm tốc độ cao trong vòng 48h. Mỗi nồng độ sẽ xuất hiện một băng, trong đó, đốivới ADN, chịu ảnh hưởng ở mức mà phân tử không bị biến tính bởi ethidium bromide.

Sự kết hợp của ethidium bromide trong ly tâm để tăng khả năng liên kết củaDNA. Những hạn chế trong cấu trúc xoắn cuộn DNA có nghĩa là các phân tử DNAkhép vòng (ví dụ plasmid) có thể liên kết yếu với ethidium bromide. DNA mạch vòng,và những đoạn DNA mạch thẳng liên kết với ethidium bromide chặt hơn và cấu trúckhông bị phá hủy khi được chèn thêm chất này (hình 2.12). Kết quả DNA mạch vòngvà mạch thẳng nhẹ hơn so với mạch xoắn cuộn tương ứng của nó, và do đó được táchra ở vị trí khác nhau trên CsCl. Nhược điểm chính của isopycnic là thời gian li tâm dàiđể hình thành gradients, với băng DNA isopycnic mất 36-48 h để hình thành mộtgradient CsCl. Kỹ thuật này hiện nay ít được sử dụng do sự ra đời của bộ “kits”thương phẩm cho phép phân lập DNA nhanh và không ảnh hưởng tới DNA khi tiếpxúc với thuốc thử có hại. Cơ sở của những bộ “kits” này được thảo luận dưới đây.

Tinh sạch DNA plasmid (xem Chương 3) là cực kỳ quan trọng đối với nhân bảnvô tính trong ống nghiệm và thao tác các gen. DNA plasmid thường được phân lập từtế bào vi khuẩn. Một lần nữa, việc phá vỡ tế bào là một giai đoạn quan trọng trong tiếntrình. Phá vỡ tế bào không tốt sẽ dẫn đến lượng plasmid thấp. Các phương pháp phổbiến nhất trong chiết xuất DNA từ tế bào chủ yếu dựa trên qui trình của Birnboim vàDoly (1979). Phương pháp này được gọi là qui trình phân giải nhờ dung dịch kiềm,dựa vào pH hoạt động trong môi trường kiềm (giữa 12,0 và 12,5) chỉ có DNA mạchthẳng bị biến tính còn DNA mạch vòng thì không. Qui trình này đảm bảo kết quả cắtcủa genome E.coli dạng vòng để tạo ra những đoạn lớn AND mạch thẳng. Hầu hết cácphương pháp để tinh sạch DNA plasmid dựa trên quan sát này đòi hỏi môi trường nuôicấy tế bào vi khuẩn là 1-5ml. Các phương pháp cơ bản để tinh sạch plasmid như sau.

Page 82: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

81

Hình 2.25. Tinh sạch DNA plasmid. Sử dụng SDS phá vỡ DNA plasmid chứatrong tế bào vi khuẩn. Bổ sung sodium hydroxide để gây biến tính genomic DNA. Saukhi trung hòa, genomic DNA hình thành dạng kết tủa với phức SDS-protein. Chúngđược loại bỏ bằng cách li tâm. DNA plasmid sau đó kết hợp với dịch matrix mà khôngkết hợp với tạp chất. DNA plasmid tinh sạch sau đó được phân tách từ dịch này.

• Các tế bào vi khuẩn được xử lí bằng chất tẩy rửa (SDS) trong môi trườngNaOH để đảm bảo pH kiềm. SDS phá vỡ màng tế bào và biến tính protein. Trong quátrình này, DNA nhiễm sắc thể bị biến tính, nhưng các phân tử DNA plasmid sẽ vẫncòn trong dung dịch.

• Hỗn hợp này sau đó bất hoạt bằng cách sử dụng acid acetate kali (pH 5.2). CácDNA nhiễm sắc thể tái cấu trúc sau khi trung hòa, nhưng kết hợp để tạo thành dạngkhông hòa tan. Nồng độ acid acetate kali cao cũng gây kết tủa của protein này - phức

Page 83: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

82

SDS và trọng lượng phân tử RNA cao. Một lần nữa, các phân tử DNA plasmid sẽ vẫncòn trong dung dịch.

• Các kết tủa sau đó được loại bỏ bằng ly tâm và DNA plasmid tiếp tục được tinhsạch từ dịch nổi này.

• Các DNA plasmid trong dung dịch sau đó được tinh sạch từ các tạp chât (chấtchuyển hóa, ARN, phân đoạn genome DNA v.v) bằng cách liên kết các DNA hoặc làsilica hoặc trao đổi (anionic) ion tích điện dương. Đối với nhiều quy trình nhỏ, cácDNA plasmid được nhốt trong dịch silica với đệm có chứa hàm lượng muối cao.Trong điều kiện này, các tạp chất khác sẽ không liên kết với các dịch và có thể đượcrửa trôi. Sau đó, DNA có thể được phân tách từ dịch silica bằng cách sử dụng dungdịch đệm nồng độ muối thấp (hoặc nước). Quy trình lớn hơn, các chế phẩm plasmidthường gắn vào DNA plasmid với một cực trao đổi ion mang điện tích dương, chẳnghạn như DEAE (diethylaminoethanol), trong môi trường chứa dung dịch đệm, ví dụ,1M NaCl. Nồng độ muối cho phép DNA kết hợp với dịch, nhưng không kết hợp vớitạp chất. Sau khi rửa, nồng độ muối được tăng lên đến 1,6 M để phân tách các DNA.Qui trình này đòi hỏi các DNA được kết tủa (với ethanol hoặc isopropanol) vàresuspended trong dịch đệm hàm lượng muối thấp trước khi được sử dụng trong cácqui trình sinh học phân tử.

Page 84: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

83

CHƯƠNG 3VECTORS Vectơ là những phân tử DNA tái tổ hợp mà có thể được sử dụng để mang những

đoạn DNA ngoại lai. Các đoạn DNA được tạo dòng trong vectơ có thể đạt được với số lượng đủ lớn

cho các thao tác trong phòng thí nghiệm. Các vecto dựa vào trình tự DNA đã được sửa đổi và kết hợp để thực hiện những

chức năng khác nhau. Việc lựa chọn các vecto dựa vào kích thước phân tử DNA được chèn vào nó. Các Vecto đã được khai thác cho nhiều mục đích khác nhau: sản xuất sợi đơn

DNA, sự biểu hiện cấp độ cao của các gen mã hóa protein, và việc sản xuất RNA.Phần lớn các thí nghiệm nhân dòng vô tính phân tử sử dụng vi khuẩn E coli cho

nhân dòng DNA vô tính. Thậm chí nơi được đưa các đoạn DNA vô tính vào là tế bàoeukaryote. Các cấu trúc DNA hầu như luôn luôn được sản xuất trong E.coli trước rồisau đó mới đưa vào vật chủ cuối cùng. Việc nhân dòng vô tính có thể khả thi vớinhững ưu điểm của E.coli nên nó được sử dụng rộng rãi trong kĩ thuật di truyền.E.coli, được đặt tên từ nhà vật lý học người Đức Theodor Escherich (1857–1911) là vikhuẩn gram âm, hình que di chuyển bằng cách quay nhanh lông roi. Có nhiều trongmiệng và ruột người giúp bảo vệ vùng ruột khỏi các vi khuẩn truyền bệnh, giúp tiêuhóa và sản xuất một lượng nhỏ vitamin B12 và K. Như là một sinh vật sử dụng trongphòng thí nghiệm, E.coli có những ưu điểm sau:

Dễ dàng tăng trưởng trong môi trường đơn giản, ít tốn kém.Là sinh vật có khả năng nhân đôi nhanh chóng khoảng 20-30 phút trong phase log.Bộ máy di truyền học của nó đã được hiểu rõ.Sử dụng E.coli trong phòng thí nghiệm thường an toàn và ngăn chặn đột biến là

cho chúng không thoát ra được môi trường phòng thí nghiệm.Có một bộ gen đã được xắp sếp và lập chuỗi.

Page 85: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

84

Các bản sao nhiễm sắc thể phụ của DNA (các Plasmid và thể thực khuẩn DNA) cóthể được lợi dụng để mang các DNA ngoại lai.

Các tế bào E.coli hầu hết là sinh sản vô tính nhưng để tăng tính đa dạng và tăngtính truyền đạt thông tin gen, chúng có các cơ cấu để chuyển các vật chất di truyền từmột vi khuẩn đến loài khác. Trở lại giữa thập niên 1940 các tế bào vi khuẩn được cholà có khả năng trao đổi vật chất di truyền với loài bán giới tính. Thí nghiệm củaLederberg and Tatum đã mô tả rõ ràng sự vận chuyển thông tin di truyền thông qua sựtiếp hợp vi khuẩn. Khả năng để thực hiện được sự vận chuyển này là từ một bộ genđược gọi là F. Những gen này tồn tại trong mảnh vòng của DNA mà được sao chép lạimột cách độc lập từ nhiễm sắc thể vi khuẩn, hoặc chúng có thể được hợp nhất vàotrong nhiễm sắc thể. Vi khuẩn mang những gen này ( thường là những vi khuẩn đực)dùng tua để bám vào một vi khuẩn gần nó, 2 tế bào được kéo lại gần nhau, và DNAđược chuyển từ vi khuẩn này đến vi khuẩn kia. Có 3 biểu hiển của nhân tố di truyền: .F hay Fepisome là phân tử sợi đôi DNA tròn, lớn mà chỉ mang những gen di

truyền, được giữ trong vi khuẩn như là một sợi nhiễm sắc thể phụ plasmid. .Hfr: thành tố F đã được hợp nhất vào trong bộ gen E.coli. Khi sự tiếp hợp xảy ra,

các gen F di chuyển qua tua kéo theo phần còn lại của gen sau chúng. Cuối cùng tua bịđứt, vì thế bộ gen không được chuyển hoàn toàn. Bộ gen vi khuẩn có thể được đotrong nhiều phút từ khi bắt đầu chuyển với một lược thời gian cần cho từng gen riêngbiệt để được chuyển từ vi khuẩn này đến vi khuẩn kia cho biết được bao lâu kể từ khibắt đầu sao chép. .F’ : đây là phân tử sợi đôi DNA mang các gen di truyền và một số loại gen khác.

Những gen này được vận chuyển với hiệu suất rất cao bởi vì độ dài của sợi DNA đượcchuyển khá ngắn đủ để nó có thể di chuyển dọc theo khúc nối giữa 2 tế bào vi khuẩntrước khi tua bị đứt.

Khả năng của F’ episome để tái tổ hợp và được giữ như là một thực thể tách biệt vớicác nhiễm sắc thể vi khuẩn làm nó lý tưởng để mang các trình tự DNA ngoại lai. Tuynhiên kích thước của F’ episome là ngăn cản sự phân tích và thao tác trên nó và thuộctính gen chuyển của nó có thể làm cho không ổn định.

Về tổng quan các DNA ngoại lai cần được mang trong vecto để bảo đảm sự truyềnvà tái tổ hợp trong tế bào vật chủ. Vecto được mô tả tốt nhất như là các trình tự DNAtự tái tổ hợp mà có thể được dùng để mang các DNA ngoại lai. Các vecto có nền tảngdựa trên các chuỗi DNA được tìm thấy có thể được tái tổ hợp dưới những hình thứckhác nhau. Hầu hết các vecto được sử dụng dựa vào cả plasmid và thực khuẩn λ. Tổngquan, các vecto được xem như các môdun riêng biệt mà cung cấp các điều kiện cơ bảnthiết yếu cho việc nhân dòng vô tính phân tử hiệu suất cao. Các vecto được sử dụngtrong tái tổ hợp DNA thường được quy cho là các vecto dòng vô tính, trong khi nếu nóđược sử dụng cho biểu hiện gen được mang trong DNA dòng vô tính, nó được gọi làvecto biểu hiện.

Các vecto phải mang một trong các đặc điểm sau đây để làm cho nó trở nên hữudụng trong nhân dòng vô tính phân tử:

Page 86: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

85

Có khả năng tự sao chép Có tính chọn lọc để nhận diện những tế bào đã biến đổi với những tế bào chưa

biến đổi.Thêm vào đó hầu hết các vecto đều chứa những vùng enzyme nhận diện giới hạn để

cho các đoạn DNA có thể được nhân dòng vô tính vào trong vecto một cách dễ dàng.Một mạng lưới lớn những loại vecto được sử dụng ngày nay, với các tính chất chuyênbiệt cao và được thiết kế ra để thực hiện một chức năng đặc trưng. Trong chương nàychúng ta sẽ bàn về một vài điểm tổng quan của việc thiết kế một vecto, nhưng sẽ tậptrung vào các vecto dùng trong các thí nghiệm dòng vô tính.3.1 PLASMID

Plasmid thường được tìm thấy trong các đoạn DNA thuộc nhiễm sắc thể phụ mà thếhệ fromone được thừa hưởng ổn định từ một vùng nhiễm sắc thể phụ khác. Plasmidđược phân tán rộng rãi trong prokaryote khoảng 1500bp đến hơn 300kbp. Hầu hếtplasmid hiện diện như là các phân tử sợi đôi DNA vòng kín và thường có một kiểuhình riêng biệt trên tế bào vi khuẩn, nơi mà chúng được sao chép lại. Đó là vì plasmidthường mang gen mã hóa để chống lại các tác nhân kháng sinh và kim loại nặng, hoặcđể sản xuất nguồn DNA hạn chế và các enzyme sửa chữa, những thứ mà vi khuẩn khibình thường thì không có được. Sự sao chép plasmid thường được ghép đôi với tế bàochủ nơi mà chúng được giữ lại, cùng với sự sao chép plasmid là sự sao chép lại bộ gencủa tế bào vật chủ. Plasmid thường được mô tả như dư dả (relaxed) hoặc khan hiếm(stringent) là dựa vào lượng bản sao của plasmid được giữ trong tế bào, plasmid dư tứcnhiều bản sao được giữ lại trong một tế bào(10-200), trong khi plasmid khan hiếm khichỉ hiện diện 1 hoặc 2 bản sao trong một tế bào.Nền tảng của sự khác nhau này là docơ cấu khác nhau được thực hiện bởi plasmid để tự nhân đôi. Nói chung,plasmid dưthừa sử dụng vật chủ có nguồn gốc từ protein, trong khi plasmid khan hiếm mã hóa cácnhân tố protein cần thiết cho sự nhân đôi của chúng.

Hầu hết các plasmid được sử dụng ngày nay dựa trên nguồn gốc sự tự nhân đôiđược tìm thấy trong plasmid E.coli ColE1 hoặc họ hàng gần của nó là pMB1. ColE1là phân tử DNA vòng đóng dài 6646bp mã hóa cho tác nhân kháng sinh của vi khuẩn,

Page 87: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

86

colicin E1 và các gen đề kháng mà giúp vi khuẩn vật chủ thoát khỏi ảnh hưởng của tácnhân kháng sinh. Colicin E1 là protein vận chuyển trên màng gây nên sự khử cực gâychết màng của vi khuẩn (Konisky và Tokuda, 1979). Gen kháng thuốc mã hóa choprotein ngăn cản hoạt động của Colicin bằng cách kiềm chế khả năng hình thành kênhxuyên màng vi khuẩn (Zhang và Cramer, 1993). Vi khuẩn có chứa pladmid ColE1 cóthể khác biệt so với những vi khuẩn không chứa plasmid này bởi chúng có khả năngphát triển trong một dĩa có chứa colicin E1. Tuy nhiên việc bảo vệ cho quá trình pháttriển này là khá khó khăn và đã lâu kể từ khi các kĩ thuật bảo vệ thuốc kháng sinhkhông còn được sử dụng nữa.

Plasmid ColE1 được sao chép theo kiểu độc lập sử dụng DNA polymerase đượccung cấp từ tế bào vật chủ. Không giống như nguồn gốc sao chép thuộc vi khuẩn, sựsao sao chép của ColE1 chỉ diễn ra theo một chiều. Plasmid không mã hóa cho proteinkhởi sướng quá trình sao chép nhưng lại mã hóa cho các phân tử RNA không dịch mã,các RNA này có liên quan đến sự khởi sướng quá trình sao chép cũng như một proteinđóng vai trò điều hòa các phân tử RNA. Nguồn nhân đôi DNA của ColE1 là một vùngcủa DNA mà 2 phân tử RNA (RNAI và RNA II) được phiên mã từ nguồn khởi xướngcủa chúng (hình 3.2). RNA II được bổ sung vào gốc sao chép ColE1 và gắn vào nóhình thành nên dạng lai DNA-RNA (Cesarenivà cộng sự, 1991). Phân tử gắn RNA IIđược tách ra từ gốc, bởi enzyme mã hóa vật chủ RNase H và đáp ứng như một đoạnmồi nơi mà sự sao chép DNA xảy ra. Trong quá trình bắt cặp base, RNAII chỉ có thểgắn lên 1 sợi DNA, và kể từ đây sự sao chép DNA là đơn hướng.

Hình 3.2: Plasmid ColE1 và gốc sao chép. Plasmid ColE1 là một sợi đôi DNA vòngkín, dài 6646bp. Nó mã hóa cho tác nhân kháng sinh trong vi khuẩn colicin E1 vàprotein miễn dịch giúp ngăn các ảnh hưởng từ chất độc trong các tác nhân khángkhuẩn có trong plasmid. Sự sao chép DNA chỉ xảy ra theo 1 hướng như được chỉ ra từmũi tên ori. Hai phân tử RNA chưa phiên mã, gọi là RNAI và RNAII, và sản phẩmprotein của gen rop điều khiển quá trình sao chép. Mũi tên trên các gen cho thấy chiềuhướng phiên mã.

Page 88: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

87

Điều khiển quá trình sao chép được thực hiện bởi một phân tử RNA chưa phiênmã khác. RNAI được bổ xung vào gốc 5’ của RNAII và dạng RNA kép giữa RNAI vàRNAII không thể thực hiện như là một đoạn mồi cho sao chép. RNAI có tồn tại tươngđối ngắn, do đó plasmid ColE1 được giữ ở mức 15-20 bản sao trong một tế bào. Sựtương tác giữa RNAI và RNAII được giữ ổn định bởi protein ROP(Helmer-Citterichvàcộng sự, 1988).

Cơ cấu sao chép DNA thực hiện bởi ColE1 có một số vai trò quan trọng, 2plasmid với cùng một gốc sao chép không thể cùng tồn tại trong một tế bào. RNAI củagốc plasmid ngăn cản RNAII của plasmid đi vào để khỏi hình thành đoạn mồi, đâykhông gọi là sao chép. Điều này quan trọng trong các thí nghiệm nhân dòng vô tínhkhi mà một tập hợp các plasmid được hòa trộn, điều mà tạo ra các phản ứng thắt nút,được chuyển vào trong vi khuẩn. Các cá thể chuyển theo phương pháp chỉ mang mộtplasmid đơn mà không phải là một tập hợp. Các Plasmid với các gốc sao chép khácnhau không thể cùng tồn tại trong một tế bào. MỘt hệ quả của cơ cấu sao chép ColE1là sự tổng hợp DNA mới không cần khởi sướng sự sao chép DNA. Sự hiện diện cácyếu tố kháng sinh mà ngăn cản sự tổng hợp protein, sự sao chép DNA nhiễm sắc thể bịngừng lại nhưng với plasmid nền tảng ColE1 vẫn tiếp tục được sao chép và tích lũyvới nồng độ cao (1000–2000 bản sao một tế bào) (Clewell, 1972).3.1.1. pBR322

ColE1 và tương ứng với nó là pMB1, hữu dụng trong nhân dòng vô tính vectonhưng chúng lại có một số bất lợi. Đầu tiên, khó khăn trong việc nhận diện plasmid táitổ hợp làm chúng không được sử rộng rãi. Cần một plasmid có thể được sao chépgiống với cách của ColE1, nhưng phải trong plasmid nào dễ nhận diện.

Plasmid pBR322 lần đầu tiên được sử dụng như là một vecto plasmid, là mộtplasmid nhỏ (4363bp) được cấu thành từ các plasmid trong tự nhiên và các đoạn DNAkhác (Bolivar và cộng sự, 1977). pBR322 mang những thành phần sau đây. Gốc sao chép : pBR322 mang gốc sao chép ColE1 và gen rop để bảo đảm một

lượng bản sao plasmid hợp lý ( 15-20 một tế bào) có thể tăng lên 200 vòng nhờ sựkhuyếch đại chloramphenicol.

Gen kháng kháng sinh: pBR322 mang 2 gen mà có thể được sử dụng như là các tínhiệu chọn lọc. Gen kháng ampicilin được nhân dòng vô tính vào trong plasmid nhờ

Page 89: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

88

gen nhảy Tn3. Gen kháng tetracyline được nhân dòng vô tính từ plasmid pSC101(Bernardi và Bernardi, 1984).Vùng nhân dòng vô tính: plasmid mang các vùng nhận diện enzyme giới hạn.một

vài trong số này có trong cac gen kháng kháng sinh. Ví dụ như vùng cho PstI, PvuI vàSacI được tìm thấy trong gen kháng ampicilin hoặc vùng cho amHI và HindIII tronggen kháng tetracylin.

Các gen kháng kháng sinh trong pBR322 cho phép chọn lọc trực tiếp các chất tái tổhợp trong một chu trình được gọi là bất hoạt vùng gắn (insertional inactivation). Ví dụ,nếu chúng ta muốn nhân dòng vô tính một đoạn DNA vào trong vùng BamHI củapBR322, sau đó DNA gắn sẽ làm ngắt quãng vai trò của gen KHÁNG chống tetracilin,nhưng vai trò của gen chống ampicilin vẫn không bị thay đổi. Các tế bào đã biến đổiđược nuôi trên một đĩa thí nghiệm mang ampicilin để diệt hết tất cả các tế không mangplasmid. Sau đó được cho phát triển tiếp trên mội trường có cả ampicilin và tetracilin.Những tế bào có thể phát triển khi có ampicilin nhưng lại chết dưới sự chọn lọc củatetracilin sẽ mang plasmid có DNA gắn vào. Nói cách khác, sự thêm vào các đoạnDNA ngoại lai vào các gen kháng kháng sinh làm bất hoạt gen và dẫn tới tính nhạycảm với yếu tố kháng sinh.

Hình 3.4 Sự lồng vào yếu tố gây bất hoạt của gen kháng kháng sinh trong pBR322.Nếu đoạn DNA được lồng vào vùng nhận diện enzyme giới hạn BamHI bên trong gentetracyline, gây ra bởi plasmid tái tổ hợp khi được chuyển vào trong vi khuẩn sẽ vẫn

Page 90: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

89

đem lại sự sống trên môi trường chứa ampiciline nhưng sẽ không thể xúc tiến được sựphát triển trong môi trường chứa tetracilin. Gen kháng Tetracilin sẽ bất hoạt về mặtchức năng khi có mặt DNA gắn.3.1.2 pUC plasmid

PBR322 là một đột phá trong lĩnh vực sinh học phân tử như là một plasmid lần đầutiên được sử dụng trong nhân dòng vô tính phân tử nhưng tiêu tốn thời gian và dể gặplỗi. Vào 1982 một chuỗi plasmid được phát triển cho phép nhận diện tế bào mangDNA ngoại lai trong bước sàng lọc đơn là plasmid pUC (Vieira và Messing, 1982). Nócó 3 đặc tính quan trong khi so với pBR322 Lượng bản sao lớn – đột biến trong gốc sao chép sản xuất ra 500-600 bản sao của

plasmid trong một tế bào mà không cần dùng tác nhân khuyếch đại chloroamphenicol. Sàng lọc xanh- trắng – Sàng lọc theo kiểu này là một dạng đặc biệt của hoạt hóa

vùng gắn. Nhiều vùng nhân dòng vô tính. Đây là một loại DNA nhân tạo mà chứa trình tự

của nhiều vùng nhận diện enzyme giới hạn. Nó được gắn vào một phần của vecto mãhóa β-galactosidase α-peptide theo chiều hướng để không ảnh hưởng đến chức năng vàbiểu hiện của nó. Tuy nhiên việc gắn DNA ngoại lai vào hầu như luôn luôn làm phá vỡhoạt động của α-peptide. Do đó các cụm tái tổ hợp vẫn còn màu trắng trong khi cụmkhông tái tổ hợp lại chuyển xanh.

Hình 3.5- pUC plasmidƯu điểm của pUC plasmid so với pBR322 là đoạn DNA ngoại lai có thể được nhân

dòng vào nhiều vùng nhận diện enzyme giới hạn khác nhau và các chất tái tổ hợpnhanh chóng được sàng lọc. Thêm vào đó gốc α-bổ trợ chỉ cần một gen nhỏ để mangtrên plasmid. DNA mã hóa α-peptide trong chuỗi pUC trong các vecto thì nhỏ hơn400bp. Nếu như toàn bộ khung đọc mở LacZ được cần đến, trên 3500bp sẽ được giữlại trong những vecto này. Nói chung, sự ổn định của nhiều vecto plasmid giảm trong

Page 91: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

90

khi chiều dài của chúng tăng. Kết quả trong giới hạn chiều dài DNA là có thể đượcnhân dòng vô tính vào trong một plasmid riêng biệt. Ví dụ, khả năng tế bào vi khuẩnvẫn còn plasmid pUC tái tổ hợp giảm mạnh khi kích thước của chúng đạt đến 15kbp.3.2 Lựa chọn chỉ thị (Dấu chuẩn chọn lọc)

Một đặc điểm cơ bản của các plasmid là chúng tạo điều kiện cho vector đượcdễ dàng phát hiện. Các plasmid như vậy được sử dụng thường xuyên như các vectortrong thí nghiệm tạo dòng. Nhiều loại plasmid được tìm thấy trong tự nhiên trong cácvi khuẩn và trong một số nấm men. Việc lựa chọn đánh dấu thường phụ thuộc vào cáctế bào vật chủ được chuyển. Một số dấu hiệu chỉ có chức năng với các sinh vật nhânsơ, trong khi những một số khác có một tác động rộng hơn. Một số dấu hiệu thườngđược sử dụng lựa chọn được liệt kê dưới đây, cùng với cơ chế hoạt động của chúng. Ampicillin – gắn vào và ức chế một số enzym trong màng tế bào vi khuẩn có

liên quan đến sự tổng hợp của các thành tế bào Gram âm. Do đó, tế bào không nhânbản trong trường hợp có sự hiện diện của ampicillin. Các gene kháng ampicillin(AMPR hoặc bla) mã hóa cho các enzyme β-lactamase được tổng vào khe quanh tếbào chất của vi khuẩn, nơi mà nó xúc tác thủy phân của vòng β-lactam củaampicillin. Do đó, các sản phẩm của gen AMPR làm mất hiệu lực chất kháng sinh.Theo thời gian ampicillin trong môi trường nuôi cấy trên đĩa petri có thể bị mất hiệulực khá rõ bởi β-lactamase. Khi điều này xảy ra, sức ép chọn lọc để duy trì cácplasmid sẽ không còn nữa và quần thể tế bào có thể phát sinh mà không có plasmid. Tetracycline – kết hợp với một protein tiểu đơn vị 30S của ribosom để ức chế

sự di chuyển ribosome dọc theo mRNA và do đó cản trở quá trình dịch mã tổng hợpprotein. Các gen kháng tetracycline (TETR) được mã hóa bởi 399 amino acid ở bênngoài màng liên quan đến protein của tế bào Gram âm và ngăn chặn các kháng sinhxâm nhập vào tế bào. Như vậy, gene kháng thuốc không làm mất hiệu lực của khángsinh. Sức ép chọn lọc sẽ được duy trì trong suốt quá trình nuôi cấy tế bào để giữ chocác plasmid có chứa gene kháng thuốc. Chloramphenicol – kết hợp với các tiểu đơn vị 50S ribosome để ức chế sự tổng

hợp protein. Các chloroamphenicol acetyltransferase (CAT) được mã hóa bởi genkháng chloramphenicol (CMR). Các protein CAT là bốn (tetrameric) bào thể protein,trong sự hiện diện của acetyl coenzyme A, xúc tác hình thành các chất dẫn xuấthydroxyl acetoxy của chloramphenicol nó không thể liên kết với các ribosome. Nhưvới ampicillin, các sản phẩm gen CMR làm mất hiệu lực của chất kháng sinh. Kanamycin và neomycin – kết hợp với các thành phần ribosome và hạn chế tổng

hợp protein. Các protein được tổng hợp bởi mã hóa gene KANR được tổng hợp ở khequanh tế bào chất và cản trở việc vận chuyển các chất kháng sinh vào trong tế bào.Giống như các gene kháng tetracycline, gene KANR không làm mất hiệu lực các chấtkháng sinh. Bleomycin và zeocin – các kháng sinh glycopeptide liên kết với DNA và ức chế

DNA và sự tổng hợp RNA. Chúng tác động chống lại hầu hết các vi khuẩn (bao gồmcả E. Coli), vi sinh vật có nhân điển hình (ví dụ như nấm men), các tế bào thực vật và

Page 92: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

91

tế bào động vật. Các gene Sh ble từ vi khuẩn Streptoalloteichus hindustanus mã hóamột protein nhỏ có đề kháng đối với zeocin bằng cách gắn vào các chất kháng sinh(Gatignol, Durand và Tiraby, 1988). Hygromycin B - ức chế bằng cách can thiệp dịch chuyển vị ribosome. Kháng

sinh tác động chống lại cả hai sinh vật nhân sơ và sinh vật nhân chuẩn. Các genkháng (HYGR, mã hóa hygromycin-B-phosphotransferase) bất hoạt các kháng sinhbởi sự phosphoryl hóa.

Mặc dù vectơ plasmid được sử dụng cực kỳ rộng rãi sử dụng trong nhiều ứng dụngcủa việc tạo dòng và đã được thiết kế với mục đích tạo ra nhiều chức năng hơn.Những chức năng trong số này sẽ được thảo luận trong chương sau của cuốn sáchnày, nhưng ở đây tôi sẽ liệt kê một số ví dụ để cung cấp cho người đọc một chứcnăng chính trong sự đa dạng của việc sử dụng plasmid. Tách dòng - hầu hết các thao tác thực hiện trên DNA trong phòng thí nghiệm

đều lựa chọn có mang plasmid. Dễ dàng thao tác sử dụng và lưu trữ của plasmid nênthường được sử dụng trong các thí nghiệm về DNA tái tổ hợp. Vector con thoi - những plasmid không chỉ chứa toàn bộ thông tin gốc nhân bản

và lựa chọn đánh dấu cho E. coli, những trình tự cũng có chức năng tương tự để duytrì truyền lại ở các tế bào vật chủ khác. Ví dụ, plasmid cho nhân bản và biểu hiện củagen ở nấm men Saccharomyces cerevisiae có chứa toàn bộ thông tin nhân bản vàđánh dấu lựa chọn cho cả E. coli và nấm men. Hầu hết các các thao tác DNA sẽ đượcthực hiện bằng cách sử dụng E. coli là tế bào chủ trước khi chuyển thành DNA cuốicùng được tạo ra vào trong nấm men. Tạo ra RNA - nhiều plasmid đã được thiết kế để nhân bản đoạn DNA ngoại và

nó có thể phiên mã thành RNA. Như vậy plasmid bao gồm các vùng khởi động(promoter ) cho một RNA polymerase, ví dụ: Ở bacteriophages có T3, T7 hoặc SP6,Giả sử RNA có thể được thực hiện trong ống nghiệm bằng cách sử dụng RNApolymerase tinh khiết và DNA plasmid. Các RNA được thực hiện bằng phương phápnày thường được sử dụng như thăm dò lai trong Northern blotting. Sản xuất Protein - nhiều plasmid chứa trình tự khởi đầu (promoter) để biểu hiện

các gen ngoại mà chúng có. Biểu hiện thường được thực hiện trong E. coli, nhưngbằng cách sử dụng các đoạn khởi động (promoter) phù hợp, protein biểu hiện có thểđược định hướng hầu như bất kỳ trong cơ thể nào. Sản xuất protein ở mức độ cao cóthể được điều khiển từ một promoter mạnh, trong khi sản xuất ở mức thấp có thể sẽlà từ các promoter yếu hơn. Mức độ sản xuất protein cũng có thể được điều khiểnbằng cách thay đổi số lượng bản sao của plasmid này.

Trong kỹ thuật di truyền, các plasmid gặp trong tự nhiên thường được sửa đổinhiều để tạo ra các vector có các đặc điểm mong muốn. Ví dụ, nếu bạn đã nhân bảnvô tính một gen, bạn có thể muốn biểu hiện các sản phẩm của gene ở mức cao trongE. coli, trong khi cũng thể biểu hiện protein trong môi trường nuôi cấy tế bào độngvật có vú và sản xuất một protein mới dựa trên protein đã biểu hiện mà kháng thể đơndòng có sẵn để dùng. Các hệ thống nên được thiết kể để vận chuyển vào các đoạn

Page 93: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

92

ADN giữa các vector mà không cần phải sử dụng enzyme giới hạn. Một trong nhữnghệ thống được phác thảo (hình 3.7).

Hình 3.7. Gene xáo trộn giữa các plasmid bằng cách tái tổ hợp. Các gen đượcchuyển giao từ các plasmid cho đến plasmid nhận tại địa điểm LoxP sử dụng enzymeCre recombinase.

Ở đây, các đoạn DNA mã hóa gene mục tiêu được chuyển từ một plasmid khác dotác động của các enzyme Cre recombinase. Cre nặng 38 kDa protein recombinase từcác vi khuẩn P1 (Sternberg và cộng sự, 1981). Nó làm trung gian để điều chỉnh giữasự tái tổ hợp và trong các trình tự DNA tại các điểm cụ thể gọi là các điểm loxP (Abremski và Hoess, 1984 ). Các điểm này bao gồm một cặp 13 bp ngược lặp đi lặplại cách nhau bởi một vùng đệm 8 bp. Vùng đệm 8 bp trong điểm loxP được địnhhướng rằng sự tái tổ hợp xảy ra theo một chiều hướng chính xác và định hướngtrước. Plasmid cho chứa hai điểm loxP và hai điểm đó kẹp giữa hai đầu của gene mụctiêu. Plasmid nhận chứa một điểm loxP và các yếu tố mà các gen mục tiêu sẽ trởthành hợp nhất. Các gen mục tiêu khi chuyển sẽ liên kết với các yếu tố biểu hiện cụ

Page 94: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

93

thể mà các vector nhận đã được thiết kế. Hơn nữa, nếu các trình tự mã hóa cho cácgen quan trọng nằm trong khung ngược dòng với các điểm loxP ở vector cho nó sẽ tựđộng được nằm trong khung với tất cả các chuỗi axit amin đã thiết kế ở vector nhận.Một plasmid cho được thay thế và hệ thống chấp nhận plasmid đó là dựa vào mộtđiểm đặc biệt các phản ứng tái tổ hợp trung gian bởi thể thực khuẩn λ (Karimi, Inzevà Depicker, 2002).

Trong trường hợp này, các đoạn DNA tái tổ hợp hai bên các điểm ( att ) có thểđược chuyển vào vector tái tổ hợp có chứa các điểm tương thích ( att × attP hoặc attL× attr ) trong một phản ứng trung gian bởi các protein tái tổ hợp λ.

Tính linh hoạt của plasmid đã dẫn đến chúng được sử dụng rộng rãi như là cácvectơ cho các thí nghiệm về thao tác trên gene. Tuy nhiên nó cũng có một số hạn chếđáng kể. Thứ nhất, hiệu quả mà plasmid được chuyển đến một tế bào vi khuẩn là rấtthấp. Phân tử DNA plasmid được đưa vào tế bào vi khuẩn phải được tế bào chấpnhận ( xem Chương 2 ), nhưng điều này không phải lúc nào cũng được đáp ứng.Plasmid được chuyển vào tế bào E. coli được cho là có mức độ thích nghi tốt nhất 1× 109 tế bào chuyển đổi có thể được tạo ra mội microgram phân tử DNA plasmid.Đối với một plasmid điển hình, 1 μg đại diện cho khoảng 1,5 × 1011 phân tử. Điềunày có nghĩa là các tế bào thu được ít hơn 1 % các phân tử DNA có sẵn. Thứ hai,năng suất của các plasmid để chuyển các đoạn lớn của DNA ngoại lai là rất hạn chế(Bảng 3.1). Hầu hết các plasmid trở nên không ổn định nếu kích thước của chúngvượt quá khoảng 15 kbp.Trong nhiều trường hợp, điều đó không thành vấn đề, nhưngtrong một số ứng dụng, điều quan trọng là phải tăng kích thước của các đoạn lên tốiđa trước khi tác dòng. Cần có các vector có khả năng tiếp nhận các đoạn DNA lớn.Các loại vector có như vậy được phát triển để khắc phục những khó khăn này.

3.3 λ VectorsVào đầu năm 1950, Andre lwoff đã miêu tả một đặc tính kì lạ của Escherichia coli.

Khi ông soi sáng một chút sự căng của những tế bào E.coli với một lượng ánh sáng cựctím vừa phải, vi khuẩn dừng hẳn sự phát triển và, sau đó khoảng 90 phút, vi khuẩn dunggiải và phóng thích ra nhiều mẫu virut, gọi là λ , bên trong môi trường trung gian(Figue 3.8)

Những virut, nhiều khi được gọi là thể ăn vi khuẩn hoặc đơn giản là thể thực khuẩn,có thể gây nhiễm tới các tế bào E. coli khác mà trước đây không gây nhiễm bởi nhữngthể thực khuẩn λ. Không chỉ tất cả những tế bào vi khuẩn chịu sự biến đổi phân hủy nàykhi bức xạ bằng con đường này. Tuy nhiên, vi khuẩn đầu tiên tiêu diệt thễ ăn khuẩn A,nhưng không thể phân hủy, là đặc điểm khác thường.Chống lại sự lây nhiễm bởi thểăn khuẩn A, những tế bào E. coli sẽ chịu đưng một trong 2 cách thức sau. Hoặc tế bàothủy phân và tổng hợp nên nhiều mảnh thể ăn khuẩn mới sẽ phóng thích vào trong xungquanh khoảng giữa, hoặc, một sự lựa chọn nữa , thể ăn khuẩn có thể thay đổi đột ngộtvào trong Dormant lifestyle mà thể ăn khuẩn DNA trở nên hợp nhất trong nhiễm sắcthể E coli bên trong nguyên nhân này là sự phân giải lifestyle được tiếp tục.

Page 95: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

94

Chu trình sống của thể ăn khuẩn λ được diễn tả trên biểu đồ hình 3.9.

Thực ra nó là vi khuẩn phân giải mà nó tỏ ra phân hủy nhanh chóng để chống lạibức xạ cực tím. Trong phòng thí nghiệm, thể ăn khuẩn λ phát triển và tái tạo đượckiểm tra trên đĩa petri (hình 3.10).

Page 96: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

95

Thể ăn khuẩn được pha trộn với những tế bào E. coli xem là 1 dung dịch mềm dẻoagar được gọi là top agar hỗn hợp được rót trên bề mặt dinh dương agar một lớpmỏng và được ủ cho vi khuẩn phát triển.

λ phát triển là nguyên nhân của cái chết (sự phân giải) của những tế bào E.colixung quanh vị trí tiêm nhiễm lúc ban đầu. Trong những vị trí được theo dõi trên đĩacó một chút hỗn độn những màng trong vải batit vi khuẩn. DNA λ có thể được lọc từnhững mẫu thể ăn khuẩn bao gồm có những màng này.

Di truyền học và phân tử sinh vật học ở cấp độ phân tử của thể thực khuẩn λ vừađược nghiên cứu rộng khắp – xa hơn là cung cấp thông tin về λ , độc giả được hướngdẫn bởi văn bản hết sức hoàn hảo bởi Mark Ptashne (Ptashne, 1992). DNA bao gồmthể ăn khuẩn là 1 phân tử sợi đôi thẳng với kích thước 48502 bp, đầu 5- và 3- kếtthúc của λ hệ gene có 12 cặp base mà sợi đôi được gọi là cố kết hay cos kết thúc.Những chuỗi này bổ sung và có thể được thấu với một vài thứ khác tới dạng 1 phântử sợi đôi mạch vòng (hình 3.11). Chức năng liên quan tới gene của λ thường đượctập hợp lại với nhau tạo nên hệ gene λ loại trừ 2 gene điều hòa dương N và Q, nhữnggene bên trên phía bên tay trái của bản đồ gene quy ước mã hóa cho protein đầu vàcuối của mảnh thể ăn khuẩn.

Page 97: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

96

Theo sau nó là những gene mà sản phẩm protein liên quan với sự tái tổ hợp vàquá trình hoạt hóa thực khuẩn của nhiễm sắc thể thể ăn khuẩn được chèn vào bêntrong nhiễm sắc thể chủ và được tái tạo ổn định như là tiền thể ăn khẩn. Phía bên tayphải của bản đồ gene có liên quan đến sự điều chỉnh bản sao và tiền ăn khuẩn nhiễmvào cho tới lần thứ 2 ( N, cro,cl), theo cùng là những gene cho sự tổng hợp DNA,chức năng điều chỉnh chậm trễ (Q) và sự phân hủy của những tế bào chủ.

Sự hiểu biết khá lớn của chúng ta về thể thực khuẩn λ và những con đường mà nóphân hủy và phân giải chu trình sống được điều khiển vừa được tạo nên λ một vectorlý tưởng để mang những mảnh DNA ngoại bào. Lợi thế chủ yếu của λ căn cứ vàonhững vector ngoài bào plasmid có khả năng mà thể ăn khuẩn có thể xâm nhiễm vàotế bào E.coli. Khi chúng ta thực sự có 1 buổi thảo luận, sự biến nạp DNA plasmid vàotrong vi khuẩn là 1 quy trình không có hiểu quả, sự xâm nhiễm λ là một con đường cóhiệu quả để đưa DNA vào trong tế bào vi khuẩn.

Để nghiên cứu làm thế nào mà λ có thể được lợi dụng như là một vector, thật làquan trọng để có 1 hiểu biết cơ bản về chính thể ăn khuẩn. Thể ăn khuẩn λ lây nhiễmvà phân giải xảy ra được định rõ trong trong từng buớc. sự lây nhiễm xảy ra như làkết quả của sự hút bám của mảnh thể ăn khuẩn λ tới tế bào vi khuẩn bằng việc kếthợp với receptor maltose. Bộ gen DNA của λ được tiêm nhiễm vào trong tế bào vàhầu như gửi thông tin ngay lập tức. ngay tại điểm này nó có thể xâm nhập bằng 1trong 2 con đường. Con đường Lýogenic. DNA thể ăn khuẩn trở thành hợp nhất với hệ gen vi khuẩn

tái tổ hợp via tương đồng giữa attP và khu vực hệ gene attB vi khuẩn) và tái tạo cùngvới DNA của vi khuẩn. di chứng DNA tiền thực khuẩn kết hợp cho tới khi nó gâyra việc xâm nhập bằng con đường phân giải

Page 98: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

97

Con đường phân giải. Số lượng to lớn của những mảnh thể ăn khuẩn (protein vàDNA) xảy ra mà cuối cùng dẫn đến sự phân giải tế bào.

Sự giả quyết khi sự phân giải hay phân huỷ xảy ra là kết quả của hoạt động củaprotein cII, Hoạt tính của CII thì phụ thuộc vào bản sao của chất ức chế cI. Và một vàigene phụ thuộc vào sự hoà hợp với DNA thể ăn khuẩn bên trong nhiễm sắc thể E.coli.hoạt tính cII là kết quả sự chấp nhận con đường phân giải , trong khi cII không hoạt tínhkết quả trong con đường phân huỷ cũng được kéo theo.

Protein cII thì tương đối không bền và dễ bị ảnh huởng tới sự phân tách và pháhuỷ của protease vi khuẩn. Những điều kiện của môi truòng ảnh huởng tới hoạt tínhcủa những protease này. Khi phát triển ở mức trung lớn, ví dụ , proteases có hoạtđộng chung , giống như cII bị suy biến và λ phân giải xảy ra.

Dưói những điều kiện của E.coli starvation , protease ít thiết thực và cho nên λ sẽ cónhiều sự phân giản thường xuyên hơn Cách hoạt động này rất có ý nghĩa cho tế bào thiếuđới này sẽ ít cấu thành thiệt suy yếu để tạo nên những mảnh thể ăn khuẩn mới.

Con đường phân huỷ được mô tả bởi 1 chuỗi những bản sao xảy ra mà sản xuất sựkhác biệt của nhưng protein mà phụ thuộc vào sự tái tạo ra DNA thể ăn khuẩn và sảnphẩm của những mảnh thể ăn khuẩn mới. Bản sao sớm bản sao của gene N và cro xuất hiện. bản sao này được đưa ra để

ngăn cản bởi sản phẩm của gene cI và trong 1 quá trình phân giải sự ngăn cản này làcơ bản của sự miễn dịch lần hai Bản sao chậm trễ sớm. bản sao protein N kêt shợp với RNA polymerase vi khuẩn

và đẩy mạnh bản sao của gene thể ăn khuẩn cuộn tròn vào trong bản sao DNA Sự tái tạo. sự tái tạo lớn tiến đến 1 đơn khởi nguyên của khu vực tái tạo. sự tái

tạo chậm trễ dẫn đến via 1 chu trình lăn cuôn tới sản xuất long concatamer của DNAthể ăn khuẩn mà nó kết hợp với những thể ăn khuẩn khác tại những vị trí cosBản sao trễ. Sản phẩm protein của gene cro che lấp đi mức độ quan trọng và sau

đó dừng lại ở bản sao sớm. sản phẩm của gene Q hoạt hoá bản sao, đưa đến kêt quảsản phwmr protein cần đến cho đầu và đuôi của mảnh thể ăn khẩun truởng thành, vànhững thể ăn khuẩn đó phụ thựôc vào sự phân huỷ tế bào vi khuẩn

Cuối cùng, tập hợp thể ăn khuẩn mang đến khi 1 đơn vị chiều dài của DNA đượcmang vào tập hợp đầu bởi sự phân tách concatameric DNA tại vị trí cos. Đuôi thìđược thêm vào và những mảnh truởng thành thể ăn khuẩn được hoàn tất. Cùng với sựphân huỷ tế bào , khoảng 100 mảnh thể ane khuẩn tổng hợp mới được phóng thích từ1 tế bào lây nhiễm đơn vi khuẩn..

Wild-type λ DNA bao gồm một vài vị trí nhận ra enzyme hạn chế khác thườngbên trong những mảnh DNA ngoại lai có thể được nhân vô tính, và do vậy mà nókhông hoàn toàn thích hợp như là 1 vector để mang nhiều chuỗi. thêm vào đó, sựgắn kết của DNA vào trong λ thể ăn khuẩn có kích cỡ giới hạn..

Khả năng gắn kết sẽ chỉ mang đến với những mảnh DNA tương ứng giữa 78 và105 % so với kích thuớc của hệ gene wild – type ( 37 – 51 kbp). Những giới hạn đạtra hạn chế gay gắt với số lượng DNA mà có thể n\tạo dòng trong hệ gene thể ăn

Page 99: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

98

khuẩn. Hai luận điểm quan trọng, tuy nhiên, giả thiết đưa ra mà λ có thể phù hợp nhưlà vector tạo dòng.

Đầu tiên nó được xác định sản phẩm gene phụ thuộc vào sự tái tổ hợp có thể bịloại bỏ bởi hệ gene λ và phân huỷ chu trình sống có thể vẫn đựoc hoàn thiện vànhững mảng có hình thái, DNA còn lại, thường nhắc đến như ở bên tay trái hay taiphải của hệ gene λ , khả năng có điều kiện tất cả chức năng tất yếu cho cong đưòngphân huỷ mang tới. Điều thứ hai, tất nhiên mang lại những enzyme giới hạn bởinhững vị trí được nhận ra có thẻ được được loại trừ mà không có chức năng gene quáít, mà cho phép sự phát triển của vector với vị trí duy nhất cho sự găn vào của DNAngoại bào. 1 vector có thể theo cách đó được xây dựng mà nó thiếu những gene phụthuộc vào sự tái tổ hợp, và vì vậy mà có thể chỉ nhập vào chu trình phân giải, nhưngcó khả năng mang nhiều DNA lớn ngoại bào thêm vào. Hai buớc cơ bản của vectorvừa được phát triển:Vector thêm vào – DNA được thêm vào trong 1 enzyme giới hạn nhận biết vị trí cắtVector thay thế - DNA ngoại bào thay thế cho những mảnh DNA (mảnh nhồi) của

vector

Sự thuận lợi của vector thay thế mà nó có khả năng mang nhưng đoạn DNAlớn. ví dụ, λEMBL4 có 1 vector 42 kbp mà nó bao gồm có 14 kbp DNA đệm giữa bêntay trái và phải của λ. Sự gắn chặt chỉ của nhửng chủng λ sẽ tạo ra 1 hệ gene λ 28kbp.Cái đó quá nhỏ để xếp vào trong 1 mảnh λ . sự thêmvào DNA ngoại bào giữa 2 chủngλ tuy nhiên hệ gene đạt tới kích cỡ gói gọn. Giới hạn kích thuớc gói gọn là cách thức

Page 100: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

99

mà λEMBL4 có khả năng lưu giữ những mảnh DNA ngoại lai khoảng chùng kíchthuớc 23kbp ( hình 3.12)

Giới hạn kích thước của gói λ như vậy cung cấp 1 bộ máy chắc chắn để DNA ngoạibào được thêm vào giữa chủng λ tới dạng tái tổ hợp. Một vài kế hoạch cơ bản khác đểtìm ra để nhận dạng những thể ăn khuẩn λ tái tổ hợp..Sự khử của gene cI. Một vài vector thể ăn khuẩn λ ( e.g λgt 11) có duy nhất

enzyme cắt giới hạn nhận dạng những vị trí cắt chứa đựng vị trí gene cI. Những thể ănkhuẩn mà gene cI phá vỡ bởi sự thêm vào DNA ngoại lai có 1 thay đổi hình thái, mànhững mãng tạo ra xuất hiện “ clear” khi kháng lại sự hỗn độn. tấm chắn của loại nàylà kĩ thật khó và phụ thuộc vào khả năng kết nối kỉ năng trên từng phần của nguờiquan sát.Tấm chắn blue – white. Những vector ăn khuẩn λ ( e.g. λZAP) được xây dựng để

chứa đựng gen lacZ giống hệt nhau của the α-fragment và β -galactosidase. Tấm chắncho những thể ăn khuẩn tái tổ hợp có thể sau đó được hình thành trong tế bào E coliNhanh chóng từ the ω-fragment của β –galactosidase trong 1 con đường giống nhau tạonên tấm chắn tái tổ hợp trong pUC base plasmid. Một lựa chọn là hệ gene λ được tạora, vấn đề là làm thế nào để đưa DNA vào trong vi khuẩn mà nó có thể tái tạo lại trongE. coli ( hình 3.13), bình thưòng gói gọn trong vivo của λ DNA bao gồm đầu tiên làmpre-head.

Một đơn vị chiều dài của DNA λ sau khi được thêm vào bên trong pre- head , vớiđơn vị chiều dài chuẩn bị bởi sự phân chia của hệ gene λ concatamerized tại những vịtrí xung quanh. Một protein capsid thứ yếu D sau khi thêm vào trong pre – head đểhoàn thiện đầu chín, và những sản phẩm của những hệ gene khác đáp ứng như là

Page 101: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

100

protein chính yếu, bảo đảm sự liên kết của những đuôi đã hàn thành với dầu hoànthành. Gói gọn λ của hệ gene tái tổ hợp có để xảy ra trong in vitro bằng cách lợi dụng2 đoạn E.coli mà chống lại λ phân giải kìm hãm những điểm khiếm khuyết khác nhaugói gọn trong cô đưòng này.

Một điểm khuyết trong sản xuất protein E, kết quả từ một sự thay đổi t\bên tronggene E, ngăn cản pre-head thành dạng thẳng BHB2688. một sự thay đổi trong gene Dcản trở sự thay đổi của pre-head, với DNA kết thúc, bên trong dầu hoàn thiện trongstrain BHB2690. thành phần của BHB2699/BHB2690 dung giải nhỏ nhất, tuy nhiên,hoàn thành một vài thứ thiếu hụt khác nhau và cung cấp tất cả những sản phẩm góigọn chính xác ( hình 3.13 ). Do đó, hệ gene λ tái tổ hợp có thể đựoc tạo nên bằng invitro và gói gọn trong mảnh thể ăn khuẩn bình thường truớc khi tái sinh và nhân lêntrong tế bào Ecoli.3.4. Các vector cosmid

Chỉ những đoạn DNA phù hợp cho in vitro mới được chuyển vào thể thực khuẩn λtại 2 điểm cos trong chuỗi trình tự ở khoảng 37 – 51 kbp. Vector cosmid đã được pháttriển nhờ quan điểm này, và nó giống plasmid ở chỗ được đưa vào trong thể thựckhuẩn λ ở điểm cos (Collins and Bruning, 1978). Hình 3.14 cho thấy toàn bộ cấu trúccủa một vector cosmid và một hệ thống tạo dòng vô tính để chuyển DNA ngoại lai.Cũng như plasmid, cosmid gồm một bản sao và một marker lựa chọn. Cosmid cũngchỉ có duy nhất một enzyme giới hạn để nhận biết điểm để chèn các đoạn DNA vào.Sau khi phản ứng chuyển vừa xảy ra, thể λ mới sẽ được đưa vào tế bào E.coli. DNAđược chuyển vào cũng giống như các λ DNA bình thường và nó sẽ truyền đạt thông tinbổ sung cho các điểm cos. Sẽ có hiện tượng thiếu hụt các chuỗi λ có nghĩa, tuy nhiên,những đoạn λ chuyển sẽ không chuyển sang giai đoạn này. Thông tin trong DNA sẽđược bảo vệ trong tế bào E.coli. Do vậy sự chọn lọc các thể biến dị sẽ dựa trên cơ sởcủa sự kháng thuốc kháng sinh và khuẩn lạc của vi khuẩn sẽ có dạng chứa các cosmidtái tổ hợp. Khi tiền thể thực khuẩn λ có thể chèn vào khoảng 37 – 51kbp, và hầu hếtcosmid có kích thước khoảng 5kbp thì đoạn DNA ở khoảng 37 – 41 kbp có thể đượctạo dòng thành những vector. Đây là một tính chất quan trọng so với việc tạo dòng từchính các vector λ

Cosmid, giống plasmid, rất bền vững, tuy nhiên phải chèn vào một đoạn DNA lớnđiều này có ý nghĩa trong việc bảo vệ vector trong tế bào vi khuẩn. Các chuỗi DNAlặp lại thường gặp ở các DNA của sinh vật eukaryote, và sự tái cấu trúc của DNA cóthể dẫn đến sự tổ hợp lại các trình tự lặp lại của DNA chèn vào cosmid. Khó khănchính khi làm việc với cosmid là những sản phẩm tuyến tính, chuyển đoạn DNA vàocosmid và chèn nhiều vị trí cùng lúc. Hai vấn đề cơ bản đặt ra:

Các phản ứng chuyển vào cosmid và chèn DNA, giống như những gì đã trìnhbày trong hình 3.14, sẽ tạo ra những phân tử DNA vòng không có khả năng tham giavào phản ứng “bao gói” in vitro.

Có nhiều hơn một phân tử DNA được lồng vào sẽ gắn vào giữa đoạn DNAcosmid. Điều này khiến cho cấu trúc DNA được lồng vào có vẻ sai khác.

Page 102: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

101

Những khó khăn này có thể được khắc phục với việc cắt cosmid với 2 enzyme giớihạn khác nhau bằng việc tạo ra các điểm giới hạn trái và giới hạn phải để không kết hợpvới vị trí nào khác (Ish-Horowicz and Burke, 1981). Enzyme phosphastase sẽ tác độnglên DNA chèn để đảm bảo những đoạn lồng vào sẽ không chèn vào DNA của cosmid.3.5 M13 vectors

M13 và các họ hàng của chúng là f1 và fd là thực khuẩn E.coli, dạng sợi. M13 làmột lysogenic phage giống đực đặc trưng (male – specific) – thực khuẩn thể sinh ravirus phân hủy vi khuẩn khi bị kích thích. Hệ gene của chúng là một DNA chuỗi đơndạng vòng dài 6407 bp (hình 3.15). Thực khuẩn thể M13 (M13 phage) có kích thước900 * 9 nm, chứa một vòng đơn phân tử DNA (goi là chuỗi +). M13 xâm nhập vào vikhuẩn qua “cảng” là tiêm mao. Phage gắn một đầu vào tiêm mao rồi chuỗi đơn DNAcủa chúng xâm nhập vào vi khuẩn ( hình 3.16). Chuỗi đơn nhân đôi một cách nhanhchóng tạo chuỗi kép ( relicative form, RF) bằng cách tổng hợp mạch DNA bổ sung(mạch -) sử dụng DNA polymerase của vi khuẩn. Dạng RF của phage tăng lên theocấp số nhân, khoảng 100 phân tử RF xuất hiện trong vi khuẩn. Quá trình phiên mã củahệ gene virus sản xuất những protein cần thiết cho sự lắp ráp một virus mới. Chuỗiđơn mã hóa protein (protein mã hóa bởi gene 2 ) thúc đẩy sự sao chép RF DNA chỉ có

Page 103: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

102

trên một mạch đơn của DNA virus( mạch +). Các chuỗi phân tử DNA mạch đơn đượclắp ráp trong các cơ thể virus mới rồi được giải phóng khỏi tế bào mà không phá hủytế bào đó. Một tế bào vi khuẩn giải phóng khoảng 1000 phage trong một vòng đời củanó. Sự xâm nhiễm của thực khuẩn thể M13 không gây chết tế bào. Tế bào E.colikhông bị phá hủy nhưng chúng phát triển chậm lại do phải gánh vác việc tổng hợp cácbộ phận của phage. M13 nguyên thủy của quá trình sao chép (gọi là f1 ori) chứa 2chuỗi DNA riêng biệt xếp chồng lên nhau có nhiệm vụ kiểm sóat quá trình sinh tổnghợp DNA. Hai vị trí – f1 initiator (khởi đầu) và f1- terminator (kết thúc) là dấu hiệunhận biết sự bắt đầu và kết thúc sinh tổng hợp DNA. Vị trí khởi đầu được nhận biếtbởi protein tổng hợp từ gene 2 – nằm trên mạch + trong RF DNA. Ở vị trí này, vòngDNA bắt đầu sao chép theo một chiều nhất định và kết thúc ở vị trí f1 terminator cũngđược nhận biết bởi protein mã hóa bởi gene 2.

Sự chuyển đổi giữa dạng mạch đôi RP và mạch đơn (+) của hệ gene của M13 làmnảy ra ý tưởng ứng dụng chúng làm vector. Chúng ta sẽ theo dõi ở chương sau, DNAmạch đơn tổng hợp từ phage rất thuận tiện trong kĩ thuật chuyển gene đột biến invitro(chương 7) và DNA sequencing (chương 8). Khác với λ, M13 không có “ vùng khôngcần thiết” có thể bị hủy trước khi gắn DNA ngoại lai. Nhưng lại có vùng intergenic(vùng hoạt động) giữa vùng khởi đầu của quá trình lặp và gene 2( hình 3.15) trong đóđoạn DNA ngoại lai được chèn vào. Vector M13 được phát triển cuối thập niên 70 khigene lacZ (mã hóa α- peptide của β-galacttosidase ) được chèn vào hệ gene M13

Page 104: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

103

(Messing và cộng sự, 1977). Sau đó, polylinker tương tự và những đoạn α–peptide nhưdòng pUC plasmid được chuyển gene vào hệ gene M13, vùng nhận biết của enzyme cắtgiới hạn bị loại bỏ (Yanisch-Perron, Vieira and Messing, 1985; Norrander, Kempe andMessing, 1983). Dạng RF của vector M13 có thể được xử lí qua các bước chuẩn bị nhưDNA plasmid và DNA ngoại lai được chèn vào như plasmid thông thường.

Những ứng dụng đặc trưng của vector M13 giúp chúng được sử dụng như nhữngphương tiện hình thành chuỗi đơn DNA. Một đoạn DNA ngoại lai được tạo dòng vôtính trong M13, một lượng lớn chuỗi đơn sau đó được cô lập dễ dàng từ các phagetrưởng thành xuất ra từ tế bào vi khuẩn E.coli. Khó khăn chính ở dạng vector này làchúng sẽ không ổn định khi đoạn DNA ngoại lai gắn vào lớn hơn vài kilobases.(Zinder and Boeke, 1982).

Page 105: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

104

3.6 PhagemidsPhagemids là những plasmid chứa đọan phage f1 gốc của sự sao chép để sinh

mạch đơn DNA. Phagemids thường là những đoạn plasmid nhỏ vì vậy chúng có khảnăng tiếp nhận những đoạn DNA lớn hơn chèn vào đó hơn vector M13-based.Phagemids lần đầu tiên được phát triển vào đầu những năm 1980, khi người ta khámphá ra rằng sự thêm vào của bản gốc f1 khi tái sinh có thể sao chép thành pBR322 đểsinh mạch đơn DNA (Dotto và Horuichi, 1981; Dotto, Enea và Zinder, 1981). Sự saochép bản gốc f1 không đủ để điều khiển sự sản sinh mạch đơn DNA, nhưng nếu mộtgiống vi khuẩn mang phagemid trong cơ thể bị nhiễm độc bởi cấu trúc wild-type M13hoặc f1 helper phage, thì sự sản sinh mạch đơn phagemid DNA sẽ xảy ra. Cácphagemid mạch đơn DNA sẽ được đóng thành các hạt virus và tiết vào môi trườngxung quanh theo cùng một cách mà các hạt thực khuẩn M13 được sản sinh. Ngoài ra,người ta khám phá rằng việc nhân bản bản gốc f1 trong việc định hướng đảo ngược sẽdẫn đến việc sản sinh các mạch đối diện của DNA (Dente, Cesavent and Cortese,1983). Vì vậy, mạch đơn DNA đại diện hoặc mạch của sợi nhân bản có thể sản sinhsau khi nhân bản vô tính thành một vector phagemid phù hợp. Những phagemids cómột điểm là, khi phage hỗ trợ vắng mặt, sợi đôi DNA được tách ra như một plasmidbình thường. Hơn nữa, sự thiếu các gene bổ sung của thể thực khuẩn mà các vectorcần mang nghĩa là kích thước nhỏ của chúng có sự gia tăng về công suất để mangnhững đoạn DNA bên ngoài.

Những phagemids khác đã được phát triển để tận dụng lợi thế từ những khía cạnhkhác nhau của plasmids, λ phage và M13 phage. Chúng ta thấy rằng sự sao chép bảngốc f1 đều có cùng khởi đầu và kết thúc. Trong bộ máy di truyền của thể thực khuẩnM13, những giải trình tự này trùng lập với nhau, như vậy việc sao chép lại sẽ bắt đầuvà kết thúc sau khi đã hình thành bộ máy di truyền hình vòng. Những phần tử khởi đầuvà kết thúc sẽ được phân cắt riêng biệt để xác định những điểm khởi đầu và kết thúccho việc sao mã DNA. Một loại vector λ bổ sung, λZAP, được xây dựng như vậy phíabên trái và phải của cánh tay λ sẽ được kết nối thông qua giải trình tự DNA của mộtphagemid bắt đầu với f1 khởi đâu và kết thúc với f1 kết thúc (Short và cộng sự, 1988).Loại Vector này (hình 3.17) có khả năng thực hiện chức năng của một thể thực khuẩnλ, ví dụ, xây dựng cấu trúc thư viện cDNA. Tuy nhiên, DNA ngoại bào có thể được cắttừ λ phage dưới dạng một plasmid sau khi dã gây nhiễm lần 2 bằng thể thực khuẩnM13. λZAP chứa đựng tất cả những giải trình tự λ DNA cần thiết cho sự tăng trưởngcủa các yếu tố gây phân hủy (lytic), và giữa các sợi DNA này là một giải trình DNAcần thiết cho sự sao mã plasmid và chọn lọn (ColE1 ori và AMPR). Thêm vào dó,λZAP chứa gene lacZ và nhiều mạng lưới tự nhân bản với cùng một hình dáng tươngtự với pUC plasmids. Giải trình tự plasmid trong vector bắt đầu với f1 khởi đầu và kếtthúc với f1 kết thúc. Vector mang DNA ngọai bào có thể được chọn lọc bởi bộ lọcxanh-trắng của màng λ và DNA bổ sung có thể bị cô lập dưới dạng của một plasmidkhi vi khuẩn chứa các thể thực khuẩn λ bị nhiễm bởi phage f1 hỗ trợ. Mạch đơn DNAsẽ phát “thông tư” và sẽ được đóng gói như một M13 – như một thể thực khuẩn và tiếtra từ tế bào. Sự ra đời của thể thực khuẩn M13 sẽ hợp thành chủng F_E.coli và việc

Page 106: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

105

chọn lọc trên các ampicillin sẽ dẫn đến việc hình thành một cụm chứa những plasmidtái tổ hợp, để rồi sau đó có thể bị cô lập như những plasmid mạch đôi.

3.7 Nhiễm sắc thể nhân tạo.Hạn chế chủ yếu của hầu hết các vector mà chúng ta đã nghiên cứu cho đến nay là

giới hạn về kích thước của DNA cần tạo dòng. NST của sinh vật nhân chuẩn chứahàng trăm hoặc hàng ngàn gene, cùng với DNA những yếu tố cần thiết cho sự ổn địnhvề chức năng của NST như telomeres và centromeres. Telomeres, trong đó bao gồmDNA và protein, được đặt ở cuối NST và bảo vệ chúng khỏi bị hư hỏng. Centromeres(tâm động) là những phân đoạn DNA lặp lại rất cần thiết cho sự sắp xếp của NSTtrong suốt quá trình phân bào.

Các vector phải được thiết kế hợp lý sao cho nhân bản được nhiều đoạn DNA, dođó, để khôi phục sự sao chép NST một cách chủ động trong các phân đoạn DNA cóthể dung kĩ thuật nhân bản vô tính. Nhân bản vô tính theo cách này cũng tương tự nhưnhân bản vô tính trong phage λ – với sự tái tạo lại của các phân tử DNA – ngoại trừcác DNA ngoại lai có thể được nhân bản vô tính với tỉ lệ cao hơn.3.7.1 YACs

Các NST nhân tạo của nấm men (YAC). Vector YAC cho phép tạo dòng, trong cáctế bào nấm men, các đoạn DNA ngoại lai có thể có kích thước tới 500 kbp. Trongnhững vector chứa các thành phần quan trọng của NST, bao gồm cả các thành phầnsau đây.

Page 107: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

106

A yeast centromere (CEN4). Trình tự của tâm động, đảm bảo sự chia đôi và đi về 2cực của tế bào như tâm động, được quy định bởi một đoạn DNA với kích thước 125bp. Chuỗi hoàn chinh bao gồm 3 yếu tố: một phân đoạn dài 78-86 bp với hơn 90%lượng AT, một đoạn bảo tồn ở một bên và một đoạn bảo toàn ngắn ở bên khác (ghinhận của Clarke – 1990).Yeast autonomously replicating sequence (ARS1). Trình tự sao chép tự chủ của

nấm men, là yếu tố cần thiết của quá trình nhân bản trong tế bào nấm men từ sự tự saochép của NST ở nấm men.Yeast telomeres (TEL). Trình tự đầu cuối của NST, Telomeres là trình tự đặt biệt

(5_-TGTGGGTGTGGTG-3_) có mặt ở các đầu của NST trong nhiều bản sao và là cầnthiết cho sự tái tạo và duy trì NST.Genes for YAC selection in yeast. Các gen phù hợp với sự lựa chọn của YAC.

Vector có một bản sao chức năng của URA3, một gen liên quan đến sự sinh tổng hợpuracil, và TRP1, một gen liên quan đến sự sinh tổng hợp tryptophan, đó là sự lựa chọncủa các tế bào nấm men có mang vector.Bacterial replication origin and a bacterial selectable marker. Vi khuẩn tái tổ hợp

và vi khuẩn chuẩn di truyền. Để truyền các vector YAC vào trong các tế bào vi khuẩn,trước khi chèn vào hệ gen, các vector YAC thường chứa các ori ColE1 và các genkháng ampicillin giúp cho sự tăng trưởng và phân tích trong E.coli.

Hình 3.18. Cloning of very large DNA fragments into a YAC vector.

Page 108: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

107

Quá trình tạo dòng các đoạn DNA trong 1 YAC được thể hiện sơ lược trong hình3.18. Các YAC được cắt ở một vị trí xác định bằng một enzyme cắt giới hạn tạo thànhhai nhánh mà mỗi nhánh đều có 1 chuỗi telomere ở cuối. Một trong hai nhánh chứa 1trình tự sao chép tự chủ (ARS1), 1 trình tự trung tâm (CEN4) và có dấu chuẩn ditruyền (TRP1).

Nhánh khác chứa dấu chuẩn di truyền (URA3). Những đoạn DNA lớn (>100kbp)được nối giữa 2 nhánh (Anand, Villasante and Tyler-Smitu, 1989). Việc chèn cácDNA ngoại lai vào đã bất hoạt tRNA của gen SUP4, thể hiện chức năng tRNATyr trongDNA vector. Trong một ade2–ochre của tế bào nấm men, sự biểu hiện của SUP4 là sựhình thành các khuẩn lạc màu trắng, trong khi đó việc chèn các DNA ngoại lai sẽ thểhiện các khuẩn lạc màu đỏ (Burke, Carle and Olson, 1987). Tế bào nấm men được độtbiến ở gen sản phẩm ADE2 (mã hóa cho các enzyme phosphoribosylamino-cacboxylaza-imidazol) tạo ra nhiều con đường sinh tổng hợp adenine, làm chúng tíchtụ trong không bào. Sự tích tụ này đã tạo cho tế bào có màu đỏ. Các YACs tái tổ hợpđã biến đổi một loại nấm men mà trong đó có sự sai sót ở các bản sao NST của các genura3, trp1 và ade2. Quá trình biến nạp này đã được xác định bằng các khuẩn lạc pháttriển bất định trên những vùng thiếu uracil và tryptophan. Điều này đảm bảo rằng cáctế bào đã nhận được một nhiễm sắc thể nhân tạo có cả hai telomere (vì sự bổ sung của2 yếu tố dinh dưỡng) và nhiễm sắc thể nhân tạo có chứa DNA chèn (vì tế bào có màuđỏ). Có những khó khăn liên khi làm việc với YACs. Một số trong số này là được liệtkê dưới đây. Rất nhiều phân tử DNA lớn rất yếu và dễ gãy, vấn đề đầu tiên là sắp xếp lại. Theo ước tính có khoảng 10-60% bản sao được lưu trong thư viện bộ gen là thể

khảm, tức là từ các vùng khác nhau của bộ gen trở thành một bản sao YAC đơn(Green và cộng sự, 1991.). Dòng vô tính có xu hướng không ổn định, với các DNA ngoại lai thường bị biến

mất. Trình tự DNA vốn có lặp lại rất hiếm trong hệ gen của nấm men, và với việc chèncác trình tự DNA của người sẽ làm tăng tầng số tái tổ hợp trong YAC. Điều này có thểlàm cho YAC không ổn định. Thật thú vị, tuy nhiên, các vector YAC lớn hơn ổn địnhhơn so với các vector ngắn, do đó nó được chọn để tạo các DNA lớn (Smith, Smythand Moir, 1990). Có một tỷ lệ lớn các YAC nguyên chất mất trong suốt quá trình tăng trưởng Thật khó khăn để tách các YAC từ các NST vật chủ khác vì kích thước của

chúng quá giống nhau. Việc tách chúng đòi hỏi kĩ thuật phức tạp pulsed-field gelelectrophoresis (PFGE) (điện di trên gel với trường dao động). Sản lượng của ADN là không cao khi YAC được phân lập từ tế bào nấm men.

3.7.2 PACsĐể khắc phục một số vấn đề liên quan đến sử dụng cosmid hoặc hệ thống YAC,

một phương pháp để nhân bản và đóng gói các đoạn DNA bằng cách sử dụng thể thựckhuẩn P1đã được phát triển để cung cấp khả năng sao chép các đoạn DNA với kíchthước lớn từ 70-95 kbp. Thể thực khuẩn P1 có một bộ gen lớn hơn nhiều so với phage

Page 109: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

108

λ (trong khoảng 110-115 kbp), và vector cũng được thiết kế với các thành phần thiếtyếu để P1 kết hợp vào một plasmid (Ioannou, 1994.). Sau khi được đưa vào E. coli,thể thực khuẩn P1 hoặc có thể thể hiện chức năng lytic của nó, sản xuất 100-200 hạtthể thực khuẩn mới và thay thế các hạt thể thực khuẩn bị hỏng, hoặc các hạt thểkhuẩn bị hỏng có thể kiềm chế chức năng lytic của nó, và bộ gen của thể thực khuẩnđược thống nhất trọn vẹn, ổn định, bản sao plasmid thấp. Thể thực khuẩn P1có haiquá trình tái tạo – một để kiểm soát quá trình chọn dòng vi khuẩn có chứa DNA lytic,và một cái khác là để duy trì plasmid trong suốt quá trình tăng trưởng không lytic.Trong chu kì không có lytic, các DNA thể thực khuẩn mới được tạo ra và được cắt taimột vị trí pac trước khi được chèn vào các phần tử thể thực khuẩn.

Các bản sao của đoạn DNA ngoại lai trong vector P1, hoặc NST nhân tạo của P1(PAC), được thể hiện trong hình 3,19. Các vector PAC được đồng hóa vớicác enzyme giới hạn ScaI và BamHI để tạo ra hai nhánh vector: một nhánh ngắnvà một nhánh dài. Những đoạn dài từ 70 – 95 kb đã bị tách ra và bị thắt giữa 2 nhánhcủa vector để tạo ra một loạt các phân tử dài. Nếu thắt giữa 2 nhánh ngắn, kết quả sẽtạo các phân tử không có P1 gốc và cũng không có gen KANR, và sẽ không khả thi.Nếu ở cả hai nhánh dài thì tại đó đều không có vị trí pac, và quá trình đóng gói cácphage không xảy ra. Quá trình tái tổ hợp chỉ khả thi khi chèn các trình tự vào mộtnhánh ngắn và một nhánh dài. Phage P1 sử dụng 1 “head-full” để đóng gói và có thểchứa một lượng DNA dài khoảng 110 – 115 kbp.

Điều này có nghĩa rằng khi chèn bất kì một đoạn có chiều dài hơn 90 – 100 kbpDNA đóng gói sẽ bị cắt trước khi loxP được chèn vào phage, và các phân tử này sẽkhông thể truyền được thông tin khi đưa vào các vật chủ. Sau khi tiêm vào các tế bàovật chủ cre+ E. coli, các protein sẽ truyền thông tin đến các vị trí loxP trên DNA, vàDNA sao chép bằng cách sử dụng các plasmid gốc. Các vector BamHi được đưa vàocác DNA ngoại lai, nằm trong gen sacB của vi khuẩn (mã hóa lavansucrase). Biểu hiệncủa gen này là hạn chế sự phát triển của tế bào E.coli trên sucrose. Do đó tăng sucrosegiúp việc lựa chọn các PACs. Sự lan truyền của các tế bào nấm men có chứa các PACtái tổ hợp trên các vùng có hàm lượng sucrose cho phép các khuẩn lạc phát triển.

Các PACs tái tổ hợp được duy trì như những plasmid trong thời gian E.coli sử dụnggen kháng kanamycin như một gen marker. Số lượng bản sao plasmid có thể được tănglên 25 lần bởi isopropyl β-D-thiogalactopyranoside (IPTG) đã kích thích promoter lackiểm soát quá trình tạo bản sao trong PAC tái tổ hợp.

Các phân tử DNA tái tổ hợp sau đó được tách plasmid bằng cách sử dụng cácphương pháp truyền thống. Bằng việc sử dụng hệ thống đóng gói DNA P1, hệ genDNA trong khoảng 70 – 95 kbp có thể dễ dàng nhân bản và thao tác. Các vector đượcthiết kế để cho phép tạo ra các PACs có thể chứa các đoạn chèn từ 130 – 150 kbp. Cácưu điểm chính của phương pháp đóng gói DNA P1. Các đoạn DNA có kích thước lớn cũng có thể được chèn vào các vector. Không có sự sắp xếp lại hay sự xóa các DNA bị methyl hóa do sử dụng hạn chế

các giống vật chủ. DNA tái tổ hợp có thể dễ dàng phục hồi như plasmid.

Page 110: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

109

Hình 3.19. Việc tạo dòng trong vector PAC. Các vector PAC chứa plasmid của vikhuẩn P1 và replicons lytic, cùng với một pac cho phép lắp ráp DNA vào các phage.Ngoài ra, các vector có thành phần pUC và các gen kháng ampicillin cho quá trìnhtruyền đạt thông tin và lựa chọn các vector cho chính nó.Những trình tự bị mất trongPAC tái tổ hợp. Các DNA cần tạo dòng được chèn trong các gen sacB và đóng góitrong ống nghiệm để đưa vào phage P1.3.7.3 BACs

Nhiễm sắc thể nhân tạo của vi khuẩn (BAC) được tạo ra từ những kiểu plasmidF (Shizuya và cộng sự, 1992). BAC có khả năng mang khoãng 200kbp chuỗi DNAđược chèn vào và điểm gốc nhân tố F của sao mã (oriS) duy trì cấp độ của nó khoảng 1

Page 111: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

110

bản sao trên mỗi tế bào. thêm vào đó, BACs còn chứa 4 gene nhân tố F, là gene cầnthiết cho quá trình sao mã và duy trì số lượng bản sao, repE, parA, parB và parC. Hình3.20 mô tả cấu trúc toàn diện của một dạng BACs.

Ngoài các gene nhân tố F, pBeloBac11 cũng chứa một maker kháng kháng sinhcó thể được chọn (CAMR) và gene lacZ' chứa một dòng vô tính phức tạp cho screeningxanh da trời - trắng của các BAC chứa các trình tự DNA thêm vào (Kim và cộng sự,1996b). Ngoài ra, BAC chứa một vị trí cos (cosN) và một vị trí loxP.

Những vị trí này được dùng cho quá trình phân tách đặc biệt của các trình tựđược chèn vào chứa BAC trong suốt quá trình xắp xếp giới hạn. vị trí cosN có thểđược tách ra bằng cách dùng terminase alpha (Rackwitz, 1985), trong khi loxP đượctách bởi protein Cre với sự hiện diện của một oligonucleotide trình tự loxP (Abremski,1983). ngoài ra BAC được tạo ra chứa những vị trí chấp nhận những enzyme cắt giớihạn cực kì hiếm. ví dụ như I-Scel là một intron được mã hóa enzyme cắt giới hạn từ tythể của nấm men Saccharomyces cervisia (Monteilhet và cộng sự, 1990).

Hình 3.20 Cấu trúc của vector BACTrình tự chấp nhận nó (5'- TAGGGATAACAGGGTAAT-3') không xuất hiện trong

hệ gene người và do do rất hữu ích cho quá trình tuyến tính hóa vector không có sựtách ra của các đoạn DNA được chèn vào.

DNA được thêm vào một BAC xuất hiện rất bền vững, nó có thể tồn tại nguyên vẹntrong vòng hàng trăm thế hệ tế bào E. coli và xuất hiện ít hơn trong các quá trình táixắp xếp và hủy bỏ khi duy trì trong sự tái tổ hợp của tế bào chủ E.coli khiếm khuyết.trở ngại chính trong việc sử dụng các vector BAC là chúng hiện diện chì một hoặc là 2bản sao. điều náy có thể gây rắc rối trong quá trình phân lập và screening.3.7.4 HACs

Nhiễm sắc thể nhân tạo của người (HAC) đã được tạo ra và có thể tồn tại trongnhững khoảng thời gian dài trong những tế bào nuôi cấy. như chúng ta đã biết, 3 yếu tốđược yêu cầu cho sự bền vững của nhiễm sắc thể - trung đoạn, phần kết thúc và mộtorigin cho quá trình sao mã. đoạn cuối trong nhiễm sắc thể người lặp lại trình tự ( 5'-

Page 112: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

111

TTAGGG-3'), nhưng nó khác với trình tự tương đượng của nấm men và cả 2 khôngthể thay thế cho nhau. một YAC sẽ không có chức năng như một Nhiễm sắc thể trongcác tế bào người. để giúp đỡ trong quá trình phân lập trung đoạn và các trình tự origincho quá trình sao mã ở người, các HAC được tạo ra có thể thay đổi và duy trì trong cáctế bào người (Henning và cộng sự, 1999). phương pháp này nhận ra các đoạn lặp lạiphức tạp của một trình tự DNA có 171 bp (được gọi là một đoạn lặp vệ tinh alpha)được chứa trong một đoạn DNA có 3 triệu cặp base của nhiễm sắc thể X có nhữngchức năng như một trung đoạn (Schueler và cộng sự, 2001). tính chất lặp đi lặp lại củanhững trình tự này làm cho chúng khó nghiên cứu và làm cho quá trình xác định trungđoạn của chính nhiễm sắc thể đó rất khó khăn.

Hình 3.21. Một NST nhân tạo ở người trong các tê bào nuôi cấy. Một vệ tinh alphatổng hợp chứa vi nhiễm sắc thể được hình thành bởi transfection của DNA vệ tinhalpha và các trình tự cuối từ các tế bào nuôi cấy. Một dòng vô tính được phân lập vàcho thấy chứa 1 HAC (mũi tên trên hình) tìm thấy từ DNA transfected và không từ sựcắt cụt của các nhiễm sắc thể nội sinh.

Hệ gene người chứa những gốc phức tạp cho quá trình sao mã. trung bìnhnhiễm sắc thể người chứa khoãng 150x106 bp DNA trong khi chức năng của enzymeDNA polymerase tối đa chỉ khoãng 3000 base được tái tạo mỗi phút. Quá trình sao mãđược bắt đầu tại một điểm riêng biệt, mỗi nhiễm sắc thể sẽ tách ra trong vòng 1 thángđể được sao mã, hơn lúc nó thật sự xảy ra. Những điểm gốc sao mã phức tạp ám chỉđến có nhiều nơi trên nhiểm sắc thể prokaryote nơi mà quá trình sao mã có thể bắt đầuvà quá trình sao mã diển ra sau đó với tốc độ nhanh hơn. Trình tự của điểm gốc sao mãthì thoái hoá, nhưng sự phát triễn của HAC cho phép một sự xắp xếp chính xác hơncủa những vùng này.

Các HAC có tiềm năng lớn như là công cụ cho cả các nghiên cứu cơ bản và cácphương pháp chữa bệnh trong y học. Các nhiễm sắc thể nhân tạo có thể điều khiển cácvector liệu phap gene với nhiều thuận lơi hơn các vector từ virus trước đó.

Chúng tồn tại như những thành phần thêm vào nhiễm sắc thể và vì thế sẽ khôngxuất hiện đột biến chèn vào.Chúng không giới hạn về số lượng DNA mà chúng có thểmang. Vì sự khác nhau giữa trạng thái của trung thể trong quá trình nguyên phân vàgiảm phân, chúng có thể được thiết kế không có chức năng trong phôi.

Những khả năng này vẫn còn trong tương lai và sẽ phụ thuộc vào sự hiểu biếthơn nữa về chức năng của nhiễm sắc thể.

Page 113: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

112

Chương 4POLYMERASE CHAIN REACTION

Những khái niệm chính: PCR là khuếch đại những trình tự DNA cụ thể in vitro. PCR cần có 2 mồi (primer), một trong hai mồi đó sẽ bổ sung cho mỗi mạch

DNA và một DNA polymerase. Những chu kì nóng và lạnh được lặp đi lặp lại nhiều lần sẽ làm khuếch đại đoạn

DNA ở giữa hai vị trí liên kết của mồi thành một số lượng lớn DNA tái bản.Kĩ thuật PCR khởi đầu vào giữa thập niên 1980 (Saiki và cộng sự, 1985; Mullis

and Faloona, 1987), không phải là không hợp lí khi nói rằng các tác động của PCR lênsinh học phân tử, khoa học pháp lí, chuẩn đoán các bệnh lí về gen ở người đã trở nênrộng mở hơn. Tự bản thân của quá trình này là một sự kéo dài cực kì đơn giản của chutrình sao chép DNA, nhưng nó sử dụng nhiều cách khác nhau để tạo nên nhiều sự nhânbản và thao tác trên DNA trong nhiều trường hợp thì dễ dàng và thích hợp hơn tronglần đầu tiên. Khái niệm đơn giản nhất thì PCR là sự sao chép lặp lại nhiều lần của mộtđoạn trên chuỗi DNA kép. Tiến trình này được trình bày sơ lược trong hình 4.1. Sự ưuviệt của PCR là do nó có khả năng nhân bản một số lượng lớn các bản sao từ một phânđoạn DNA cụ thể trong một thời gian ngắn. PCR cũng có thể khuếch đại nhanh chóngmột vùng nào đó trên phân tử DNA mạch đơn trong ống nghiệm để sinh ra một lượngđủ có thể được nhân bản, nối dài, hoặc phân tích bằng cách xác định giới hạn. Tác dụngcủa PCR đã được tôn vinh vào năm 1993 với giải thưởng Nobel hóa học cho KaryMullis cho sự đóng góp của ông với khoa học. Mullis đã viết về các phát minh thú vịcủa mình (Mullis, 1990) và có thể tìm thấy cuốn tự truyện thú vị của Mullis trên website giải Nobel (http://www.nobel.se/chemistry/ laureates/1993/mullis-autobio.html).PCR liên quan đến hai mồi là hai chuỗi oligonucleotide, thường có chiều dài khoảng 17đến 30 nucletide, cái mà nhận diện trình tự DNA mục tiêu để sao chép.

Một trong hai mồi có trình tự giống với một mạch DNA (sense - mồi xuôi)trong khi mồi còn lại thì có trình tự giống như chuỗi DNA còn lại (antisense - mồingược). Mồi xuôi sẽ liên kết, bổ sung bắt cặp với các base, với mồi ngược và bắt đầutổng hợp mạch DNA mới. Tương tự, mồi ngược cũng liên kết với mồi xuôi và tổnghợp mạch DNA mới của mồi xuôi mới. Chương trình PCR được chia làm ba giai đoạnriêng biệt, mỗi giai đoạn thực hiện ở nhiệt độ khác nhau (hình 4.1). Chu kì quá trìnhbiến tính – bắt cặp với mồi (hay còn gọi là lai) – kéo dài được lặp lại 20-30 lần để đạtđược mức độ khuếch đại mong muốn của một trình tự DNA cụ thể. Ba bước trong mỗichu kì như sau:

Biến tính: hai mạch của phân tử DNA được tách ra bằng nhiệt độ. Như chúngta đã biết trong chương 1, DNA có thể bị biến tính thuận nghịch bởi chu kì nóng vàlạnh. Bước này thường được thực hiện ở nhiệt độ là 94oC.

Bắt cặp với mồi (lai): hai mạch mục tiêu sau đó được làm lạnh với sự có mặtcủa các đoạn mồi oligonucleotide. Một mồi sẽ nhận diện và gắn vào mạch DNA mục

Page 114: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

113

tiêu và một mồi khác cũng sẽ nhận diện và gắn vào mạch còn lại. Các mồi được thiếtkế sao cho đầu 3’ của mỗi đoạn mồi phải đối mã với cái còn lại, vì vậy sự tổng hợpDNA diễn ra trên cả hai mạch trong vùng giữa hai mồi. Nhiệt độ để bắt cặp của mỗimồi với DNA mẫu thì phụ thuộc vào chiều dài và trình tự của mồi, và mức độ đặctrưng của các phản ứng PCR cụ thể thì có trong chương 2. Nhiệt độ thông thườngđược chọn trong phạm vi 45-60oC.

Kéo dài: DNA polymerase sẽ gắn vào đầu 3’ của mỗi liên kết oligonucleotidevà sử dụng dNTP để tổng hợp mạch DNA mới theo chiều 5’-3’. Các thí nghiệm PCRđầu tiên sử dụng các phân đoạn Klenow DNA polymerase I như là enzym sao chép,nhưng do bước biến tính nhiệt, các enzym được thêm vào trong suốt mỗi chu kì. Một sựđột phá khi đưa ra Tag DNA polymerase từ vi khuẩn ưa nhiệt Thermus aquaticus(Lawyervà cộng sự, 1989). Tag DNA polymerase kháng với nhiệt độ cao, nó có chịuđược nhiệt độ 94oC của giai đoạn biến tính và vẫn còn khả năng hoạt động tốt. Điều nàycó nghĩa là enzym không cần phải được bổ sung trong suốt phản ứng và các chu kì nóng- lạnh cần thiết trong PCR có thể được thiết kế tự động. Hơn nữa Tag DNA polymerasecó nhiệt độ tối ưu cho sự sao chép DNA là 72oC. Ở nhiệt độ cao mà lúc đó các phản ứngkéo dài vẫn có thể diễn ra thì có nghĩa là giai đoạn bắt cặp mồi không bị sai sót.

Sau mỗi vòng của quá trình nhân bản PCR, một phiên bản mới của mỗi mạchDNA được tổng hợp, như minh họa trong hình 4.1. Vị trí bắt đầu của sự tổng hợpDNA được quyết định bởi liên kết của đoạn mồi oligonucleotide với DNA mẫu. Cụ thểtrong quá trình lai thông qua liên kết hydro giữa cặp base, chính xác từng vị trí mỗinucleotide cho tới các trình tự, cái mà được bổ sung vào mạch mẫu. Không có gì quáphức tạp, tuy nhiên sự tồng hợp DNA kết thúc như thế nào. Nếu chúng ta kiểm tra kếtquả của một phản ứng PCR điển hình trên gel agarose như trong hình 4.2, ta sẽ thấynhững dải đơn rời rạc được tạo thành. Điều này cho thấy những phân đoạn DNA đượctạo thành đồng nhất, và chúng bắt đầu và kết thúc ở cùng vị trí. Để hiểu điều này xảyra như thế nào, ta xem các đoạn DNA được tạo thành trong suốt nhiều chu kì của PCR.

Một phân tử DNA mục tiêu (được mô tả bằng màu đỏ và xanh) chứa các trình tựbổ sung với hai oligonucleotide. Các oligonucleotide có tác dụng như là điểm bắt đầucho sự nhân bản DNA. Các sản phẩm của mỗi chu kì PCR đều là mẫu cho sự nhân bảnDNA của chu kì tiếp theo. Trong hình là sản phẩm của chu kì đầu PCR (xanh lá), chukì hai (tím), chu kì ba (nâu). Sự hoàn thành chu kì dẫn đến hình thành hai phân tửDNA mạch đôi (được đóng khung), cái mà đầu của mạch 5’ và 3’ thích hợp chính xácvới đầu của đoạn mồi oligonucleotide. Các chu kì tiếp theo dẫn đến sự gia tăng theocấp số nhân của phân tử DNA này.

Trong suốt chu kì PCR đầu tiên, hai mạch DNA mục tiêu được tách ra và quátrình nhân bản DNA bắt đầu tại điểm liên kết với mồi. Hai mạch DNA mới được tổnghợp ở cuối chu kì 1 (ở hình 4.3), sẽ có đầu 5’ xác định, như là được quy định bởi vị tríliên kết với mồi, nhưng đầu 3’ không xác định. Quá trình tổng hợp DNA không giớihạn ở một điểm cụ thể, nhưng nó sẽ chỉ dừng lại trong suốt bước biến tính nhiệt củachu kì 2. Mỗi mạch DNA có ở cuối chu kì 1 sẽ tiếp nối vào chu kì kế tiếp của PCR, vàmỗi mạch sẽ có tác dụng như là mẫu cho sự liên kết với các mồi mới. Trong chu kì 2,

Page 115: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

114

mồi sẽ gắn với mạch DNA mẫu ban đầu và các mạch được tổng hợp trong chu kì 1.Liên kết giữa mồi với mạch mẫu ban đầu sẽ đưa đến kết quả là tạo thành các sản phẩmtương tự trong suốt chu kì 1.

Lặp lại

Hình 2: Khuếch đại PCR của một gen từ DNA. Hai đoạn mồi oligonucleotideđược thiết kế để flank gen trong bộ gen người. Một phản ứng PCR diễn ra 25 chu kì,

Biến tính

Bắt cặp mồi (lai)

Kéo dài bằng DNA polymerase

Page 116: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

115

một phần mười phản ứng được chạy trên gel agarose sắp xếp theo kích thước DNA.Gel được nhuộm với ethium bromide và được chụp dưới kính hiển vi.

Hình 4.3: Các sản phẩm tạo thành trong suốt 3 chu kì đầu của một thí nghiệm PCR.Tuy nhiên, liên kết giữa mồi với mạch DNA được tổng hợp trong chu 1, tiếp

theo đó là sự nhân bản, dẫn đến việc tạo thành một mạch DNA với đầu ở đầu 3’ và 3’đều xác định. Điều này xảy ra bởi vì sự nhân bản DNA sẽ chấm dứt khi không có thêmtrình tự DNA nào nữa được sao chép. Vì thế khi kết thúc chu kì 2 thì 2 mạch DNAđược tạo thành (thể hiện trên hình với màu tím) có đầu 5’ và 3’ xác định. Tuy nhiêncác base bắt cặp với các đoạn DNA có đầu 3’ không xác định. Một lần nữa, sản phẩmtrong chu kì 2 của tiến trình PCR sẽ đi vào chu kì 3, lần nữa mỗi mạch DNA được sửdụng làm mẫu để mồi gắn vào. Vào cuối chu kì 3, phân tử DNA mạch đôi được tạothành và cuối mạch 5’ và 3’ bắt đầu và kết thúc tại những vị trí mồi gắn vào trình tựDNA mục tiêu ban đầu.

Ngoài chu kì 3 của PCR, các chu kì biến tình nhiệt, bắt cặp mồi, kéo dài đượclặp lại sẽ dẫn đến sự nhân lên theo cấp số mũ của một đoạn DNA mục tiêu cụ thể (hình4.1). Sau 25 chu kì, thông thường của các thí nghiệm PCR, mong đợi sẽ khuếch đạikhoảng 30 triệu lần, và sự khuếch đại vẫn đạt được như vậy trong thực tế. Tất cả cácphản ứng PCR “bị nhiễm” bởi một lượng ít các phân đoạn DNA được tạo thành khôngđúng với chủ định nhưng không đáng kể, bởi vì phần lớn là sự khuếch đại của cácphân đoạn DNA cụ thể.

Page 117: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

116

Có nhiều yếu tố cần được xem xét khi khuếch đại một trình tự DNA cụ thểbằng phương pháp PCR. Nó bao gồm việc chọn lựa DNA polymerse được sử dụng,mẫu DNA, điều kiện phản ứng và trình tự mồi oligonucleotide. Chúng tôi sẽ thảo luậnngắn gọn về mỗi vấn đề ở phía dưới như là các thí nghiệm về kĩ thuật gen có thể bị ảnhhưởng như thế nào, nhưng cái độc giả hướng tới là các văn bản với những khía cạnhthực tế của PCR theo chiều sâu hơn.4.1 ĐIỀU KIỆN PHẢN ỨNG PCR Thành phần của một phản ứng PCR bao gồm các thành phần: DNA (0.01–0.1 μg) Primer 1 (20 pmol) Primer 2 (20 pmol) Tris-HCl (20 mM, pH 8.0) MgCl2 (2 mM) KCl (25 mM) or KCl (10 mM) and (NH4)2SO4 (10 mM) Deoxynucleotide triphosphates (50 μMeach of dATP, dCTP, dGTP, dTTP) Thermostable DNA polymerase (2 units) A total reaction volume of 50–100 μL.

Chúng tôi sẽ nói về enzyme polymerase, DNA mục tiêu và mồi rõ hơn ở phầndưới. Một số thành phần phản ứng (Tris, KCl and MgCl2), nồng độ của các ion magiêtrong phản ứng đóng vai trò quan trọng trong sự thành công của một phản ứng PCR(Hình 4.4). Mg là chất cần thiết cho DNA polymerase hoạt động, nhưng các đặc điểmcủa bất kỳ phản ứng PCR phụ thuộc vào nồng độ của Mg được sử dụng. Nồng độ Mgthấp , phản ứng không xảy ra vì enzyme polymerase không hoạt động. Nồng độ Mgcao, phản ứng sẽ mất đi đặc trưng và sản xuất nhiều sản phẩm không mong muốn.Nồng độ tối ưu Mg cần phải được xác định bằng thực nghiệm cho mỗi bộ mồi PCRriêng biệt, nhưng thường sẽ có trong khoảng từ 1-5 mM. Các thành phần đệm và muốicủa phản ứng (Tris và KCl) thường được sử dụng thường xuyên, mặc dù làm giảmnồng độ KCl kích thích DNA polymerase ở lại trên mẫu lâu hơn và đạt được một chiềudài lớn hơn của sản phẩm khuếch đại (Foord và Rose, 1994).

Page 118: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

117

Hình 4.4 : Ảnh hưởng của nồng độ Mg về hiệu quả và đặc trưng của một thínghiệm PCR. Một thí nghiệm PCR đã được thiết lập có chứa nồng độ MgCl2 khácnhau. Sau khi PCR, các sản phẩm đã được tách trên gel agarose và nhuộm vớiethidium bromide. Các kích thước của sản phẩm PCR thu được được so sánh với mộtthang DNA mẫu (M). Tái sản xuất các yếu tố quan trọng cho thành công của PCR ,của Qiagen GmbH.

Một khi các phản ứng PCR đã được thiết lập, nó thường được phủ một lớp dầuđể ngăn chặn sự bốc hơi của mẫu trong quá trình làm nóng - cách khác, một máy PCRvới một nắp sẽ ngăn chặn sự bốc hơi nước nóng - trước khi được chịu các nhiệt độkhác nhau mà sẽ thúc đẩy sự biến tính, nhiệt luyện, và các thành phần mở rộng củamột chu kỳ PCR. Điều kiện một chu kỳ cho một thí nghiệm PCR có thể được 94°C, 30 s – giai đoạn biến tính 60°C, 30 s – giai đoạn lai 72°C, 1 min – giai đoạn kéo dài

Giai đoạn biến tính và lai ngắn, nhưng đủ để cho phép phá vỡ và gắn các liênkết hydro giữa các sợi DNA. Bắt đầu bao gồm một bước biến tính ban đầu (94 0 C, 2phút) để đảm bảo rằng các mẫu DNA ban đầu là chuỗi đơn. Điều này thường khôngxảy ra khi tiếp xúc lâu với nhiệt độ cao sẽ chặn lại trong DNA mẫu. Chiều dài của sảnphẩm PCR khuếch đại trong thời gian cho phép cho bước kéo dài của phản ứng. Hầuhết các polymerase sử dụng trong PCR sẽ tái tạo DNA trong ống nghiệm với tỷ lệkhoảng 500-1000 bp min-1 (Bảng 4.2). Thời gian mà các thí nghiệm PCR được ủ ởnhiệt độ giãn được điều chỉnh tùy thuộc vào chiều dài của sản phẩm ban đầu.

Page 119: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

118

Số chu trình PCR được thực hiện trong một thử nghiệm cá nhân phụ thuộc vàosố lượng cả hai mẫu DNA ban đầu trong phản ứng và lượng DNA cần thiết sau quátrình khuếch đại. Nói chung, để tránh các lỗi sao chép (xem bên dưới), như vài chu kỳcó thể sẽ được thực hiện. Điều này thường sẽ có trong khoảng 17-25 chu kỳ. Sau khihoàn thành các chu kỳ , phản ứng chuẩn PCR bao gồm một bước kéo dài cuối cùng(72°C trong 5 phút) để đảm bảo rằng tất cả các DNA trong phản ứng này đã được nhânlên thành dạng mạch đôi. Giai đoạn kéo dài cuối cùng có thể làm tăng hiệu quả nhânbản của sản phẩm PCR (Li và Guy, 1996).4.2. DNA POLYMERASE CHỊU NHIỆT:

Các vi khuẩn Thermus aquaticus lần đầu tiên được phát hiện tại một số suốinước nóng ở Công viên quốc gia Yellowstone (Brock and Freeze, 1969). Từ đó nóđược tìm thấy sống trong môi trường nhiệt trên khắp thế giới. Sinh vật này sống ởnhiệt độ từ khoảng 50 và 80°C, và nhiệt độ tối ưu tốc độ tăng trưởng của nó là khoảng700C. Taq ADN polymerase là enzym monomeric với trọng lượng phân tử 94 kDađược phân lập từ các sinh vật (Chien,Edgar và Trela, 1976; Luật sư và cộng sự, 1989)..Các enzyme chịu nhiệt, nó lặp DNA tại 74 0C và vẫn còn chức năng ngay cả sau khi ủở 950C. enzyme này bao gồm một hoạt động polymerase 5’ tới 3’ một hoạt độngexonuclease 5’tới 3’, nhưng nó thiếu một 3’tới 5’ exonuclease (proofreading) hoạtđộng. Việc thiếu proofreading hoạt động có nghĩa là nếu một cơ sở không chính xácđược đưa vào chuỗi polynucleotide mở rộng, nó không thể được loại bỏ và do đó TaqADN polymerase là dễ bị lỗi và gây những đột biến cho các sản phẩm PCR khuếchđại. Trong thử nghiệm in vitro, Taq ADN polymerase misincorporates một base 104-105 những base lặp lại (Barnes năm 1992; Cline, Braman và Hogrefe, 1996). Các sự

Page 120: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

119

khác biệt lớn trong tỷ lệ lỗi ước tính là do, một phần, với những phương pháp được sửdụng gây những đột biến. Theo ước tính mức độ thấp nhất, với tỷ lệ lỗi của 10 -4 lỗicho mỗi cặp base tái sử dụng, nếu một chuỗi 1 kb là khuếch đại cho 25 chu kỳ với Taqsau đó khoảng 10 phần trăm của các sản phẩm khuếch đại sẽ có đột biến. Tuy nhiên, vìnhững đột biến xảy ra trong một chu kỳ sẽ được khuếch đại trong chu kỳ sau đó, thựctế tần số đột biến có thể khác nhau từ các thí nghiệm thử nghiệm. Mức độ báo lỗi làkhông, tuy nhiên, ảnh hưởng đến ảnh hưởng đến kết quả của một thí nghiệm.Nếu phảnứng PCR đang được thực hiện chỉ đơn thuần là để xác định sự có mặt hay vắng mặtcủa một gen trong một phân tử DNA mục tiêu, sau đó sự thành công của phản ứng nàysẽ không bị ảnh hưởng bởi sự xuất hiện của lỗi vào trong trình tự khuếch đại. Tuynhiên nếu là để khuếch đại gen để nghiên cứu chức năng, sau đó PCR sai sót có thểảnh hưởng đến thử nghiệm. Các vấn đề về báo lỗi có nghĩa là, tuy nhiên, sản phẩmPCR có thể bị phân tích trình tự DNA trước khi chúng được sử dụng trong các thínghiệm nhân bản. Ngoài ra, một số dòng vô tính PCR độc lập nên được lựa chọn đểđảm bảo rằng các trình tự thu là điển hình.

Một chức năng khác của Taq ADN polymerase tác động đến trình tự của sảnphẩm PCR cuối cùng là xu hướng của các enzyme để kết hợp một deoxynucleotide(thường là một adenosine) một cách độc lập mẫu kết thúc ở đầu 3’của sợi DNA mớitổng hợp. Một hệ quả của hoạt động này là sản phẩm PCR được sản xuất bởi Taqkhông thể kết thúc, nhưng đã có đầu 3’ đơn A nhô ra dư lượng. Đặc tính này đã đượckhai thác để hỗ trợ nhân bản của sản phẩm PCR (xem bên dưới). Kể từ khi tìm ra Taqpolymerase DNA, một số ADN polymerase chịu nhiệt khác đã được mô tả và đã đượcsử dụng trong các thí nghiệm PCR. Trong khi Taq vẫn là thông dụng nhất của cácenzym chịu nhiệt cho PCR, polymerase từ các nguồn khác có tính chất khác nhau màlàm cho chúng hữu ích cho các ứng dụng nhất định (Bảng 4.2).

Một số các DNA polymerase chịu nhiệt khác, ví dụ Pfu polymerase cô lập vớifuriosis vật Pyrococcus, không có một hoạt động 3’tới 5’ exonuclease proofreading, vànhư vậy tốc độ đột biến giảm. Sử dụng ví dụ trên, nếu là 1 kb phân đoạn của DNAđược khuếch đại hơn 25 chu kỳ với Pfu polymerase, sau đó chỉ có 0,1 phần trăm củacác sản phẩm khuếch đại sẽ có đột biến. Ngoài ra, một số các DNA polymerase chịunhiệt khác sản xuất sản phẩm PCR thấp (Bảng 4.2). Các hoạt động 5’ tới 3’

exonuclease của Taq polymerase DNA có nghĩa là enzyme có khả năng làm suy giảmmồi oligonucleotide trong phản ứng PCR. Điều này đặc biệt có liên quan trong bướcbiến tính đầu tiên của chu kỳ 1, khi các oligonucleotides không bị ràng buộc với cácmẫu DNA, và trùng hợp tự do trong dung dịch. Trong chu kỳ nóng nhất, nhiệt độ củahỗn hợp PCR tăng từ nhiệt độ phòng (hoặc 4 0 C nếu phản ứng đã được thiết lập ởnhiệt độ) tới 94 0 C. Điều này có nghĩa rằng, tại một số điểm, nhiệt độ trong ống sẽđược 72 0 C - tối ưu cho polymerase - nhưng các enzyme sẽ không thể sao chép DNAvì tái sử dụng trong số các oligonucleotides với mẫu DNA. Nhiệt độ vượt qua nhiệtđộ của enzyme mà sự sao chép không xảy ra sẽ có xu hướng dẫn đến suy thoái mồi, vàPCR không hiệu quả. Để khắc phục vấn đề này, và để ngăn chặn các sản phẩm PCRkhông đặc trưng được tổng hợp trước chu kỳ, Taq polymerase DNA có thể được thêm

Page 121: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

120

vào hỗn hợp phản ứng đã ở 94 0 C. Khi tăng nhiệt độ tăng cả sản lượng và đặc trưngcủa phản ứng PCR. Ngoài ra, Taq polymerase DNA có thể được trộn với một khángthể cụ thể mà liên kết với enzyme và ức chế hoạt động của nó (Kellogg và cộng sự,1994.). Các kháng thể - ức chế enzyme phức tạp sao chép ở nhiệt độ thấp, nhưng phứctạp không thể phục hồi phân ly ở nhiệt độ cao, sau đó enzyme là không ngăn cản cácchức năng của nó.

Sự tồn tại của một số ADN polymerase chịu nhiệt với những đặc tính khác nhauđã dẫn đến sự "pha trộn" của polymerase cho các chức năng cụ thể. Ví dụ, Taq ADNpolymerase sản xuất sản lượng cao của sản phẩm PCR, nhưng dễ gây lỗi và có kích thướcsản phẩm PCR tối đa khoảng 5-7 kbp. Pfu DNA polymerase, mặt khác, là ít hơn nhiều dễgây lỗi, nhưng vẫn còn gặp khó khăn hiệu quả sản xuất sản phẩm PCR trên 7 kbp. Mộthỗn hợp của hai polymerase (15 phần Taq và 1 phần Pfu ) đã được tìm thấy các mảnhDNA có hiệu quả khuếch đại lên đến 35 kbp dài với độ trung thực cao (Barnes, 1994).4.3. DNA KHUÔN MẪU

Hầu như mẫu DNA nào cũng có thể được sử dụng như một khuôn cho mộtphản ứng PCR, bao gồm dạng thẳng, plasmit DNA dạng tròn và đóng xoắn, genomeDNA, cDNA… DNA có nguồn gốc từ những chất phi vật thể, do vậy PCR đơn thuầnlà một chuỗi những phản ứng tiếp diễn. Với yêu cầu duy nhất là vị trí liên kết mồi tạothành chuỗi giữa chúng là nguyên vẹn.

Trong các trường hợp, nhìn về tương lai cho những lợi ích rõ ràng, chúng ta cânnhắc kĩ cho việc khuyết đại DNA mục tiêu đơn. Khi điều này chắc chắn đạt được trongthực tiễn và thường được tiến hành với quy mô số lượng DNA lớn. Khi với một lượngnhỏ DNA được sử dụng nhưng khi bị nhiễm tạp chất trong phản ứng PCR có thể trởnên một vấn đề nghiêm trọng. Khuếch đại đặc tính PCR trên quy mô lớn mà bị nhiễmtạp chất vào DNA có thể gây hỏng thí nghiệm. Nhiễm tạp chất có thể do nhiều nguyênnhân khác nhau bao gồm người đang tiến hành thí nghiệm,những mồi xuôi và mồingược sử dụng để thiết lập phản ứng và enzyme hoặc các chất cần thiết trong chínhphản ứng. Trong một thí nghiệm PCR điển hình giữa 0,1 và 1 μg DNA sẽ được thêmvào phản ứng với một lượng tương đối thấp số chu kỳ PCR nhưng vẫn có thể đượcthực hiện được với nguyên liệu đầy đủ cho các thí nghiệm . Điều này làm giảm khảnăng gây tạp nhiễm vào sự khuếch đại mong muốn. Với bao nhiêu bản sao của chuỗimục tiêu đủ lượng DNA cần thiết? Nếu bạn thêm 1 μg DNA bộ gen của người để chomột phản ứng PCR, điều này tương đương với 1×10-6/ (6,4×109×650) = 2,4 × 10-19

mol, khi đó DNA của người có khoảng 6,4×109 bp của DNA và khối lượng trung bìnhcủa bp là 650 Da. Thành ra 1 μg DNA của người tương ứng 2,4 ×10-

19mol×6×1023(Avogadro’s number)=khoảng 144.000 phân tử.Điều này có nghĩa là với1 gen đơn trong 1 μg sẽ tạo ra 288.000 DNA đôi. Tám triệu lần khuếch đại của một1000 bp trong genomic DNA, trải qua 25 chu kì PCR, khoảng 10 μg của 1000bp củađoạn DNA. Với một phần nhỏ sản phẩm của PCR đủ để phát hiện bằng ethidiumbromide trên điện di agarose.

Page 122: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

121

4.4 MỒI OLIGONUCLEOTIDESự thành công trong một thí nghiệm PCR là gần như hoàn toàn phụ thuộc khi

mồi oligonucleotide. Các đoạn mồi cần phải được thiết kế để nhận ra đoạn DNA màchúng cần được nhân lên. Mồi có những đặc điểm sau đây.

+ Độ dài mồi khoảng 17-30 nucleotid+ Số lượng G và C vào khoảng 50%+ Cách tính nhiệt độ của các cặp mồi được tính theo công thức 2(A+T) +

4(G+C)- sử dụng làm thí nghiệm xấp sỉ bằng nhau.+Các mồi riêng lẻ không nên bắt cặp bổ sung với nhau. Ví dụ, một mồi có trình

tự như sau 5’-GAGATCGATGCATCGATCTC-3’ có thể là một lựa chọn tốt cho mồiPCR (dài 20 nucleotid, 50% GC, không có sự bắt cặp giữa các trình tự), nhưng nó sẽtạo thành cấu trúc kẹp nếu đầu 5’ kết thúc liên kết với 3’ kết thúc có thể gây khó khăntrong việc bắt cặp của mồi trong phản ứng PCR nên không khuếch đại được.

Hình 4.5. Các vị trí của mồi để khuếch đại một phần của gen GAL4 từ Saccharomycescerevisiae .

(a) Các trình tự DNA, và acid amin tương ứng trình tự, một phần của genGAL4 . Các chuỗi ADN mã hóa đầu tiên 100 axit amin của protein Gal4p được thểhiện với màu nâu. Các vị trí của mồi để khuếch đại trình tự này được hiển thị. Lưu ýrằng mồi 1 là cùng trình tự như là mạch xuôi (sense strand) và sẽ do đó liên kết với cácmạch ngược (antisense strand) và DNA polymerase sẽ tổng hợp ra một sợi mới. Tươngtự như vậy, mồi 2 là trình tự giống như mạch antisense, để nó nhận ra các mạch sensevà sẽ dẫn đến sự hình thành của một mạch antisense mới.

(b) Các kết quả của thí nghiệm PCR được thực hiện với mồi của chính nó, hoặclà sự kết hợp của cả hai mồi. Các sản phẩm PCR sẽ được nhìn thấy sau khi ethidiumbromide phát huỳnh quang trên gel agarose.

Không nên có sự bắt cặp bổ sung giữa hai mồi hoặc trong đầu 3’ của một mồi.Ví dụ, hai mồi sau đây lần nữa xuất hiện là một sự lựa chọn tốt:

5’-GATCGATCGATACGTGATCC-3’ và5’-CGTAGCTAGCTAGGATCACG-3’.

Page 123: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

122

Tuy nhiên, đầu 3’ của những đoạn mồi được bổ sung cho nhau và có thể xảy raviệc tự bắt cặp mồi, điều này có thể sẽ được nhân lên trong các chu kỳ đầu tiên củaphản ứng PCR:

Hầu hết mồi phù hợp với các tiêu chí trên có thể được sử dụng trong thí nghiệmPCR, nhưng một số gói phần mềm miễn phí sẵn có, bao gồm cả một số trong đó đượcdựa trên web, đã được viết để hỗ trợ việc thiết kế mồi (Rozen và Skaletsky, 1998).4.4.1 Tổng hợp mồi Oligonucleotide

Hầu hết các oligonucleotides được thực hiện trên việc tổng hợp acid nucleicbằng cách sử dụng phương pháp phosphoramidite hóa học. Phosphoramiditeoligonucleotide được tổng hợp hóa học đã được giới thiệu gần 20 năm trước (McBridevà Caruthers, 1983). Các khối được sử dụng để tổng hợp được DNA phosphoramiditenucleoside (đôi khi được gọi là monome). Đây là những sửa đổi để ngăn chặn sự bắtcặp hoặc phản ứng phụ không mong muốn khác xảy ra trong quá trình tổng hợp.Chúng sửa đổi đầu 5’ (với một nhóm dimethoxytrityl) và đầu 3’ (với một β-cyanoethyl bảo vệ nhóm 3’-phosphite), và cũng có thể bao gồm thêm sửa đổi để bảovệ các amin trong phản ứng chính có các cấu trúc vòng nucleoside.

Phosphoramidite dẫn đến việc tổng hợp oligonucleotide diễn ra trong bốn bướcnhư hình 4.6. Tự tổng hợp được thực hiện trên các chất hỗ trợ, thường dùngpolystyrene. Polystyrene được nạp vào một cột nhỏ như các buồng phản ứng. Một cộtnạp được gắn vào đường dây phân phối thuốc thử trên một tác nhân tổng hợp DNA vàhóa chất phản ứng tiến hành dưới sự kiểm soát máy tính. Căn cứ được thêm vào chuỗingày càng tăng theo một chiều 3’-5’ (ngược với sự tổng hợp enzyme của polymeraseDNA). Tổng hợp là bắt đầu sử dụng polystyrene, đã tác động với base đầu tiên thôngmột liên kết este tại 3’-hydroxyl (Hình 4.6 (a)).

Sự tổng hợp primer bắt đầu bằng sự phân cắt của nhóm 5’-trityl (hình 4.6 (b))bằng cách sử lí với axit. Monomer kích hoạt bởi tetrazole được nối với 5’-hydroxyl(hình 4.6 (c)) và kết quả là liên kết phosphite bị ôxi hóa thành phosphate bằng cách xửlý với i-ốt (hình 4.6 (d)). Điều đó hoàn tất một 'chu kỳ' của tổng hợp oligonucleotide.

Page 124: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

123

:Hình 4.6. Sự tổng hợp của mồi oligonucleotide. Việc tạo thành 5’-AT-3’.

Phophoramidite nucleoside được biến đổi với một nhóm bảo vệ dimethoxytrityl ở đầu5’ (đỏ) và một cyanoethyl β-bảo vệ nhóm 3’-phosphite (màu xanh). Ngoài ra, một tácnhân biến đổi khác (màu xanh) bảo vệ cho các amin của mồi diễn ra ở bất cứ mọi nơitrong phân tử. Xem các đoạn văn để biết chi tiết về chu kỳ phản ứng

Phản ứng ngưng tụ nucleoside có hiệu quả cao, với ít hơn 1 phần trăm củanhững nhóm 5’- hydroxyl không phản ứng với các nucleoside mới gắn vào. Để ngănchặn các phân tử chưa phản ứng này tham gia trong các phản ứng tiếp theo dẫn đếnviệc xóa cắt không mong muốn, các nhóm chưa phản ứng 5’-OH bị khóa bằng cáchacetyl hóa các acetic anhydride trước khi diễn ra bước oxy hóa. Hiệu quả của việc bắtcặp đảm bảo rằng mồi lên đến chiều dài khoảng 60 nucleotide chiều có thể được tạothành một cách dễ dàng.

Sau khi tổng hợp xong, oligonucleotide được cắt từ sự hỗ trợ của hydroxitamoni ở nhiệt độ phòng. Tiếp tục trong amoniac ở nhiệt độ cao sẽ tác động đến cácnhóm phosphat thông qua xoá gốc β của nhóm cyanoethyl và cũng loại bỏ các nhómbảo vệ từ các vị trí dị vòng. Các oligonucleotide hoàn thành có thể được tinh sạch từcác hóa chất bị nhiễm do sai sót, và chuỗi trình tự đầy đủ thường bị phân lập bằngcách lọc qua HPLC.

Các lợi thế lớn cho tổng hợp hóa học mồi là bất kỳ trình tự nào cũng có thểđược sản xuất nhanh chóng và tương đối rẻ (<0,5 % cho mỗi base). Các trình tự củamồi cũng có thể được trộn lẫn. Ví dụ, với các mồi được nêu trong HÌNH 4.6 nếu mộthỗn hợp 01:01 của DT và DC monome đã được thêm vào để phản ứng ở giai đoạn C,sau đó sơn lót kết quả có thể có trình tự của một 5’-TA-3’ hoặc 5’-CA-3’. Các sảnphẩm cuối cùng sẽ là một hỗn hợp bằng nhau của hai loài. Bởi kiểm soát số lượng củamỗi monomer thêm ở bước ngưng tụ, các mồi có thể được pha tạp với bất kỳ nồng độ

Page 125: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

124

quy định tại vị trí bất kỳ trừ 3’-kết thúc. Ngoài ra, thay đổi cơ sở (ví dụ như nhữngphosphothioates chứa, hoặc có nhãn với biotin) có thể được thêm vào trình tự mồi.4.5 MỒI BẤT XỨNG (không khớp)

Các đoạn mồi oligonucleotide dùng trong thí nghiệm PCR không cần phải phù hợpmột cách chính xác với trình tự mục tiêu. Đặc biệt là khi tạo sự thay đổi, gây đột biếnchuỗi DNA khuyếch đại hay để tìm kiếm trình tự gen tương đồng với một trình tự genđã biết. Chúng tôi sẽ đưa ra một số ứng dụng đơn giản của đột biến dựa trên PCRnhưng phương thức tối ưu gây đột biến sẽ được biết ở chương 7. Nơi duy nhất trongđoạn mồi phù hợp với trình tự mục tiêu là đầu 3’. Nếu đầu 3’ của đoạn mồi khôngphù hợp với trình tự mục tiêu thì khi đó các polymerase sẽ không thể kéo dài mồi. Kếtquả là quá trình PCRse4 thất bại, không đạt hiệu quả. Điều này sẽ gặp trong chẩn đoánđột biến điểm ở gen (xem bên dưới). Người ta nghĩ đến việc dùng PCR trong đột biếnđể khuyếch đại sản phẩm từ những đoạn mồi. Các mồi bắt đầu quá trình sao chépDNA nhưng chúng sẽ hợp nhất vào sản phẩm cuối cùng. Do đó, bất kì sự thay đổi giữamồi và DNA mẫu đều sẽ được chuyển vào sản phẩm khuyếch đại. Vì thế không thểthấy những đột biến xảy ra ở đầu 3’ của mồi. Nơi tốt nhất cho ta thấy những thay đổi,đột biến đó là đầu 5' của mồi. Ở trường hợp này, chúng tôi cũng khuyếch đại cùngtrình tự như trong hình 4.5. Tuy nhiên lần này các mồi oligonucleotide chứa các trìnhtự bổ sung tại điểm 5 kết thúc. Mồi 1 trong trường hợp này chứa trình tự nhận biếtenzyme giới hạn EcoRi ở điểm 5 kết thúc của chuỗi, và được sử dụng để nhận biếtnhững gen GAL4. Mồi 1 và mồi trong hình 4.5 sẽ liên kết giống nhau với chuỗi DNAmẫu. trình tự nhận biết EcoRi không tương xứng với trình tự mẫu, không đủ để ngănchặn khả năng lien kết của mồi. Trình tự nhận biết EcoRi sẽ được sát nhập vào sảnphẩm cuối cùng của PCR như trong hình 4.7. Mồi 2 trong trường hợp này chứa trìnhtự nhận biết enzyme giới hạn BamHi, ezym này cũng sẽ được sát nhập vào sản phẩmcuối cùng. Việc nhân bản sản phẩm cuối trở nên đơn giản khi được cắt bởi 2 enzymgiới hạn, tuy nhiên không chắc là bản than sản phẩm PCR sẽ không có EcoRi hayBamHi. Thong thường đòi hỏi các enzyme giới hạn cắt đúng chỗ nhằm tách một cáchhiệu quả. Vì vậy 3-6 dư lượng bổ sung sẽ được thêm vào điểm 5 kết thúc của mồitrước khi nhận biết enzym . Đây thường là G hoặc C(kẹp GC) để hiệu quả cắt là tối ưu.Bất kì sự không tương thích nào giữa mồi và DNA mẫu đều sẽ được chuyển tiếp vàosản phẩm PCR cuối cùng. Vì vậy, sự đột biến có được dựa trên các sản phẩm PCRcuối cùng bằng cách thay đổi trình tự của mồi. Đặc biệt muốn thay đổi trình tự gen mãhóa từ đó thay đổi trình tự acid amin của protein hay muốn thay đổi việc sử dụngcodon của một gen. VD: enzyme giới hạn được nhận biết nhưng vẫn không thay đổitrình tự acid amin của protein kết quả hoặc sử dụng codon nếu protein kết quả đượcthể hiện ở mức độ cao. Hai mồi không trùng khớp với nhau được sử dụng trong việctìm kiếm các gen mã hóa cho một protein đặc biệt và tìm kiếm gen tương đồng. Đặctính biệt lập của protein phổ biến trong sinh hóa. VD: bạn có thể cô lập một protein vàkết thúc một trình tự amino để tìm kiếm các acid amin Met-Ile-TRP-Phe. Mã di truyềnthoái hóa khi trình tự acid amin này có thể được mã hóa cho các chuỗi DNA sau. Vớitrình tự protein ở chỉ tay, nó không thể biết codon nào sẽ được sử dụng trong một gen

Page 126: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

125

đặc biệt để mã hóa một acid amin đơn lẻ. Do vậy để khuyếch đạitrình tự gen mã hóaprotein, chúng ta phải thiết kế sự thoái hóa mồi. Các mồi chỉ có thể liên kết với các tổhợp mà có thể mã hóa cho các trình tự protein.Mồi dưới đây có thể được tổng hợp theotính chất này.

Hình 4.7: Mồi để khuếch đại một phần của gen GAL4 từ genome củaSaccharomyces cerevisiae và để bao gồm các enzyme nhận diện các vị trí đặc trưng.Các sản phẩm PCR cuối cùng chứa các trình tự có trong các mồi.

Trong đó N là một hỗn hợp đẳng mol của A T C G. Các mồi trên sẽ được sảnxuất như là một hỗn hợp của 24 cặp mồi khác nhau. Chỉ một trong 24 cặp mồi này sẽmã hóa chính xác trình tự protein, những cặp mồi còn lại sẽ khác nhau bởi mộtnucleotide duy nhất từ trình tự mục tiêu và vẫn phát huy hiệu quả PCR. Trường hợp ởđây cho thấy, quá trình PCR đòi hỏi một mồi bổ sung phải nhận biết đến 3 trình tự.Bốn nucleotide sẽ thay nhau sử dụng inosine tại một vị trí trên mồi. Inosine là mộtpurine,có trong tRNA có khả năng bắt cặp với C, T, A. Cặp đôi inosine-A sẽ khôngtrùng khớp với DNA kép như là cặp purine-purine. Do đó, sẽ có một lượng nănglượng bị mất mát khi xoắn những chỗ phình ra trong lúc kết nối. Khi được yêu cầu,inosine có thể được sử dụng trên mồi tại vị trí bất kì trong 4 base trên. Mỗi inosineđược dung sẽ làm giảm sự thoái hóa mồi xuống 4 lần. Sự không tương thích giữainosine-G có thể xảy ra nhưng sẽ được khắc phục tại những vị trí khác trên mồi saocho sự bắt cặp là chính xác. Sử dụng inosine trong mồi đòi hỏi các DNA polymerasedung trong thí nghiệm PCR phải có khả năng tổng hợp DNA trong một mẫu có chứainosine. Taq polymerase có thể làm được điều này, nhưng một số polymerase kháckhông thể làm được như Vent và Pfu (Knittel và Picard, 1993). Trong cùng một loàinhiều gen có trình tự acid amin giống nhau (do đó trình tự gen cũng tương tự) mã hóachức năng giống nhau trên những protein khác nhau. PCR có thể được sử dụng để xácđịnh các thành viên trong cùng 1 loài them 1 lần với 1 số đặc trưng. Để minh họa điềunày, quan sát 1 vài ví dụ đơn giản nhất. VD: K.POU- vùng chứa protein, là 1 loạtnhững nhân tố phiên mã tham gia bảo tồn vùng DNA ( figure 4.8a). miền này cónguồn gốc bởi 4 miền đặc trưng là 3 protein động vật có vú Pit-1, Oct-1, Oct-2 vàgen-86 UNC từ giun tròn. Hai vùng có độ bảo tồn cao của miền là Pou và Pouhomeodomain. Sau này có homeobox chứa protein kiểm soát sự phát triển ở ruồi giấm.

Page 127: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

126

Sự thay đổi trong những gen này sẽ tác động dến sự phát triển của sinh vật. chẳng hạnnhững thay đổi trong gen Pit-1 (chuột)dẫn đến thất bại trong sự phát triển của tuyếnyên và sự sản xuất những con chuột người lùn(lietal..,1990). Để xác địnhOthermembers của miền Pou mồi phải được thiết kế cho hầu hết các vùng bảo tồn cụthể là Pou và homeobox Pou (hình 4.8b). Những đoạn mồi thoái hóa rất cao dựa trênsự thoái hóa của mã di truyền, nhưng được sử dụng thành công để xác định các miềnPou được bổ sung từ nhiều nguồn khác nhau(Lillycrop và cộng sự,1992). Hai mồiđược hiển thị ở hình 4.8c đã đươc tìm thấy để khuyếch đại 1 đoạn DNA khoảng400bp. Tính không đồng nhất là do sự khác biệt trong chiều dài của các gen mã hóavùng Pou được khuyếch đại từ các mẫu DNA. Vấn đề này đã dẫn đến việc xác địnhnhiều gen mới bao gồm Brn-3 có trong các tế bào thần kinh, được đánh giá cao chothấy sự khác biệt và quyết định sống còn của các tế bào thần kinh cảm giác và vậnđộng ( Erkman và cộng sự,1996).4.6. PCR TRONG CHUẨN ĐOÁN BỆNH DO GEN QUY ĐỊNH:

Khả năng của PCR để khuyếch đoạn DNA cụ thể là một công cụ hữu ích trongviệc chuẩn đoán bệnh về sự thiếu sót hay đột biến của gen. PCR đòi hỏi phải biết kiếnthức cơ bản về chuổi DNA mà đoạn này sẽ được khuyếch đại, vùng đột biến sẽ đượcbiết khi phân tích PCR có thể dẫn đến thất bại. Thuận lợi của phương pháp PCR là chỉcần một lượng nhỏ DNA được dùng để chuẩn đoán. Mẫu của máu hoăc tế bào từ bêntrong mô cung cấp đủ khoán chất để làm chuẩn đoán, trong khi mẫu nhỏ của mànglong tơ có thể sử dụng để làm một chuẩn đoán trong utero.

PCR được sử dụng để tìm ra cả đột biến chèn và đột biến điểm. 1 phạm vi rộngcủa công nghệ có thể được phát triển để tìm ra đột biến=PCR. Chúng tôi sẽ tập trungvào 1 cặp mẫu, nhưng người đọc sẽ nhận thấy rằng tồn tại nhiều thay đổi.

Đột biến chèn hay bỏ: hội chứng Wardenburg một bệnh thừa hưởng nhiễm sắcthể trổi mà bệnh có đặc điểm biểu hiện bởi 1 sự kết hớp của bệnh điếc và màu dakhông bình thường. Bệnh này có thể chiếm hơn 2% trường hợp của người điếc trưởngthành, và thường hay lien kết với bệnh đớm trắng của tóc ở trước tráng và long mitrắng. Chắc chắn những dạng của hội chứng Waardenburg được gây ra bởi đột biếntrong gen PAX-3 liên quan một yếu tố dịch mã trong sự phát triển của bệnh nhân bịphôi. Một trong những điểm đầu tiên được tìm thấy trong gen PAX-3 từ những hộichứng Waardenburg la mất 18 base trong DNA mã hóa.

DNA trội trong yếu tố phiên mã, đột biến mất thể tìm ra trong những bệnh nhânbị bệnh Waardenburg bằng PCR. Mới có thể được thiết kế bên cạnh vùng đột biến(hình 4.9). khuếch đại của chuỗi . Sẽ hình thành một đoạn lớn DNA ( 156bp trong hình4.9 ),trong khi sự khuếch đại của chuỗi đột biến sẽ hình thành 1 vùng DNA nhỏ hơn(138 bp trong hình 4.9) kích thước của những nhánh này dễ dàng nhận ra trên gelpolyacrylamide hoặc gel agarose. Thật vậy, sự biểu hiện của đột biến có thể đượcquyết định bởi kích thước của sản phẩm PCR. Trong trường hợp này, do bệnh là gentrội , hầu hết người chịu đựng là dị hợp tử, có một bảng coppy của gen wild – type vàbản coppy của gen đột biến, PCR khuếch đại của thể dị hợp sẽ mang lại 2 vùng DNAcó kích thước khác nhau.

Page 128: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

127

Hình 4.9: PCR phát hiện đột biến do mất đoạn. Các trình tự DNA tự nhiên(wild-type) của mạch xuôi là một phần của exon 2 từ gen Pax-3 ở người. Trình tự chothấy phần đầu tiên của sự bắt cặp, là nơi có độ bảo tồn cao, có chức năng như là mộtyếu tố phiên mã. Một số bệnh nhân bị hội chứng Waardenburg vì bị xóa các trình tựđược in đậm. Điều này dẫn đến việc xoá bảy amin axit (MAHHGIR) và sự hình thànhcủa một codon mới (Agg mã hóa arginine). Tiếp theo là việc xoá sáu axit amin(MAHHGI) từ protein. Mồi được thiết kế sao cho nhận biết được vị trí xóa.

(b) PCR khuếch đại DNA của cá thể bình thường với mồi 1 và 2 sẽ mang mộtđoạn ADN 156 bp. Khuếch đại DNA từ một cá thể bị đột biến Waardenburg với haiđoạn DNA dài 156 bp và nhỏ hơn 138 bp. Các chuỗi nhỏ có nguồn gốctừ các nhiễm sắc thể có chứa bp 18 bị xóa. Bởi vì hội chứng Waardenburg có tính chấtđặc biệt, đa số những người bệnh là dị hợp tử.

Đột biến điểm: phương pháp mô tả ở trên không thể được sử dụng để tìm ra độtbiến điểm với một gen. Mồi sẽ tạo ra 2 vùng DNA có cùng kích thước cho cả đột biếnvà tự nhiên (wild-type). Sản phẩm của PCR có thể đưa ra để phân tích PCR nhưngđiều này sẽ tốn thời gian. Điều này thì đòi hỏi là PCR đồng nhất đột biến bazơ đơn.PCR khai thác dựa vào đặc điểm của allen đặc biệt, theo cách này làm tăng khả năngkéo dài của DNA polymerase 1 mồi cần chính xác đầu 3’.

PCR khuếch đại allen cụ thể của gen đột biến với β-globin là nguyên nhân gâyra bệnh lưỡi cầu hình liềm. Để tìm ra đột biến điểm của 1 gen 3 mồi phải được thiết kếđể tham gia vào 2 phản ứng PCR mồi (mồi 3 trong hình 4.10) thì hiện diện ở cả haiphản ứng, trong khi đó những mồi khác (mồi 1 và mồi 2) được tìm ra sự có mặt hoặclà wild-type hoặc chuỗi DNA đột biến. Sự khuếch đại của wild –type chuỗi DNA vớimồi 1 và 3 được thực hiện. Tuy nhiên, nếu mồi 2 va 3 được sử dụng phản ứng sẽ thấtbại bởi vì sự ghép đôi không đối xứng giữa chuỗi wild- type và đuôi 3’ của mồi 2 . nhưvậy sự khuếch đại của chuỗi DNA đột biến với mồi 1 và 3 sẽ thất bại, PCR sẽ được

Page 129: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

128

thực hiện bình thường với mồi 2 và 3 sử dụng cho chuỗi đột biến như mẫu. Kết quảcủa 1 phân tích thì được trình bày trên biểu đồ trong hình 4.10. Chúng tôi so sánh 1chuỗi DNA wilp-type với một nhân vạt người mã bị đột biến đồng hợp tử. Nếu 1 cáthể ở dạng dị hợp ,khi đó phản ứng PCR sẽ thực hiện bình thường từ cả alen sẽ đượcbiểu hiện trong DNA mẫu. Để chắc chắn rằng tất cả phản ứng PCR làm việc một cáchchính xác, 1 sự thiết lặp mồi sự khuếch đại 1 vùng không lien quan đến gen thì baogồm những kinh nghiệm làm PCR , vì thế một nhánh sẽ luôn luôn được biểu hiện,điều kiện PCR, và sự có mặt hoạc váng mặt 1 nhánh phụ thì được nghiên cứu.4.7. TẠO DÒNG CÁC SẢN PHẨM PCR

Như chúng ta đã biết, có thể tạo dòng các sản phẩm PCR bằng cách chèn thêmcác trình tự phụ vào trên các đầu 5’ của các mồi để các enzym nhận diện được phốihợp. Cũng có thể tạo dòng các sản phẩm PCR một cách chính xác, thuận lợi bằng cáctác dụng vận chuyển giới hạn của Tag DNA polymerase để thêm vào một lượng A tựdo vào đầu 3’ của các sản phẩm PCR. Kết quả của việc này là hầu hết các phân tửDNA được khuếch đại sử dụng Tag polymerase có mạch đơn 3’ chứa các trình tự A bịdư ra (kí hiệu là 3’-A). Trong một quá trình gọi là tạo dòng TA, điều đó có thể tạo nênbằng cách sử dụng vector tuyến tính T, cái mà có mạch 3’ chứa các trình tự T ở cả haiđầu tạo nên sự chính xác, hiệu quả tạo dòng cao đối với các sản phẩm PCR (Zhou,Clark and Gomez–Sanchez, 1995;Marchuk và cộng sự, 1991). Việc bổ sung giữa cácsản phẩm PCR 3’-A và các vector 3’-T làm tăng thêm hiệu quả ràng buộc, cái màkhông xảy ra với các phân tử DNA có kết thúc như thường. Tiến trình tạo dòng TAđược thể hiện sơ lược trong hình 4.11.

Hình 4.10: PCR dò đột biến điểm.

Page 130: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

129

a)Bệnh hồng cầu lưỡi liềm gây ra do đột biến một cặp base một sự biến đổi A thành Tlàm chuyển đổi Glu6 thành Val, trong gen β-globin ở người. Đối với cá nhân đồng hợptử loại đột biến này, sự thay thế trong đơn phân β-globin trong hemoglobin dẫn đếnviệc giảm độ hòa tan của deoxyheamoglobin và hồng cầu có hình dạng bất thường.b)Xác định sự thay đổi của một base trong DNA sử dụng PCR với alen cụ thể.

Hình 4.11: Quá trình tạo dòng TA của các sản phẩm PCR. Một vector plasmidđược cắt bằng enzym cắt giới hạn tạo thành các đầu cùn, ví dụ EcoRV. Vector đã cắtsẽ tương tác với Tag DNA polymerase khi có deoxythymine triphosphate (dTTP). Tácdụng chuyển đổi có giới hạn của polymerase xúc tác thêm vào lượng dT đơn vào đầu3’-hydroxyl của DNA. Kết quả là vector T được pha trộn với một sản phẩm Taq-generated PCR và cả hai đều sử dụng DNA ligase. Kết quả là sản phẩm PCR được tạodòng chuyển vào trong vector T.4.8. RT-PCR

Như chúng tôi đã nói ở trên, PCR liên quan đến việc khuếch đại sợi đôiDNA. Tuy nhiên, DNA không nhất thiết phải là vật liệu khởi đầu cho PCR. Sự phiênmã ngược - phản ứng dây chuyền polymerase (RT-PCR) đã được nghĩ ra như là mộtphương pháp khuếch đại và định lượng RNA sau khi chuyển đổi của nó đến DNA.RT-PCR có thể được sử dụng để nhân bản, xây dựng thư viện cDNA và tổng hợp điềutra. Kỹ thuật này bao gồm hai phần (hình 4.12) - sự tổng hợp DNA từ RNA bằng quá

Page 131: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

130

trình sao chép ngược (RT) và sự khuếch đại tiếp theo của một phân tử ADN cụ thểbằng PCR.

Phản ứng RT sử dụng một mẫu RNA (RNA tổng số hoặc PolyA+ RNA), mộtmồi (mồi ngẫu nhiên hoặc mồi Oligo dT), dNTPs, đệm và một enzyme phiên mãngược (mà chúng tôi sẽ thảo luận nhiều hơn trong chương 5) để tạo ra một sợi đơnphân tử ADN bổ sung cho các RNA (cDNA). cDNA sau đó sử dụng như một mẫutrong phản ứng PCR. Trong chu kì đầu tiên của PCR, các mạch đơn được tạo thànhmạch đôi thông qua các liên kết, nguyên tắc bổ sung, mồi và hoạt động của enzym TagDNA polymerase.

Giống như các phương pháp phân tích mRNA khác, chẳng hạn như northernblots và thử nghiệm nuclease protection, RT-PCR có thể được sử dụng để định lượngsố lượng mRNA được chứa trong các mẫu ban đầu. Loại phân tích này đặc biệt quantrọng để theo dõi những thay đổi trong biểu hiện gen. Tuy nhiên, do sự khuếch đạiPCR là theo cấp số mũ, sự tập trung mẫu đến mẫu nhỏ và sự khác biệt loading đượckhuếch đại là tốt. Ngay cả sự khác biệt lớn trong nồng độ mục tiêu (100 lần hoặc hơn)có thể sản xuất cùng một cường độ của band sau 25 hoặc 30 PCR chu kỳ. Do đó, RT-PCR yêu cầu tối ưu hóa cẩn thận khi sử dụng để phân tích định lượng mRNA. Địnhlượng thường dùng một trong hai hình thức - tương đối hay tuyệt đối. Định lượng tương đối so sánh bản sao phong phú trên nhiều mẫu, sử dụng một co-amplified kiểm soát nội bộ để bình thường hóa mẫu. Kết quả được thể hiện bằng tỷ lệcủa các tín hiệu gen cụ thể và các tín hiệu kiểm soát nội bộ. Điều này mang lại một giátrị sửa chữa tương đối cho các sản phẩm gen cụ thể trong mỗi mẫu. Những giá trị nàycó thể được so sánh giữa các mẫu cho một ước lượng của các biểu hiện tương đối củacác RNA mục tiêu trong các mẫu. Định lượng tuyệt đối, bằng cách sử dụng RT-PCR cạnh tranh, đo số lượng tuyệt đối(ví dụ: 5,3 × 105 bản sao) của một chuỗi mRNA cụ thể trong một mẫu. Dung dịch phaloãng của một RNA tổng hợp (có chứa các mồi xác định, nhưng hơi ngắn hơn so vớiRNA mục tiêu) được thêm vào mẫu và là co-amplified với mục tiêu. Các sản phẩmPCR từ các bản sao nội sinh sau đó được so sánh với đường cong nồng độ RNA đượctạo ra bởi sự tổng hợp RNA competitor.

Page 132: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

131

Hình 4.12 :RT-PCR. Các enzyme phiên mã ngược sử dụng một oligonucleotide bổ sungcho sự tổng hợp DNA mồi từ một phân tử RNA. Các sợi đơn DNA sau đó được sử dụngnhư một khuôn để tổng hợp một chuỗi DNA thứ hai, và sau đó cho khuếch đại bằng PCR.4.9. REAL-TIME PCR

Phương pháp định lượng Real time RT-PCR kết hợp các thuộc tính tốt nhất củaRT-PCR đó là chính xác, đặc hiệu, độ nhạy cao và thực hiện tương đối dễ dàng. Real-time PCR là quá trình tự động hóa chứ không mất thới gian như RT-PCR bởi việc địnhlượng sản phẩm phản ứng cho mỗi mẫu trong mỗi chu kỳ. Hệ thống Real-time PCRdựa vào sự phát hiện và định lượng một chất phát huỳnh quang, tín hiệu này tăng tỷ lệtrực tiếp đến số lượng sản phẩm PCR trong phản ứng. Trường hợp đơn giản nhất, chấtphát huỳnh quang này là một đôi đươc nhuộm với SYBR Green. SYBR Green gắn vớiDNA sợi kép, có thể là trong các rãnh nhỏ, và khi bị kích thích, phát ra ánh sáng. Nhưvậy, chất nhuộm màu được xem là thành phần của phản ứng PCR khi một sản phẩmPCR có sự tích lũy huỳnh quang tăng dần. Những lợi thế của SYBR Green là rẻ tiền,dễ sử dụng, và độ nhạy cao. Nhưng cũng có bất lợi là SYBR Green sẽ liên kết với bấtkỳ DNA đôi bị nào trong phản ứng, bao gồm cả các dimer primer và các sản phẩmphản ứng khác, có thể gây ra sai sót trong việc dự đoán đoạn DNA mục tiêu. Đối với

Page 133: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

132

các phản ứng PCR có sản phẩm duy nhất với mồi được thiết kế thích hợp, SYBRGreen có thể làm việc rất tốt, những hiệu ứng giả chỉ hiển thị trong các chu kỳ rất trễ.

Hình 4.13. TaqMan, định lượng Real-time PCR. Ba mồi được sử dụng trong suốt quátrình PCR - hai trong số này (mồi 1 và 2) định hướng bắt đầu sao chép DNA ở mỗichuỗi DNA, và mồi thứ ba (mẫu dò) liên kết với một sợi ở giữa. Mẫu dò này có hai sựsửa đổi - một chất phát huỳnh quang (R) gắn ở đầu 5’ và một chất hấp phụ tương ứng(Q) tại phần cuối đấu 3’. Khi DNA bắt đầu nhân đôi, sản phẩm được kéo dài từ mồi 1di chuyển tới đầu 5’ của mẫu dò và exonuclease của polymerase sẽ hoạt động tách cácchất phát huỳnh quang mẫu dò. Việc tách các chất phát huỳnh quang khỏi các chất hấpphụ tương ứng cho phép nó phát huỳnh quang. Số lượng huỳnh quang phát ra tỷ lệthuận với lượng sản phẩm PCR tạo thành và được đo trong mỗi chu kỳ PCR.

Phương pháp khác để định lượng cho các sản phẩm PCR là TaqMan, dựa vàochuyển đổi năng lượng cộng hưởng huỳnh quang (FRET) của mẫu dò để định lượng(Hình 4,13). TaqMan dò là một oligonucleotides có chứa một chất phát huỳnh quang,thường gắn ở đầu 5’, và một chất hấp phụ tương ứng, thường gắn với đầu 3’. Mẫu dònày được thiết kế để lai với vùng bên trong của một sản phẩm PCR. Khi chiếu xạ, chấtphát huỳnh quang được nhận năng lượng kích thích sẽ chuyển đến các phân tử hấp phụtương ưng gần đó hơn là phát huỳnh quang, kết quả là chất nền không phát huỳnh

Page 134: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

133

quang. Trong suốt quá trình PCR, khi polymerase thực hiện việc nhân đôi trên mạchkhuôn có mẫu dò gắn vào, các 5’-3’ exonuclease của polymerase sẽ hoạt động tách cácđầu dò (Hà Lan và cộng sự, 1991). Sự tách rời các chất phát quang và chất chất hấp phụnày làm cho việc ức chế phát quang không còn xảy ra. Sự phát huỳnh quang tăng dầntrong mỗi chu kỳ PCR, tỷ lệ thuận với tỷ lệ các mẫu dò bị cắt, và được điều chỉnh trongmột chu trình luân nhiệt. Real-time PCR là công cụ định lượng hiệu quả cao, nhưng chiphí của hóa chất và trang thiết bị đắt tiền hơn rất nhiều so với các phản ứng PCR chuẩn.4.10. NHỮNG ỨNG DỤNG CỦA PCR

Kĩ thuật PCR đã cách mạng hóa sinh học phân tử bằng cách cho phép khuếchđại và đặc trưng của một lượng nhỏ các axit nucleic. Cũng như được các nhà khoa họccơ bản sử dụng, kỹ thuật này có tầm quan trọng to lớn trong y học để xác định các độtbiến trong vòng một lượng nhỏ DNA của con người, và để nghiên cứu bệnh lý học,những người thường xuyên cần phải phát hiện và mô tả một lượng nhỏ vi sinh vật gâybệnh. Trong bài viết này chúng tôi không miêu tả chi tiết những ứng dụng đa dạng củaPCR, nhưng một số ít trong những ứng dụng chính của PCR được liệt kê dưới đây:• tạo dòng phân tử• trình tự AND• khảo cổ học• pháp y• khuếch đại các trình tự chưa biết rõ• bệnh lý lâm sàng• chẩn đoán di truyền• mô tả những tính đột biến chưa được biết rõ• vân tay / phân tích dân số• phân tích bộ gen• PCR định lượng RNA hoặc DNA.

Page 135: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

134

Chương 5TẠO DÒNG GENCác khái niệm Thư viện DNA là kho chứa các phân tử DNA tái tổ hợp Thư viện gen có chứa các đoạn gen của tất cả các trình tự DNA hiện diện

trong genome Thư viện cDNA có chứa các bản sao DNA của mRNA trong từng mô và giai

đoạn phát triển cụ thể, sự hình thành của chúng phụ thuộc vào enzyme DNApolymerase phụ thuôc RNA, enzyme phiên mã ngược.

Thư viện cơ sở PCR phủ nhận các quy luật về những đoạn ADN được táchdòng và có thể trải qua sự loại trừ để phân lập gen được thể hiện một cách khác biệt.

Hệ gen chứa một số lượng lớn DNA (Bảng 5.1). Do đó, mỗigen có trong bộ gen chỉ đại diện cho một phần rất nhỏ kích thước của bộ gen.

Tất cả các phương pháp tạo dòng DNA truyền thống này bao gồm bốn phần: mộtnhóm các đoạn ADN ngoại lai, sự chèn của DNA ngoại lai vào một vectơ, sự chuyểncủa phân tử DNA tái tổ hợp vào một tế bào chủ, trong đó nó có thể được tái tạo vàphương pháp lựa chọn hay sàng lọc dòng vô tính để xác định những tế bào có cácDNA tái tổ hợp mà chúng ta đang quan tâm. Trong chương này chúng tôi sẽ giải quyếtmột số vấn đề cụ thể và các vấn đề với hai bước đầu tiên trong sự hình thành của cácthư viện DNA. Một thư viện DNA chỉ đơn giản là một tập hợp các đoạn ADN.

Có một số loại thư viện khác nhau mà chúng tôi sẽ xem xét ở đây. thư viện đoạnDNA được chỉ định là, hoặc một thư viện DNA hoặc một thư viện cDNA. Hầu hết cácphương pháp truyền thống xây dựng thư viện liên quan đến việc tách dòng vật lý củacác đoạn DNA khác nhau trong một vector thích hợp. Tuy nhiên, như chúng ta sẽ thấysau này, đoạn DNA không được tách dòng (ví dụ như những sản phẩm có nguồn gốctừ PCR) đang trở nên ngày càng quan trọng trong các thí nghiệm kỹ thuật di truyền.

Một thư viện DNA chứa các bản sao đại diện của tất cả các vật liệu di truyềncủa một sinh vật đơn lẻ. Các thư viện giống như một sinh vật cụ thể. Đó là, một thưviện được xây dựng từ bất kỳ mô nào bên trong một loại sinh vật nên nó chứa cácđoạn DNA tương đồng như những đoạn có nguồn gốc từ bất kỳ mô khác. Tuy nhiêncác thư viện tạo ra từ các sinh vật khác nhau, ví dụ như những thư viện có nguồn gốctừ chuột nhà và chuột rừng , sẽ khác nhau. Thư viện bộ gen DNA chứa tất cả các vậtliệu di truyền, nơi mà chúng được biểu hiện trong một loại mô cụ thể hoặc trong cácgiai đoạn phát triển hoặc không được biểu hiện. Thư viện bộ gen sẽ chứa tất cả cáctrình tự DNA: gen biểu hiện, gen không biểu hiện, exon và intron, promoter và vùngkết thúc và trình tự ADN xen vào.

Thư viện cDNA được xây dựng bằng cách chuyển mRNA từ một mẫu mô cụthể thành đoạn DNA, có thể được nhân bản trong một vector thích hợp. Thư việncDNA chỉ chứa các trình tự mã hóa của các gen biểu hiện trong một mẫu mô cùng vớicác vùng nhỏ của đầu 5’ và 3’ của gen chưa được dịch mã. Do đó, thư viện cDNAphân lập từ các mô khác nhau của cùng một sinh vật có thể rất khác nhau về thành

Page 136: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

135

phần. Các gen biểu hiện trong một loại mô hoặc giai đoạn phát triển cũng có thể khácvới những biểu hiện trong một loại mô hoặc các giai đoạn phát triển khác nhau. Ngoàira, các thành phần của một thư viện cDNA phản ánh sự phong phú tương đối củamRNA trong mẫu mô ban đầu. Các gen biểu hiện ở mức cao được thể hiện trong thưviện nhiều lần, trong khi gen biểu hiện ở mức thấp sẽ được thể hiện trong thư viện ítthường xuyên.

5.1. Thư viện bộ genĐơn vị nhỏ nhất của DNA trong hệ gen là nhiễm sắc thể. Ngay cả trong các

sinh vật đơn giản, nhiễm sắc thể chứa một số lượng rất lớn DNA. Ví dụ, nhiễm sắcthể E.coli chứa 4.6Mbp (4 600 000 bp) DNA (Bảng 5.1). Số lượng DNA này là quálớn để được nhân bản trong bất kì các vectơ đã có sẵn (chương 3). Vì vậy một thư việnbộ gen là thực sự cần thiết, đối với đoạn DNA trước khi được nhân bản trong mộtvector thích hợp. Phương pháp “ phân chia và xâm nhiễm” được sử dụng ở đây, theođó các đoạn nhỏ của bộ gen có thể được chỉ định một chức năng cụ thể trong khi toànbộ bộ gen không thể thực hiện được. Các phương pháp phân mảnh đóng vai trò quantrọng trong chất lượng của thư viện. DNA của hệ gen nên được chia thành các mảnh,chồng chéo và ngẫu nhiên trước khi nhân bản. Sự phân cắt sẽ đảm bảo rằng thư việncó chứa các bản sao đại diện của tất cả các đoạn DNA hiện diện trong bộ gen, và đókhông phải là đoạn chéo gặp phải do sự phân cắt của DNA tại các vị trí cụ thể. Có haicơ chế cơ bản để tách ADN được sử dụng trong việc xây dựng các thư viện di truyền.

(a) Cắt cơ học. DNA tinh khiết hoặc đi qua một ống tiêm kim hep nhiều lần hoặcđược xử lí bằng sóng âm để phá vỡ các DNA thành những đoạn có kích thước phù hợpcó thể nhân bản. Thông thường kích thước trung bình của đoạn DNA vào khoảng 20kbp là thích hợp cho nhân bản trong vecto λ . Phương pháp cơ học như thế này có lợithế là sự phân mảnh của DNA là ngẫu nhiên, nhưng thực tế là số lượng lớn các DNAđược yêu cầu, và kích thước trung bình của DNA phân mảnh có thể khá khác nhau.

(b) Sự phân cắt của enzyme cắt giới hạn. Các enzyme cắt giới hạn, chẳng hạnnhư EcoRI, thường nhận ra 6 bp chuỗi DNA và tách ADN ở trình tự nhân biết. Tínhtrung bình, có 6bp chuỗi DNA thì sẽ xảy ra với khoảng 4000bp trong DNA. Sự tiêuhủy hoàn toàn của DNA bộ gen bằng EcoRI sẽ tạo ra những đoạn ADN quá nhỏ để cóthể sử dụng trong việc xây dựng thư viện di truyền. Các enzyme cắt giớ hạn, ví dụnhư NotI, nhận biết và tách 8 bp trình tự nhận biết. Trình tự như thế sẽ xảy ra ít hơnthường trong DNA (khoảng một lần mỗi 65 kbp). Tuy nhiên, các enzyme cắt giới hạnphân cắt để tạo ra những đoạn ADN như một trình tự các vị trí nhận biết chính nó.Nếu như vậy, một gene mà chúng ta muốn nhân bản sẽ chứa nhiều vị trí nhận biết chomột enzyme cắt giới hạn cụ thể, sau đó các đoạn tạo ra sau sự phân cắt của enzyme cóthể quá nhỏ để tiến hành nhân bản, và do đó gen có thể không được thể hiện trong thưviện. Để khắc phục vấn đề này thư viện DNA thường được xây dựng bằng cách phâncắt DNA bằng các enzyme cắt giới hạn theo cách phân cắt không hoàn toàn (Hình5.1). Sự phân cắt không hoàn toàn của các enzyme cắt giới hạn sẽ đảm bảo rằngkhông phải tất cả trình tự nhận biết của DNA được cắt và, do đó, các thư viện sản xuấtcần có bản sao của gen có nhiều trình tự nhận biết của enzyme cắt giới hạn. Trong

Page 137: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

136

thực tế, sự phân hủy của enzyme cắt giới hạn thường được thực hiện bằng cách sửdụng một loại enzyme cắt giới hạn, hoặc hai, để nhận biết và tách các trình tự xuấthiện phổ biến. Ví dụ, như trong hình 5.2,phân tử DNA có trọng lượng phân tử caođược cắt với một hỗn hợp các enzyme cắt giới hạn HaeIII và AluI. Mỗi enzyme cắtgiới hạn nhận biết 4 bp trình tự ADN. Trình tự của chúng vì thế sẽ xuất hiện, trungbình, cứ khoảng 256 bp trong DNA hệ gen. Sự phân cắt không hoàn toàn hạn chế sốlượng vùng enzyme cắt giới hạn và dẫn đến sự hình thành các đoạn DNA có kíchthước thích hợp cho nhân bản. DNA được tạo ra theo cách này có đầu bằng khi cả haienzyme HaeIII và AluI cắt DNA theo đầu bằng:

Các đoạn DNA đầu bằng xác nhận là mơ hồ khi nỗ lực thực hiện để nhânbản chúng. Như chúng ta đã gặp (Chương 2), mối nối của DNA đầu dính được coi làhiệu quả hơn DNA là đầu bằng. Do đó, những đoạn gen có chứa đầu dính rất thíchhợptrong quá trình nhân bản. Điều này có thể đạt được bằng một trong hai cách.

Hình 5.1. Sự phân cắt hoàn toàn hay không hoàn toàn cuả một enzyme cắt giớihạn. (a) Sự phân hủy hoàn toàn đảm bảo rằng tất cả các vị trí nhận biết của enzymecắt giới hạn đều được cắt.(b) Sự phân cắt không hoàn toàn, kết quả của sự phân cắt làmột tập hợp ngẫu nhiên của vị trí nhận biết. Phân cắt không hoàn toàn sẽ tạo ra cácsản phẩm như mong muốn.

• Các linker hoặc các adaptor. Như trong hình 5.2, các đoạn DNA đầu bằng có thểđược nối lại thành một chuỗi các oligonucleotides hoặc có chứa các trình tự nhận biếtcủa enzyme cắt giới hạn (linker) hoặc có một đầu bằng để nối DNA và đầu dính treo

Page 138: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

137

bên trên cho sự nhân bản ở các vị trí giới hạn cụ thể (adaptor). Trong trường hợp này,các đoạn DNA là được bảo vệ bởi sự phân cắt của enzyme cắt giới hạn bằng cách xửlý với enzyme DNA methylase (Maniatis và cộng sự năm 1978.,). Việc xử lí các đoạnDNA bằng methylase EcoRI, và sự hiện diện của S-adenosylmethoinine, sẽ gây ra sựmethyl hóa của phần lớn các chất bên trong. Một đầu của trình tự nhận biết của EcoRI(5-GAATTC-3). DNA biến đổi theo cách này có thể không bị phân cắt bởi enzyme cắtgiới hạn (xem hình 2,1). Các linkers oligonucleotide sau đó được thêm vào DNA đãđược methyl hóa với số lượng lớn với nồng độ cao của enzyme DNA ligase. Sau đó xửlí bằng các enzyme cắt giới hạn EcoRI sẽ cho kết quả DNA phân cắt bởi các phân tửliên kết, chỉ có những phân tử chứa các trình tự nhận biết của enzyme cắt giới hạnEcoRI không bị methyl hóa . Kết quả là các đoạn DNA sau đó có thể được nhân bảntại vị trí giới hạn EcoRI của một vector thích hợp.

Hình 5.2. Cấu trúc của thư viện DNAKhi các đoạn ADN được tạo thành, sẽ có sự nhân bản bằng một vector thích hợp.

Thường thì đó sẽ là vectơ λ, như chúng ta đã gặp ở chương 3, một loạt các vector cósẵn để nhân bản các đoạn DNA lớn. Các vector tái tổ hợp và sự kết hợp các đoạn chèn

Page 139: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

138

được phát triển ở E. coli giống như việc tạo khuẩn lạc riêng lẻ ở vi khuẩn hoặc tạo vếtvirus, phát sinh từ việc nối một đoạn DNA đơn lẻ vào vector. Tế bào E. coli nhiễmbằng thể thực khuẩn λ hoặc chuyển bằng một DNA plasmid không có khả năng hỗ trợviệc sao chép các phân tử ADN bổ sung cùng loại. Do đó, mỗi vết của vi khuẩn λ hoặckhuẩn lạc vi khuẩn chứa nhiều bản sao của phân tử DNA tái tổ hợp cùng loại. Một thưviện của các phân tử được sản xuất bằng cách tổng hợp các khuẩn lạc hoặc các vết nhưvậy là đủ để đảm bảo rằng mỗi đoạn DNA được thể hiện ít nhất một lần trong thư viện.Ưu điểm chính của nhân bản đoạn ADN lớn là các dòng nhân bản đơn lẻ ít hơn, phảiđược gộp lại với nhau để tạo nên một thư viện điển hình. Một câu hỏi đặt ra ở đây làcó bao nhiêu khuẩn lac đơn lẻ hoặc vết phải được gộp lại để đảm bảo rằng thư việnthực sự là đại diện cho DNA mà nó đã thể hiện? Câu trả lời cho điều này phụ thuộcvào kích thước của cả bộ gen mà từ đó thư viện được thể hiện và theo kích thước trungbình của các đoạn ADN nhân bản trong thư viện. Ví dụ, nếu một thư viện của bộ genvi khuẩn E. coli (4,6 Mbp) được xây dựng có chứa 5 kbp đoạn DNA, từ đó tỉ lệ kíchthước bộ gen so với kích thước trung bình của đoạn gen nhân bản đơn lẻ (f) sẽ đưa racon số khả thi thấp nhất của dòng vô tính mà thư viện phải chứa :

Do đó, thư viện gen về kích thước của một vi khuẩn E. coli sẽ cần ít nhất 920dòng nhân bản độc lập. Sử dụng cùng một công thức, một thư viện gen người có kíchthước chèn tương tự sẽ cần ít nhất 580 000 dòng tái tổ hợp độc lập để xây dựng một thưviện điển hình. Nếu kích thước đoạn tăng lên đến 20 kbp, sẽ phù hợp cho vecto λ, khi đóthư viện người phải có ít nhất 145 000 dòng tái tổ hợp độc lập được thể hiện. Tỷ lệ từkích thước bộ gen đến kích thước đoạn là một ước tính phức tạp cần thiết để xây dựngmột thư viện. Thư viện phải chứa một số lớn hơn nhiều các dòng vô tính tái tổ hợp khimột số trình tự được biểu hiện ẩn hoặc bằng cách thay đổi mẫu bị lỗi, hoặc là một hệ quảcủa chính chuỗi DNA - DNA nhân bản là tương đối độc đối với tế bào chủ, trong đóvector tái tổ hợp được sao chép, hoặc chúng có chứa các trình tự rất khó để sao chép, vídụ như DNA lặp đi lặp lại cao. Trong những năm 1970 giữa, Clarke và Carbon bắtnguồn từ công thức có liên quan xác suất (P) bao gồm cả các trình tự ADN trong thưviện ngẫu nhiên của sự tái tổ hợp độc lập N (Clarke và Carbon, 1976):

Trong đó f là tỷ lệ kích thước bộ gen với kích thước đoạn DNA đã mô tả ở trên,và ln là log cơ số tự nhiên. Vì vậy, để đạt được xác suất 99 (P = 0,99) bao gồm cảtrình tự ngẫu nhiên cụ thể của DNA bộ gen người trong một thư viện có 20 kbp đoạnDNA, N = 6,7 × 105. Trong thực tế, hầu hết các thư viện gen của con người sẽ có hơnmột triệu dòng tái tổ hợp độc lập. Việc tổng hợp cùng nhau của các vết hoặc các khuẩnlạc tái tổ hợp tạo ra một thư viện sơ cấp. Các dòng tái tổ hợp chỉ đơn giản là rửa sạch

Page 140: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

139

các đĩa tăng trưởng và kết hợp chúng trong một ống nghiệm thích hợp. Các thư việnnên chứa bản sao đại diện của mỗi phân tử DNA từ cái mà nó được tạo ra. Tất nhiên,có thể là một số phân tử DNA có thể không được kết hợp trong thư viện. Trình tựDNA nhất định có thể độc hại cho E. coli. DNA ngoại lai có thể:

• Được thể hiện ngẫu nhiên trong E. coli và protein hoặc đoan protein có thể có hạicho sự phát triển của vi khuẩn

• Hoạt động như một vị trí liên kết cho E. coli và protein, cô lập chúng theo cách màchúng không thể thực hiện chức năng tự nhiên của chúng hoặc

• Lặp đi lặp lại cao và bị loại khỏi tế bào vi khuẩn thông qua tái tổ hợp.Các thư viện sơ cấp thường độ chuẩn xác thấp và không ổn định. Để tăng sự ổn

định và chuẩn xác của nó, thư viện thường phải có một bước khuyếch đại. Đó là, cácbộ sưu tập các dòng vi khuẩn và các thể thực khuẩn được cấy trên đĩa petri một lầnnữa, và kết quả là con cháu được tập hợp để tạo thành một thư viện khuyếch đại. Cácthư viện khuyếch đại thường có khối lượng lớn hơn nhiều so với các thư viện sơ cấp,và do đó có thể được thử nghiệm nhiều, hoặc thậm chí hàng trăm lần. bộ sưu tập thểthực khuẩn λ có thể được lưu trữ gần như vô hạn định. Tế bào vi khuẩn chứa plasmidcó nhiều khó khăn để lưu trữ thường có một mức độ mất dòng tái tổ hợp sau khi hồiphục tế bào vi khuẩn đông lạnh. Sự khuyếch đại thư viện là điều cần thiết nếu thư việnlà dung để kiểm tra nhiều lần. Tuy nhiên, có thể là quá trình khuyếch đại sẽ cho kết quảtrong thành phần của thư viện khuyếch đại không thực sự phản ánh thư vện sơ cấp. Nhưchúng tôi đã thảo luận, trình tự ADN cụ thể có thể tương đối độc hại đối với tế bào E.coli, khi một trình tự vi khuẩn chứa dòng nhân bản sẽ phát triển chậm hơn so với các vikhuẩn khác chứa các chuỗi DNA mà không ảnh hưởng đến tăng trưởng của vi khuẩn.Như trình tự DNA có vấn đề có thể có mặt trong thư viện chính, nhưng sẽ bị mất, hoặcbiểu hiện ẩn, sau giai đoạn tăng trưởng cần thiết để hình thành thư viện mở rộng.5.2. Thư Viện cDNA

Không phải hầu hết các hệ gen của sinh vật nhân thật bậc cao đều lớn ,nhưngkhông nhiều các mảnh nhỏ của DNA chứa các đoạn mã hóa gen. Trong dự án cấu trúchệ gen người (chương 9) đã ước tính cấu tạo của gen có khoảng 1,5% DNA chứa tronghệ gen. Những hiểu biết về toàn bộ cấu trúc hệ gen là rất quan trọng trong việc tìmhiểu về cấu trúc chức năng của protein tế bào . Protein có sản xuất một cách toàn diện,nhưng quan trọng hơn là các hiểu biết về hàm lượng protein của một tế bào có thể sảnxuất thực sự .Hầu hết các tế bào trong sinh giới đều nhận được một hệ gen tương đốigiống nhau về cấu trúc,nhưng mỗi cách thức sao chép và chuyển đổi của mỗi hẹ gen làduy nhất đối với từng loại tế bào ,và tuỳ thuộc vào từng giai đoạn phát triển của các cáthể trong tế bào.Mặc dù có rất nhiều các đoạn gen cụ thể của từng loại tế bào ,nhưngchúng vẫn có thể giống nhau, ví dụ các đoạn gen mã hoá cho các enzyme trong chutrình TCA tồn tại một vài điểm khác biệt . Ví dụ sự khác nhau giữa các đoạn gen mãhoá cho tế bào da và tế bào cơ, những sự khác biệt giữa các đoạn gen mà chúng sảnxuất, xác định rõ các loại tế bào .Như vậy mRNA tồn tại trong khuôn khổ tế bào sẽ saochép hệ gen một cách rõ ràng ở một thời điềm nhất định . mARN thực sự là yếu tố đạidiện cho các mảnh nhỏ trong toàn bộ RNA có trong tế bào (bảng 5.2).

Page 141: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

140

Hầu hết các protein của tế bào nhân thực được phiên mã bởi enzyme RNApolymerase II và kết quả mRNA thường gặp phải vấn đề về sự biến đổi gen sau khiphiên mã bao gồm 7-methyguanosine ở mạch 5’ kết thúc và tổng cộng 100-200Adenin ở mạch 3’ kết thúc trong quá trình sao chép (hình 1.27) .Ngoài ra mRNA còntrải qua sự ghép nối sau công đoạn cắt các đoạn intron trong quá trình dịch mã, việcgắn kết đó có thể tìm thấy các tín hiệu đơn lẻ

Bảng 5.2. Sự phân phối của RNA trong tế bào . Ở tế bào nhân thực enzymeRNA polymerase II chịu trách nhiệm sản xuất khoảng 60% sản phẩm của quá trìnhphiên mã . Điều đó là ổn định ,tuy nhiên mRNA tích lũy chỉ khoảng 10% hoặc ít hơn .

Một vấn đề với mRNA là ,trong quá trình ,nó rất khó có thể duy trì tính ổn địnhcủa vector và đó là một khó khăn trong việc thao tác .Do vậy , đoạn sao DNA(đượcgọi là đoạn DNA bổ sung , hoặc cDNA) trong các mRNA là yếu tố thiết yếu trước khithư viện được hình thành . Sự chuyển biến từ RNA thành DNA phụ thuộc vào thờiđiểm diễn ra quá trình sao chép ngược , ở một enzyme tìm được trong retro virut nóchịu trách nhiệm trong việc chuyển biến các RNA trong hệ gen thành các đoạn DNAtrước khi dung hợp vào tế bào chủ ( hình 5.3). David Baltimore va Howard Temin làngười đầu tiên khám phá ra enzyme một cách độc lập vào năm 1970 . Enzyme saochép ngược là một enzyme DNA polymeaza phụ thuộc RNA . Hầu hết các DNApolymeaza , cắt chủ yếu ở các đoạn nucleotide mới phát triển từ mạch 5’ và 3’. Quátrình phiên mã ngược thông thường có 2 dạng hoạt động của enzyme:

• Dạng hoạt động của DNA polymerase. Trong chu trình sống của virut retro, quátrình sao chép ngược sản xuất DNA sao chép từ RNA, như việc tiến hành trong phòngthí nghiệm nó sẽ phiên mã cả mạch RNA và mẫu DNA sợi đơn với về hiệu suất nhưnhau. Ở 2 trường hợp, mồi RNA hoặc DNA là cần thiết để bắt đầu tổng hợp.

• Dạng hoạt động của RNaseH. RNaseH là một Ribonuclease làm phân rã RNAtừ phức hợp RNA-DNA lai, tương tự như các hình thái diễn ra trong quá trình saochép ngược của RNA mẫu. RNaseH có chức năng như 2 loại enzyme endonuclease vàexonuclease dung để phân cắt các phân tử mục tiêu.

Page 142: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

141

Hình 5.3. Enzyme phiên mã ngược. Cấu trúc của các tinh thể X-ray ở độ phân giải1,8 A˚ của đoạn xúc tác hoạt hóa của enzyme phiên mã ngược từ virus gây bệnh bạchcầu chuột Moloney (MMLV-RT) (Georgiadis và cộng sự, 1995). Enzyme này là mộtDNA polymerase phụ thuộc RNA được sử dụng trong chuyển đổi từ mRNA thành cDNA.

Hầu hết các retro virut đều tự mã hoá cho enzyme sao chép ngược của chúng,nhưng loại enzyme thương mại sử dụng trong thư viện cDNA được tìm thấy từ mộtloại virut gây bệnh bạch cầu ở chuột Moloney (MNLV-RT) hoặc từ virut tồn tại trongtế bào tuỷ xương (AMV-RT), sau quá trình tinh chế enzymme từ tế bào truyền nhiễmhoặc sau biểu hiện và sự tinh chế từ E.coli .Hai enzyme này chủ yếu có hoạt độnggiống nhau ,nhưng khác nhau về đặc tính đặc trưng như nhiệt độ hoạt động hay pH tốiưu .MMLV-RT là một sợ đơn polypepetide vào khoảng 71 kDa , trong khi đó AMV-RT bao gồm 2 đoạn polypepetide 1 mạch 64kDa và một mạch 96kDa .Quan trọng hơncả ,MMLV-RT có enzyme RNaseH hoạt động rất yếu so với AMV-RT , điều đó rõdàng tạo ra sự thuận lợi trong việc tổng hợp DNA từ phân tử RNA.

Phương pháp của quá trình tổng hợp bản sao cDNA sợi đôi từ phân tử mRNAđược biểu diễn ở hình 5.4. Sự hiện diện của đuôi polyA là yếu tố duy nhất ở mRNA vàcung cấp một cơ chế phân biệt và cô lập mRNA từ nhiều phân tử rRNA và tRNA.mRNA có thể cô lập từ một hỗn hợp bằng cách cho tổng các RNA vào cột với đoạnpolymer deoxythymidine (oligo-dT) gắn bên trong. Phân tử RNA đó không chứanhiều Adenie sẽ không bám vào cột mà sẽ chảy thảng xuyên qua cột. Phân tử mRNA,mặt khác, sẽ bắt cặp bổ sung với các cặp base từ cột và được tách rửa khi nồng độmuối chảy qua cột giảm dần.

Page 143: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

142

Hình 5.4. Quá trình xây dựng lên thư viện cDNA . Xem xét ở dạng chi tiếtViệc tạo dòng của cDNA là từ việc trộn lẫn các đoạn oligonnucleotide ngắn

(12-18 base) của dT với mRNA đã được tinh sạch như vây đoạn oligonucleotide sẽliên kết với đuôi polyA của phân tử mRNA . Enzyme sao mã ngược sau đó sẽ đượcthêm vào và sử dụng ologo-dT cũng như các đoạn mồi tổng hợp các mạch cDNA đơnvới sự hiện diện của 4 loai dNTPs. Các phân tử hình thành là mạch đôi hình thành từmột phân tử cDNA và một phân tử mRNA . Mồi Olygo dT được sử dụng để tổng hợplên cDNA sẽ có kết thúc khác nhau. Các đoạn mồi có thể bắt cặp ở nhiều vị trí vớiđuôi polyA và vì thế có thu được các đoạn cDNA các chiều dài khác nhau từ mộtphân tử mRNA giống nhau . Để khắc phục vấn đề này , các đoạn mồi oligo-dT hìnhmỏ neo thường được sử dụng . Thêm vào đó có đến 12-18 trình tự base dT, mồi hìnhmỏ neo được cấu trúc như đầu 3’ đặc biệt chứa G,A, hoặc C (Liang và Patdee,1992).Như đoạn mồi (5’-T12-18 V-3’,có tỉ lệ V=G ,A hoặc C ) nó xẽ trở lên hiệu quả cho việcsao chép mạch DNA nếu chúng bắt cặp ở đầu 5’ đực biệt của đuôi polyA , Khi đó G,A hoặc C có thể bắt cặp ngay lập tức với đoạn nucleotide có trước ở chuỗi polyA

Việc tổng hợp mạch DNA thứ 2 ,giống như sao chép DNA ,phụ thuộc vàođoạn mồi để bắt đầu tổng hợp. Tuy nhiên , sau đoạn đuôi polyA ,mRNA được sản xuấttừ các gen khác nhau sẽ khác nhau , Trước đó cơ chế cần thiết cho việc tổng hợp

Page 144: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

143

chuỗi DNA tại trình tự tương ứng với đầu 5’của RNA . Phươn pháp tạo dòng cDNAbao gồm các đoạn hair-pin trong sợi cDNA tổng hợp sớm , nó có thể phục vụ cho việctạo nên cấu trúc hình thành nên mạch thứ 2 . Sau đó hair-pin bị loại bỏ khỏi cDNAbằng cách xử lí với enzyme S1 nuclease (Efstratiadis và cộng sự,1976).Tuy nhiênphương pháp này mang lại kết quả không là mất đoạn tại vị trí 5’ của gene,và ở mạchthứ 2 tổng hợp theo cơ chế dịch chuyển từ điểm cắt (nick translation) hoặchomopolymer tailing.

-Nick translation: RNAseH được sử dụng một phần để đồng hóa RNA, thànhphần của RNA-DNA lai (Gubler và Hofman,1983). Phần còn lại của RNA sau đó đượcdùng như một mồi cho sự tổng hợp sợi DNA mới sử dụng polymerase I với sự hiệndiện của 4 loại dNTPs và enzyme ligase được sử dụng để đánh dấu các đoạn cát trongbộ khung xương DNA. Phân tử cDNA mạch đôi cuối cùng sẽ được nhân bản trongmột vector thích hợp.

- Homopolymer tailing: RNA-DNA lai hình thành sau khi đoạn cDNA đầutiên được xử lí với với enzyme terminal tranferase với sự hiện diện của cácdeoxynucleotide triphosphate đơn. Phần cuối của deoxynucletidal tranferase (TdT) làmột enzyme độc lập. Hoạt tính của TdT được định nghĩa bằng sự phân giải immunoglobin(VDJ) tái tổ hợp với các nucleotide ngoại bào được chèn thêm vào các đoạn nối (Altvà Baltimore,1982). TdT được hình thành với nồng độ cao trong tuyến ức và xươngnơi mà các yếu tố tái tổ hợp xuất hiện , nhưng rất có giá trị khi đoạn protein tái tổ hợpđược tổng hợp với số lượng lớn và được tinh chế từ E.coli . Phân tử DNA (và RNA) ủvới TdT với sự hiện diện của dCTP sẽ có nhiều mạch C được thêm vào đầu 3’ (hình5.4). Trước tiên là việc tổng hợp sợi DNA thứ hai, RNA từ RNA-DNA lai có thể bị lọibỏ để cung cấp mach đơn làm khuôn mẫu cho viêc tổng hợp DNA . Điều đó có thể đạtđược dễ dàng với sự giúp đỡ trong việc lai ở môi trường kiềm .RNA bị thuỷ phânquanh giá trị pH 11, trong khi DNA chịu được thuỷ phân ở hơn hoặc pH 13 (Watsonvà Yamazaki,1973). Việc tăng giá trị pH lên12 dẫn đến việc thủy phân RNA nhưngDNA thì không . Chuỗi cDNA có độ dài đầy đủ được tách rời từ ribonucleotide sẽ lànền tảng cho việc tạo gradiend nồng độ ly tâm . Đoạn cDNA cuối cùng sẽ có mạch C ởvị trí 3’và nhiều mạch T ở vị trí 5’. Sự tổng hợp đoạn cDNA thứ hai sau đó sẽ bắt đầubằng cách sử dụng mồi oligo-dG, trong suốt quá trình bắt cặp bổ sung đến khi hìnhthành chuỗi polyC mới. Enzyme phiên mã ngược, hoạt động với vai trò của mộtenzyme DNA polymerase phụ thuộc DNA, sự hiện diện của 4 loại dNTPs sẽ giúp chosự tổng hợp mạch cDNA thứ hai.

Homopolymer tailing có một thuận lợi đó là cả đầu 5’ và 3’ của mRNA gốcđược gắn với một trình tự đặc biệt và xác định trong sợi đôi cDNA cuối cùng. Điều nàycó thể vô cùng hữu ích khi đoạn cDNA tạo dòng theo một hướng đặc biệt là cần thiết, vídụ như trong suốt quá trình biểu hiện của cDNA. Các phân tử mRNA được định hướng.Đầu 5’ đại diện cho sự bắt đầu của trình tự gen, và đuôi 3’ polyA xuất hiện tại cuốitrình tự gen. Do đó, nếu chúng ta muốn biểu hiện cDNA trong, ví dụ tế bào vi khuẩn, thìđiều quan trọng là đảm bảo chỉ có sợi xuôi của cDNA được phiên mã. Nếu các sợi

Page 145: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

144

ngược là nhân bản theo hướng ngược lại của một promotoer vi khuẩn, thì các bản saocuối cùng (nếu sản xuất tất cả) sẽ không mã hóa protein như dự tính (Hình 5.5).

Hình 5.5. cDNA được biểu hiện phải được nhân bản theo một định hướng xácđịnh như vậy các yếu tố promoter mà nó được đính kèm sẽ bắt đầu sự phiên mã củasợi DNA xuôi, hơn là sợi ngược.5.3. Tạo dòng cDNA định hướng

Việc tổng hợp cDNA bằng cách sử dụng oligonucleotides biến đổi để bắt đầusự tổng hợp của chuỗi DNA cho phép chèn các vị trí nhận biết của enzyme cắt giớihạn đặc hiệu ở đoạn cuối cDNA vì thế việc tạo dòng của các đoạn cDNA có thể xảy ratheo một hướng (hình 5.6). Trong ví dụ này thể hiện ở đây, mồi Oligo-DT chứa trìnhtự bổ sung tại đầu 5’ mã hóa vị trí nhận biết của enzye cắt giới hạn XhoI (5’-TCGAG-3’). Như chúng ta đã thảo luận về PCR trong chương 4, các mồi bắt đầu tổng hợpDNA và bản thân nó được kết hợp vào các chuỗi kéo dài. Do đó, vị trí nhận biếtenzyme cắt giới hạn XhoI sẽ được đưa vào đầu 3’của cDNA. Tương tự, các mồi sửdụng để bắt đầu sợi cDNA thứ hai, ngoài ra trình tự Oligo-DG, chứa ví trí nhận biếtcủa enzyme cắt giới hạn EcoRI (5’-GAATTC-3’) tại đầu 5’. Do đó, các cDNA sẽ chứaEcoRI ở đầu 5’ và XhoI ở đầu 3’ của nó. Nơi chứa các vị trí này thì cDNA có thể đượcnhân bản một cách có định hướng. Một plasmid mang một promoter thích hợp theo sau,một vị trí nhận biết của enzyme cắt giới hạn EcoRI và XhoI sẽ cho phép việc cắt cácđoạn cDNA theo một hướng duy nhất. Vì vậy, các promoter sẽ kích thích sự biểu hiệncủa gen mã hóa bởi các cDNA và không có sự định hướng ngược lại cho sợi đối diện.

Page 146: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

145

Hình 5.6. Tạo dòng cDNA trực tiếp. Mồi biến đổi bắt đầu tổng hợp DNA và kết quả làsự chèn vào của trình tự nhận biết enzyme cắt giới hạn tại đầu 5’ và 3’ của cDNA.

Một vấn đề rõ ràng cho việc cắt cDNA bằng các enzyme cắt giới hạn là cDNAcủa chính nó có thể chứa các vị trí nhận biết enzyme cắt giới hạn. Phương pháp khắcphục vấn đề này tương tự như chúng ta đã gặp phải trong xây dựng thư viện gen cũngcó thể được sử dụng ở đây. Ngoài ra, các dạng methyl hóa của các deoxynucleotideskhác nhau trong quá trình tổng hợp các của cDNA sẽ bảo vệ các sợi DNA tổng hợpsớm từ sự phân cắt của một số các enzym cắt giới hạn. Ví dụ, cDNA được tổng hợpvới sự hiện diện của dCTP methyl hóa sẽ có khả năng chống phân cắt của XhoI do cómạch C methyl hóa (Endow và Roberts, 1977). Ngoài ra, sự phân cắt tại vị trí nhậnbiết của enzyme cắt giới hạn ví dụ: trình tự nhận biết của NotI (5’-GCGGCCGC-3’),có thể được thêm vào đầu kết thúc của đoạn cDNA để làm giảm khả năng tách củaenzyme trong cDNA của chính nó.

Việc bắt đầu tổng hợp cDNA bằng cách sử dụng mồi Oligo-DT đã thànhcông mĩ mãn trong việc xây dựng một loạt các thư viện cDNA. Nhiều phương phápđược tiếp cận , tuy nhiên, có những hạn chế. Một mồi Oligo-DT chỉ phù hợp với phiênmã ngược của các phân tử mRNA với đuôi poly (A). RNA của Prokaryote và một số

Page 147: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

146

mRNA của Euka không có đuôi PolyA (Adesnik và cộng sự, 1972.). Do đó thư việncDNA của sinh vật nhân sơ có thể không được sản xuất bằng phương pháp này, vàtrong các thư viện của sinh vật nhân chuẩn, một số trình tự sẽ không xuất hiện. Ngoàira, mồi ban đầu tại đầu 3’của sản phẩm phiên mã sẽ tạo ra kết quả là trong các dạngthư viện được hình thành bởi các đoạn DNA tương ứng với đầu 3’của gen- các sảnphẩm của sự phiên mã có thể không được thể hiện đầy đủ trong thư viện. Vấn đề nàycó thể được giải quyết bằng cách sử dụng mồi ngẫu nhiên để bắt đầu các sự tổng hợpcủa chuỗi cDNA đầu tiên. Các mồi ngẫu nhiên thường dài từ sáu đến chín nucleotidevà là một hỗn hợp của tất cả các base tương ứng vào từng vị trí (5’-NNNNN-3’). Mồingẫu nhiên sẽ kết hợp với vị trí ngẫu nhiên dọc theo các mRNA và sẽ là khởi điểm chotổng hợp DNA. cDNA nhân bản bằng phương pháp này, thì sự tổng hợp của sợi thứhai, có thể không có được chiều dài đầy đủ, nhưng sẽ tạo ra các đoạn DNA có nhiềubiểu hiện hơn trong mRNA ban đầu. Các phương pháp bắt đầu được đưa ra để nhânbản cDNA có chiều dài đầy đủ bắt đầu từ một đoạn, có thể được phân lập từ một thưviện mồi ngẫu nhiên (Frohman, Duch và Martin, 1988).5.4. Thư viện dựa trên PCR

Việc xây dựng thư viện cDNA chất lượng cao vừa mất thời gian và kỹ thuậtlại phức tạp. Sự ổn định và cố định của thư viện trong đó đoạn cDNA được nhân bảntrong một vector, cùng với khả năng sàng lọc nhiều lần, làm cho các thư viện này trởthành lựa chọn phổ biến cho việc cô lập dòng cDNA. Trong nhiều trường hợp, cầnphải xây dựng một thư viện dòng cDNA có thể được bỏ qua việc phân tích sản phẩmPCR được hình thành từ mRNA. Loại phương pháp tiếp cận này chỉ khả thi nếu việcthử nghiệm DNA(Chương 6) được thực hiện bằng cách sử dụng acid nucleic lai vàkhông áp dụng khi phân tích chức năng của protein mã hóa. Tuy nhiên, thư viện dựatrên PCR lại dễ dàng và nhanh chóng cho cả việc xây dựng và thử nghiệm. Thư việndựa trên PCR được xây dựng bằng cách sử dụng sự kết hợp của phiên mã ngược vàPCR (RT-PCR) (Mocharla, Mocharla và Hodes, 1990). RT-PCR vừa mẫn cảm vừalinh hoạt. Kỹ thuật này có thể được sử dụng để xác định sự hiện diện hay thiếu sót củamột bản sao, để ước tính mức độ biểu hiện và nhân bản các sản phẩm cDNA mà khôngcần thiết phải xây dựng và sàng lọc một thư viện cDNA.

Khái quát toàn bộ quá trình để tạo ra một thư viện RT-CR từ hỗn hợp của cácphân tử mRNA không xác định được thể hiện trong hình 5.7. Hầu hết các quy trìnhRT-CR sử dụng phiên mã ngược để sản xuất mạch cDNA đầu tiên (Murakawa và cộngsự, 1988.). Việc sản xuất một mạch đơn cDNA là đủ trước khi sự chuyển sang giaiđoạn PCR, việc tổng hợp sợi cDNA thứ hai và khuếch đại PCR được thực hiện bằngcách sử dụng DNA polymerase chịu nhiệt , ví dụ: Taq ADN polymerase (xem Chương4). Ngoài ra để DNA polymerase phụ thuộc DNA hoạt động, một vài DNA polymerasechịu nhiệt (ví dụ như Thermus thermophilus (TTH) polymerase DNA) có một hoạtđộng phiên mã ngược với sự có mặt của các ion mangan. Điều này đã dẫn đến sự pháttriển của quy trình cho sự phiên mã ngược của enzyme đơn và khuếch đại PCR (Myersvà Gelfand, 1991). Hệ thống chỉ được phát triển trong các phản ứng phiên mã ngượcvà PCR được dùng trong cùng một loại đệm để loại bỏ sự bổ sung thứ cấp, hỗn hợp

Page 148: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

147

phản ứng sẽ giảm cả về hai mặt, thời gian và khả năng gây tạp nhiễm vào phản ứng(Wang, Cao và Johnson, 1992).

Hình 5.7. RT_CR để tạo ra một thư viện cDNA khổng lồMột hệ thống như vậy là lý tưởng cho việc khuếch đại của các phân tử mRNA có

trình tự đã biết sử dụng mồi chuyên biệt, nhưng việc xây dựng các thư viện đại diệnlớn yêu cầu các bước bổ sung để đảm bảo rằng mỗi phân tử mRNA trong quần thểđược đại diện trong thư viện. Một số phương pháp đã được đưa ra để khuyếch đại tấtcả các loại mRNA tiềm năng trong một mẫu. Phương pháp được nêu trong hình 5.7 sửdụng rất nhiều các yếu tố tương tự như chúng ta đã thấy trong việc xây dựng thư việncDNA. Các sợi cDNA đầu tiên được tổng hợp bằng cách sử dụng phiên mã ngược từmột mồi Oligo-DT bổ sung, một trình tự duy nhất được thêm vào đầu 5’. Các sợimRNA của DNA- RNA lai bị loại bỏ bằng cách xử lý với RNaseH, đầu tiên là bổ sungcác đoạn đa C tại đầu 3’ của phân tử DNA sử dụng transferase tận cùng. Sợi cDNAthứ hai được tổng hợp bằng cách sử dụng mồi Oligo-DG có trình tự duy nhất tại đầu5’của nó. Các DNA polymerase chịu nhiệt sẽ được sử dụng cho các phản ứng PCR

Page 149: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

148

tiếp theo cũng có thể được sử dụng để thực hiện việc tổng hợp sợi cDNA thứ hai.Trình tự duy nhất tại đầu 5’ và 3’của các sợi cDNA đôi này sau đó được sử dụng nhưmồi liên kết, phản ứng PCR sử dụng mồi có chứa những trình tự này. Kết quả là cácsản phẩm PCR sẽ chứa số lượng lớn bản sao của mỗi phân tử cDNA được sản xuấttrong phản ứng RT.5.5 Thư viện loại trừ

Hình 5.8. Sự lai ghép loại trừ của thư viện nguồn PCR. Hai thư viện cDNAtạo ra từ PCR được xây dựng. Các thư viện gốc được gắn với biotin, trong khi các thưviện kiểm chứng thì không.Sự lai tạo của hai thư viện đảm bảo rằng các trình tự thôngthường sẽ được gắn biotin, trong khi các trình tự duy nhất của các thư viện kiểmchứng thì không. Các trình tự có gắn biotin có thể được tách ra từ hỗn hợp thông qualiên kết với avidin, qua đó thu được nhiều trình tự duy nhất của thư viện kiểm chứng.Các trình tự thu được có thể được khuếch đại, bởi PCR, sử dụng mồi duy nhất cho thưviện kiểm chứng.

Page 150: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

149

Như chúng ta đã thảo luận trước đó, rất nhiều các phân tử mRNA được sản xuấttừ các tế bào khác nhau sẽ giống nhau. Ví dụ, hầu hết tất cả các tế bào cần thiết để sảnxuất các enzyme cần thiết cho quá trình chuyển hóa glucose, và các thành phần proteincủa tất cả các tế bào, là giống nhau. Vì vậy, chúng ta chỉ tập trung vào sự khác biệtgiữa các loại tế bào để xác định gen được dùng để phân biệt với một loại tế bào, giaiđoạn phát triển hoặc các tác động cụ thể về môi trường. Ưu điểm của thư viện cDNAdựa trên PCR là chúng đều tuân theo việc loại bỏ (trừ) các trình tự được phổ biến giữahai thư viện riêng biệt. Điều này cho phép một quy trình làm phong phú các chuỗi duynhất và cho phép chúng được nghiên cứu dễ dàng hơn. Một cơ chế theo cơ chế loại trừđược thể hiện trong hình 5.8.

Hai thư viện cDNA tạo ra từ PCR được xây dựng từ hai mẫu mRNA khác nhau.Một trong những thư viện (các trình điều khiển) được sản xuất bằng cách sử dụng mộtoligonucleotide mà có một phân nữa biotin hóa học được thêm vào. Biotin là một đồngyếu tố cần thiết cho các enzyme có liên quan đến phản ứng carboxyl phụ thuộc ATP,vídụ: acetyl-CoA cacboxylaza và cacboxylaza pyruvate (Hình 5,9). Sư thiếu hụt Biotin ởđộng vật là rất hiếm, có thể được quan sát thấy sau quá trình tiêu hóa quá nhiều trứngsống (Baugh, Malone và Butterworth, 1968). Chất liên kết với protein lòng trắngtrứng, gọi là avidin, để ngăn cản sự hấp thu biotin của ruột (Hình 5.9). Một phức hợpđược hình thành giữa biotin và avidin là ổn định tạm thời (liên kết liên tục, Kd - ¼ 1x10-15 M) và avidin có thể cô lập một cách hiệu quả biotin từ tất cả nhưng hầu hết là từsự pha loãng (Green, 1963). Biotin có thể được đi đôi với phosphoramidites (xemhình 4.6) thông qua nhóm carboxyl và do đó có thể được kết hợp vào mồioligonucleotide ở đầu 5’ hoặc 3’ hoặc thông qua mồi gắn với một trong các bazo.Ngoài ra, biotin có thể được thêm vào các đoạn DNA sau khi tổng hợp bằng cách sửdụng các chất tương tự biotin (Barr và Emanuel, 1990). Oligonucleotides và các đoạnDNA được tổng hợp gắn biotin có một sự tương đồng cao với avidin.

Hình 5.9. Cấu trúc của biotin và phức hợp avidin-biotin. (A) Cấu trúc phân tửcủa biotin. (B) Các liên kết giữa phân tử biotin và avidin. Ở đây là sự kết hợp giữa

Page 151: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

150

một đơn phân avidin với một phân tử biotin (màu xanh) (Pugliese và cộng sự, 1993.).Các phân tử avidin chức năng là một homotetramer.

Thư viện cDNA gốc được biến tính bằng cách nung nóng, để tạo thành sợiđơn, và sau đó lai số lượng lớn với thư viện cDNA kiểm chứng bị biến tính (Luqmanivà Lymboura, 1994). Phần lớn các cDNA sợi đôi được tổng hợp theo cách này sẽ biếnđổi các bản sao của thư viện cDNA gốc khi nó hiện diện với số lượng lớn. Tuy nhiên,nhiều mẫu lai có thể xảy ra các vấn đề giữa cDNA gốc và cDNA kiểm chứng:

• Phân tử cDNA chỉ hiện diện trong cDNA gốc sẽ không thể liên kết với một tácnhân bổ sung từ các cDNA kiểm chứng và sẽ bị sửa đổi như DNA sợi đôi với mỗi sợiđược lấy từ thư viện gốc.

• Phân tử cDNA hiện diện trong cả hai thư viện có thể lai với nhau đểsản xuất giống lai mà trong đó một sợi có nguồn gốc từ cDNA gốc vàmột sợi có nguồn gốc từ cDNA kiểm chứng.

• Phân tử cDNA chỉ hiện diện trong cDNA kiểm chứng sẽ không thể liên kết vớimột tác nhân bổ sung từ cDNA gốc và sẽ bị sửa đổi như DNA sợi đôi, với từng sợiđược lấy từ các thư viện cDNA kiểm chứng.Quan trọng hơn, bởi vì những phân tử nàykhông chứa cDNA gốc, nên chúng sẽ không gắn được với biotin. Tất cả các loại DNAkhác mô tả ở trên sẽ chứa ít nhất một sợi DNA chứa một phân tử biotin.

Hình 5.10. Sự phong phú của các phân tử DNA trong quá trình lai lọi trừ. Sựloại trừ của thư viện gốc thư viện mục tiêu bởi sự loại bỏ cáctrình tự phổ biến (gen 1và 2) và sự làm phong phú các trình tự có nhiều hơn trong thư viện mục tiêu (gene 3-5). Dưới đây là gel agarose của các thư viện gắn ethidium bromide (EtBr), và sau đóđược đánh dấu và dò với các trình tự DNA trong năm gen riêng biệt. Cường độ củadải màu trong gel dò cho thấy sự phong phú của gen trong thư viện. Hình ảnh củaGerard Brady và Abdulla Bashein, Epistem Ltd

Phương pháp vật lý tách các phân tử cDNA lai bằng cách chuyển các phân tửcDNA thông qua một cột có đính kèm avidin sẽ cho sản phẩm là sự kết dính của tất cảcác loài DNA mà có một hoặc nhiều sợi cDNA gốc. Do đó, chỉ có loài DNA lai vớicDNA kiểm chứng sẽ không kết dính với cột avidin. Sản phẩm khuyếch đại PCR củacột lưu và các vật liệu được giữ lại bởi các cột (sau khi rửa giải với biotin tự do) sẽ cho

Page 152: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

151

kết quả là sự hình thành của một thư viện loại trừ và một thư viện chọn lọc. Các thưviện loại trừ chứa các trình tự duy nhất của thư viện kiểm chứng không có trong thưviện trình gốc, và các thư viện lựa chọn sẽ chứa các trình tự phố biến có mặt trong cảhai thư viện (Hình 5.10).

Thư viện loại trừ là một kỹ thuật cực kỳ mạnh mẽ để làm phong phú thêm cáctrình tự hiện nay, chỉ có trong thư viện cDNA kiểm chứng. Ví dụ, Brady và đồngnghiệp đã phân tích đoạn mRNA trong tế bào tiền thân của bệnh ho ra máu dọc theocác con đường của các tế bào máu từ nơi bắt đầu trong tủy xương (Brady và cộng sự,1995.). Họ xác định được 29 gen được biểu hiện khác nhau, hoạt động trong suốt cácgiai đoạn khác nhau theo các con đường riêng biệt.5.6. Xây dựng thư viện trong kỷ nguyên hậu genome

Mục đích chính của việc xây dựng một thư viện là xác định gen đơn lẻ. Người tacó thể nghĩ đến chuyện khi trình tự DNA đầy đủ của một bộ gen được biết đến (Bảng5.1) với sự cần thiết của một thư viện có thể chấm dứt. Quan điểm này chỉ có một phầnđúng. Kiến thức về trình tự của bộ gen người không cho chúng ta biết chức năng củaphần lớn các gen. Các thư viện, chẳng hạn như những mô tả trong chương này, sẽ tiếptục đóng một vai trò quan trọng trong việc xác định và phân công chức năng gen.Một số các tổ chức thương mại và phi lợi nhuận cung cấp quyền truy cập vào tất cả,hoặc phần lớn, các gen hiện diện trong một bộ gen có trình tự đầy đủ (Bảng 5.1). Vídụ, dự án lập bản đồ gen người (http://www.hgmp.mrc.ac.uk) và hiệp hội gen của cácđộng vật có vú (http://mgc.nci.nih.gov) sẽ cung cấp, với chi phí danh nghĩa, mộtplasmid có một bản sao cDNA của một trong số những lượng lớn gen người vàchuột. Những dịch vụ này phủ nhận sự cần thiết tạo các dòng gen đã xác định, hoặccác sản phẩm dịch mã có chiều dài đầy đủ của các phân tử cDNA khi các phân tửđược phân lập từ một thư viện, nhưng không ảnh hưởng đến quá trình nhận dạng gene.Thư viện tiếp tục hình thành lynch-pin trong sự nhận diện gene.

Page 153: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

152

Chương 6XÁC ĐỊNH GENEKHÁI NIỆMViệc cố gắng tìm thấy những dòng tái tổ hợp duy nhất cụ thể trong một thư viện

có một triệu dòng vô tính khác nhau có vẻ như một nhiệm vụ khó khăn. Trong chương3, chúng tôi nhìn vào những cách thức lựa chọn dòng vô tính tái tổ hợp ví dụ cho việcsử dụng các dấu hiệu kháng kháng sinh hoặc kích thước vật lý như là một phươngpháp để lựa chọn các đoạn vector tái tổ hợp không tái tổ hợp. Tuy nhiên, việc xác địnhtrình tự riêng lẻ hoặc chức năng của từng phần nhỏ của dòng vô tính tái hợp thì khókhăn hơn nhiều so với toàn bộ. Điều được yêu cầu là một số loại quá trình chọn lọcbằng cách nào một phân tử có thể được phân biệt với nhau. Việc lựa chọn một tái tổhợp riêng lẻ có thể được dựa trên một trong hai chuỗi của nó hay một số chức năngcủa đoạn polypeptide được mã hóa bởi trình tự DNA. Quá trình lựa chọn có thể dựatrên một trong bốn tiêu chí.

1. Trình tự DNA của dòng vô tính.2. Trình tự protein của đoạn polypeptid được mã hóa.3. Khả năng tương tác của đoạn polypeptid được mã hóa bởi dòng vô tính tái tổ

hợp với những đoạn polypeptid khác.Ở đây, chúng tôi sẽ xem xét lần lượt một trong các phương thức này . Những tiến

bộ trong công nghệ xác định trình tự DNA đã dẫn đến việc hạn chế sử dụng các kỹ thuậtlai tạo nucleic acid để xác định gen, nhưng một số kỹ thuật xác dịnh trình tự và chứcnăng proteinchúng tôi sẽ nói ở đây đã trở nên ngày càng phổ biến.6.1. Sàng lọc bởi màng lai acid nucleotide

Sự ghép cặp dựa trên nguyên tắc bổ sung của một mạch acid nucleic với mộtmạch khác có thể được sử dụng để nhận biết những dòng vô tính tái tổ hợp có chứađựng những chuỗi DNA đã được xác định hay tương tự hay của nhựng đoạn dò. Mộtđiều khó khăn ở đây là để bộ phận đọc nhận ra được kiểu sàng lọc này thì bạn cần biếtmột vài điều về chuỗi DNA bạn muốn tìm kiếm trước khi có thể thiết kế một đoạn mồiđề tìm kiếm chuỗi DNA đó. Chúng tôi đã gặp phải vấn đề này trước khi tìm kiếm ởviệc thiết kế các mồi PCR. Thế nhưng, màng lai cung cấp khung sườn cho việc xácđịnh gen trong một số năm qua. Những thành tựu chính của kiểu sàng lọc này là nókhông dựa vào sự biểu hiện của những đoạn DNA nhân bản vô tính bên trong thư việnvà nó có thể được áp dụng với hầu hết mọi hệ thống vecto trong một thư viện đã dượcchuyển dòng vô tính

Một kế hoạch tổng quát cho việc xác định các dòng vô tính tái tổ hợp dựa trêntrình tự DNA của chúng được tóm tắt trong hình 6.1.

Page 154: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

153

Hình 6.1:sàng lọc những trình tự DNA bới màng lai acid nucleic. Một tấm màngnitroceelulose ( hay nilon) được dặt trên một đĩa thạch để tạo thành một bản sao củanhững cụm vi khuẩn. DNA từ vi khuẩn cái mà bao gồm thư viện tái tổ hợp được gằnkết với màng sau khi vi khuẩn bị dung giải. DNA biến tính ( chuỗi DNA đơn) có thểđược sử dụng như là khuôn mẫu cho việc gắn kết bổ sung đồng vị phóng xạ với trìnhtự DNA. Việc gắn kết của những trình tự này với màng có thể được phân tích bởi việcphơi màng rửa dưới tấm phim X-ray.

Kế hoạch này được căn cứ vào sự mô tả ban đầu bởi Grunstein và Hogness,nhưng bao gồm những biến đổi sau cùng, cái mà cho phép sự sàng lọc của số lượnglớn khuẩn lạc từ một mảnh tế bào đơn và cũng sử dụng phương pháp filter (Grunsteinvà Hogness, 1975; Grunstein and Wallis, 1979; Hanahan and Meselson,1980). Ýtưởng cơ bản của kiểu qui trình sàng lọc này là để giữ lại được DNA chứa trong mỗibản sao trên một tấm lọc nitrocellulose ( ngày nay người ta dùng nylon) để có thể đượcsử dụng như là một điểm cố định cho các liên kết khác, bổ sung thêm, những phân tửDNA. Những khuẩn lạc được sàng lọc thì phát triển trên những đĩa agar mỏng chứađựng những kháng thể thích hợp cho phép sự phát triển của những tế bào chứa đựngnhững phân tử tái tổ hợp. khi khuẩn lạc vi khuẩn phát triển, một tấm nylon được dặttrên đỉnh của chúng và sau đó được nhấc ra để sản xuất một phiên bản bản sao của đĩa.Một phần của mỗi khuẩn lạc sẽ dính vào tấm nylon được nhấc ra và rời khỏi đĩa agarcùng với nitrocellulose. Sau đó tấm nylon bản sao được xử lí theo những cách khácnhau để luse vi khuẩn và gắn chặt DNA vào đĩa. Kiểu đặc trưng theo những bước tiếnhành sau:

- Tấm nylon được xử lí với kiềm (0.5 M NaOH) để bắt đầu vừa ly giải tế bào vikhuẩn và biến tính DNA.

- Khi trung hòa, tấm nylon được xử lí bằng protease (ví dụ như proteinase K)- Sau đó tấm nylon được nung ở 80◦C, hoặc xử lí bằng tia UV, để chắc chắn

DNA bám lên màng.Kết quả thu được là trong tấm nitrocellulose chứa đựng một bản sao DNA biến

tính của khuẩn lạc vi khuẩn ban đầu có mặt trên đĩa agar. Bản sao chuỗi đơn DNA cóthể được sử dụng như là khuôn mẫu cho việc cố định những phân tử DNA khác. Kĩthuật lai của mẫu dò chuỗi đơn có đánh đấu để DNA trên màng nitrocellulose sẽ tiết lộvị trí của những khuẩn lạc trên đĩa gốc chứa đựng những chuỗi DNA tương đồng hay

Page 155: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

154

ít nhất là tương tự. mẫu dò có thể là một vài chuỗi acid nucleic đơn và không cần thiếtphải phù hợp với trình tự mục tiêu.

Một ví dụ tinh sạch một dòng vô tính tái tổ hợp sử dụng phương pháp này làcDNA mã hóa một protein phức tạp trong việc sản xuất plasmin. Plasmin là một serinproteinase có hiệu lực mạnh có những chức năng quan trọng trong những chu trìnhsinh lí khác nhau ở động vật có vú chẳng hạn như việc giảm sút các protein chất nềnngoại bào, sự phân hủy của những cục máu đông, sự di căn của tế bào ung thư.(Vassalli and Saurat, 1996). Trong tế bào chất của động vật có vú, plasmin làm tannhững mạng lưới máu đông thành những sản phẩm có thể hòa tan được. plasmin đượcsản xuất từ tiền chất, Plasminogen, do bị giới hạn phân hủy protein bởi chất hoạt hóaplasminogen. Chất hoạt hóa plasminogen đươc sử dụng về phương diện lâm sàng chonhững bệnh nhân bệnh tim để thêm khả năng chống lại máu đóng cục (MadganiMovsowitz và Kotler, 1993). Ttrong những giai đoạn đầu những năm 1980 chất hoạthóa Plasminogen các loại mô của con người (t-PA) được tinh sạch theo phương diệnsinh học từ những tế bào u melanin và được phân hủy bởi enzyme Trypsin. Một vài kếtquả những đoạn protein được trình tự amino acid và một vài đoạn peptid được tạo rabằng cách này được chỉ dẫn ở hình 6.2. Việc sử dụng tất cả trình tự DNA của hầu nhưtất cả mã di truyền cái mà có thể mã hóa chuỗi pepid này được chú trọng đến. Có 15base trong 5 loại mã hóa, chỉ có 4 trong số chúng chứa những trình tự tiềm năng khác.Vì thế, loài Pennica đã cấu trúc một đoạn mồi DNA ngược 14 nucleotide suy biến, cáimà chứa đựng một sự pha trộn của tám trình tự khác nhau (Pennical và cộng sự,1983). Chúng sử dụng đoạn mồi này để sàng lọc một thư viện plasmid DNA ngượccủa 4600 chuỗi đã chuẩn bị từ dòng tế bào u melanin ác tính. Trong số này, 12 đượcgạch bỏ khi xác định trong màng lai và sau đó đọc trình tự chuỗi DNA, một trong sốchúng được tìm thấy chứa đựng DNA có thể mả hóa cho đoạn peptid. Quá trình nàydẫn đến việc tinh sạch cả cDNA mã hóa cho t-PA protein.

Hình 6.2 :Mẫu dò được thiết kế để cô lập chất hoạt hóa plasminogen tế bào môcủa người (Pennica và cộng sự1983 ).Các trình tự của năm aminoacids của proteinnày đã được đưa ra.Chuỗi này (từ đoạn 253-257 của 527 aminoacid protein) được tạora khi tiêu hóa toàn bộ chiều dài của protein được tách bỏ trypsin.Dựa vào các mã ditruyền ,một mẫu dò được thiết kế để có thể liên kết với tất cả các trình tự DNA cái mà

Page 156: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

155

có thể mả hóa cho đoạn peptid này. Trình tự màu vàng là để bổ sung cho các gene bịcô lập.

Các mẫu dò DNA sử dụng trong thí nghiệm lai tạo phải tương đồng với trình tựđó để phát hiện được nó.Có nhiều ví dụ trong các tài liệu,các gene được phân lập từmột sinh vật được sử dụng như là một mẫu dò lai tạo để phát hiện một gene tươngđồng trong thư viện gene được phân loại từ các sinh vật khác nhau.

Ví dụ,một số gen mã hóa histone của nhím biển đã được sử dụng để cô lập genhistone tương đồng từ một thư viện gene của ếch .Như chúng ta thấy ở trên,cácphương pháp tổng hợp hóa học các mẫu dò oligonucleotide ,trong phạm vi chiều dàikhoảng 14-20 nucleotide,các mẫu dò này có thể được sử dụng để phát hiện các proteinđặc biệt. Trường hợp của t-PA ở trên, trình tự peptid được sinh ra có thể chỉ được mãhóa bởi một trong một ít trình tự DNA- một trình tự chứa đựng một ít giống thoái hóa.Những amino acid khác được mã hóa đến 6 bộ bao mõa hóa khác nhau. Ví dụ,aminoacid Leucine được mã hóa bởi những bộ ba mã háo sau đây : CTA, CTC, CTG,CTT, TTA, và TTG. Một số lượng lớn những giống thoái hóa trong một trình tự mồi lànguyên nhân của sự liên kết của đoạn mồi để những trình tự không thể mã hóa genemục tiêu được mong đợi, ngược lại một đoạn mồi có tính đặc biệt cao sẽ liên kết vớimột ít trình tự gene có tính tương đối. Do đó, những trình tự peptid chứa đựng nhữngamino acid methionine và trytophan được mã hóa bởi mỗi một bộ ba mã hóa thì đặcbiệt quan trọng cho việc thiết kế những đoạn mồi. Trước đây, khi chúng ta đã xem xétthấy rằng với phương pháp Southern Blotting, sự chặc chẽ trong việc làm sạch đoạnmồi từ màng có thể được sử dụng để điều chỉnh số lượng của những tương tác dươngtính cái mà xảy ra.

Những đoạn mồi lai thường được sử dụng chất đồng vị phóng xạ để giúp đỡchúng dễ dàng trong sự phát hiện khi lên kết trên màng. Những đoạn mồioligonucleotide được tổng hợp bằng phương pháp hóa học có thể được xử lí vớienzyme polynucleotide kinase trong sự hiện diện của γ32-P-ATP nhóm chất phóng xạphosphate từ nguyên tử ATP được dịch chuyển lên trên đuôi 5’ của oligonucleotide.Mặt khác, sự lựa chọn chất không có phóng xạ để thay thế đã được phát triển, ví dụ:đánh dấu với digoxigenin (McCreery, 1997), và có ích đối với một số qui trình thửnghiệm, nhưng độ nhạy và khả năng phát hiện phóng xạ có nhiều khó khăn để vượtqua. Như đã mô tả ở trên, việc sàng lọc khuẩn lạc có thể được sử dụng để sàng lọcplasmid hoặc cosmid dựa vào những thông tin của thư viện. Tuy nhiên, chỉ với nhữngthay đổi nhỏ, nó cũng có thể được sử dụng để sàng lọc những thông tin từ thư viện thểthực khuẩn (Benton và Davis, 1977). Thật vậy, sàng lọc các mảng λ được coi là hơn cảmong đợi.

Một ít DNA từ tế bào chủ vi khuẩn sẽ được di chuyển đến màng nitrocellulosekhi nhân lên nhiều mảng hơn là những khuẩn lạc vi khuẩn. Kết quả này trong mộtnhóm rõ ràng hơn ( sự lai mồi dưới chất nền) cho việc sàng lọc từng mảng.

Những mảng có thể được nhân lên một vài lần, vì vậy nhiều quá trình sàng lọccó thể thực hiện cùng một đĩa.

Page 157: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

156

Sự sàng lọc có thể được thực hiện ở một mật độ dày bằng cách sàng lọc cácmảng nhỏ. Sàng lọc ở mật độ cao có lợi thế là số lượng lớn những dòng vô tính tái tổhợp có thể sàng lọc được từ sự hiện diện của các trình tự tương đồng đến mẫu dò trongmột thí nghiệm đơn lẻ. tuy nhiên sàng lọc theo cách này có nghĩa không đơn thuần làmột dòng vô tính tái tổ hợp được phân lập từ một vòng kiểm tra. Trong hình 6.3, việcsàng lọc một tấm thạch có chứa 50000 hoặc nhiều hơn những mảng riêng biệt với mộtmẫu dò có thể tạo ra một, hay hai điểm trong film chụp X-quang tương ứng với vị trímơi mà mẫu dó liên kết. Trong trường hợp này, một khu vực trên đĩa thạch tương ứngvới vị trí của vết bôi trên dĩa ban đầu đã được loại bỏ và nhiều mảng đã được mạ lại vớimật độ thấp hơn. Việc sàng lọc sau đó đã được lặp lại để tạo nên một mô hình lai tạo thứcấp được làm giàu hơn cho các mảng bám hiển thị tích cực trong màng lai. Hai hoặc bavòng sàng lọc thường được yêu cầu trước khi một mảng tinh khiết có thể đươc cô lập.

Hình 6.3: nhiều vòng sàng lọc để tinh sạch dòng tái tổ hợp đơn thuần khiết. Trong mộtmàng lai của thư viện thể thực khuẩn, kết quả dương tính từ vòng đầu tiên, mật độ cao, việcsàng lọc được tái mạ và lặp lại ở mật độ thấp hơn. Điều này cho phép sự tinh sạch củanhững mảng tái tổ hợp đơn thuần khiết. Hình ảnh lịch sử của Michael Bromley và JayneBrookman, F2G Ltd

Một giới hạn hợp lí cho việc sàng lọc bằng phương pháp lai là thay vì ta sàng lọcmột thư viện với một đoạn oligonucleotide đơn cho những trình tự tương đồng, sànglọc bằng phương pháp PCR sử dụng hai đoạn mồi để khuếch đại những điểm tươngđồng của những gene.Thành tựu chính đạt được là tốc độ. Thư viện không cần đượcmạ trước khi sàng lọc từ phản ứng PCR sẽ nảy ra việc sử dụng DNA trần làm khuôn.Những đoạn mồi suy biến có thể được sử dụng để khuếch đại những điểm của nhữnggene tương đồng từ thư viện (Tkumi, 1997). Việc tinh sạch sản phẩm PCR thường đạidiện cho một vùng nhỏ của gen. tuy nhiên, đoạn tinh sạch này có thể được sử dụng

Page 158: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

157

như là đoạn mồi có tính đặc biệt cao trong việc sàng lọc bằng phương pháp lai truyềnthống hay như là điểm bắt đầu để khuếch đại đầu 3’ và 5’ của gene sử dụng nhữngphương pháp PCR khác nhau (Frohman và cộng sự, 1988)6.2. Immunoscreening: sàng lọc miễn dịch (là một phương pháp trong công nghệsinh học dùng để phát hiện ra polypeptid tạo ra từ gen nhân bản)

Nếu thư viện DNA được nhân bản trong một véctơ biểu hiện (xem chương 3),các sản phẩm gen mã hóa trong DNA ngoại lai có thể được tạo ra trong tế bào vậtchủ.Ngay cả khi protein không hoàn toàn thiết thực, trình tự các peptid thể hiện có thểlà duy nhất trong tế bào vật chủ.Do đó, cơ chế nhận biết các chuỗi polypeptid duy nhấtnày được dùng để kiểm tra thư viện để nhận biết dòng vô tính đặc biệt.Việc phát hiệnra các chuỗi polypeptid thường được thực hiện bằng cách sử dụng các khángthế.Kháng thế khá đơn gián để tạo ra nếu tinh khiết, hoặc một phần tinh khiết, proteintinh khiết có sẵn.Các gen mã hóa cho các protein này có thế được xác định bằng cáchsử dụng kháng thế trong các phương pháp kiểm tra nêu dưới đây.Kiểm tra loại nàykhông dùng bất kì khá năng đặc biệt nào của protein ngoại lai.nhưng đòi hỏi phái cókháng thể đặc trưng cho protein có sẵn

Kháng thể tăng lên khi một protein ngoại lai hoặc một đoạn peptid lạ được tiêmvào một con vật.Các con vật được dùng để tăng lượng kháng thể ở trong phòng thínghiệm như thỏ hoặc chuột, ngoài ra cừu, dê, lợn ngựa tất cả dùng để tăng lượngkháng thể nhiều hơn (Harlow và Lane, 1999).Sự hiện của protein ngoại lai được pháthiện trong các động vật bới các thụ thế trên mặt tế bào lympho B và T. Mỗi tế bàolympho B có hàng ngàn thụ thể trên bề mặt nó mà có khá năng liên kết với các khángnguyên đặc biệt. Các liên của các kháng nguyên với một thụ thế riêng, thông qua conđường phức tạp, trong đó thể hệ sau của tế bào B tiết số lượng lớn chất hòa tan hìnhthành bởi các thụ thể đặc biệt.Đây là những kháng thế.

Kháng thể là glycoprotein bao gồm các tiểu đơn vị chứa hai chuỗi nhẹ giốngnhau (chuỗi L) , mỗi chuối chứa khoảng 200 axit amin, và hai chuối nặng giống nhau(chuỗi H), mỗi chuỗi khoảng 400 axit amin (Davies, Padlan và Sheriff, 1990). 100 axitamin đầu hoặc các axit amin của hai chuỗi H và L khác nhau rất nhiều từ kháng thếnày đến kháng thế khác, đây là vùng thay đổi V.Các chuỗi axit amin biến đổi ở khuvực V đặc biệt rõ rệt ở điểm kích động thay đổi (hình 6.4). Cấu trúc bậc ba của khángthể gắn kết lại trong ba vùng kích động thay đổi của hai chuỗi L và H cùng nhau để tạonên vị trí gắn kết kháng nguyên.Chỉ một vài chuỗi axit amin khác nhau được tìm thấyđầu cuối carboxy của chuỗi H và L – những vùng không đổi (C). Động vật có vú tạo rahai vùng C khác nhau cho các chuỗi nhẹ của chúng, chuỗi kappa (κ) L và chuỗilambda (λ) L. Ngoài ra, năm loại vùng C khác nhau cho chuỗi H là: α (chuỗi nặng củacác kháng thể IgA), γ (IgG), δ (IgD), ε (IgE) và μ (IgM). Mỗi loại chuỗi H có thể bắtcặp với một trong hai hoặc chuỗi λ hoặc chuỗi L (Bảng 6.1). Các liên kết cộng hóa trịdisulphide giữ cặp của chuỗi H và L lại với nhau.

Các phân tử kháng thể được yêu cầu phải thực hiện hai chức năng - chúngphải nhận ra và gắn vào một kháng nguyên và sau đó kích hoạt các phản ứng của tếbào đối với kháng nguyên đó. Các vùng V chịu trách nhiệm về việc nhận biết kháng

Page 159: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

158

nguyên, trong khi vùng C có trách nhiệm gây ra các phản ứng của tế bào. Năm chuỗinặng khác nhau cung cấp một cơ chế về sự đáp ứng khác nhau với một kháng nguyên(Wysocki và Gefter, 1989).

Hình 6.4. Cấu trúc của một kháng thể. (a) Sơ đồ thể hiện cấu trúc của kháng thể.Các chuỗi nặng (màu đỏ) và các chuỗi ánh sáng (màu xanh) được kết nối với nhauthông qua một loạt các cầu nối disulphide (đường màu đen). Cả hai chuỗi nặng và nhẹ

Page 160: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

159

chứa một loạt các vùng siêu biến (hypervariable) (màu cam) tại đầu amino của chúngcung cấp mức độ đa dạng của các vùng liên kết với kháng nguyên. (b) Cấu trúc tinhthể X-ray của một kháng thể đơn dòng. Các chuỗi nặng (màu vàng và màu xanh) vàcác chuỗi nhẹ (màu xanh lá cây và màu đỏ) được hiển thị (Harris và cộng sự, 1992)..(c) Một chuỗi kháng thể đơn chuỗi , vùng biến đổi của đoạn kháng thể (ScFv). Cácvùng biến đổi từ các chuỗi nặng và nhẹ có thể được chế tạo để có thể được biểu hiệnnhư là một chuỗi polypeptide đơn tham gia một mối liên kết của 15-amino-acid (củadãy (Glycine4 serine)3 ), đó có khả năng linh hoạt để cho phép hai vùng lắp ráp mộtvùng kháng nguyên chức năng.

Hầu hết các kháng thể được sử dụng trong phòng thí nghiệm được mô tả hoặc đadòng hoặc đơn dòng. Kháng thể đa dòng được phân lập từ huyết thanh của một con vậtđược miễn dich và chứa nhiều kháng thể khác nhau cái mà nhận biết các epitope (nhântố quyết định kháng nguyên) khác nhau của cùng một kháng nguyên. Kháng thể đơndòng được sản xuất từ việc cô lập các tế bào đơn dòng và nhận biết một epitope đơn cụthể trong kháng nguyên này. Kháng thể liên kết với các protein có thể nhận biết cácetitop liên tục (tức là các chuỗi amino acid của protein) hoặc không liên tục. Mộtepitope không liên tục được hình thành bởi sự xếp của protein để tạo ra một khángnguyên bề mặt, nó bao gồm các đoạn khác nhau của cấu trúc bậc một. Phần lớn cácepitope xuất hiện tự nhiên là loại không liên tục, mặc dù kháng thể sử dụng trongphòng thí nghiệm thường được sản xuất bằng cách sử dụng các protein biến tính đểđảm bảo rằng việc sản xuất các kháng thể nhận biết được các epitope liên tục và do đócó thể được sử dụng để phát hiện các protein biến tính bằng cách sử dụng phươngpháp thẩm tách Western (Chương 2). Mặc dù việc sử dụng động vật trong sản xuất cáckháng thể ái lực cao vẫn còn phổ biến, một số nghiệm thức phù hợp cho việc lựa chọnvà sản xuất các đoạn kháng thể cụ thể trong tế bào vi khuẩn (Hexham, năm 1998;.Portner-Taliana và cộng sự, 2000; Daugherty và cộng sự, 1999).

Một sơ đồ tổng quát cho việc sàng lọc miễn dịch của một thư viện DNA đượchiển thị sơ lược trong hình 6.5. cDNA được nhân bản vô tính trong vector biểu hiệnλZAP (xem chương 3) như vậy các DNA ngoại lai được đặt dưới sự kiểm soát củapromoter lac của vi khuẩn. Thể thực khuẩn λ tái tổ hợp được nuôi cấy với một tế bàovi khuẩn thích hợp trên đĩa thạch. Các đĩa có chứa các thư viện thể thực khuẩn được ủcho đến khi xuất hiện các mảng nhỏ. Tại thời điểm này, một tờ nitrocellulose đã đượcngâm trong IPTG từ trước, các tác nhân gây cảm ứng tự do của lac promoter, được đặt

Page 161: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

160

lên trên các mảng bám. Tờ nitrocellulose ở bên trái của đĩa thạch trong bốn giờ để cảhai gây ra sự biểu hiện của các polypeptide mã hóa bởi cDNA, và liên kết các proteinđược tạo ra khi các tế bào E. coli dung giải một trình tự của thể thực khuẩn gây nhiễm.Tờ nitrocellulose sau đó được bóc ra khỏi đĩa và sẽ chứa các protein, hấp phụ trên bềmặt của nó được biểu hiện trong mỗi đĩa riêng biệt. Tờ này sau đó được ủ với mộtkháng thể cụ thể đối với protein mà gen này được tìm kiếm. Các kháng thể nên liênkết với các tờ nitrocellulose ở vị trí nơi mà một đĩa thể hiện protein đó được đặt trêncác đĩa thạch ban đầu. Tờ này sau đó được rửa sạch để loại bỏ các kháng thể khôngliên kết và sau đó ủ với một kháng thể kiên kết thứ hai để phát hiện sự hiện diện củacác kháng thể liên kết đầu tiên.

Ban đầu, phương pháp sàng lọc miễn dịch sử dụng kháng thể phóng xạ liên kếtban đầu để phát hiện kháng thể liên kết với các tờ nitrocellulose (Broome và Gilbert,1978). Phương pháp được thay thế bằng cách sử dụng các kháng thể xen vào cáckháng thể được mô tả ở trên. Kháng thể thứ hai nhận biết vùng liên tục của kháng thểban đầu và them vào đó là kết hợp với một enzyme kiểm nghiệm. Ví dụ như , enzymeperoxidase từ cải ngựa hoặc alkaline phosphatase (Mierendorf, Percy và Young, 1987;.de Wet và cộng sự, 1984), có thể được khảo nghiệm trực tiếp trên tờ nitrocellulose đểsản xuất hoặc so màu, hoặc trong các phản ứng liên quan đến sự phát xạ của ánh sángkhi các kháng thể liên kết có thể được phát hiện bằng cách sử dụng phim X-ray. Khángthể xen vào tạo ra một tín hiệu khuyếch đại khi nhiều kháng thể thứ hai có thể liên kếtvới mỗi kháng thể ban đầu.

Hình 6.5. Sự sàng lọc miễn dịch của một thư viện thể thực khuẩn λ.

Page 162: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

161

Sàng lọc miễn dịch vẫn còn là một kỹ thuật sử dụng rộng rãi để xác định các genetừ protein hữu hiệu. Ví dụ, Liu và cộng sự đã tinh chế uridine phosphorylase (mộtenzyme xúc tác cho sự phục hồi phosphorolysis của uridine thành uracil) từ một khối uđại tràng (Liu và cộng sự, 1998). Kháng thể từ protein tinh chế đã được đưa ra khỏi thỏvà được sử dụng để sàng lọc thư viện cDNA biểu hiện của gan người. Đây là kết quả từsự cô lập dòng 1,2 kbp chứa khung đọc mở của gen uridine phosphorylase ở người.

Một sự kết hợp đặc biệt thành công của màng dựa trên sự sàng lọc proteinchức năng được gọi là sàng lọc south-western, đã được sử dụng rộng rãi để xác địnhnhững gen mã hóa DNA liên kết với protein. Sự sàng lọc này được thực hiện như đãnêu trong hình 6.5, ngoại trừ, việc ủ màng nitrocellulose với kháng thể, đoạn DNAmạch đôi gắn phóng xạ của một trình tự đã biết được sử dụng thay thế (Singh và cộngsự, 1988). Protein được có thể liên kết với chuỗi này, thường có nguồn gốc từ cácpromoter của một gen, sẽ giữ DNA trên màng tế bào, và vị trí của họ có thể quan sátđược bằng cách sử dụng phim X-ray. Phương pháp này đòi hỏi DNA liên kết có thểxuất hiện trên màng và đòi hỏi các hoạt động liên kết DNA chứa trong mộtpolypeptide duy nhất. Tuy nhiên, nó đã được sử dụng để cô lập nhiều DNA liên kếtvới protein (Vinson và cộng sự, 1988).6.3 Phát hiện dòng dựa vào chức năng

Việc phát hiện dòng của thư viện cDNA bằng cách sử dụng các kháng thể chỉdựa vào sự biểu hiện của cDNA mã hóa cho các chuỗi polypeptide và không đòi hỏi sựbiểu hiện của một protein đầy đủ chức năng .Tuy nhiên cũng có thể cần sự biểu hiệnđó để xác định hàm lượng protein cụ thể trong tế bào vật chủ .Để cho việc phát hiệnthành công,tế bào vật chủ đòi hỏi phải: một là phải thiếu một chức năng sinh hóa nàođó mà ta có thể chọn lựa được hoặc bị vô hiệu hóa một số chức năng chuyên biệt và cóthể được bổ sung bằng một protein được sản xuất từ một thư viện biểu hiện cDNA.Sựbổ sung này đặc biệt hữu ích đối với các gene xác định của một sinh vật ,nó bổ sungcác khiếm khuyết trong các sinh vật khác.Ví dụ, tế bào E.coli chứa bản sao của genekhiếm khuyết hisB, mã hóa cho enzyme imidazole glycerol phosphate dehydratase,enzyme này cần thiết cho sự tổng hợp aminoacid histidine, tế bào sẽ không thể pháttriển bình thường nếu thiếu histidine.Nếu các tế bào E.coli khiếm khuyết hisB đượcbiến nạp (sự thu nhận những đặc điểm di truyền mới ở vi khuẩn nhờ việc chuyển vàovi khuẩn các phân tử DNA) với một thư viện các tính trạng được biểu hiện ở nấm menvà thực hiện trên các nơi thiếu histidine ,các tế bào duy nhất có thể phát triển sẽ sảnxuất một bản sao chức năng của enzyme nấm men và được mã hóa bởi gene HIS3. Cácgene His3 ở nấm men và gene HisB ở E.coli chia sẻ những trình tự DNA tương tựnhau (các trình tự này thường ít hơn 20% amino acid) nhưng các protein được mã hóanày, mặc dù khác nhau trong chuỗi aminoacid, thực hiện cùng một chức năng .

Việc tạo dòng vô tính chức năng đã thành công cao hơn khi cô lập các “higher-eukaryotic genes” so với các gene chức năng tương đồng được tìm thấy trong nhiều thínghiệm,ở các “lower-eukaryotic” thì tỉ lệ thành công thấp hơn.Ví dụ, nhiều gene của“higher-eukaryotic” đã được phân lập dựa vào chức năng của chúng để bổ sung vàonhững các bản đối chiếu nấm men của chúng. Các gene đó bao gồm:

Page 163: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

162

- Các gene mã hóa cho một số chức năng trao đổi chất của con người,đã đượcBostein kiểm tra lại.

- Các gene topoisomerase II ở ruồi giấm.- Một số nhân tố phiên mã RNApolymerase II .- Các gene kiểm soát chu kỳ tế bào chuột .Hạn chế lớn của phương pháp tạo dòng này là các “assayable mutation” phải có

sẵn trong tế bào vật chủ để bổ sung bằng “the gene Expressed from the foreign DNA”.Đối với nhiều gene thì không có sẵn để thực hiện các thí nghiệm.Ngoài ra các đột biếncó thể không được bổ sung đầy đủ cho các “foreign DNA”.

Ví dụ ,các “foreign gene” có thể chỉ là một phần chức năng bên trong tế bào chủ.Một “foreign gene” có thể không được biểu hiện trong các tế bào chủ “or the producedproteins may not be appropriately post-translationally modified to produce the activeform”. Ngoài ra việc xây dựng thong tin cho thư viện thường cho dẫn đến kết quả làviệc tạo dòng của các “single genes” vào các vector. Nếu hai hay nhiều hơn các sảnphẩm khác nhau của “foreign genes” cần để sản xuất các protein có khả năng hoạtđộng thì việc sang lọc (phát hiện dòng) bù là không thể thành công .Các gene được tạodòng như một chuỗi chức năng ,nếu các protein biểu hiện được trao một kiểu hình mớitrên tế bào vật chủ nơi mà chúng được “transformed”. Ví dụ những gene trên tế bàoung thư có thể được phân lập từ thư viện DNA của con người dựa trên việc kích thíchsự phát triển của các tế bào trong môi trường nuôi cấy thích hợp.Việc phát hiện dòngdựa vào chức năng này có thể có hữu ích ở một giới hạn nào đó, đây là một cách cựckỳ tốt để phát hiện một gene cụ thể nơi mà chúng được áp dụng.6.4. Tương tác sàng lọc

Hầu hết các protein không tồn tại trong các tế bào là các thực thể đơn. Hầu hếtcác tương tác với một loạt các protein khác đó là điều chỉnh chức năng của chúng hoặctập hợp chúng vào phức hợp chức năng lớn hơn (Legrain và Selig, 2000). Vì vậy, mộtkhi chúng ta đã nhân bản vô tính một gen mã hóa protein, chúng ta có thể đòi hỏi sựtương tác của nó protein khác.6.5. Hiển thị phage

Hiển thị thể thực khuẩn là một kỹ thuật mạnh để xác định liên kết các chuỗi axitamin hoặc protein với các phân tử khác. DNA mã hóa một gen cụ thể hoặc một thưviện của đoạn cDNA là nhân bản vô tính vào hệ gen của virus (bacteriophage) M13trong khung với gen 3 (xem hình 3.15), mã hóa lớp vỏ protein nhỏ PIII. Kết quả nàydẫn đến biểu hiện các peptide hoặc protein được hiển thị trên bề mặt của các hạt phagenhư là một phản ứng để tổng hợp PIII nội sinh (Smith, 1985). Vì vậy phage display tạora một liên kết vật lý giữa các chuỗi peptide ngẫu nhiên cho mỗi chuỗi DNA mã hóatrong một thư viện, và cho phép xác định nhanh chóng của các phối tử peptide cho mộtloạt các phân tử mục tiêu (chất kháng thể, enzyme, thụ thể cellsurface vv) bởi một quátrình lựa chọn trong ống nghiệm gọi là panning (quét, phân tích trọng lượng). Tronghình thức đơn giản của nó, panning (quét, phân tích trọng lượng) được thực hiện bởiviệc ủ một peptide của thư viện phage display với tấm (hoặc hạt) có phủ lớp bề mặtvới mục tiêu, rửa tách các phage không liên kết và tách rửa riêng biệt các phage liên

Page 164: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

163

kết. Các phage được tách rửa sau đó khuếch đại và thực hiên them thông qua tăngthem rang buộc/để làm giàu chu kỳ vùng khuếch đại trong lợi ích của các chuỗi liênkết. Sau ba hoặc bốn vòng, các dòng vô tính riêng biệt được đặc trưng bởi trình tựDNA. Display phage đã được sử dụng để xác định liên kết các chuỗi axit amin với cácthụ thể, chất hoặc các chất ức chế enzyme, epitoes (biểu vị), cải thiện được các khángthể, thay đổi enzyme và dòng cDNA (O'Neil và Hoess, 1995). Các peptide ngẫu nhiêncủa thư viện display trên phage đã được sử dụng trong một số ứng dụng, bao gồm lậpbản đồ epitope (biểu vị), lập bản đồ tiếp xúc protein-protein và xác định các peptidegiống của các phối tử không peptide. Ví dụ, Beck và cộng sự sử dụng ngẫu nhiên mộtthư viện display peptide để chọn cho chất nền cho HIV-1 protease (Beck và cộng sự,2000). Họ đã có thể xác định được chuỗi peptide có thể được cắt hơn 200 lần hiệu quảcác loại trình tự kiểu tự nhiên, và có thể cung cấp một cơ sở để thiết kế cụ thể các chấtức chế protease của chính nó.6.6. Hai ưu thế lai sàng lọc

Điều cơ bản trong sự tương tác của lai sàng lọc là RNA polymerase II củaEkaryote hoạt hóa phiên mã protein. Nó gồm hai phần protein nhỏ - một trình tự đặchiệu DNA ghép lại (ABD) cho phép gắn promoter của gene đặc hiệu và vùng hoạt hóa(AD). Từ năm 1985, nó chỉ ra các protein chức năng thành phần của DNA ghép lại từmột potein đến vùng họat hóa của protein khác có chức năng như các vùng hoạt hóaphiên mã khác. Nó chỉ ra một liên kết giữa DNA liên kết và những chức năng họat hóakhông là điều kiện tiên quyết để làm thay đổi gene và trong từng vùng riêng biệt củaprotein có thể có những chức năng với các vùng khác. Trong nhiều vùng hoạt hóaphiên mã protein của DBD và AD chức năng được tìm thấy giữa các polypeptidegiống nhau. Cả hai chức năng đó thì cần thiết cho sự phiên mã. Những vùng hoạt hóaphiên mã khác gồm từ hai tiểu phần trở lên nơi mà một polypeptide đóng vai trò nhưmột DBD hay AD. Trong trường hợp này, tác động giữa hai protein giữ chặt 2 tiểuphần DBD và AD lại với nhau nhờ vào protein chức năng.

Protein Gal4p của nấm men được xem là protein hoạt hóa nguyên thủy (hình6.6). Nó hoạt hóa các gene theo con đường Leloir trong phản ứng mà tế bào nấm men

Page 165: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

164

nhận galactose là nguồn carbon duy nhất. Gal4p là một polypeptide đơn gồm 881 acidamin. Tuy nhiên protein này được chia thành nhiều vùng phân biệt với DBD là aminocuối và AD là carboxyl cuối.

Amino acid 1-65 từ một vùng được gọi là cụm 2 nhân Zn(II)2Cys6 với 2 nguyêntử Zn và 6 cysteine (hình 6.7). Phần này của protein tác đông trực tiếp với DNA ở mộttrình tự đặc biệt gọi là UASG – sự hoạt hóa ngược trình tự của galactose. Trình tự này(5’-CGGN11CCG-3’) được tìm thấy trong nhiều mẫu phức tạp, 50-200 bp đầu củađiểm bắt đầu sự phiên mã của gene điều hòa galactose.

Amino acids 65–94 form a coiled-coil motif that is responsible for thedimerization of the protein.

Amino acid 768 – 811 từ AD trưởng thành. Giống như tất cả các vùng hoạt hóacủa nấm men, vùng này có tính acid. Tuy nhiên tính acid không phải là yếu tố quyếtđinh duy nhất của vùng hoạt hóa. Vùng hoạt hóa xuất hiện có cấu trúc không rộng, vớiacid và amino acid kị nước góp phần vào việc tạo thế hoạt hóa. Gal4p chiếm một ADthêm vào giữa amino acid 148 và 196. Vùng này có một chất kích thích yếu và sự liênquan của nó góp phần tạo nên các chức năng của protein chưa được biết.

Amino acid 851 - 881 cũng là nơi liên kết của gene ức chế sự phiên mã, Gal80p,có chức năng chỉnh sửa vùng hoạt động của Gal4p. Nơi liên kết của Gal80p dẫn đến sựxuất hiện để duy trì carboxyl cuối của Gal4p trong một định hướng không thể hoạt hóasự phiên mã.

Điều căn bản bản cho sự tương tác sàng lọc dùng nhân tố phiên mã phát sinh từviệc quan sát sự biểu hiện của DBD hoặc AD trong một tế bào thì không đủ hoạt hóacho sự phiên mã. Sự phối hợp trong sàng lọc là một hướng được chỉ ra ở hình 6.8.Gal4p DBD có khả năng liên kết UASG, nhưng việc thiếu một AD không thể sử dụngpolymerase RNA hoặc kích hoạt biểu hiện gene. Tương tự, AD Gal4p một mình sẽkhông kích hoạt biểu hiện gen bởi vì protein có thể không được gắn mục tiêu vào cácgen đặc biệt. Tuy nhiên, nếu DBD và AD có thể liên kết một cách nào đó, ví dụ nhưthông qua các tương tác protein-protein của các polypeptide kết hợp với chúng, sau đó

Page 166: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

165

một protein kích hoạt chức năng trong đó DBD được liên kết với các AD sẽ được hìnhthành và gen kích hoạt sẽ xảy ra.

Năm 1989, Stanley Fields và Song Ok-kyu là những người đầu tiên sử dụngphiên mã từng phần kích hoạt hệ thống để phát hiện sự tương tác giữa protein-proteintrong các tế bào nấm men (Fields và Song, 1989). Họ xây dựng thể plasmid biểu hiệnnấm men trong đó các trình tự gen mã hóa hoặc DBD Gal4p hoặc là AD Gal4p đãđược tái tổ hợp vào trình tự gen mã hóa polypeptide khác (hình 6,9). Những kết quảtrong sản xuất các protein tái tổ DBD Gal4p AD Gal4p . Khi biểu hiện trong các tếbào trên của chính nó, không có khả năng kích hoạt sự biểu hiện gen. Ngoài ra, nếu cảhai phản ứng tổng hợp protein được thể hiện trong cùng một tế bào nhưng polypeptidekết hợp để các DBD và AD không tương tác với gen khác, sự hoạt há gen xẽ khôngxảy ra. Tuy nhiên, nếu các polypeptide kết hợp để DBD và AD có sự tương tác, sau đóDBD và AD chức năng sẽ được thể hiện cùng với nhau, thông qua sự tương tác nàycác protein-protein và gen kích hoạt sẽ xảy ra (Hình 6.8). Điều đó xảy ra chỉ khi hailoại protein tái tổ hợp có thể tương tác với nhau khi sự biểu hiện gen xảy ra. Mặc dùsự kích hoạt của galactose trong quá trình chuyển hóa gen tự nhiên thì UASG có thểđược sử dụng để phát huy hiệu quả của sự tương tác protein-protein (Fields và Song,1989), nó là điều thuận tiện hơn để phân tích phát hiện các sản phẩm của sự biểu hiệngen. Một trong những tiện ích của việc thực hiện tương tác sàng lọc trong tế bào nấmmen là một số lượng lớn các gen chỉ thị có sẵn để sử dụng trong tế bào nấm men.Những yếu tố đó được thể hiện trong Bảng 6.2 và một số gen chỉ thị dinh dưỡng có thểđược lựa chọn để sử dụng. Để làm cho việc sử dụng gen chỉ thị, các trình tự DNAđược nhân bản vô tính UASG ngược của một gen chỉ thị để biểu hiện của nó đồngnghĩa với sự kết hợp của các DBD chia và AD. Ví dụ, sự biểu hiện của gen lacZ E.coli trong các tế bào có nhân điển hình, bao gồm cả nấm men, tạo ra một enzyme β-galactosidase chức năng.

Việc sản xuất của enzyme này có thể được phát hiện bằng cách sử dụng phươngpháp tương tự như chúng ta đã thảo luận. Cho ngừng hoạt động sự lồng ghép trongnhân bản vô tính vectơ (Chương 3) cạnh bên, Ví dụ, sản xuất một màu xanh khi trồngtrên các tấm có chứa XGal. Tế bào nấm men trong đó UASG đã được đặt ở điểm xuấtphát của các lacZ được mã hóa cấu trúc xẽ sản xuất β-galactosidase theo một mẫugalactose phụ thuộc vào các hành động của Gal4p (Yocum và cộng sự, 1984).

Page 167: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

166

Hình 6,9. Plasmid được tạo ra tạo ra do sự liên kết các DNA cho 2 sự tái tổ hợp trên.Một plasmid sản xuất tái tổ hợp và hợp với DBD sản xuất các kết hợp khác với AD. Các genkết hợp cho cả hai loại protein trên được thể hiện từ một promoter tha nh lập mạnh (ADH1)và được chứa các bản plasmid mang chuỗi 2μ. Các gen dinh dưỡng khác nhau (TRP1 vàURA3) cho phép ta lựa chọn plasmid trong tế bào nấm men.

Theo mô tả ban đầu, hệ thống kết hợp kép đã được sử dụng để phát hiện cụ thểtương tác giữa hai loại protein được biết đến, đôi khi được gọi là mồi và con mồi,trong tế bào nấm men (Fields và Song, 1989). Bảng tra này được thực hiện trong mộtchủng nấm men đã được xóa các bản sao của các gen GAL4 và GAL80, và sự tươngtác hiệu quả của “mồi” và “con mồi” được đo bằng cách sử dụng lacZ

Gal4p chứa các trang liên kết. Tuy nhiên ở hệ thống này, sớm tương thích với dữliệu thư viện cDNA (Chien và cộng sự, 1991) và sửa đổi hoạt động trong các tế bàonhân chuẩn cao hơn (La và cộng sự, 1997) và vi khuẩn (Hu, Kornacker và Hochschild,

Page 168: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

167

2000). Để việc biểu hiện trong thư viện cDNA, trong khung cDNA ,sự hợp nhất đượcthực hiện với AD. Sau đó được chuyển đổi vào các tế bào nấm men cùng với sự hợpnhất DBD-mồi Gal4p. Các yếu tố đó có thể được cô lập từ các tính chất trên như lànhững yếu tố kích hoạt sự biểu hiện của gen nhận biết (Hình 6,10). Sàng lọc trên phảiđược thực hiện với các thư viện hợp nhất với AD, kể từ phản ứng tổng hợp cDNA củaDBD Gal4p đưa đến một số lượng lớn các trình tự mà có thể kích hoạt phiên mã khitích hợp vào DNA. Các thí nghiệm đã chỉ ra rằng khoảng 1% DNA ngẫu nhiên củaE.coli có chức năng như kích hoạt phiên mã khi kết hợp các Gal4p DBD (Ma vàPtashne, 1987c). Điều này tạo ra một kết quả quá cao mức độ dương tính giả trongmẫu - đó là kết quả của nhiều nấm men có thể kích hoạt các gen chỉ thị mặc dù họkhông có chứa protein tương tác với nhau.

Hình 6.10. Các kết quả của một mẫu kết hợp kép điển hình. Một chủng nấm men chứamột gen hiển thị UASG-lacZ đã được chuyển đổi với hai plasmid - một trong những thể hiệnmồi DBD Gal4p và các biểu hiện khác của phản ứng tổng hợp với Gal4p trong thư việncDNA. Việc biến nạp được lựa chọn và được chuyển giao cho các mẫu có chứa XGal. Chỉ cómột trong các cDNA Gal4p được mã hóa protein (vòng tròn) có thể nó đã tương tác với “mồicâu” để tạo ra một màu xanh biểu hiện. Việc không tương tác giữa các yếu tố đã không gợira những phiên mã lacZ là các mẫu màu trắng.6.6.1 Những vấn đề và giải pháp với màng lai (two-hybrid screening)

Màng lai là một kĩ thuật được sử dụng phổ biến để phát hiện các tương tácprotein-protein (Colas và Brent, 1998). Tuy nhiên, kĩ thuật này có nhiều nhược điểm.Vài nhược điểm cùng với giải pháp tiềm tàng được liệt kê bên dưới.

Dương tính giả. Các trình tự trong thư viện cDNA có thể mả hóa các proteinliên kết với DNA mà có thể phá vỡ mối tương tác với protein mồi câu(bait) -DBD.Nếu sự hợp nhất mồi (prey) có thể bám ngẫu nhiên vào promotor cùa gene reporter,thì nó sẽ khởi động phiên mã của reporter thậm chí bất chấp nó không tương tác vớibait. vấn đề này có thể giải quyết bằng cách tạo màng cho sự biểu hiện của hai, hoặchơn, gene reporter khác nhau. Phương pháp này cần thiết nếu các thư viện màng chocác đối tương tương tác với nhau, và trong hai cách mà có thể thực hiện được thể hiệnở hình 6.11. Các dòng nấm men có nhiều các gene reporter khác nhau trừ các vị trí

Page 169: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

168

bám Gal4p, đã được xây dựng (James, Halladay và Craig, 1996). Các cụm khuẩn chỉđược phân tích xa hơn nếu tất cả, và không chỉ một tập hợp nhỏ, các reporter đượckích hoạt. Một phương pháp thay thế là làm màng trong một dòng nấm men biểu hiệnhai bait khác nhau và một prey đơn (Xu, Mendelsohn và Brent, 1997). Trong trườnghợp này, nên xảy ra sự kích hoạt duy nhất một reporter và tạo ra một dương tính giảnếu cả hai reporter đều kích hoạt (Serebriiskii, Khazak và Golemis, 1999).

Tương tác yếu. vài tương tác protein-protein, mặc dù liên quan sinh lí, là rấtyếu. Các tương tác protein-protein yếu có thể đủ mạnh để phục hồi bộ máy sao mã đếnpromoter, và kết quả là gene reporter sẽ không được kích hoạt. Đánh giá rằng nếu áilực liên kết giữa bait và prey yếu hơn 10-50 µM, thì không gợi một đáp ứng sao mã(Brent và Finley, 1997).

Hình 6.11. Sử dụng nhiều reporter trong cùng một tế bào để giảm lượng dương tính giảtrong một màng lai. (a) 3 reporter khác nhau mang vị trí liên kết Gal4p (UASG) hoạt độngđược lọc qua màng đồng thời. Những tương tác giữa bait và prey sẽ kích hoạt tất cả reporterchứ không phải một tập hợp của chúng. (b) Màng sử sụng 2 bait khác nhau. Một tương tácđặc hiệu giữa một trong các protein bait và prey sẽ gây sự kích hoạt chỉ một trong nhữnggene reporter. Loại màng này đặc biệt hữu ích nếu 2 protein bait quan hệ chặt chẽ với nhauđể nhận dạng một prey mà tương tác đặc hiệu với chỉ một bait (Serebriiskii, Khazak vàGolemis, 1999)

Protein bait không phải là chất kích hoạt sao mã. Nếu bait là chất kích hoạt thìnó không thể được sử dụng để tìm các đối tượng tương tác bằng cách sử dụng các

Page 170: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

169

màng được miêu tả bên trên. Nhiều protein, thậm chí bất chấp thông thường chúngkhông là chất kích hoạt sao mã, sẽ kích hoạt sự sao mã khi chúng liên kết với DNA.Các hệ thống màng lọc khác, như các hệ thống màng lọc dựa trên sự sao mã củaenzyme RNA polymerase III (Marsolier, Prioleau và Sentenac, 1997), hoặc hệ thốngsplit-ubiquitin (Johnsson và Varshavsky, 1994), đã được phát triển để thí nghiệm cácbait loại này.

Các protein màng. Hệ thống lai (two-hybrid) truyền thống dựa vào cả proteinbait và prey vào nhân eukaryote và có thể tương tác ở đó. Một vài protein sẽ không thểlàm được điều này. Ví dụ, một protein trên màng sẽ liên kết với màng và do vậy khôngthể vào nhân. Một phương pháp lọc qua màng khác , gọi là hệ thống phục hồi SOS, đãđược phát triển, mà trong màng lai sự tương tác protein-protein diễn ra trên màng tếbào chất của tế bào nấm men (Aronheim và cộng sự, 1997).

Các tương tác ngẫu nhiên. Một vài protein có thể tương tác trong một hệ thốnglai (two-hybrid system) mặc dù sự tương tác không liên quan quá trình sinh lí. Ví dụ,các protein mà thông thường ở trong các vị trí khác nhau của tế bào hoặc ở những giaiđoạn phát triển khác nhau có khả năng tương tác với nhau khi được biểu hiện trongcùng một tế bào, nhưng chúng thường không bao giờ được biểu hiện ở trạng thái tựnhiên của chúng. Cũng có thể bait và prey không tương tác trực tiếp với nhau, nhưngmối liên kết đó thông qua bởi một protein thuộc tế bào khác. Ví dụ, protein Rev đượcmã hóa bởi HIV tương tác trong một màng lai (two-hybrid screen) với Rip1p, mộtprotein nucleoporin của nấm men (Stutz, Neville và Rosbash, 1995), nhưng tương tácnày thực tế có thể thông qua protein khác của nấm men, Crm1p, mà liên quan đến việcphóng nhân ra (nuclear export) (Neville và cộng sự, 1997).

Các bait phải được thử nghiệm riêng biệt. Một bait có thể được lai bằng cáchsử dụng thư viện các các đối tác prey tương tác với nó, nhưng sự hợp nhất DBD-baitphải được tạo ra riêng được biến đổi cùng với thư viện trong các tế bào nấm men. Điềunày rất mất thời gian nếu nhiều bait cần được lai. Việc lai hiện nay được sử dụng rộngrãi dể lọc số lượng lớn protein bait (Finley và Brent, 1994). Một danh sách các baitkhác nhau được lập và thay đổi trong nấm men đơn bội của một trong hai loại lai sau(a và α). Một thư viện prey được thay đổi trong một dòng nấm men của loại lai còn lạivà những dòng khác nhau được lai. Sau đó lọc những nấm men lưỡng bội chứa cácgene reporter hoạt động. Phương pháp này cho phép lọc nhanh nhiều bait trong một thínghiệm đơn (Colas và Brent, 1998).

Hệ thống lai cung cấp những cơ hội tuyệt vời để nhận dạng các protein mà tươngtác với nhau. Những thông tin bên trên cho biết kĩ thuật sẽ không hiệu quả cho từngprotein nhưng, khi chúng ta xem chương 10, bản đồ tương tác protein rộng-genomeđược xây dựng bằng cách sử dụng dữ liệu thu thập từ hai màng lai (Uetz và cộng sự,2000). Nhiều hệ thống lai khác nhau đã được mô tả sử dụng các bait với các DBDkhác nhau (ví dụ, DBD của các protein kìm hãm LexA hoặc TetR thuôc vi khuẩn)hoặc các prey với các trình tự AD khác nhau (ví dụ, sự kích hoạt domain của VP16-protein virus phức Herpes hoặc trình tự kích hoạt nhân tạo B42), được ghi lại bởi

Page 171: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

170

Brent và Finley (1997). Các đặc điểm chính được miêu tả bên trên cho các hệ thốngdựa vào Gal4p vẫn đúng cho từng phiên bản khác biệt.6.7 Sự tương tác màng lai

Màng lai kép có thể được biến đổi nhiều hơn để phù hợp với những mục đíchkhác nhau. Những đối tượng cơ bản đằng sau mỗi kiểu sàng lọc được liệt kê bên dướithì để thu thập một chức năng protein hoạt hóa của sự sao mã bên trong mỗi promotercủa mỗi gen báo cáo, mà sự biểu hiện của nó sau đó có thể được phát hiện.

Các kiểu sàng lọc khác6.7.1 Lai đơn

Trong một trường hợp đơn giản hóa của hệ thống lai kép, một thư viện cDNA-AD được đưa vào bên trong một loài nấm men loài mà nuôi dưỡng một gen báo cáobên trong liên kết DNA với vị trí được đưa vào. Những protein được mã hóa bởicDNA có thể liên kết với những vị trí liên kết với DNA sẽ tham gia hoạt động phiênmã của gen báo cáo ( Li và Herskowitz, 1993). Thành tựu này được sử dụng trongviệc xác định protein cái mà điều chỉnh những promoter của những gen đã biết (Wangvà Reed,1993). Để thực hiện một phương pháp sàng lọc giống như vậy, phần tử liênkết DNA thường multimerized để sản xuất một phần tử hoạt hóa mạnh (xuyên suốtliên kết của đa số những protein hoạt hóa) vì vậy sự biểu hiện của gne báo cáo đượcnhân ra dễ dàng.6.7.1 Lai ba

Bất cứ cơ chế mà những chức năng AD và DBD của những chất hoạt hóa của quátrình sao mã có thể liên kết được với nhau để có thể được sử dụng để hoạt hóa genebáo cáo. Một vài phương pháp sàng lọc được mô tả trong những protein dung hợpDBD và AD không trực tiếp tương tác với nhau nhưng sự tương tác của chúng thì giántiếp đến đến các phần tử khác. Ví dụ, loài SenGupta liên kết với hai protein gắn kết

Page 172: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

171

RNA (một nút đến DBD và một nút đến AD) thông qua một phân tử RNA bifunctionalđược sản xuất bên trong những tế báo nấm men (SenGupta và cộng sự, 1996). Nhữngphương pháp sàng lọc sau đó có thể được thiết lập để tìm kiếm những protein gắn kếtRNA cái mà gắn kết những trình tự lạ thường đã sát nhập vào bên trong liên kế củaRNA. Trong một mạch đơn giản, Lictra và Liu đã phát hiện một hệ thống để dò tìmnhững liên kết phân tử Protein nhỏ (Lictra và Liu, 1996). Trong hệ thống này, DBDđược nối với một phối tử liên kết protein (một thụ thể nhỏ hơn hoặc bằng những liênkết hormone dexamthasone) và một phối tử bifunctional (chứa đựng dexamathason vànhững nhóm khác) được sử dụng để sàng lọc protein trong một thư viện cDNA-ADdung hợp cái mà liên kết với những phần khác của phối tử bfunctional. Trong cảtrường hợp được mô tả ở đây một thành phần không phải là protein cố định DBD vàAD lại với nhau để cho phép sự sao mã xảy ra.6.7.3 Lai nghịch đảo

Tương tác giữa bait và prey được sử dụng để nhấn mạnh sự biểu hiện của gen màsản phẩm của nó tiêu diệt tế bào (Leanna và Hannink, 1996). Đây là cách hữu dụng đểsàng lọc thuốc những cái mà phá vỡ liên kết giữa những protein và vì thế cho phépnhững tế bào tồn tại thông qua sự không biểu hiện cảu những gen báo cáo.

Page 173: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

172

CHƯƠNG 7TẠO ĐỘT BIẾNNhững khái niệm chínhĐột biến – là sự thay đổi của một chuỗi DNA –cần thiết cho sự hiểu biết về

chức năng của gene và protein.Trình tự DNA có thể được thay đổi một cách có định hướng cụ thể và ở mức độ

cao.Oligonucleotide liên kết với các trình tự DNA bổ sung có thể được sử dụng để

tạo đột biến không kết đôi được. Oligonucleotide đột biến sau đó dược sử dụng nhưđoạn mồi trong sự tổng hợp DNA sao cho DNA mới chứa đột biến.

Các phương pháp chọn lọc sợi phân biệt giữa DNA đột biến vừa mới tổng hợpvới trình tự cha mẹ tự do.

PCR có thể được dùng để tạo các đột biến cụ thể hoặc ngẫu nhiên.Trình tự gene “điều khiển” chuỗi amino acid của protein mà nó mã hóa. Do đó,

các đột biến trong gene tức là việc thay đổi trình tự DNA có thể dẫn đến sự thay đổitrình tự amino acid trong protein. Việc phân tích các đột biến đặc biệt hữu dụng trongviệc làm rõ chức năng protein. Đột biến làm giảm hoạt động của protein hoặc làmprotein hoạt động một cách bất bình thường, có thể được sử dụng để quy vào một chứcnăng đặc biệt của các phần protein riêng lẻ. Việc sai sót khi sao chép DNA trong genegây ra tỉ lệ đột biến tự nhiên rất thấp (ước tính ở mức độ thay đổi của một DNA basecho mỗi 106-108 base được sao chép) và thay đổi nhiều nhất giữa các gene riêng lẻ vàcác sinh vật. Tuy nhiên đột biến xảy ra trong tự nhiên được sử dụng để phân lập genesvà mô tả cụ thể chức năng của protein mà chúng mã hoá. Trước khi có sự bùng nổ củakỹ thuật sinh học phân tử vào những năm 1970 và 1980, tốc độ gia tăng đột biếnthường do toàn bộ tế bào bị xử lý bằng phương pháp vật lý hoặc tác nhân hóa học.

Ví dụ như việc xử lý vi sinh vật hoặc sinh vật nhân chuẩn đơn bào bằng tia X,ánh sáng tia cực tím hoặc hóa chất như ethyl methane sulphonate (EMS) tạo ra DNAbase thay đổi suốt hệ gene. Trong một lần sản xuất, những sự thay đổi sẽ được chuyềntừ thế này sang thế hệ khác thông qua sự phân chia tế bào. Đây là kiểu đột biến truyềnthống, tuy nhiên có một số điều còn hạn chế. Ví dụ như các đột biến được tạo ra mộtcách ngẫu nhiên có thể xảy ra tại bất cứ nơi nào trong hệ gene không chỉ ở gene riêngrẽ hay những phần của gene. Ngoài ra, cần đến sự phát triển của các màng chuyên mônnhận dạng các đột biến xảy ra ở các gene riêng rẽ (Additionally, highly developed andspecialized screening procedures are required to identify mutations that have occurredwithin individual genes). Điều này tương đối đơn giản trong việc tạo đột biến ở genemã hóa, ví dụ như một trong những enzyme của chuỗi phản ứng trao đổi chất. Đột biếnphá hủy hoạt động của một phần trong chuỗi phản ứng sinh hóa có khả năng dẫn đếnsự hình thành của cơ quan không có sự chuyển hóa chất dinh dưỡng riêng biệt. Dựatrên sự tăng trưởng của màn có thể được dùng để cô lập các đột biến. (Screens basedon growth assays can then be devised to isolate these mutants.) Các hình thức truyềnthống gây đột biến cũng bị ảnh hưởng, kể từ khi quan sát ngoại cảnh thay đổi trên màn

Page 174: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

173

chắn không có kết quả đột biến trong một gene đơn. Ngoài ra, nhiều loại đột biến cóthể phụ thuộc (có lẽ khi có nhiều gene dư xuất hiện trong cùng tế bào) trước khi sựthay đổi điều kiện ngoại cảnh.

Các đột biến trong DNA thường rơi vào một trong hai loại. Đầu tiên, một basehoặc nhìu base trong trình tự DNA được thay đổi từ một trình tự này thành một trìnhtự khác, trong khi các base thứ hai là chèn vào hoặc loại bỏ khỏi gene. Sự thay đổi củacặp base DNA đơn được mô tả như là đột biến đồng hoán hoặc đột biến dị hoán:

Đột biến đồng hoán - sự thay đổi một cặp base purine-pyrimidine đến một cặpbase purine-pyrimidide khác (ví dụ: AT GC, hay GC AT, hay TA CG).

Đột biến dị hoán - chuyển một cặp base purine-pyrimidine đến một cặp basepurine- pyrimidine (ví dụ: AT TA, hay GC CG, hay AT CG, or GCTA).

Sự thay đổi của base đơn có thể dẫn đến nhiều sự biến đổi khác nhau của trình tựamino acid của protein được mã hóa bởi các gen ở vùng mà các base bị thay đổi. Sựđột biến có thể là:

Đột biến yên lặng - bộ ba mã hóa bị thay đổi, nhưng amino acid được mã hóathì vẫn như cũ (ví dụ: những bộ ba 5’-TCG-3’ và 5’-TCC-3’ đều mã hóa cho aminoacid serine),

Đột biến sai nghĩa – sự thay đổi của codon làm biến đổi amino acid được mãhóa (nếu codon serine 5’-TCG-3’ được đột biến thành 5’-ACG-3’, sau đó acid aminthreonine sẽ được chèn vào các polypeptide được mã hoá tại vị trí của serine)

Đột biến vô nghĩa - một codon amino acid được thay đổi để tạo ra codon kếtthúc.

Ví dụ, nếu codon serine 5’-TCG-3’ được đột biến thành 5’-TAG-3’, sau đó chuỗipolypeptide được mã hóa sẽ được kết thúc tại điểm đó.

Việc chèn vào hoặc bỏ đi một cặp base, hoặc nhiều cặp base vào trình tự mã hóacủa một gene có thể có tác động mạnh mẽ đến polypeptide được mã hóa. Vì khi mãDNA được đọc trong bộ ba, thì việc chèn vào hoặc bỏ đi trong các base nhiều hơn basẽ dẫn đến đột biến cấu trúc. Ví dụ, nếu một ký tự đơn trong trình tự dưới đây bị bỏ đi,sau đó ý nghĩa của trình tự kia bị thay đổi hoàn toàn.

Tương tự, xóa hoặc chèn một hoặc hai base vào trong trình tự mã hóa của genesẽ làm lộn xộn phần còn lại của trình tự đột biến kia. Chỉ có việc xóa hoặc chèn thêmcác bộ ba base sẽ cho phép phần còn lại của trình tự polypeptide được mã hóa đượcgiữ nguyên, nhưng sẽ loại bỏ (hoặc chèn thêm) các amino acid.

Page 175: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

174

Sự thay đổi của amino acid đơn thành một amino acid khác trong protein có thểcho kết quả thú vị trong chính chức năng của protein. Để tiếp cận trực tiếp việc nghiêncứu mối quan hệ giữa các gene và các protein, cần hiểu rõ cơ chế tạo đột biến tại vị trícụ thể của DNA.7.1. Tạo những thay đổi cho DNA cụ thể bằng cách sử dụng qui trình đột biếnkéo dài mồi

Như chúng ta đã thấy trong chương 3, thực khuẩn thể M13 trải qua một sự thayđổi trong suốt vòng đời của nó, trong suốt quá trình đó bộ gene sợi đơn được biến đổithành một sợi đôi . Điều đó nghĩa là, dạng sợi đơn của bộ gene cung cấp khuôn cho sựtổng hợp một chuỗi DNA thứ hai. Quá trình này có thể được sử dụng nếu chúng tamuốn tạo ra các đột biến trong chuỗi DNA mới được tổng hợp và được phác thảotrong hình 7.1. Việc sử dụng các oligolucleotide trong việc tạo ra những đột biến điểmđịnh vị được đưa ra trong phòng thí nghiệm của Michael Smith, đoạt giải nobel về hóahọc cho phát minh của ông Smith và các đồng nghiệp đã sử dụng bộ gene DNA sợiđơn của M13 như một mẫu lai cho sự tổng hợp các oligonucleotide (Zoller và Smith,1983). Các oligonucleotide liên kết thành trình tự bổ sung với bộ gene sợi đơn vàđược thiết kế có một hoặc nhiều hơn những đột biến (những cặp base không bổ sung)xuất hiện khi nó liên kết với DNA M13.

Sự liên kết của oligonucleotide với DNA sợi đơn được ổn định bởi những cặpbase bổ sung xuất hiện tại bất cứ vị trí nào. Ngoài việc thay đổi những base riêng lẻmột oligonucleotide cũng có thể chèn thêm hoặc xóa bớt base trong một gene. Mộtkhi kết hợp thành trình tự bổ sung, oligonucleotide cung cấp một nhóm hydroxyl 3’ tựdo như điểm bắt đầu cho sự tổng hợp DNA. Lai ghép, sợi đôi không hoàn chỉnh, phântử DNA được ủ với một enzyme polymerase trong sự hiện diện của bốndeoxynucleotide triphosphate (dNTP).Điều này sẽ dẫn đến sự tổng hợp một chuỗiDNA mới được bổ sung hoàn toàn với chuỗi DNA gốc ban đầu, ngoại trừ tại các vị trínơi mà những đột biến được dưa vào trong chính oligonucleotide. Chu trình tổng hợpDNA mới, sau đó được hoàn thành bởi sự hoạt động của các DNA ligase, trong sự cómặt của các ATP, để nối các đoạn còn riêng biệt với nhau. Các DNA thường không thểđi vào tế bào E.coli , nhưng vì nó phải được đưa vào trong vi khuẩn, nơi mà DNA sẽđược sao chép nên các thực khuẩn thể được tạo ra. Khi những vòng DNA được saochép trong tế bào của vi khuẩn, một trong hai khả năng có thể phát sinh, hoặc là chuỗiDNA gốc ban đầu hoặc là chuỗi DNA đột biến mới được tổng hợp có thể đưa ra nguồn

Page 176: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

175

gốc cho con cháu của thực khuẩn thể M13. Đó là kết quả các M13 có thề chứa cáctrình tự nhiên hoặc trình tự đột biến .

Những thể thực khuẩn chứa hoặc trình tự tự nhiên hoặc đột biến được phân biệtthông qua việc kiểm tra màng lai (tương tự như mô tả trong chương 6). Một kiểu đánhdấu đồng vị phóng xạ của các oligonocleotide tổng hợp được sử dụng để tạo ra sự độtbiến sẽ được ưu tiên kết hợp cho trình tự đột biến khi so sánh với trình tự tự nhiên(Wallace và cộng sự, 1981). Do đó mảng thực khuẩn thể có khả năng kết hợp vớioligolucleotide một cách chính xác cao sẽ chứa đựng trình tự đột biến .

Hình 7.1 Tạo đột biến điểm định vị sử dụng mẫu DNA sợi đơn. DNA sợi đơn được phânlập từ một thể thực khuẩn M13 tái tổ hợp mang gene đột biến được cô lập và sử dụng nhưmẫu cho sự kết hợp của một mồi oligonocleotide . Các mồi lai thành trình tự bổ sung của nóvà đưa vào một hoặc nhiều đột biến cụ thể . Kết quả lai sau đó được sử lý với DNApolymerase trong sự hiện diện của 4 deoxynucleotide triphosphate (dNTP) để tổng hợp mộtchuỗi DNA M13 mới bổ sung với mỗi base ban đầu , trừ trường hợp các thay đổi được đưavào trong mồi . Khung đường-phosphate của các vòng DNA mới sau đó được hoàn thànhbằng cách sử dụng DNA ligase và DNA chuỗi đôi được đưa vào trong các tế bào E coli .

Page 177: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

176

Trong Ecoli hoặc là sợi DNA đột biến mới được tổng hợp hoặc là sợi DNA tự nhiên gốc đượcsử dụng để tạo nên những thực khuẩn M13 mới .

Quy trình tạo đột biến điểm định vị kéo dài mồi được chấp nhận rộng rãi vàonăm 1980. Tuy nhiên, nó còn một số khiếm khuyết vì là một phương pháp cho việcsản xuất nhanh hàng loạt những đột biến DNA cụ thể.

Các DNA bị đột biến cần được nhân bản trong hệ gene M13.Hiệu quả của quá trình đột biến là khá thấp. Để tạo ra một sợi DNA đột biến

mới, sự liên kết của các oligonucleotide, sự sao chép DNA và nối DNA phải có hiệuquả. Mỗi quy trình có hiệu quả ít hơn 100%, và vì thế sợi DNA tự nhiên sẽ chiếm ưuthế trong hỗn hợp được biến đổi trong vi khuẩn.

Các DNA mới được tổng hợp sẽ không được methyl hóa vì nó được sản xuấttrong ống nghiệm, trong khi bộ gen M13 tự nhiên phân lập từ những mẻ cấy vi khuẩnsẽ được methyl hóa. Điều này là quan trọng vì những hệ thống sửa chữa không phùhợp của E.coli có lợi cho việc sửa chữa DNA không methyl hóa (Kramer andFritz,1984). Điều này sẽ dẫn đến sự bất xứng trong giữa những sợi DNA tự nhiên vàđột biến đang được sửa chữa theo hướng trở về trình tự tự nhiên.

Quy trình kiểm tra màng lai khác nhau để xác định những thực khuẩn đột biếnđều chậm và cồng kềnh ngổn ngang và thường những kết quà trong sự cô lập của loạitự nhiên hơn thực khuẩn thể đột biến .

Tất cả những nhân tố này dẫn đến một hiệu quả đột biến thấp. Điển hình,nhữngtần số sự phát sinh của đột biến ít hơn 10% có thể thu được cho những phản ứng kéodài mồi giống như mô tả ở trên. Một hậu quả của tần số đột biến thấp là một số lượnglớn các đột biến tiềm năng cần phải được kiểm tra để đảm bảo rẳng ít nhất có một độtbiến thật có thể được phân lập. Những quy trình đó tần số đột biến xuất hiện 100% cónghĩa là chỉ một mảng vi khuẩn đơn (hoặc có thể hai) sẽ cần phải được phân tích đểđảm bảo rằng một đột biến có thể được phân lập. Những tần số đột biến thấp hơn dẫnđến một số lượng lớn thực khuẩn thể cần phải được phân tích trước khi một đột biến cókhả năng được tìm thấy và có những kết quả cho tốc độ mà tại đó những đột biến đặctrưng có thể được phân lập. Những phương pháp đã được đưa ra để tăng hiệu quả tổngthể của một đột biến thử nghiệm bằng cách tăng hiệu quả phản ứng dột biến của chínhnó, hoặc sử dụng các chủng vi khuẩn ít có khả năng làm suy giảm những chuỗi DNAđột biến mới được hình thành. Ví dụ những tế bào Ecoli có thiếu sót trong hệ thống sửachữa sai khớp mutL, mutS, mutH có thể được sử dụng cho sự chuyển đổi các phân tửDNA lai để các đột biến có thể không được sửa chữa lại thành trình tự tự nhiên.

Page 178: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

177

Hình 7.2. Những quy trình đột biến có hiệu quả giảm số lượng các dòng vô tínhphải được kiểm tra từ một đột biến đặc trưng riêng lẻ.7.2. Những phương pháp lựa chọn mạch DNA

Một cách thức tiếp cận vô cùng hiệu quả để làm tăng đột biến là đề ra mộtphương thức chọn mạch DNA đột biến, hoặc gây bất lợi cho mạch DNA tự nhiên. Ởđây, chúng tôi sẽ mô tả hai phương pháp mà hiện nay vẫn đang được sử dụng. Phươngpháp đầu tiên là hợp nhất các nucleotide tương tự bảo vệ cho mạch DNA đột biến vừađược tổng hợp khỏi sự thoái hóa trong ống nghiệm (Taylor, Ott and Eckstein, 1985),trong khi đó phương pháp thứ hai là mạch DNA tự nhiên làm mục tiêu cho quá trìnhthoái hóa trong tế bào E.Coli (Kunkel, 1985).7.2.1. Sự chọn lựa mạch chứa Phosphorothioate

Một nucleotide phosphorothioate có chứa liên kết phospho – lưu huỳnh ở vị trínhóm phospho – oxy (Hình 7.3). Nếu trong phosphorothioate deoxynucleotides mà lưuhuỳnh được gắn với α-phosphate để sử dụng trong phản ứng tạo DNA, thì sau đóphosphorothioate kết hợp với DNA vừa mới tổng hợp. Và chắc chắn một số cácenzyme cắt giới hạn không thể cắt đứt được DNA có chứa phosphorothioates(Nakamaye and Eckstein, 1986). Các oligonucleotide đột biến được ủ với mẫu DNAsợi đơn M13 như được mô tả ở trên, nhưng được kéo dài bởi DNA polymerase trongsự hiện diện của 3 deoxynucleotide triphosphates (dATP, dTTT and dGTP) và mộtphosphorothioate nucleotide đơn (dCTPαS). Điều này dẫn đến sự hình thành sợi DNAvừa mới được tạo đột biến, nhưng không phải là sợi DNA tự nhiên, mà là sợi có chứaphosphorothioate tại vị trí C còn lại. Ví dụ, sự phân cắt DNA sợi đôi, enzyme cắt giớihạn PstI sẽ cắt sợi DNA tự nhiên (không phosphorothioate) nhưng lại không cắt sợiDNA đột biến. DNA bị cắt có thể bị loại bỏ bằng cách xử lý với exonuclease III, làmột loại enzyme phân giải DNA. Các enzyme exonuclease sẽ không phân giải DNAdạng vòng đột biến vì chúng không có đuôi kết thúc tự do. Kết quả là DNA đột biếndạng vòng tăng lên và được chuyển vào trong vi khuẩn E.Coli. Hiệu quả đột biến bằngphương pháp này có thể đạt tới 40-60%.

Page 179: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

178

Hình 7.3. DNA chứa liên kết với phosphorothioate chống lại sự phân cắt củaenzyme cắt giới hạn. (a) Cấu trúc hóa học của dCTPαS. Một nguyên tử lưu huỳnh thaythế cho 1 nguyên tử oxy trên α-phosphate của nucleotide (vị trí màu đỏ trên hình). (b)Phosphorothioate nucleotides trên DNA có tác dụng ngăn cản sự phân cắt của enzymecắt giới hạn PstI. PstI tách chuỗi để tạo bốn base lơ lửng ở đầu sole. Nếu chuỗi cóchứa phosphorothioate (biểu thị bằng dấu hoa thị màu đỏ) tại vị trí C còn lại của mộtsợi, sau đó enzyme sẽ chỉ cắt tại vị trí của sợi còn lại. Nếu các sợi đều chứaphosphorothioate thì enzyme sẽ không cắt bất cứ sợi nào.7.2.2. Sự lựa chọn sợi dut - ung – (hay Kunkel)

Trong phương pháp này, sợi tự nhiên không bị đột biến được nhắm đến cho quátrình thoái hóa. Các mẫu DNA trong phản ứng đột biến thu được từ các thể trực khuẩnphát triển trong tế bào vi khuẩn E.Coli chứa dạng đột biến của gene dut lẫn gene ung(Hình 7.4).

Các gene dut mã hoá dUTPase, là 1 chất có chức năng phân huỷ dUTP ở bêntrong tế bào. Quá trình đột biến dut làm cho nồng độ của dUTP tăng cao, tích tụ trongtế bào và kết quả là uracil (U) thay cho thymine (T) tại một số vị trí trong suốt quátrình sao chép DNA.

Các gene ung mã hóa uracil N-glycosylase, là chất thường loại bỏ uracil từDNA.

Page 180: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

179

Hình 7.4. Phương pháp lựa chọn sợi dut - và ung - (Kunkel, 1985) để làm giảmchuỗi không đột biến trong suốt quá trình đột biến tại vị trí đó. Xem phần văn bản đểbiết chi tiết.

Như vậy, trong đột biến đôi (dut-, ung-) uracil được kết hợp với DNA và lỗi nàykhông được sửa chữa. U dư có cùng đặc điểm kết đôi như T, do đó sự kết hợp của Uvào DNA tại vị trí của T không gây đột biến trong chính nó. DNA của thể thực khuẩnM13 được phân lập từ chủng E.coli dut- ung- chứa khoảng 20-30 lượng U dư trênkhoảng 8000 base của hệ gene. Các sợi DNA đơn M13 được phân lập để dùng làmkhuôn cho quá trình ủ gây đột biến oligonucleotide. Các phản ứng kéo dài được hìnhthành như miêu tả ở trên để tạo ra sợi DNA đột biến vừa mới được tổng hợp mà khôngchứa lượng U dư. Một lần nữa, sau khi quá trình tổng hợp sợi DNA thứ hai hoàn tấtđược nối đồng hóa trị bằng DNA ligase. Các kết quả của DNA sợi kép gồm sợi tựnhiên có chứa uracil dư và sợi vừa mới tổng hợp chứa base đột biến trongoligonucleotide nhưng không có uracil dư. Các DNA sợi kép sau đó được chuyển vàotế bào E.coli ung+ tự nhiên, là nơi uracil N-glycosylase nhận ra uracil dư trong DNA

Page 181: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

180

và cắt bỏ base uracil khỏi vị trí apyrimidinic trong sợi khuôn mẫu. Sự hiện diện của vịtrí apyrimidinic làm cho sợi DNA không hoạt động vì nó không thể sao chép bằngDNA polymerase. DNA được cắt tại vị trí apyrimidinic bởi một nucleas đặc biệt(endonuclease IV) trong tế bào vi khuẩn E.Coli và trở nên thoái hóa. Do đó, khi DNAsợi kép được đưa vào ung+ của E.Coli thì chỉ có sợi đột biến được sao chép. Vớiphương pháp này hiệu quả đột biến thu được lên đến gần 100%.

Mặc dù phương pháp gây đột biến DNA được mô tả ở trên có hiệu quả cao, tất cảcác kỹ thuật đều dựa vào quá trình nhân bản lúc bước đầu của gene được đột biếnthành thể thực khuẩn M13 để sợi DNA đơn được phân lập. Viêc sử dụng rộng rãiplasmid có DNA sợi kép như vector tạo dòng vô tính đoạn DNA vào vector đột biếnM13, và tiếp tục nhân bản vô tính DNA đột biến trở lại vào plasmid ban đầu – đây làquá trình tốn nhiều thời gian.7.3. Băng đột biến

Hình 7.5 Băng đột biến. Đoạn DNA bị cắt bởi hai hai enzyme cắt giới hạn đượctách ra từ một DNA plasmid và được thay thế bằng một sợi kép có chứa đột biến cầnthiết. Ở đây, một codon alanine (A) trong chuỗi mã hóa protein giữa chỗ phân táchEcoRI và Pstl được thay thế bằng một codon lysine (K). Chuỗi oligonucleotide képđược tổng hợp sao cho khi lai, chúng sẽ hình thành các đầu sole cần thiết để nối cácDNA plasmid đã bị cắt

Băng đột biến dựa trên sự có mặt của hai enzymes cắt giới hạn nhận diện các vịtrí cắt trên đoạn DNA mạch khuôn, đoạn mà sẽ bị đột biến (hình 7.5). Plasmid đượccắt bằng các enzym và đoạn DNA lớn đại diện cho phần lớn plasmid được tinh sạch từnhững đoạn nhỏ hơn. Plasmid DNA mạch thẳng sau đó được nối lại tạo thành DNAmạch nhờ việc ủ với hai chuỗi oligonucleotide bổ sung (hình 7.5). Các oligonucleotidebổ sung có chứa các đột biến mong muốn và những chuỗi nhô ra cần thiết cho việc nốivới vị trí phân cắt của enzyme cắt giới hạn (Wells, Vasser và Power, 1985). Kỹ thuật

Page 182: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

181

này mang lại hiệu quả đột biến cao, những đoạn DNA tự nhiên dạng nhỏ có thể bị loạibỏ. Tuy nhiên nó cũng có hạn chế ở chỗ đòi hỏi hai enzyme cắt giới hạn nhận diệnchuỗi để tấn công DNA đột biến (Worrall, 1994).Chuỗi oligonucleotide khó tổng hợpmột cách chính xác khi chiều dài lớn hơn 70 nucleotide. Mặc dù đây không có giới hạnmà tại đó vị trí phân cắt có thể bị phân tách, vì nhiều chuỗi oligonucleotide trùng khớpvới nhau có thể tổng hợp để tạo ra chuỗi lớn hơn, nó tạo ra một giới hạn về kích cỡ vậtlý của băng mà có thể được sản xuất một cách hiệu quả. Chúng ta sẽ quay trở lại băngđột biến một lần nữa khi chúng ta nhìn vào việc sản xuất các đột biến ngẫu nhiên trongcác gen cụ thể.7.4 PCR Based Mutagenesis

Chúng ta đã thấy như thế này, bằng cách thiết lập phù hợp các oligonucleotide,những đột biến có thể được đưa vào đầu mút của các sản phẩm PCR theo cách dẫn đếnhiệu quả đột biến gần như 100% (chương 4). Theo phương pháp này (xem hình 4.7)những đột biến được đưa vào trong chính đoạn mồi PCR của chúng, là những công cụhết sức mạnh mẽ cho việc đưa những DNA bị biến đổi vào trong đầu mút của đoạnDNA mạch thẳng. Tuy nhiên, phương thức PCR này được phát triển để cho phép việctạo ra các đột biến ở bất kỳ điểm nào trong suốt chiều dài của sản phẩm PCR (Higuchi,Krummel and Saiki,1988). Phương pháp này thường được gọi là đột biến PCR haibước, đòi hỏi bốn đoạn mồi oligonucleotide ngắn và ba phản ứng PCR riêng biệt vàđược phác thảo trong hình 7.6.

Hình 7.6 (Hai bước PCR để đưa các đột biến vào giữa một đoạn DNA đượckhuếch đại. Mồi chéo (mồi 2 và mồi 3) được thiết kế để đưa một đột biến vào mạchxuôi và mạch ngược mới được tổng hợp một cách tương ứng. Những đoạn mồi đượcsử dụng trong thí nghiệm PCR để khuếch đại đoạn DNA cần thiết thành hai phần -DNA chứa những đột biến và trình tự tại đầu 5’ của mạch xuôi, một cách riêng biệt,và DNA chứa những đột biến và trình tự tại đầu 3’ của mạch xuôi. Hai sản phẩm PCRđược hình thành do quá trình này có thể nối với nhau thông qua các trình tự bổ sung

Page 183: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

182

của chúng, được quyết định bởi vị trí của mồi 2 và mồi 3. Những sợi DNA hỗn tạp cóthể được khuếch đại bằng cách sử dụng mồi 1 và 4 để tạo ra các đoạn DNA nguyênvẹn có chứa đột biến)

Hai trong số những đoạn mồi (1 và 4) được thiết kế để bổ sung với sợi ngược vàsợi xuôi của DNA mục tiêu, một cách tương ứng. Hai đoạn mồi khác (2 và 3) đượcthiết kế để liên kết với các sợi khác nhau trong cùng một chuỗi DNA và cũng đưanhững đột biến cần thiết vào trong mỗi sợi. Ở bước PCR đầu tiên, gene bắt đầu ở đầu5’ được khuếch đại bằng cách sử dụng đoạn mồi 1 và 2. Sản phẩm tạo ra sẽ mang độtbiến tại đầu 3’ của nó. Ở bước PCR thứ hai, đầu 3’ của gene được khuếch đại bằngcách sử dụng đoạn mồi 3 và 4 để sản phẩm tạo ra sẽ mang đột biến tại đầu 5’. Mồi 2 và3 được thiết kế sao cho chúng bổ sung lẫn nhau và chồng chéo lẫn nhau. Điều này cónghĩa là đầu 3’ của sản phẩm PCR 1 sẽ trùng với đầu 5’ của sản phẩm PCR 2. Do đó,nếu sản phẩm PCR 1 và 2 được trộn lẫn với nhau, biến tính và được làm mát, sau đócác sợi riêng rẽ của từng phản ứng có thể lai với nhau. Hai phân tử lai có thể hìnhthành. Nếu sợi xuôi của PCR 2 liên kết với các sợi ngược của PCR 1, sau đó một phântử được tạo ra sẽ không được kéo dài bằng cách sử dụng DNA polymerase (Đầu 3’không có base để kết hợp). Tuy nhiên, nếu các sợi xuôi của PCR 1 liên kết với các sợingược của PCR 2, sau đó DNA polymerase có thể tạo ra một phiên bản mạch kép củagen có chứa đột biến. Trong thực tế, các sản phẩm của PCR 1 và PCR 2 được trộn lẫntrong sự có mặt của mồi 1 và 4 để toàn bộ chiều dài gen đột biến được khuếch đại đểmang một lượng lớn các DNA đột biến. Trong hình 7.6, những đoạn mồi 1 và 4 khôngđưa những tác nhân đột biến vào trong gene. Đó là trường hợp thông thường, tuy nhiênnhững đoạn mồi này được sử dụng để đưa vị trí nhận dạng enzyme cắt giới hạn vàotrong sản phẩm PCR ( như minh họa trong hình 4.7) để các gene đột biến có thể dễdàng nhân bản vô tính thành một plasmid. Hiệu suất đột biến của phương pháp PCRrất cao, các bước khuếch đại đảm bảo rằng trên thực tế không DNA tự nhiên nào cómặt trong sản phẩm. Tuy nhiên một số hạn chế của phương pháp này là:

Bản chất dễ mắc lỗi của DNA polymerase chịu nhiệt làm cho một số đột biếnkhông mong muốn có thể được đưa vào sản phẩm đột biến. Do đó điều quan trọng làtoàn bộ sản phẩm PCR được sắp xếp theo trình tự (xem chương 9) để đảm bảo rằngđột biến chính xác đã được tạo ra trong khi những đột biến khác thì không.

Đoạn ADN lớn thì khó để khuếch đại khi sử dụng PCR. Điều này có thể hạnchế kích thước của sản phẩm khuếch đại cuối cùng là sản phẩm mà có thể được sảnxuất thành công.

Khả năng đưa những đột biến tùy ý vào trong một phân đoạn DNA đã cho phéphoàn thành việc phân tích những gene ngắn bất thường và những gene bình thường,điều mà không thể thực hiện được trước đây. Ngoài ra, giai đoạn đầu của phản ứng độtbiến là hai phản ứng tách rời, có nghĩa là kỹ thuật này có thể dễ dàng được điều chỉnhđể tạo ra các chuỗi DNA khảm (chimeric DNA). Có nhiều lý do tại sao các chuỗiADN cụ thể cần phải được nối với nhau:

Page 184: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

183

Phân tích sự loại bỏ - việc loại bỏ các trình tự gen nhất định có thể được xemnhư là sự hợp nhất của các trình tự còn lại với nhau.

Thay đổi promoter của một gene để điều khiển nó theo một cách khác nhưchúng ta sẽ xem ở chương 8, nhiều gene được biểu hiện trong tế bào vật chủ nhằm làmtăng việc sản xuất protein. Để những gene ngoại lai được biểu hiện, chúng luôn cầnđược đặt dưới sự kiểm soát của một trình tự hoạt hóa chính.

Việc xây dựng các gen mới - protein mới có thể được sản xuất bằng phản ứngtổng hợp các trình tự DNA mã hóa nhiều đoạn gene khác nhau, ví dụ protein có thểđược đánh dấu với các trình tự nhất định cho phép sự làm sạch đơn giản của chúng,hoặc đưa chúng đến vị trí tế bào nào đó bằng cách bổ sung thêm các chuỗi tín hiệu.

Các phương pháp nhân bản truyền thống để nối các đoạn DNA lại với nhau làdựa trên sự hiện diện của các enzyme cắt giới hạn, cho phép chèn vào các đoạn DNAngoại lai. Việc này hạn chế các dạng phản ứng nối và các mức độ chính xác của cácphản ứng nối riêng biệt. Tuy nhiên, việc sử dụng PCR sẽ giảm bớt hoàn toàn nhữngvấn đề này. Việc thiết kế mồi PCR thích hợp, như minh họa trong hình 7.6, sẽ dẫn đếnsự kết hợp chính xác của hai đoạn DNA bất kỳ nếu đoạn cuối của mồi chứa các trình tựtrùng khớp. Nghĩa là, các mồi (2 và 3 trong hình 7.6) được thiết kế sao cho chúng khớpvới nhau và chứa mối nối hợp nhất cuối cùng trong trình tự. Như vậy, sự lắp ráp hai sảnphẩm PCR ban đầu với nhau sẽ dẫn đến việc hình thành một phản ứng tổng hợp chínhxác được quyết định bởi trình tự của các mồi trong những phản ứng đầu tiên.

Một ví dụ cụ thể, trong công việc của chúng tôi (Reece and Ptashne, 1993), nơimà hai bước PCR được sử dụng để đạt được hiệu quả tuyệt vời để tạo ra các gene dunghợp, được thể hiện trong hình 7.7. Nấm men Saccharomyces Cerevisiae chứa chứa mộthọ lớn các trình tự liên quan đến yếu tố phiên mã được gọi là protein C6 zinc cluster.Cũng như hầu hết các yếu tố phiên mã của sinh vật nhân thật, các protein này đều cómột vùng gắn DNA và vùng kích hoạt riêng biệt – có chức năng là hướng các proteinthành các gene đặc biệt, và bổ sung RNA polymerase II tương ứng. Vùng gắn DNAcủa ba trong số các protein, Gal4p, Put3p and Ppr1p, nằm ở đầu amino tự do của mỗiprotein, và mỗi vùng có chứa sáu cystein có tính bảo tồn cao có 2 ion zn đề hình thànhvùng gắn DNA (DBD). Mỗi protein gắn kết như một homodimer có vị trí gắn DNAtương ứng. Vị trí gắn DNA của ba protein trên cũng có liên quan đến nhau (Hình7.7(b)). Đó là, mỗi vị trí đều có chứa bộ ba nucleotide có tính bảo tồn cao 5’-CGG-3’bị đảo ngược khi đã bị tách ra một khoảng đệm biến thiên. Tuy nhiên, chiều dài củakhoảng đệm này khác nhau ở mỗi protein khác nhau. Ở Gal4p, khoảng giữa gồm 11bp,ở Put3p là 10bp và ở Ppr1p là 6bp. Vì các protein trong cùng một họ có thể liên kết vớinhau, nhưng chuỗi DNA mà chúng ta muốn thiết lập một cách chính xác có khu vựccủa mỗi protein chịu trách nhiệm về truyền đạt nét đặc trưng của vùng gắn DNA. Dođó, chúng tôi muốn thay thế đặc trưng liên kết DNA của protein C6 zinc cluster bằngcách thay thế một số acid amin của chính protein đó bằng các trình tự tương ứng củamột protein C6 zinc cluster khác. Trong trường hợp không có các thông tin về điểmdung hợp để tạo thành các protein dung hợp, chúng tôi sẽ tạo một loạt lớn các protein

Page 185: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

184

dung hợp từ chuỗi DNA mã hóa một trong các protein C6 zinc cluster đã được dunghợp từ những cái khác (Hình 7.7(c)). Có hai bước PCR để hoàn thành phản ứng dunghợp. Vị trí dung hợp chỉ được xác định bằng trình tự các oligonucleotide (2 và 3 tronghình 7.6). Điều này cho phép các chimeric gene được tạo thành để sản xuất, theo yêucầu, protein tại vị trí dung hợp có thể bị thay đổi acid amin. Không có vị trí nhận biếtcủa enzyme cắt giới hạn trong sự nhân bản này, các oligonucleotide sẽ tự cung cấp cácphần khớp nhau và theo đó, gene dung hợp được tạo thành. Mỗi chimeric gene sau đósẽ được nhân bản vô tính trong E.coli và protein cuối cùng sẽ được tinh sạch và kiểmtra khả năng liên kết của các vị trí liên kết DNA.

Hình 7.7. Vùng liên kết DNA của ba protein C6 zinc cluster trong nấm men.(a) Trình tự acid amin của các protein Gal4p, Put3p và Ppr1p.(b) Vị trí liên kết của ba protein này có bộ ba nucleotide có tính bảo tồn cao 5’-

CGG-3’ và khác nhau ở số lượng các bp.(c) Các protein dung hợp được sản xuất bằng cách tạo ra các chimeric gene

giữa Gal4p, Put3p và Ppr1p. Trình tự của mỗi protein được thể hiện phía trước lượngcysteine của C6 zinc cluster.

Mỗi protein DBD tự do có thể liên kết với DNA bằng các đặc trưng riêng biệt.Put3p và Ppr1P chỉ có thể liên kết với DNA của chính nó, trong khi Gal4p liên kết tạivị trí của nó với hiệu quả rất cao, có hiệu quả gấp khoảng 10 lần và Put3p cũng vậy.Phân tích của chimeras cho thấy việc thay thế khu vực zinc cluster của một protein

Page 186: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

185

không ảnh hưởng đến khả năng liên kết DNA. Ví dụ, trong hình 7.8, protein 4 có khuvực zinc cluster của Put3p liên kết với đầu carboxyl của Gal4p. Protein này nối vớiDNA bằng khả năng của Gal4p hơn là Put3p. Một dạng khác là protein 2 và 7. Vì vậy,chúng tôi muốn biết có bao nhiêu trình tự để phần đầu carboxyl được đòi hỏi đểchuyển tính đặc hiệu gắn kết DNA tới zinc cluster. Phần lớn, các phản ứng dung hợpquá dài không thể gắn kết với bất kỳ chuỗi DNA nào, có lẽ là do việc hình thành cácnếp gấp sai sót hoặc do cấu trúc protein bị sắp xếp sai. Tuy nhiên, protein có chứa cáczinc cluster và có thêm 19 acid amin vào đầu carboxyl có thể liên kết với DNA bằngtính đặc hiệu của protein có nguồn gốc từ chính trình tự đó. Vì vậy, 19 acid amin gắnvào đầu carboxyl của zinc cluster này chịu trách nhiệm trong việc xác định tính đặchiệu ắn kết DNA. Tiếp theo công việc này, cấu trúc của phức hợp Gal4p-, Put3p-,Ppr1p-DNA được khám phá bằng cách sử dụng tinh thể học X-ray (Marmorstein vàcộng sự, 1992; Marmorstein and Harrison, 1994; Swaminathan và cộng sự, 1997) vàđược thể hiện ở hình 7.7 (c)-(e). Mỗi phức hợp protein-DNA cho thấy các dạng nóichung gần như nhau. Mỗi protein có đối xứng hai bên và tạo nên vị trí tiếp xúc đặctrưng với DNA tại 5’-CGG-3’ bằng cách sử dụng zinc cluster. Zinc cluster tạo thànhmột vùng phụ phía dưới gồm hai ion Zinc (hình cầu màu vàng) nối với nhau. Hai DNAphân bố kéo dài về hai phía theo kiểu đối xứng. Có một vùng gọi là vùng liên kết đểnối các phần lại với nhau.7.5 Phương pháp phát sinh đột biến QuikChange

Quá trình phát sinh đột biến dựa vào PCR được mô tả ở trên đòi hỏi đoạn DNAđột biến được nhân bản vô tính vào các DNA plasmid để chúng có thể được di truyềnvà phân tích chức năng. Phương pháp sử dụng khả năng của PCR để chuyển các độtbiến định vị vào DNA plasmid sẽ làm giảm bớt những bước tạo dòng vô tính.

Một phương pháp phổ biến dựa trên PCR để chuyển những thể đột biến một cáchtrực tiếp và DNA plasmid được mô tả ở hình 7.9. Phương pháp này thường được biếtđến là phương pháp QuikChange (Wang, Malcolm, 1999), sử dụng hai oligonucleotideprimer. Một primer được tạo ra để bổ sung cho sợi xuôi và có chứa đột biến mongmuốn trong khi đó đoạn primer còn lại thì bổ sung cho sợi ngược, nhưng nó cũng chứathể đột biến. Sợi DNA plasmid kép được sử dụng làm sợi khuôn PCR. Các DNAplasmid được gia nhiệt trong phản ứng PCR làm các sợi tách ra riêng biệt (biến tính).Làm nguội DNA biến tính với sự hiện diện của oligonucleotide kết quả là hình thànhtrình tự bổ sung trong plasmid. Chu trình nhiệt được tiếp tục để kéo dài cácoligonucleotide nhằm tạo ra những DNA plasmid đột biến mới. Sau khi phản ứngPCR hoàn thành, DNA tổng hợp mới(có chứa các đột biến) bao gồm hai phân tử DNAbổ sung sẽ hình thành một vòng tròn sợi đôi có chứa đoạn cắt so le (hình 7.9). Các sảnphẩm PCR sau đó được phân cắt bởi enzyme cắt giới hạn DpnI, chúng chí cắt DNA đãbị methyl hoá:

Page 187: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

186

DNA tổng hợp mới sẽ không bị methyl hóa, do đó không bị cắt bởi enzyme giớihạn. Mặt khác, nếu DNA plasmid gốc không mang đột biến, được cô lập từ dòngE.coli có chứa Dam methylase ( chapter 2), thì sau đó Dpnl sẽ cắt tại trình tự nhận biếtcủa chúng. Hầu hết các chủng E.coli phổ biến ở phòng thí nghiệm là dam+ ,vì vậyphương pháp làm thoái hoá DNA tự nhiên này có thể dùng cho đa số plasmid có trongphòng thí nghiệm. Sự biến đổi sản phẩm enzyme cắt giới hạn vào tế bào E.coli sẽ dẫnđến sự giảm sút của những đoạn DNA tự nhiên và phục hồi những điểm cắt trongDNA vòng đột biến mới tổng hợp, cái mà sẽ được di truyền lại. Quá trình này diễn ranhanh (khoảng 3 - 4h) và hiệu quả cao (khoảng 80%) với việc sản xuất DNA plasmidđột biến mà không cần có những bước tạo dòng vô tính.

Hình 7.9. Tạo đột biến bằng QuikChange. Plasmid đã đột biến được trộn với haioligonucleotide primer bổ sung trùng khớp.Mỗi primer đều có các đột biến mong muốn.Các primer được kéo dài trong phản ứng PCR để tổng hợp cả 2 chuỗi DNA plasmid,mỗi sợi đều chứa đột biến. Sau đó, DNA được phân cắt bởi enzyme cắt giới hạn Dnpl,

Page 188: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

187

enzyme này chỉ cắt DNA đã được methyl hoá. Nếu plasmid gốc được phân lập từ dòngE.coli Dam+ thì sau đó chuỗi DNA gốc, không phải chuỗi DNA đột biến mới tổng hợpnhưng không được methyl hoá, cũng sẽ bị cắt bởi enzyme đó. Quá trình biến đổi sau đóvào E.coli sẽ gây ra sự giảm sút của đoạn cắt DNA gốc và sửa chữa điểm cắt trongDNA tổng hợp mới. Sau đó DNA đột biến tổng hợp mới sẽ được sao chép.

7.6 Tạo đột biến ngẫu nhiên trong gene đặc trưngViệc tạo các đột biến đặc trưng trực tiếp vào gene sử dụng oligonucleotide đã

làm một bước tiến trong việc tiềm hiểu chức năng protein. Chúng ta đã có những thảoluận về tương lai, tuy nhiên có hạn chế ở sự biến đổi của các base đặc trưng tronggene. Nếu có những thay đổi ở trình tự mã hóa gen, thì điều này có thể dẫn đến việchình thành các protein đột biến mang acid amin thay đổi. Không phải lúc nào cũng cóthể xác định sự thay đổi của acid amin. Có một số phương pháp tiếp cận có hệ thốngcho vấn đề này liên quan đến sự thay đổi của bộ ba mã hóa acid amin trong gene vớimột codon alanine (Cunningham and Wells,1989). Alanine scanning mutagenesis nàycó thể xác định chuỗi amino acid có vai trò quan trọng với chức năng protein với giảthuyết rằng sự hiện diện của alanine sẽ không gây xáo trộn cấu trúc tổng thể củaprotein và chỉ loại bỏ các tương tác giữa các chuỗi amino acid. Phương pháp tiếp cậnđòi hỏi phải xây dựng được một tấm màng cho việc xác định chức năng protein và đặcbiệt áp dụng đối với những protein nhỏ hoặc khu vực protein tùy thuộc vào số lượngcá thể đột biến.

Hai phương pháp thường được sử dụng để tạo ra các đột biến ngẫu nhiên trong cácgen riêng lẻ, hoặc một phần gen. Một lần nữa, những phương pháp này dựa trên mànglọc để phân tích các đột biến với một kiểu hình thích hợp, nhưng không bị hạn chế từcác dạng đột biến cho đến các phần riêng lẻ hoặc các dạng thay thế có thể xảy ra.

Doped cassette mutagenesis. Một thí nghiệm được thực hiện giống hình 7.5ngoại trừ ngân hàng oligonucleotide được nối vào plasmid bị cắt (hình 7.10). Giốngnhư cassette mutagenesis thông thường, DNA ở giữa hai chỗ nhận biết enzyme cắt giớihạn được loại bỏ khỏi plasmid và được thay thế bằng cách sử dụng một cặpoligonucleotides tổng hợp. Tuy nhiên, các oligonucleotides không mã hóa một chuỗiduy nhất. Thay vào đó, các thư viện oligonucleotides được sản xuất dựa trên trình tựgiống nhau, nhưng có một số thay đổi ngẫu nhiên từ trình tự gốc đó. Oligonucleotideskích hoạt được tổng hợp (Hình 4.6) bằng cách sử dụng hỗn hợp các base. Ví dụ, nếubase tiếp theo được them vào chuỗi kéo dài oligonucleotide là A, sau đó thay vì về mặthóa học thêm chỉ có tiền thân từ A đến chuỗi oligonucleotide phát triển một hỗn hợpcủa A và một lượng nhỏ các tiền chất nucleotide khác sẽ được thêm vào. Hỗn hợp nhưvậy thường có thể chứa 95 phần trăm của các nucleotide hoang dại và 1,7 phần trămmỗi nucleotide khác. Mức độ "khích thích" kiểm soát mức độ đột biến thu được. Trongví dụ thể hiện trong hình 7.10, trình tự giữa các EcoRI và các vùng giới hạn PstI thìphải được thay đổi. Oligonucleotide An được xây dựng có chứa bất biến EcoRI và cáctrang web hạn chế PstI đó là hoàn toàn cần thiết cho nhân bản của DNA trở lại vàoplasmid này. Các trình tự giữa các vùng giới hạn này được doped ở một mức độ, trung

Page 189: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

188

bình, mỗi oligonucleotide sản xuất sẽ có một biến thể nào của các chuỗi hoang dại. Haiví dụ về oligonucleotides sản xuất được thể hiện trong hình 7.10.

Hình 7.10. Doped cassettes trong việc đưa đột biến ngẫu nhiên vào một đoạngene xác định. Xem chi tiết ở phần văn bản.

Bằng cách lựa chọn một mức độ thích hợp của doping, mỗi nucleotide trongkhu vực này có thể được thay đổi để mỗi nucleotide khác, nhưng chỉ có một thay đổixảy ra mỗi oligonucleotide. Oligonucleotides được sản xuất theo cách này là sợi đơnvà do đó không thể được nhân bản vô tính trực tiếp vào sợi đôi plasmid bị cắt. Cassette(hộp)có thể nhân đôi sợi bằng một trong hai cách. Hoặc là một bổ sungoligonucleotide pha tạp được tổng hợp và ủ để tạo thành hai sợi DNA,hoặc vùng nhận

Page 190: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

189

biết tính chất xuôi ngược của enzyme cắt giới hạn ở cuối oligonucleotide được sử dụngđể tạo ra các phân tử dimeric mà sau đó có thể được cắt bởi các enzyme giới hạn vànhân bản vô tính vào plasmid. Phương pháp đầu tiên dựa trên sự hiện diện của nhữngđột biến bổ sung với hai sợi DNA bổ sung và việc chịu đựng các lỗi giữa các cặpoligonucleotide có thể bị bỏ qua trong quá trình hình thành DNA sợi kép để tăng sốlương đột biến trong mỗi hộp. Phương pháp thứ hai (Hình 7.10) triển vọng hơn khi độtbiến đơn trong thư viện sợi đơn oligonucleotide sẽ được giữ lại ở dạng sợi kép.

Error-prone PCR. Chúng ta đã thảo luận về các lỗi dễ gặp trong tự nhiên củaDNA polymerases được sử dụng trong PCR. Đặt biệt, việc thiếu hoạt động đọc và sửacủa exonuclease 3’-5’ trong Taq DNA polymerase có nghĩa là các đột biến quan trọngcó thể được đưa vào sản phẩm PCR (Keohavong and Thilly, 1989). Sự thuận lợi củaphương pháp này cho việc đưa những đột biến ngẫu nhiên chỉ xảy ra trên phản ứng củaPCR. Sản phẩm PCR có thể được nhân bản và phân tích chức năng. Tỉ lệ sai sót củaTaq DNA polymerase có thể được tăng lên, tần số đột biến cũng tăng lên bởi sự thayđổi của nhiều điều kiện phản ứng PCR.Ví dụ, tăng nồng độ magie của phản ứng lênhoặc thêm ion Mg cho phản ứng sẽ làm tăng tỉ lệ sai sót của polymerase. Ngoài ra,thayđổi nồng độ deoxynucleotide, nồng độ polymerase hoặc chiều dài của phản ứng kéodài có thể làm tăng tỉ lệ sai sót. Sự hạn chế chủ yếu của kỹ thuật này là dựa vào enzymđể tạo đột biến ngẫu nhiên. Trong một số trường hợp của Taq DNA polymerase,sựdịch mã được ủng hộ hơn sự phiên mã, một số đột biến khó mà có được.7.7. Kỹ thuật protein

Kỹ thuật protein có thể được xem là sự thay đổi có chủ ý một đoạn protein đểprotein có một chức năng mới hoặc khác thường. Phương pháp này sẽ được sử dụngđể tạo ra enzym có đặc tính thay đổi cho một mục tiêu nhất định. Một số đặc tínhenzym có thể được thay đổi là:

Sự bền với nhiệt dộSự bền với pHTính động lực họcSự ổn định của các dung môi hữu cơSự thay đổi cofactorThay đổi cơ chất liên kếtChất kháng proteaseSự thay đổi quy định của các cơ chế dị lập thểKỹ thuật protein được sử dụng thay đổi nhiệt độ ổn định của lysozyme 1 cách

trực tiếp (Matsumura, Signor and Matthews, 1989). Cơ sở của những thí nghiệm là cầunối disulphide được tạo thành giữa 2 amino acid cystein trong protein có thể khóa cấutrúc protein thành thể kháng với sự biến tính do nhiệt. Gene mã hóa lysosom từbateriophage T4, một enzyme có cầu disulphide tự do, được tạo thành bằng cách đưavào một codon cystein vào chuỗi của nó để tạo ra một protein cuối cùng có cầu nốidisulphide được tạo thành để nối 2 amino acid 3-97, 9-164 và 2-142. Protein đột biến

Page 191: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

190

được chịu được nhiệt độ 66oC, so sánh với dạng tự nhiên tương ứng chỉ chịu được42oC (Matsumura, Signor and Matthews, 1989).

Kỹ thuật protein dùng để thay đổi sự đặc tính của 1 enzym, có thể dùng làm xúctác phản ứng của các cơ chất thay đổi. Ví dụ 1 điểm đột biến đơn của gen ancoldehyrodgenase I, chuyển đổi acit aspatic 233 thành glycine, kết quả là tạo ra mộtprotein có thể sử dụng cả NAD+ và NADP+ , hơn là sử dụng NAD+ như 1 cofactor đểkhử acetaldehide thành etanol (Fan, Lorenzen và Plapp, 1991). Trong một số trườnghợp đặc biệt, lactate hydrogenase từ vi khuẩn bacillus stearothermophilus đượcchuyển đổi thành malate hydrogenase dạng hoạt động cao, thông qua sự đột biến của 3vùng hoạt động của amino acid (Wilks và cộng sự, 1988). Trong tất cả các trường hợp,sự thay đổi được tạo ra trong protein tương ứng với ánh sáng có độ phân giải cao vàđược chuyển từ enzym tự nhiên thành enzym có chức năng khác so với ban đầu.Vấnđề khó khăn là thiết kế 1 loại protein có chức năng hoàn toàn mới. Phương pháp tiếnhóa trực tiếp là phương pháp sử dụng protein để làm đột biến vùng mở đầu của 1 genđể tạo ra protein đặt biệt hơn. Ví dụ, Olsen và cộng sự sử dụng thực khuẩn và đột biếnngẫu nhiên để cô lập protease với 1 chất nền lạ đặc trưng. Phương pháp này thànhcông trong việc thay đổi đặc tính protein hơn là tạo thành protein mới. Ví dụ, Williamsvà cộng sự, 2003 đã sử dụng phương pháp này để thay đổi phản ứng hóa học lập thểđược xúc tác bởi tagatose-1,6-bisphosphate aldolase. Sau 3 chu kỳ đột biến và sànglọc, một aldose mới được tạo ra và cho thấy sự thay đổi 100 nếp gấp trong cấu trúckhông gian theo hướng dùng chất nền nhân tạo fuctose 1,6-bisphotphate. Enzym bịthay đổi chứa 4 sự thay đổi amino acid đặc trưng khi so sánh với tagatose-1,6-bisphosphate aldolase gốc và sự thay đổi sẽ kéo dài suốt chuỗi polypeptide.

Page 192: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

191

Chương 8SẢN XUẤT VÀ TINH SẠCH PROTEINKhái niệm- Protein được sản xuất hàng loạt bằng cách thay thế đoạn gen mã hóa chúng dưới sựđiều khiển của promoter (trình tự khởi đầu sao mã).- Các promoter mạnh và dễ hoạt hóa cho phép sản xuất các protein độc và khiến chocác protein được tạo ra dưới các điều kiện xác định.- Protein có thể được tạo ra trong tế bào nhân sơ hay nhân chuẩn.- Đoạn đuôi (tag) DNA mã hóa trong tinh sạch protein thường được thêm vào tronggen trong quá trình tinh sạch.- Các tag (dạng trình tự gắn vào DNA) trong tinh sạch protein góp phần vào một tínhchất duy nhất để sản xuất protein hàng loạt vì thế có thể được tinh sạch.

Việc sản xuất và tinh sạch protein cho các phân tích hóa sinh và phân tích cấutrúc tạo nên những thuận lợi trong kĩ thuật gen, tìm ra các loại thuốc và trong hóa dượcvài năm gần đây. Một vài loại protein được tạo ra một cách ngẫu nhiên ở mức cao. Vídụ như actin là loại protein chức năng có thể được tích lũy lượng lớn trong tế bào. Sốnhiều còn lại là các protein cần thiết và quan trọng thì biểu hiện ở mức thấp. Ví dụnhư những yếu tố dịch mã liên quan đến việc kích hoạt (hay không kích hoạt) gen thìtồn tại một lượng rất ít các bản sao trong tế bào. Để giúp tìm hiểu việc sản xuất proteinở mức thấp, các gen mã hóa chúng phải được biểu hiện hàng loạt. Cách dễ dàng nhấtđể đạt được điều này đó là phải kích gen mục tiêu thành promoter mạnh. Promoter

Hình 8.1. Cấu trúc của một vector biểu hiện. Một vector biểu hiện chứa một đoạnpromoter dễ cảm ứng, một vị trí đa nhân dòng cho sự chèn vào của các gen mục tiêu, vàmột đoạn kết thúc sao mã. Thêm nữa là một vị trí gắn ribosome để khởi động sao mã.

Page 193: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

192

mạnh thường lấy được từ gen có mức biểu hiện cao, sẽ làm biểu hiên bất cứ gen nào bịthay thế dưới sự điều khiển của nó thông qua việc bổ sung RNA polymerase.

Việc thiết kế các vector được tiến hành để sản xuất protein lớn nhất. Một cấu trúccủa một vector biểu hiện điển hình được biểu diễn ở hình sau. Mỗi vector thường gồmmột vị trí đa dòng đặt giữa đoạn promoter dịch mã và đoạn terminator (trình tự kếtthúc). Thêm nữa, vector biểu hiện như những plasmid khác, sẽ chứa một đoạn saochép gốc và một marker có thể chọn được vì thế mỗi vector có thể sao chép tự động vàđược chứa trong tế bào.

Ở mức cao, nhiều protein sẽ có hại đối với tế bào chủ và do đó chúng được tạora. Thêm nữa, một vài protein khi được tạo ra một lượng nhỏ cũng có hại cho tế bàochủ. Ví dụ, sự biểu hiện của sản phẩm gen poliovirus 3AB có hại cho tế bào E.Colinhờ vào sự thay đổi mạnh mẽ tính thấm mà nó tạo ra trong màng tế bào của vi khuẩn(Lâm và Carrasco, 1992). Do đó, để làm protein biểu hiện là lớn nhất thì cần thiết phảithiết lập một hệ thống biểu hiện dễ hoạt hóa, một lượng lớn các tế bào chủ có thể pháttriển trước khi sự biểu hiện của protein mục tiêu được khởi động. Việc sản xuất proteinsau đó được kích hoạt một cách nhanh chóng và các tế bào được thu lấy sau đó trướccác ảnh hưởng có hại của protein được biểu hiện. Trong phần này chúng ta sẽ thảoluận về các hệ thống biểu hiện dễ hoạt hóa được sử dụng phổ biến ngày nay. Và miêutả một số hệ thống vector chủ phổ biến sử dụng trong sản xuất protein ở tế bào E.coli,nấm men, côn trùng và động vật có vú.8.1 SỰ BIỂU HIỆN Ở E.COLI

E.coli được lựa chọn là tế bào chủ trong phần lớn các thực nghiệm sự biểu hiệncủa protein. Với thời gian nhân đôi nhanh trong môi trường xác định, đơn giản và khôngđắt tiền. cùng với trình của đoạn khởi động và đoạn kết thúc được biết đến rộng rãi, điềunày có nghĩa là nhiều protein gốc của cả prokaryote và eukaryote có thể được tạo ratrong sinh vật. Hơn nữa các tế bào E. coli dễ dàng bị phá vỡ khi thu nhận protein đượcsản xuất trong tế bào. Đương nhiên, E. coli phải trải qua một điều đó là chúng là sinh vậtnhân sơ và chúng được sử dụng để sản xuất protein của sinh vật nhân chuẩn. Tế bào E.coli không có khả năng xử lý các đoạn intron và không có bộ máy dịch mã phổ biến tìmthấy trong tế bào nhân chuẩn như glycolylate, methylate, phosphorylate hoặc thay đổisản phẩm protein ban đầu bằng các cách khác như thông qua sự hình thành liên kếtdisulphide rộng rãi. Việc sử dụng cDNA để sản xuất vector biểu hiện giúp khắc phụcnhược điểm đầu tiên của những vấn đề này, nhưng nếu như PTM đối với protein là cầnthiết cho chức năng của nó thì cần tìm kiếm một tế bào chủ lựa chọn. Một số trình tựkhởi động được sử dụng để giúp cho việc sản xuất protein dễ hoạt hóa ở E. coli.8.1.1 Lac promoter

Gen lac được biểu hiện cao nhất khi E.coli được nuôi ở môi trường lactose. Việcthêm trình tự lac promoter vào đoạn gen khác sẽ dẫn đến sự biểu hiện độc lập củanhững gen đó trong lactose. Có thể dùng lac promoter, tuy nhiên có một số vấn đềkhiến nó hiếm khi được sử dụng để kiểm soát sự biểu hiện của gen mục tiêu. Đầu tiênlà lac promoter yếu, và do đó không thể điều khiển việc sản xuất protein ở mức cao vàthứ hai là gen lac được sao chép ở một mức đáng kể khi thiếu chất cảm ứng

Page 194: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

193

(Gronenborn, 1976). Vấn đề cuối cùng có thể là sự khắc phục không hoàn chỉnh bằngviệc biểu hiện bản đột biến của gen lacI, làm tăng khả năng gắn kết DNA chẳng hạnnhư alen LacIq là nguyên nhân sản xuất quá mức lacI và thường dẫn đến giảm mức saochép khi không có chất cảm ứng (Muller-Hill, Crapo and Gilbert, 1968).8.1.2 Tac promoter

Lac promoter dễ dàng được hoạt hóa (có sự bổ sung IPGL vào môi trường nuôicấy E.coli ) khiến nó là một hệ thống hấp dẫn để sản xuất protein mục tiêu. Tuy nhiên,promoter tương đối yếu sẽ dẫn đến gen mục tiêu sẽ không được sản xuất quá mức.Thông qua phân tích nhiều promoter ở E.coli ,trình tự tương đồng của vùng -35 và -10mà RNA polymerase phải gắn để sao mã gen, có thể được xác định (Lisser andMargalit, 1993). Lac promoter yếu bởi vì vùng -35 bị lệch khỏi đoạn tương đồng(Figure 8.2). Việc tạo ra trình tự gắn liền chứa vùng -35 của đoạn operon E.coli trp vàvùng -10 của đoạn lac operon, điều khiển sự biểu hiện gen tổng hợp tryptophan vàchuyển hóa lactose một cách tương ứng, dẫn đến tạo ra các tac promoter, mạnh gấpnăm lần lac promoter (de Boer, Comstock and Vasser, 1983). Tac promoter có thể cảmứng biểu hiện gen mục tiêu do đó polypeptide được mã hóa được tích lũy ở mức 20-30% của toàn bộ protein trong tế bào (Amann, Brosius and Ptashne, 1983).

Các vector biểu hiện mang tac promoter và cũng có thể mang phần gen điềukhiển lacO và gen lacI thường mã hóa vùng ức chế Lac (Stark, 1987). Các gen đượcnhân dòng vào những vector này do đó cảm ứng được IPTG và có thể bị ức chế vàcảm ứng ở các giống E.coli khác nhau (Figure 8.3).8.1.3 PL promoter

PL promoter chịu trách nhiệm sao mã phần bên trái của hệ gen , bao gồm Nvà cIII (ở chương 3). Chất ức chế , sản phẩm của cI gen, ức chế promoter. Có hai

Hình 8.2. Các trình tự DNA của các promoter lac, trp và tac. Sự đồng nhấtcủa các trình tự -35 và -10 dựa vào sự phân tích ngẫu nhiên các promoter đãnêu, và trình tự của mỗi promoter, mở rộng từ vùng -35 đến vị trí bắt đầu saomã. Promotet tac mạnh gần gấp 5 lần promoter lac , nhưng vẫn có thể cảmứng được nhờ lactose hoặc IPTG

Page 195: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

194

phương pháp cơ bản được sử dụng để hoạt hóa PL promoter. Phương pháp đầu tiên,một dạng đột biến của cI (cI857) được sử dụng lien kết với PL cho sự biểu hiện genmục tiêu (Hendrix, 1983). Khi được phát triển ở nhiệt độ 300C protein đột biến cI cóthể gắn với PL promoter và ức chế nó. Tuy nhiên, trên 300C, protein cI không có khảnăng gắn với DNA và PL promoter được hoạt hóa (Bernard và cộng sự, 1979).Phương pháp này sản xuất mức cao các gen mục tiêu cần biểu hiện nhưng khó có thểđiều khiển lượng nhiệt để hoạt hóa sản xuất protein. Phương pháp thứ hai là chuyểnvector biểu hiện vào một dòng E.coli mà ở đó gen cI bị thay thế dưới sự điều khiển củapromoter trp được qui định. Sau đó, sự biểu hiện có thể được cảm ứng bởi việc thêmtryptophan vào môi trường nuôi cấy, để ngăn chặn sự sao mã của gen cI và do đó hoạthóa mạnh mẽ PL promoter. Khi dùng phương pháp này dễ dàng điều khiển và do đócó thể sử dụng để biểu hiện gen thậm chí có mặt các protein độc (Wang, Deems andDennis, 1997; Celis và cộng sự, 1998).

8.1.4 Hệ thống biểu hiện T7Đây là RNA polymerase được mã hóa bacteriophage T7 khác với bản sao E.coli

của nó. Không giống với cấu trúc đơn vị 22 của enzyme ở E.coli, RNA polymeraseT7 là một enzyme có 1 đơn vị kết hợp với trình tự promoter DNA 17 bp riêng biệt (5’-TAATACGACTCACTATA-3’) ngược chiều với gen T7 của virus nó hoạt hóa. E.coliRNA polymerase không nhận trình tự promoter T7 như là điểm khởi đầu trong saochép. Sự sắp xếp toàn bộ để sản xuất protein mục tiêu sử dụng hệ thống T7 được thểhiện ở hình sau 8.4.

Hình 8.3. Việc sản xuất ba loại protein khác nhau ở E.coli, được điều khiển bởi promoter tac. Trongcác tế bào vi khuẩn, chứa tac tương ứng dựa vào vector biểu hiện, được nuôi dưỡng trong môi trườnglỏng và sau đó thêm IPTG vào, bằng một nửa môi trường. Việc nuôi dưỡng được tiếp tục ở 90 phút tiếptheo trước khi tế bào được thu hoạch, bị phá vỡ và cho vào gel chạy điện di SDS-polyacrylamide.Protein chứa ở mỗi môi trường được quan sát khi chứa trong gel với Coomassie xanh. Các vị trí của 3protein được tạo ra với chất cảm ứng IPGT được chỉ định.

Page 196: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

195

Gen mục tiêu được tạo dòng vào vector biểu hiện của plasmid vì thế nó chịu sựđiều khiển bởi promoter T7. Sự nhân lên của plasmid này trong các tế bào của nhiềuloại E.coli sẽ không làm gen mục tiêu biểu hiển nếu T7 RNA polymerase vắng mặt.Để khiến cho gen mục tiêu biểu hiện thì plasmid biểu hiển được biến đổi thành mộtđoạn trong E.coli chứa bản sao của gen T7 dưới sự điều khiển của lac promoter. Mỗitrình tự có thể được chuyển thành các đoạn trong E.coli dùng lysogen được gọi làDE3 có chứa T7 RNA polymerase dưới sự điều khiển của promoter lacUV5. Do đó,chất cảm ứng IPGL (lactose) sẽ thúc đẩy sự tổng hợp T7 RNA polymerase, là enzymekết hợp với promoter T7 và điều khiển sự biểu hiện gen mục tiêu. Như chúng ta đãnói, lac promoter sẽ làm biểu hiện một lượng nhỏ gen mà nó điều khiển khi không cóchất cảm ứng. Việc thêm trình tự lacO giữa promoter T7 và gen mục tiêu trong vectorbiểu hiện đã làm giảm mức biểu hiện gen mục tiêu (Dubendorff and Studier, 1991).Để điều khiển sản phẩm thất thoát của T7 RNA polymerase thì trong các tế bào E.colicó thể được chuyển đổi bằng cách thêm plasmid. Trong hình 8.4, plasmid pLysS tuysử dụng khác nhau nhưng chúng tương thích, là điểm khởi đầu sao chép, sẽ sản xuất ra

Hình 8.4. Hệ thống biểu hiện protein T7 ở E.coli. Vector biểu hiện chứa gen mục tiêu dướisự điều khiển của promoter T7 RNA polymerase. Vector được chuyển vào một giống E.coli,được nhập vào hệ gen, sao chép gen cho T7 RNA polymerase (T7 gene 1) dưới sự điều khiểncủa promoter lac. Các promoter của cả gen mục tiêu và T7 gene 1 đều chứa trình tựoperator lacO và do đó chúng bị ức chế bởi chất ức chế lac (lacI). Chất cảm ứng IPTG chophép sự sao mã của gen T7 RNA polymerase mà các sản phẩm protein của chúng sau đóhoạt hóa sự biểu hiện gen mục tiêu. Sự có mặt của một plasmid thêm vào trong tế bào E.colisản xuất ra T7 lysozyme không hoạt hóa bất kì T7 RNA polymerase nào có thể được tạo rakhi không có chất cảm ứng. Sau khi cảm ứng đủ, T7 RNA polymerase được sản xuất ngoàisự điều khiển.

Page 197: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

196

lysozyme T7 là một chất ức chế tự nhiên của T7 RNA polymerase. Sản sinh ra chất ứcchế này sẽ không hoạt hóa polymerase tạo ra ở mức thấp khi không có chất cảm ứng,nhưng không mất tác dụng, do đó sẽ hoàn trả lại không hiệu quả bởi lượng lớnpolymerase được tạo ra trong chất cảm ứng.

Mặc dù có những promoter vô cùng tốt sẽ điều khiển tạo ra mức cao các RNA,nhưng có nhiều protein không tạo ra trong các tế bào E.coli. Độ dài của các promoterlà yếu tố xác định không cần thiết như một mức mà protein mục tiêu sẽ tích lũy trongtế bào.

- Các mức vector biểu hiện: Ban đầu chúng ta hãy hình dung rằng tăng số lượngcác bản sao vector biểu hiện sẽ dẫn đến việc tăng sự tích lũy protein mà nó mã hóa.Tuy nhiên có nhiều tài liệu cho rằng tăng lượng bản sao không làm tăng lượng proteinsản xuất ra (Yansura and Henner, 1990) và có thể làm giảm mức sản xuất protein(Vasquez và cộng sự,1989). Hầu hết các vector biểu hiện có hiệu quả sử dụng trongthương mại ngày nay chứa gốc sao chép của pBR322 hay pUC và việc thay đổi lượngbản sao thường không được sử dụng để điều chế sản xuất protein mặc dù một vài cóhiệu lực (Wild, Hradecna and Szybalski, 2001).

- Kết thúc sao mã: Mặc dù chúng ta thường quan tâm thiết kế các vector biểuhiện, nhưng việc kết thúc sao mã hiệu quả là một thành phần quan trọng để đạt đượcmức biểu hiện gen cao. Đoạn kết thúc nâng cao sự ổn định (Hayashi and Hayashi,1985) của mRNA, dẫn đến sự gia tăng đáng kể sự tích lũy protein (Vasquez và cộngsự, 1989). Hai đoạn kết thúc sao mã ở sau từ vùng operon rrnB rRNA của E.coli(Brosius và cộng sự, 1981) thường có mặt trong vector biểu hiện nhưng những đoạnkết thúc khác làm việc cũng tốt.

- Việc sử dụng codon: Sự thoái hóa của mã gen có nghĩa rằng có nhiều hơn mộtcodon sẽ gắn vào một amino acid riêng trong việc hình thành chuỗi polypeptide. Cácgen ở cả prokaryote và eukearyote đều cho thấy rằng việc sử dụng các codon không hềngẫu nhiên. Các gen chứa các codon tốt sẽ được dịch mã có hiệu quả hơn là những genchứa các codon hiếm khi sử dụng. Ảnh hưởng này phổ biến một cách riêng biệt trongnhững gen thường biểu hiện cao trong E.coli, nơi mà có mức độ cao của các codon.Nói chung, việc sử dụng thường xuyên các codon lựa chọn mang lại lượng lớn phân tửtRNA cùng bản chất với chúng. Ví dụ như arginine tRNAArg(AGG/AGA) thứ cấp được cholà một yếu tố giới hạn trong sản xuất một số protein (ở động vật có vú)trong vi khuẩn(Brinkmann, Mattes and Buckel,1989) bởi vì các codon AGG hay AGA hiếm khi đượcsử dụng trong E.coli. Chất đồng biểu hiện cho gen mã hóa tRNAArg(AGG/AGA) (dna Y)có thể mang lại việc tạo ra các gen mục tiêu ở mức cao. Hệ thống này được thiết lậpcho việc biểu hiện của phân tử tRNA khác thường xuất hiện trong trình tự mã hóa ởđộng vật có vú nhưng hiếm khi được sử dụng trong E.coli. Một hệ thống như vậy sửdụng một dòng vi khuẩn gọi là RosettaTM làm biểu hiện các tRNA cho AGG, AGA,AUA, CUA, CCC và GGA trên plasmid tương thích với vector biểu hiện. Các codonhiếm khi xuất hiện làm biến đổi gen được biểu hiện làm cho các codon nó chứa đượcsử dụng thường xuyên hơn bằng các gen được biểu hiện cao khác trong E.coli. Cónghĩa rằng, trình tự DNA của gen được biến đổi để cho phép các codon tốt được sử

Page 198: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

197

dụng nhiều hơn nhưng đoạn polypeptide được mã hóa vẫn không thay đổi. Sẽ khôngcó sự tương quan đơn giản giữa sự có mặt của các codon hiếm trong gen và mức sảnxuất protein. Sự kết hợp giữa các codon hiếm trong trình tự mục tiêu và các yếu tốkhác làm giảm hiệu quả của toàn bộ quá trình dịch mã.

- Trình tự protein: Các trình tự amino acid trong protein mục tiêu đóng vai tròquan trọng trong khả năng tích lũy protein ở mức cao. Đầu tiên được miêu tả ở phòngthí nghiệm của Alexander Varshavsky, với ‘‘qui tắc kết thúc liên kết sự ổn định củaprotein với các trình tự mà ở vị trí đoạn amino kết thúc (Bachmair, Finley andVarshavsky, 1986; Varshavsky, 1992). Ở E.coli, một đoạn amino acid kết thúc là Arg,Lys, Leu, Phe, Tyr and Trp được đặt trực tiếp sau methionine mở đầu trong protein cóchu kì phân đôi ít hơn 2 phút. Các amino acid khác ở vị trí tương tự trong cùng mộtprotein có chu kì đó hơn 10h (Tobias và cộng sự, 1991). Thêm nữa, trình tự aminoacid phụ thuộc vào các yếu tố ổn định protein cũng tồn tại.

- Sự thoái hóa protein: E.coli được xem là một cái “túi phân tử sinh học tạo raDNA và protein. Đương nhiên, các sinh vật phát triển cao và chứa các bộ máy phứctạp để loại bỏ các chất độc đối với nó. Ví dụ, E.coli chứa lượng lớn protease trong tếbào chất và chất bao kết hợp với bên trong và bên ngoài màng (Chung, 1993;Gottesman, 1996). Các chất phân giải protein giới hạn sự tích lũy của các protein điềuchỉnh và cũng tống khứ các protein dị thường và không có nếp gấp. Các protein mụctiêu được biểu hiện trong E.coli có thể bị mất nếp gấp bởi nhiều nguyên nhân khácnhau như các gốc kị nước bị lộ ra mà chúng thường ở trong lõi của protein, sự thiếuhụt các chất cộng tác phản ứng bình thường của nó và không thích hợp hoặc thiếu chấtcảm ứng PTM. Một số phương pháp thường sử dụng để chống lại ảnh hưởng của cácproteolysis gồm cả sử dụng các dòng E.coli thiếu hụt protease; tế bào phát triển ở nhiệtđộ thấp; sự biểu hiện của các gen mục tiêu đến một protein ổn định đã biết và mục tiêucủa protein được sản xuất ở chất bao nơi mà có ít hơn các protease tồn tại hơn (Murby,1996). Mặc dù chúng ta đã thảo luận về giới hạn ở trên nhưng E.coli vẫn được sử dụngrộng rãi là một sinh vật sản xuất protein. Một số hệ thống biểu hiện được sử dụngtrong phòng thí nghiệm thì không sử dụng, tuy nhiên, sự thuận tiện trong việc sản xuấtprotein vẫn ở mức lớn.8.2 SỰ BIỂU HIỆN Ở NẤM MEN

Cũng như các eukaryote, nấm men có rất nhiều thuận lợi của các tế bàoeukeryote, như các PTM (sự biến đổi hóa học của protein sau khi dịch mã), trong cùngmột thời gian ta dễ điều khiển như ở E.coli. Tế bào nấm men phát triển nhanh hơn, dễhơn và rẻ hơn các tế bào nhân chuẩn khác và có mức biểu hiện cao hơn. Có ba loạinấm men được sử dụng để sản xuất protein tái tổ hợp như Saccharomyces cerevisiae,Pichia pastoris và Schizosaccharomyces pombe.8.2.1Saccharomyces cerevisiae

Nấm men bánh mì, S. cerevisiae, là loại nhân chuẩn đơn bào phát triển một cáchnhanh chóng (thời gian nhân đôi gần 90 phút) đơn giản, môi trường nuôi tương tự nhưở E.coli. S. cerevisiae, sản xuất nhiều protein nhưng không phải là tất cả, PTM đượctìm thấy ở các tế bào nhân chuẩn. Ví dụ như α-1-antitrypsin ở người là một loại

Page 199: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

198

protein huyết thanh 52 kDa, có liên quan đến việc điều khiển sự đông máu và phângiải fibrin, thông thường bị phân giải. Tuy nhiên, nếu được tạo ra trong S. cerevisiae,quá trình phân giải vẫn tồn tại nhưng kiểu phân giải thì khác (Moir and Dumais, 1987).Một lượng promoter mạnh tạo thành được sử dụng để điều khiển gen mục tiêu biểuhiện trong nấm men.Ví dụ, promoter của gen mã hóa enzyme phosphoglycerate kinase(PGK) glyceraldehyde-3-phosphate dehydrogenase (GPD) và alcohol dehydrogenase(ADH1) tất cả đều được sử dụng sản xuất protein mục tiêu (Cereghino, Cregg, 1999).Tuy nhiên, những vấn đề này tương tự như hệ thống biểu hiện ở E.coli. Một hệ thốngkhác được sử dụng để cảm ứng sản xuất protein trong S. cerevisiae đã được sử dụng.8.2.1.1 Hệ thống GAL

Trong nấm men, giống như hầu hết tất cả các tế bào khác, galactose đượcchuyển hóa thành glucose-6-phosphate bởi các enzyme của con đường Leloir. Mỗi gencấu trúc của con đường Leloir (thường được gọi là gen GAL) được biểu hiện ở mứccao, 0.5-1% của toàn bộ mRNA của tế bào (St John, Davis, 1981), nhưng chỉ khi nàocác tế bào phát triển trên galactose (như một nguồn carbon duy nhất). Mỗi gen GALchứa ít nhất một promoter, thường nhiều, gắn kết với các vị trí với chất hoạt hóa saomã Gal4p. Sự gắn kết của Gal4p với những vị trí này, và hoạt động sao mã của nó khiliên kết, được điều chỉnh bởi nguồn carbon trong tế bào. Khi nấm men được nuôi trênglucose, nó hấp thu nguồn carbon, sao mã từ promoter GAL4 (điều chỉnh tạo raGAL4p) được điều chỉnh xuống vì thế có ít hơn GAL4p trong tế bào và do đó chấthoạt hóa gắn ở promoter của gen cấu trúc GAL (Griggs and Johnston, 1991). Ở cácnguồn carbon khác, như raffinose, Gal4P được tạo ra và gắn với promoter của gen cấutrúc GAL, nhưng một chất ức chế, Gal80p, kiềm chế hoạt động của nó. Gal80p gắntrực tiếp với Gal4p và che vị trí hoạt động của nó do đó nó không có khả năng thêmbộ máy sao mã vào gen (Lue và cộng sự, 1987). Chỉ khi có galactose có ức chế củaGal80p làm cảm ứng mức biểu hiện của gen mục tiêu.

Để tạo ra protein mục tiêu ở S.cerevisiase sử dụng galactose để cảm ứng, thìgen mã hóa protein phải được nhân dòng dưới sự điều khiển của một promoter GAL.Promoter từ gen GAL1, mã hóa galactokinase, được sử dụng phổ biến nhất, nhưngpromoter tổng hợp chứa nhiều vị trí gắn Gal4p vẫn sử dụng được. Bước đầu được tạora, vector biểu hiện được chuyển vào tế bào nấm men, việc sản xuất protein được bắtđầu bằng cách chuyển các tế bào vào môi trường chứa galactose. Protein được tạo rabằng cách này hiếm khi tích lũy đến mức như ở các protein tái tổ hợp được tìm thấytrong tế bào E.coli. Thường không có khả năng phát hiện được protein tạo ra theophương pháp này khi sử dụng gel nhuộm màu Coomassie và lượng protein lớn nhấtchỉ có khoảng 1-5 phần trăm của toàn bộ tế bào. Phương pháp đánh dấu Western haycác phương pháp phát hiện khác phải được sử dụng.

Page 200: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

199

Hình 8.5. Galactose cảm ứng sự biểu hiện gen ở nấm men. Sự biểu hiện của các gendưới sự điều khiển của promoter GAL1 (PGAL1) có thể gia tăng một cách cơ bản nếugen mã hóa chất hoạt hóa sao mã của GAL1, GAL4, cũng được thay thế dưới sự điềukhiển của PGAL1. Trong trường hợp này, sự cảm ứng của galactose sẽ sản xuất ra nhiềuGal4p và do đó tạo ra nhiều protein mục tiêu.

Thêm một khó khăn của chất hoạt hóa Gal4 của gen GAL mang lại là nó tồn tạiở mức rất thấp ở trong tế bào nấm men. Do đó, nếu vector mang nhiều vị trí gắnGal4p, là một lượng lớn bản sao của plasmid có thể bị thiếu Gal4p dùng để hoạt hóa sựbiểu hiển của tất cả các gen mục tiêu đến mức cao nhất. Để khắc phục vấn đề này, cácgiống nấm men được tạo ra mà tại đó trình tự mã hóa của gen GAL4 bị thay thế dướisự điều khiển của promoter GAL (Schultz và cộng sự, 1987; Mylin và cộng sự,1990).

Page 201: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

200

Các kết quả này nằm trong mối liên hệ vòng tròn mà sự cảm ứng của galactose làm tạora Gal4p để nhiều gen mục tiêu hơn được biểu hiện (như ở hình vẽ).8.2.1.2 Hệ thống CUP1

Các ion đồng (Cu2+ và Cu+) cần thiết ở các mức thích hợp, có thể gây độc ởnồng độ cao cho tất cả các sinh vật sống. Do đó, các tế bào phải giữ các ion Cu trongtế bào ở mức thích hợp, không quá thấp và cũng không quá cao. Ở S.cerevisiae, ở nộimô có các hệ thống hấp thu, phân phối và giải độc đồng. Ở nồng độ cao, sự giải độccác ion đồng được thực hiện bởi một yếu tố sao chép điều khiển cảm ứng ion kim loạiđồng được gọi là Ace1p. Trong các tương tác với đồng , Ace1p gắn với DNA ngượcchiều với gen CUP1 (Winge, 1998), mã hóa một protein metallothione và cảm ứng nósao mã. Việc sao mã của CUP1 được cảm ứng nhanh chóng khi thêm đồng vào môitrường (Winge, Jensen, 1998). Các vector biểu hiện chứa các promoter CUP1 được sửdụng để cảm ứng sự biểu hiện gen (Mascorrogallardo, Covarrubias and Gaxiola,1996). Không giống hệ thống Gal, nấm men chứa plasmid biểu hiện CUP1 có thể đượcnuôi trên môi trường giàu carbon, như glucose, mật độ tế bào cao, quá trình sản xuấtprotein được khởi động bằng cách thêm đồng sunfate (0.5 mM) vào môi trường. Mộthạn chế của hệ thống này là sự có mặt của các ion đồng trong môi trường nuôi nấmmen và cần cung cấp nước. Do đó, trạng thái“tắt“ khi không cho đồng vào vẫn tạo ramột lượng protein đáng kể.8.2.2 Pichia Pastoris

Là một loại nấm men khử các hợp chất một carbon, có khả năng chuyển hóamethanol là nguồn carbon duy nhất. Giai đoạn đầu tiên của việc chuyển hóa methanollà oxi hóa methanol thành formaldehyde sử dụng phân tử bằng enzyme alcoholoxidase. Alcohol oxidase có ái lực thấp với oxi và nó bù vào khuyết điểm này bằngviệc tạo ra các enzyme (Koutz và cộng sự, 1989). Promoter qui định tạo ra alcoholoxidase (AOX1) có thể được sử dụng để làm biểu hiện một protein khác loại trongP.pastoris (Tschopp và cộng sự, 1987) khi nó được qui định và cảm ứng bởi methanolở nồng độ cao. Các tế bào P.pastoris chứa vector biểu hiện, thường được nhập vào hệgen như một hay nhiều bản sao, được nuôi trên glycerol (nuôi trên glucose ngăn chặnsự sao mã của AOX1, thậm chí khi có mặt methanol) với mật độ tế bào cực kì cao vàcó bổ sung methanol. Khi được hóa hóa, protein đích có thể tích lũy ở nồng độ caothường ở khoảng 0.5-10 gram protein/lít môi trường nuôi cấy. Ví dụ, sự biểu hiện củagen mã hóa kháng nguyên tái tổ hợp của bệnh viêm gan siêu vi B tạo ra hơn 1g khángnguyên từ 1 lít các tế bào P.pastoris (Hardy và cộng sự, 2000). Lớn hơn nhiều so vớiS.cerevisiae. Thêm nữa, khi so sánh với S. cerevisiae, thì P.pastoris có nhiều thuận lợihơn trong glycosyl hóa protein. Glycoprotein tạo ra trong P.pastoris tương tự với cấutrúc glycoprotein tìm thấy trong các sinh vật nhân chuẩn cao hơn (Cregg, 1993).8.2.3 Schizosaccharomyces pombe

S.pombe là một sinh vật eukaryote đơn bào với nhiều đặc tính tương tự như ởcác sinh vật eukaryote cao hơn. Những đặc tính như, cấu trúc và chức năng nhiễm sắcthể, điều khiển chu kì tế bào, sự ghép nối RNA và sử dụng codon, vì thế S.pombe đượcứng cử cho việc sản xuất protein ở nhân chuẩn (Giga-Hama và Kumagai, 1999). Thêm

Page 202: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

201

nữa là protein nhân chuẩn được biểu hiện trong S.pombe được cuộn gấp có thể giảmtính không tan của protein kết hợp với sản xuất nhiều protein trong E.coli. Việc sảnxuất protein trong S.pombe được điều khiển bởi sự biểu hiên từ promoter nmt1(Maundrell, 1993). Đoạn promoter này hoạt động khi các tế bào được nuôi trên môitrường không có thiamine, cho phép phiên mã ngược gen dưới sự điều khiển của nó,trong khi thiamine có mặt ở nồng độ 0.5 µM thì promoter không hoạt động(Maundrell, 1990). Các mức sản xuất protein vòng thì tương tự như trong S.cerevisiae.8.3 SỰ BIỂU HIỆN Ở CÁC TẾ BÀO Ở CÔN TRÙNG

Baculovirus là một loại virus hình ve mà có thể nhiễm vào côn trùng và liênkết với tế bào côn trùng. Loại virus này có DNA hình tròn, sợi đôi genome của nókhoảng 90-180kbp. Virus này nhiễm vào làm cho tế bào suy giảm thường từ 3-5 ngàysau đó. Khi nhiễm vào nó sẽ giết chết các côn trùng này. Các virus có nhân đa diện làmột lớp của Baculovirus mà nó tạo ra các thể hấp thụ trong nhân của tế bào bị nhiễm.Các thể hấp thụ này bao gồm một proterin đơn, polyhedron mà bao bọc một phần củavirus và bảo vệ chúng khỏi môi trường khắc nghiệt. Hầu hết virus loại này cần bị ănbởi côn trùng trước khi lây nhiễm và các thể này bảo vệ các bộ phận của virus khỏicác tác nhân của ruột côn trùng. Gene polyhedrin được sao chép ở mức cao sau đótrong quá trình xâm nhiễm. Trong các tế bào nuôi dưỡng ở côn trùng, việc tạo ra cácthể vùi thì không cần thiết cho sự xâm nhiễm hay sao chép của virus. Do đó, promoterpolyhedrin có thể được dùng để giúp cho sự biểu hiện của gen.

Virus đa nhân Baculovirus Autographa californica (AcNPV) trở thành mộtcông cụ phổ biến để sản xuất protein tái tổ hợp trong tế bào của côn trùng (Fraser,1992). Nó được sử dụng kết hợp với dòng tế bào côn trùng có nguồn gốc từ loàibướm Sapodoptera frugiperda. Đó là dòng tế bào được tạo ra trong phòng thí nghiệmvà đưa ra kế hoạch tạo ra loại virus tái tổ hợp được hiển thị ở hình 8.6.Kích thước của bộ gene của Baculovirus thường ngăn cản trực tiếp sự nhân bản củacác gene mục tiêu lên nó. Thay vào đó gene mục tiêu được nhân bản vô tính xuôidòng nhờ vào promoter polyhedrin trong plasmid vận chuyển (Lopez-Ferber, Sick andPossee, 1995 ). Plasmid vận chuyển cũng chứa các trình tự hệ gene DNA củaBaculovirus mà một phần của gene polyherin bao gồm cả phần xuôi và phần ngược.Để sản xuất virus tái tổ hợp, plasmid vận chuyển tái tổ hợp được vận chuyển cùng vớivector DNA Baculovirus bên trong tế bào côn trùng. Phần đầu của plasmid vận chuyểntham gia trong tái tổ hợp tương đồng với trình tự DNA của virus và đưa gene mục tiêuvào trong hệ gen của Baculovirus. Quá trình tái tổ hợp cũng dẫn đến việc sửa chữaDNA vòng của virus và cho phép tiếp tục sao chép virus thông qua thông tin ban đầucủa ORF 1629 (vỏ capsid của virus có bản chất protein để sản xuất các bộ phận củavirus). Sự xâm nhập của virus tái tổ hợp có thể quan sát dưới kính hiển vi bằng cáchxem các mảng virus trên nền của tế bào côn trùng. Các mảng chứa virus tái tổ hợpkhông thể tạo thành các cơ quan do thiếu protein polyhedrin. Nếu quan sát theo cáchnày thì rất khó khăn do kỹ thuật. Do đó, plasmid vận chuyển luôn chứa gene lacZhoặc các gene reporter (gen dùng để gắn vào trình tự của một gen điều khiển khác dễquan sát, nó cho phép quan sát nhận ra mảng tái tổ hợp bởi sự xuất hiện màu xanh sau

Page 203: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

202

khi nhuộm màu với X-Gal (hình 8.6). Sau khi chuyển đổi và mảng bám được làmsạch để loại bỏ bất kỳ nguồn tạp nhiễm nào từ virus ban đầu, nguồn virus tiêu chuẩn đãđược chuẩn bị và được sử dụng để xâm nhiễm vào trong môi trường nuôi cấy côntrùng để sản xuất protein.Việc sản xuất protein mục tiêu làm phá vỡ các tế bào nhiễmbệnh, sau đó các tế bào chết và có thể dung giải.

Hình 8.6. Việc tạo ra một gen tái tổ hợp của baculovirus để sản xuất protein trong tế bào côntrùng. Gen mục tiêu được nhân dòng dưới sự điều khiển của promoter polyhedron vào mộtvector vận chuyển cũng chứa các vùng gen của virus ở vị trí polyhedron. Sau đó, vector nàyđược chuyển vào các tế bào côn trùng với vùng gen virus được duỗi thẳng sử dụng enzyme cắt ởmột số vị trí. Gen tái tổ hợp tương đồng giữa gen dài và vector sẽ tạo ra một hệ gen virus cóchức năng có khả năng tạo ra các phần của virus.

Page 204: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

203

Việc sản xuất protein nhờ Baculovirus nhiễm vào trong tế bào có một ưu điểmlà mức độ biểu hiện protein rất cao có thể được sản xuất dựa trên mối quan hệ vớibiểu hiện khác có nhân điển hình và quá trình đường phân hóa thu được là tương tựnhưng không giống nhau; để tìm thấy sinh vật nhân chuẩn cao hơn (Possee, 1997,Joshi và cộng sự, 2000 ). Baculovirus cũng có một thuận lợi là nhiều gene có thể biểuhiện từ một virus đơn giản. Nó cho phép sản xuất protein phức tạp mà thành phầnriêng lẻ có thể không ổn định khi biểu hiện một mình (Roy và cộng sự, 1997).

Vấn đề không thuận lợi của việc sản xuất protein bằng cách này đó là cấu trúcvà sự tinh sạch của vector Baculovirus tái tổ hợp để biểu hiện gene mục tiêu trong tếbào côn trùng mất thời gian dài từ 4 – 6 tuần và tế bào phát triển chậm (tăng rủi ronhiễm tạp) sử dụng phương tiện đắt tiền. Một phương pháp khác thay thế cho việcsản xuất gene của virus tái tổ hợp là sử dụng sự chuyển đổi đặc biệt trong E.coli caohơn sự tái tổ hợp tương đồng trong tế bào côn trùng (Luckow và cộng sự, 1993). Nóđược dựa trên sự chuyển đổi một vị trí đặc biệt ở một khung biểu hiện vào trong hệthống vector của Baculovirus (bacmid) được phổ biến trong E.coli. Bacmid chứa toànbộ bộ gen Baculovirus, sử dụng số lượng bản sao E.coli F-plasmid thấp của quá trìnhnhân bản và vị trí gắn cho của đoạn transposon Tn7 của vi khuẩn. Bacmid phổ biếntrong E.coli như một plasmid lớn. Bacmid tái tổ hợp được cấu tạo bằng chuyển đổiyếu tố Tn7 từ plasmid cho, có chứa gen mục tiêu để được biểu hiện, để gắn kết Bamid- plasmid giúp mã hóa enzyme transposase rất cần cho chức năng này. Bamid tái tổhợp có thể tách ra từ E.coli và vận chuyển trực tiếp trong tế bào của côn trùng.8.4 SỰ BIỂU HIỆN TRONG CÁC TẾ BÀO NHÂN CHUẨN CAO HƠN

Để sản xuất các protein ở động vật có vú, các tế bào của chúng có một thuận lợirõ ràng. Vấn đề chính đối với gen biểu hiện trong tế bào động vật có vú là mức biểuhiện giống như chúng ta đã thảo luận ở trên là không dễ dàng để có thể sử dụng. Trongnhiều năm, việc sản xuất protein trong các tế bào này đã sử dụng các promoter mạnhđể sao chép các gen đích. Các promoter, như lấy từ promoter ban đầu của SV40,promoter dài có lặp lại đoạn cuối của virus Rous gây bướu thịt (RSV) và promoter banđầu của cytomegalovirus, tất cả sẽ làm biểu hiện gen thay thế dưới sự điều khiển củachúng (Mulligan and Berg, 1981; Gorman và cộng sự, 1982; Boshart và cộng sự,1985). Hệ thống cảm ứng cũng có thể được sử dụng. Ví dụ như hệ thống cảm ứng củacác promoter sốc nhiệt hoặc hormone glucocorticoid được sử dụng để biểu hiện genmục tiêu (Wurm, Gwinn and Kingston, 1986; Hirt và cộng sự,1992). Tuy nhiên, đốivới các hệ thống này sự biểu hiện gen bị thất thoát khi vắng mặt chất cảm ứng và cókhả năng gây hại đến các điều kiện cảm ứng. Để khắc phục các vấn đề của cácpromoter nội sinh để biểu hiện gen đích, các hệ thống này được lấy từ vi khuẩn điềukhiển biểu hiện gen ở tế bào động vật có vú.8.4.1 Hệ thống Tet-on/Tet-off

Như chúng ta đã thảo luận trong Chương 1, sự kiểm soát phiên mã ban đầu về cơbản khác nhau giữa các sinh vật nhân chuẩn và nhân sơ. Một chất hoạt hóa từprokaryote thì không thể mang lại phản ứng sao chép trong eukaryote và ngược lại.Tuy các DNA gắn kết nhưng chúng là những loài độc lập. DNA được điều chỉnh gắn

Page 205: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

204

với đặc tính của các chất hoạt hóa có thể được sử dụng để điều khiển các chuỗi chấthoạt hóa trong nhân chuẩn để kiểm soát sự biểu hiện gen đích. Một hệ thống tận dụngcác tính chất DNA của chất ức chế tetracycline ở E.coli.

Các operon tet ở E.coli ban đầu được xác định như các transposon (Tn10) đềkháng với kháng sinh tetracycline (Foster và cộng sự, 1981). Protein TetR, tương tựnhư protein ức chế lac (lacI) chúng ta đã thảo luận ở chương I, gắn với vùng khởi độngcủa operon chất kháng tetracycline và ngăn chặn RNA polymerase từ sự khởi đầu saomã. Sự hoạt hóa của vùng operon kháng tetracycline xuất hiện khi chính tetracyclinegắn với chất ức chế và thay đổi cấu hình, ngăn chặn hoạt động gắn của DNA. Cácprotein TetR có ái lực rất cao đối với kháng sinh ( hằng ~ 3 × 10-9 M-1) và sẽ tách ratừ vị trí gắn DNA của nó khi tetracycline có mặt ở mức thấp (Takahashi, Degenkolband Hillen, 1991). Hoạt động gắn DNA của TetR không thể tự tạo ra sự phiên mã ởeukaryote, nhưng có thể nếu protein được kết hợp với miền hoạt hóa sao mã. Việc sửdụng hệ thống tet để làm biểu hiện gen mục tiêu dựa vào sự gắn vào của hai phân tửDNA tái tổ hợp vào tế bào chủ.

- Plasmid điều chỉnh: tạo một loại chất ức chế kháng sinh tetracycline ở E.coli(TetR) được kết hợp vào miền kích hoạt phiên mã của protein của virus herpes simplexVP16. Các protein kết hợp được tạo ra chủ yếu trong tế bào chủ từ promoter CMV.

- Plasmid phản ứng: chứa gen mục tiêu được nhân dòng xuôi các bản sao củatrình tự DNA ở vùng operator tetracycline (tetO) tạo thành một yếu tố phản ứngtetracycline (TRE) sao chép vào một promoter CMV.

Khi không có mặt của tetracycline, protein kết hợp TetR-VP16 sẽ gắn với TREvà hoạt hóa sao mã gen mục tiêu. Tuy nhiên, việc thêm vào tetracycline trong tế bàothì TetR sẽ không kết hợp và sự sao mã gen đích sẽ ngừng (Gossen and Bujard, 1992).Việc sử dụng hệ thống tet trở nên phổ biến hơn nhờ vào sự tồn tại của một phiên bảnđột biến của tetR. Chất ức chế tetracycline đột biến có sự thay đổi ở 4 amino acid(E71K, D95N, L101S and G102D) từ protein loại lớn làm thay đổi cơ bản tính chấtcủa DNA gắn kết của nó. Đúng hơn là tetrecyline ức chế các đặc tính của DNA kếthợp của nó, protein kết hợp được gọi là rTetR làm hạn chế chất ức chế tetracycline, sẽchỉ kết hợp với DNA khi có mặt tetracycline (Gossen và cộng sự, 1995). Điều này cónghĩa rằng, với sự thương thích của TetR với miền hoạt hóa của VP16 thì sự biểu hiệncủa gen đích có thể bị ức chế hay hoạt hóa khi có mặt của tetracycline.

- Tet-off: protein TetR loại lớn kết hợp với VP16. Sự biểu hiện của gen mục tiêuđược hoạt hóa khi không có tetracycline.

- Tet-on: sử dụng protein đột biến rTetR kết hợp với VP16. Sự biểu hiện của genmục tiêu được hoạt hóa khi có tetracycline.

Page 206: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

205

Sự thuận lợi của hệ thống này là tế bào chủ không bị lộ diện ra trong thời giandài với chất kháng sinh làm cảm ứng gen biểu hiện hay gen lặn. Thêm nữa, việc điềukhiển hoạt hóa gen đích khác đã đạt được khi sử dụng hệ thống tet là rất dễ dàng.

Hình 8.7. Tetracycline qui định biểu hiện gen để sản xuất protein trong các tế bào ở độngvật có vú. Hệ thống Tet-off và Tet-on khác nhau trong hoạt động sao mã khi thêmtetracycline. Hệ thống Tet-off làm ngừng hoạt động sao mã gen mục tiêu khi có tetrtacyclinetrong khi đó hệ thống Tet-on chứa dạng đột biến của TetR với DNA bị biến đổi, hoạt hóabiểu hiện gen khi thêm tetracycline.

Page 207: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

206

8.5 TINH SẠCH PROTEINKĩ thuật được mô tả ở trên cung cấp cho quá trình chuyển hóa bằng một trình tự

gen mã hóa một cách hiệu quả trình tự polypeptide. Vấn đề tiếp theo của người nghiêncứu là làm cách nào để tách protein mục tiêu từ hàng ngàn protein của tế bào chủ,nhiều protein cùng có những tính chất tương tự.

Việc phân tách protein từ tế bào E. Coli được tiến hành dựa vào khả năng tíchđiện và kích thước, thể hiện số lượng lớn các điểm tương ứng với protein riêng lẻ.Phân tích này thể hiện rằng có nhiều protein có kích thước trung bình (nằm trongkhoảng 40- 80 kDa) và tích điện trung bình (điểm tích điện ở pH = 6- 8)

Các kĩ thuật tách tự nhiên cần cho phân tích chức năng của protein. Kĩ thuật táchhóa sinh truyền thống có thể được sử dụng như tách các protein dựa vào kích thước cơbản của chúng( sắc ký lọc gel), khả năng tích điện ( sắc ký trao đổi ion) hoặc dựa vàomức độ kỵ nước của chúng( sắc ký kỵ nước), nhưng có thể các kĩ thuật này bị giới hạnnghiêm trọng bởi việc tách các protein tương tự nhau. Do đó protein tái tổ hợp có thểgặp khó khăn khi tinh sạch và yêu cầu sử dùng nhiều thời gian thao tác trước khi đạtđược mức độ tinh sạch, dĩ nhiên nhu cầu mức độ tinh sạch phụ thuộc vào việc sử dụngchính protein này.

Nhiều phản ứng xúc tác bởi enzyme sẽ xảy ra bởi hợp chất phân giải tế bào màkhông cần cho tinh sạch protein, trong khi các phương pháp khác, thuộc về cấu trúcsinh học đặc biệt. Điều cần thiết là khả năng phổ biến của protein mục tiêu với mộttính chất duy nhất có thể sử dụng để phân tách nó ở hầu hết các protein khác nhau củatế bào chủ. Các tag (đuôi) dùng trong tinh sạch protein là các đoạn trình tự protein cóái lực cao với các phân tử sinh học và các tag này cho phép protein mục tiêu gắn vàochất nền, thông thường là ở dạng cột , số ít các protein khác nhau có thể gắn lên được.

Sự tinh sạch protein mục tiêu từ tế bào chủ bao gồm 4 bước:- Phân giải tế bào chủ- Sự liên kết của các protein mục tiêu lên cột sắc ký- Rửa cột để loại bỏ các protein không cần thiết- Sự rửa trôi hoàn toàn protein mục tiêu.

Hình 8.8. Sự phân tách ở nồngđộ cao của các protein bằngSDS-PAGE.

Page 208: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

207

Các tag cho phép các protein tái tổ hợp đến gắn bền vững với cột ái lực. Tươngtác giữa tag và cột với điều kiện protein không bị biến tính suốt quá trình thao tác,thêm vào đó là tag không gây trở ngại đến chức năng thông thường của protein tái tổhợp.8.5.1 His-tag

Là dạng tag trong tinh sạch protein đơn giản nhất đó. Bình thường his- tag baogồm 6 histidine, DNA mã hóa các histidine còn lại này được tạo dòng theo gen mụctiêu để sản xuất được protein, một vài vị trí trong trình tự polypeptide, 6 histidin tiếptheo (Hoffman, Roeder,1991). Sự tạo dòng thường được thể hiện bằng việc tag có thểđược đặt ở nhóm amino cuối hoặc nhóm carboxyl cuối của protin nơi mà chức năngcủa protein ít bị suy giảm nhất. Tag thì có thể, tuy nhiên có thể bị thay thế vùng giữacủa protein nếu vùng trung tâm được biết là có chức năng không cần thiết (Zenke vàcộng sự, 1996). Histidin sẽ liên kết không cộng hóa trị và bền vững với sự chắc chắncủa ion kim loại. Trong một kĩ thuật được gọi là sắc kí ái lực cố định ion kim loại sắcký (IMAC), các ion như nikel, được liên kết với chất nhựa và được sử dụng để giữprotein his-tag.

Nhựa được sử dụng phổ biến nhất cho mục đích này thì có acid nitriloacetic(NTA) cộng hóa trị gắn với chúng, NTA có 4 vị trí phối trí nơi gắn ion niken rất chặtchẽ. Chất tải của NTA với Ni2+ bị chuyển 2 trong 6 vị trí phối trí cho ion tự do. Trongsự hòa tan này sẽ liên kết yếu với nước nhưng có thể liên kết mạnh với vòng imidazolecủa histidin liên tiếp trên chuỗi polypeptide. Có ít nhất 6 histidin được yêu cầu để cungcấp liên kết cần thiết, bền vững để tạo ái lực gắn protein đã gắn tag với cột, nhiềuprotein tế bào chủ sẽ không gắn vào cột theo kiểu này.

Page 209: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

208

Hình 8.9. Sự gắn kết giữa các đuôi histidine của protein với nhựa Ni2+- NTA

Sự tinh sạch protein đã gắn his-tag từ các tế bào E.Coli. Tế bào E.Coli chứa mộtvector cảm ứng được tạo ra và chúng cảm ứng để sản xuất tag mục tiêu, các tế bào sẽvỡ ra và tế bào không hòa tan sẽ bị loại bỏ trong quá trình ly tâm. Dịch nổi sẽ đượccho vào cột Ni2+- NTA.

Cột được rửa với nồng độ thấp imidazole (20mM) chất mà sẽ cạnh tranh với cáctương tác với cột histidin ái lực thấp đến loại bỏ chúng từ bất cứ cột nào, có lẻ là nhiếuhistidin, protein không được liên kết một cách đặc biệt.

Nhìn chung tag protein của nó sẽ bị loại bỏ bởi sự tăng dần nồng độ imidazolelên cao( 250mM). Kết quả quá trình này trong bước tinh sạch cơ bản là tag protein đạtđược là rất tinh khiết, hầu hết đồng nhất.

Các protein his- tag từ bất kì hệ thống biểu hiện nào đều bao gồm: vi khuẩn, nấm,Baculovirus, và tế bào động vật hữu nhũ có thể được tinh sạch đến một mức đồng nhấtcao khi sử dụng kĩ thuật này.

Điều kiện tách rửa thay đổi có thể được sử dụng , ví dụ như , giảm pH xuống từ 8đến 4.5 sẽ gây thay đổi làm tăng thêm một proton của histidin và dẫn đến tách ra mộtprotein từ phức hợp kim loại.

Tag protein bị loại bỏ bởi tác nhân như EDTA để loại ion niken từ cột dẫn và dẫnđến loại bỏ tag protein.

Ngoài ra kích thước nhỏ của histidin thể hiện rằng protein tái tổ hợp đã gắn tagthường đồng nhất đến cả thế hệ cha mẹ nó không gắn tag.

Trong một vài trường hợp tag protein tìm được thì có hoạt tính sinh học hơn cácprotein cùng loại không gắn tag. Mặc dù hiệu quả này có ý nghĩa đến tốc độ của quátrình tinh sạch hơn bất cứ hoạt tính sinh học nào của tag.

Một vài protein được kết tinh trong sự có mặt của his- tag, thêm vào đó his- tagcó độ miễn dịch thấp và dẫn đến kết quả protein tái tổ hợp chứa tag có thể được sửdụng để sản xuất kháng thể. Ưu điểm của his- tag là sự tinh sạch có thể thực hiện dướiđiều kiện biến tính protein.

Phản ứng giữa histidin và ion kim loại không cần yêu cầu cấu trúc protein đặcbiệt nào và sẽ xảy ra thậm chí có mặt các chất gây biến tính protein. Đây là điều quantrọng trong quá trình tinh sạch protein.

Page 210: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

209

8.5.2 GST-tagGST là một họ enzyme chứa đựng bên trong tế bào, chống lại các ái lực điện từ

với hợp chất hóa học xenobiotic.Chúng xúc tác thêm glutathione đến cơ chất ái lực điện từ này. Làm tăng độ hòa

tan của chúng trong nước và thúc đẩy việc giảm dần enzyme. Glutathione là mộttripeptit bao gồm các acid amin, acid glutamic, cystein và glycine, GST gắn vớiglutathione với ái lực cao.

Enzyme từ sán ký sinh Schistosoma taponicum là một protein đối xứng hai bêncó kích thước là 26 kDa. Gen mã hóa protein này được nhập vào trong một khung đọcchính xác , để gen mục tiêu và protein được sản xuất ra từ một vector biểu hiện. Tế

Hình 8.10. Sự tinh sạch của his-tagged protein. Cấu trúc hóa học của nhóm histidine vàimidazole được nêu, cùng với gel SDS-polyacrylamide trong tinh sạch protein. Trong một tế bàoE.coli tạo ra 1 protein his-tagged 14 kDa được tiếp xúc với cột Ni2+-NTA. Cột được rửa với mộtdung dịch đệm chứa 20 mM histidine để tách rửa tagged-protein với nồng độ imidazole khoảng20-250 mM. Các protein được nhìn thấy sau khi nhuộm gel với oomassie xanh.

Page 211: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

210

bào chủ sản xuất ra protein bị vỡ ra và protein hòa tan được đưa đến cột màglutathione bị kéo lại (như glutathione-agarose)

Tương tác đặc biệt giữa GST và glutathione sẽ làm gắn protein vào cột, trong khiprotein của tế bào chủ không thể bám vào cột được. Protein liên kết sau đó có thể bịtách rửa ra khỏi cột bằng cách rửa với glutathione nồng độ cao (10mM) cạnh tranhtương tác với cột.

Hình 8.11. Sự tinh sạch protein gắn đuôi GST. (a) Cấu trúc hóa học của tripeptide glutathione vàvai trò của GST khi thêm nó vào với các hợp chất có ái lực (R). Glutathione được tạo thành bởi 3nhóm aminoacid –acid glutamic, cysteine và glycine. Chú ý rằng acid glutamic gắn với dipeptideCys-Gly thông qua nhóm -carboxyl. (b) Cấu trúc 3 chiều của phức GST- glutathione. Proteinđược miêu tả ở dạng dài và glutathione như dạng que màu xanh (Garcia-Saez et al. , 1994). (c) Sựtinh sạch của protein gắn GST từ tế bào E.coli. Protein gắn tag được gắn với cột glutathione ái lựcvà được tách rửa bằng chính glutathione. Tagged protein được miêu tả bằng mũi tên.

Page 212: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

211

Cả kích thước lớn của GST và sự đối xứng hai bên tự nhiên của nó đều có nghĩarằng tag có ảnh hưởng nhiều đến hoạt tính sinh học của protein mục tiêu hơn là his-tag. Do đó cần phải loại bỏ một phần GST của protein đồng nhất để nghiên cứu hoạttính protein mục tiêu trong khi tách riêng ra. Điều này có thể đạt được trong thể vùi,trong vector biểu hiện, của DNA mã hóa cho trình tự acidamin của một vị trí tách đặcbiệt protease giữa GST và gen mục tiêu. Xử lý protein được tinh sạch với protease sauđó sẽ cho ra kết quả của 2 chuỗi polypeptit- protein mục tiêu và chính GST. GST sauđó có thể bị loại bỏ từ protein mục tiêu bằng việc phối trộn trở lại vào cột glutathione,lúc này GST sẽ gắn vào cột nhưng protein mục tiêu thì không thể gắn được. Lưu lượngqua cột được tập trung lại và sẽ chứa đựng protein mục tiêu được tinh sạch.

Một protease đặc biệt khác được sử dụng để cắt tag trong quá trình tinh sạch cácprotein mục tiêu. Không giống các hạn chế của enzyme khi chúng cắt DNA, nhiềuprotease không có một trình tự nhất định cần cho vị trí cắt của chúng.

Ví dụ như protease Factor Xa cắt sau arginin trong vị trí cắt ưa thích đó là Ile-Glu- Gly- Arg. Tuy nhiên, đôi khi nó sẽ cắt ở các vị trí cơ bản khác, điều này phụthuộc vào cấu tạo của cơ chất protein và số lượng vị trí thứ hai có trình tự cắt tiếp theosau Gly- Arg (Quinlan, Moir and Stewart, 1989). Do đó, protease không chỉ cắt ở vị trígiữa tag và protein mục tiêu mà còn cắt chính protein mục tiêu nữa. Hiển nhiên điềunày được tránh để duy trì tính toàn vẹn của protein mục tiêu. Các protease khác như:protease TEV và PreScission có trình tự lớn hơn và có nhiều trình tự đặc biệt đượcthừa nhận và nó ít cắt các vị trí khác kẻ. Protease TEV có ưu điểm là loại protease cóthể sản xuất protein tái tổ hợp từ E.Coli và do đó không bị nhiễm bẩn bởi các proteasekhác trong chất nguyên sinh và các yếu tố khác.

Page 213: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

212

8.5.3 MBP-TagGen mục tiêu được chèn vào ngược chiều với gen malE của E.coli, mã hóa

protein gắn maltose (MBP), trong một vector biểu hiện làm sản xuất protein MBP(Kellermann and Ferenci, 1982). Maltose là một disaccharide, cấu tạo từ 2 phân tửglucose. MBP là một protein đơn phân 40 kDa tạo thành một phần của hệ thốngmaltose/maltodextrin ở E.coli, chịu trách nhiệm hấp thu và dị hóa hiệu quả cácpolymer glucose (Boos and Shuman, 1998). Protein trải qua sự thay đổi lớn khi gắnvới maltose và tạo nên một phức. Giai đoạn đầu của quá trình tinh sạch sử dụng ái lựccủa MBP đi qua amylase (di Guan và cộng sự, 1988). Các protein được tách rửa khỏiamylase bằng maltose (10mM) trong dung dịch đệm ở cột.8.5.4 IMPACT

IMPACT (sự tinh sạch các intein gắn kết đuôi chitin ái lực) là sự tinh sạchprotein dùng protein tự ghép nối các intein để loại các đuôi và protein tinh sạch bị táchra bằng một lượt chạy sắc kí. Các intein là các lớp protein, được tìm thấy trong nhiềuloại sinh vật, tự cắt bỏ từ các tiền protein và trong quá trình nối các protein có nghĩa(extein) (Cooper and Stevens, 1995). Intein bị cắt bỏ là một DNA endonuclease có vịtrí đặc biệt, xúc tác biến đổi trình tự DNA mã hóa của chính nó. Quá trình tách và gắnpolypeptide phụ thuộc vào các nhóm hóa học đặc biệt là thiol và asparagine.

Hầu hết các intein có 1 đuôi cysteine ở amino acid cuối cùng và một đuôiasparagine ở nhóm carboxyl cuối. Tất cả các thông tin cần cho phản ứng gắn kết chứatrong chính các intein và nếu những trình tự này bị thay thế trong phạm vi các proteinmục tiêu thì chúng vẫn tự ghép lại. Quá trình gắn kết thì phức tạp nhưng phản ứng thìrất hiệu quả. Hệ thống biểu hiện IMPACT đã khai thác các nhóm hóa học đặc biệt nàybằng cách thay đổi C cuối của asparagine thành alanine trong một intein của nấm men,VAM1 (Chong and Xu, 1997). Sự biến đổi này ngăn chặn phản ứng tách ở nhómcarboxul cuối của intein và giữ các protein trong nhóm thioester có thể bị tách bởi β-mercaptoethanol or dithiothreitol (DTT). Các gen đích được được tạo dòng trong mộtvector biểu hiện làm cho protein kết hợp ba thành phần được tạo ra, ở đó chuỗi liênhợp protein mục tiêu-intein-chitin được hình thành. Chitin là một polysaccharide dạngsợi không tan tạo nên từ β-1,4-

N-acetyl-D-glucosamine, được tìm thấy trong thành tế bào của nấm, tảo và vỏbọc của ngành chân đốt. Chitinase xúc tác thủy phân chitin và enzyme Bacilluscirculans (Mr 74 kDa) được chứa trong ba chuỗi- một chuỗi amino cuối có tính xúctác (CatD) (417 aa)- một chuỗi lặp lại của fibronectin loại III (FnIII) và một chuỗicarboxyl cuối gắn chitin (CBD, 45 aa) (Watanabe và cộng sự, 1990). CBD được táchra có ái lực cao gắn chitin.

Trong hệ thống IMPACT, protein kết hợp lấy từ E.coli và đi xuống cột chitin, ở đóchúng gắn với nhau. Protein có thể được tách ra khỏi cột bằng cách sử dụng thiol cótrong các hợp chất như DTT, ở 40C. Đây là một quá trình chậm và đòi hỏi phải ủ quađêm, điều này có thể khiến phát sinh vấn đề là protein mục tiêu không được ổn địnhdưới những điều kiện. Cuối cùng các protein đích được tạo ra bằng cách này được chấpnhận khi cho một nửa DTT thioester xâm nhập vào cuối nhóm carboxyl cuối. Tuy nhiên,

Page 214: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

213

khi thủy phân để sản xuất protein sẽ không ổn định và tức thời. Các nhóm thiol kháccũng được sử dụng để khởi động quá trình tách, như β-mercaptoethanol and cysteine.

Cystein làm tách và chèn một nhóm cystein vào cuối nhóm carboxyl cuối củapolypeptide bị cắt. Cystein có thể được đánh dấu bằng đồng vị phóng xạ hoặc có thể làmột vị trí biến đổi hóa học, đặc biệt nếu nó là nhóm cystein duy nhất trong protein, khinó là một vị trí tốt để thêm protein liên kết ngang, dò huỳnh quang, đánh dấu spin vànhiều đuôi khác.

Hình 8.12. Sự tinh sạch protein gắn đuôi MBP. (a) Cấu trúc hóa học của maltose, là mộtdisaccharide. (b) Cấu trúc ba chiều của MBP-maltose (Quiocho, spurlino and Rodseth, 1997).Protein được miêu tả ở dạng xoắn α màu tím và dạng màu xanh dương. Maltose được miêu tảbằng màu xanh lá cây. (c) Sự tinh sạch của một protein gắn tag MBP. Protein gắn tag được gắn vớicột amylase và được tách rửa bằng maltose. Tag MBP sau đó được cắt bởi một protease ở vị trí cắtmiêu tả bởi dấu X, và được đưa lại vào cột amylase. Protein mục tiêu sẽ không cho vào cột khi nó bịtách khỏi MBP.

Page 215: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

214

Hình 8.13. Hệ thống IMPACT cho sự tinh sạch các tagged protein và sau đó loại bỏcác tag. (a) Tương tác gắn liên quan đến sự cắt bỏ intein và nhập vào các trình tựpolypeptide ở các nhóm amino và carboxyl cuối. (b) Một dạng đột biến của intein, ởđó một asparagine chính bị thay thế bởi một alanine, gây cắt một phần và giải phóngnhóm amino cuối của chuỗi polypeptide. (c) Tương tác gắn hóa học dùng để táchprotein thành intein-chitin gắn với tag(CBD). (d) Sự tinh sạch của Hhat methylase sửdụng hệ thống IMPACT (Chong et al. , 1997). Protein mục tiêu được tinh sạch đượctách rửa khỏi cột, trong khi chất tẩy rửa được sử dụng để loại bỏ intein-CBD.

Page 216: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

215

8.5.5 TAP-taggingSự kéo dài tag của protein trong tinh sạch là để gắn các protein được sản xuất ở

mức cao trong tế bào chủ của chúng. Tinh sạch protein trong những trường hợp này,nếu dưới những điều kiện thuận lợi, có thể dẫn đến sự cô lập một cách tự nhiên làmxuất hiện các phức protein. Hầu hết các protein không tồn tại độc lập trong các tế bào.Chúng kết hợp với nhau thông qua các tương tác không cộng hóa trị, với các proteinkhác nhau có thể được liên quan đến chức năng của chúng.

Việc tạo ra quá nhiều protein đơn sẽ không dẫn đến sản xuất quá mức các proteinkhác trong các phức hợp. Do đó, để cô lập các phức hợp từ các tế bào, sự tạo ra proteinnên ở trạng thái tự nhiên khi có thể. DNA mã hóa những gì được giới hạn một TAP-tag được tách dòng đầu 3 của gen đích. TAP-tag mã hóa hai yếu tố- một calmodulingắn với peptide và protein. Một lấy từ Staphylococcus aureus. Những yếu tố này đượctách ra bởi một vị trí tách của protease TEV (Puig và cộng sự, 2001). Các tế bào chứaprotein đã gắn được phân giải nhẹ và sau đó được cho vào cột chứa IgG, có gắn kết áilực cao với protein A. Protein liên hợp và các protein được gắn kết của nó, bị loại khỏicột sử dụng protease TEV và sau đó được thêm trực tiếp vào cột bead calmodulin, cómặt của Ca2+ và được tách rửa bằng sử dụng EDTA. Phương pháp tinh sạch hai bướccó tính đặc trưng cao và có thể tách các phức protein không có tạp chất. TAP-tag chophép tinh sạch các phức hợp nhanh từ lượng nhỏ các tế bào một cách tương đối ngoàicấu tạo, hoạt động hay chức năng của phức đã biết trước (Rigaut và cộng sự, 1999;Gavin và cộng sự, 2002), và, kết hợp với hàng loạt phép đo quang phổ. Phương phápTAP cho phép định danh protein tương tác với protein cho trước.

Page 217: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

216

Chương 9PHÂN TÍCH HẬU GENOMENhững khái niệm chínhCác trình tự sẵn có của bộ gen cho phép thiết kế các thí nghiệm để điều tra mỗi

gen hoặc sản phẩm của gene trong sinh vật.Sự thay đổi số lượng và cường độ của các gen thể hiện bởi các tế bào trong điều

kiện khác nhau có thể cung cấp ảnh hưởng quan trọng cho các phản ứng của tế bào.Sự phân tích các bộ gen, transcriptomes và proteome có thể thực hiện được

thông qua gia tăng tự động hóa và điện toán.Với sự xuất hiện của một bộ gen đầy đủ trình tự, chúng ta có thể cho rằng việc

phân tích gen hơn nữa là không cần thiết. Thông tin gì có thể được biết đến sau khibiết được trình tự của mỗi gen? Thay vì đại diện cho sự kết thúc, các kiến thức về cáctrình tự bộ gen của một cơ quan đã khởi xướng một loạt thí nghiệm hoàn toàn mới màkhông thể có, thậm chí còn được dự kiến trước đây. Trong những năm gần đây 'ome-'thời hạn đã được sử dụng như là một hậu tố gắn liền với bất kỳ hiện tượng gần như cóthể được mô tả rộng ở cấp độ tế bào (Fields và Johnston, 2002). Có thể hiểu bộ gen làtoàn bộ lượng DNA ổn định trong một tế bào riêng lẻ. Tuy nhiên một số khác ‘omes'rất khó để xác định và trong nhiều trường hợp sẽ thay đổi tùy thuộc vào điều kiện tếbào trưởng thành.

Transcriptome – lượng mRNA của tế bào. Lượng này sẽ thay đổi khi các genkhác nhau được biểu hiện ở các giai đoạn phát triển khác nhau, hoặc để phù hợp vớicác yếu tố bên ngoài hoặc có chất dinh dưỡng. Các sản phẩm phiên mã thể hiện trongmột tế bào là dấu hiệu của các sản phẩm protein, nhưng không phản ánh protein chứcnăng. Ví dụ, một bản ghi có chứa nhiều codon hiếm khi được sử dụng có thể được dịchmã ở một tần số thấp để sản xuất protein

Proteome - hàm lượng protein của tế bào. Điều này có thể được dùng như cácthành phần dịch mã của bộ gen, nhưng trong nhiều trường hợp các sản phẩm proteinđược sản xuất bởi tế bào có thể khác với những dự đoán từ transcriptome này. Sửa đổisau dịch mã hoàn toàn có thể thay đổi chức năng của nhiều protein.

Metabolome - các chất chuyển hóa phân tử nhỏ hiện diện trong tế bào. Số lượngvà danh tính của các chất chuyển hóa sơ cấp và thứ cấp trong một tế bào sẽ thay đổi rấtnhiều tùy thuộc vào trạng thái sinh lý của nó. Thay đổi trong metabolome có thể phảnánh các chức năng của các protein cần thiết cho sự trao đổi chất.

Khả năng xác định những thay đổi trong từng giai đoạn ở trên có thể giúp xácđịnh chính xác các quá trình tế bào xảy ra trong những hoàn cảnh cụ thể. Ví dụ, nhữngthay đổi xảy ra bên trong tế bào một trong chuyển đổi từ trạng thái bình thường đếnung thư? Một số kỹ thuật đã được đưa ra để giải quyết những vấn đề này. Nhiều trongsố các thí nghiệm thiết kế để giải quyết những tác động toàn cầu về chức năng gen đãđược thực hiện bằng cách sử dụng nấm men Saccharomyces cerevisiae là sinh vật cónhân điển hình. Nấm men có lợi thế là một bộ gen tương đối nhỏ (~ 6300 gen) với cácvùng nhỏ gọn intergenic và ít intron. Điều này, kết hợp với khả năng thực hiện phân

Page 218: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

217

tích di truyền nhanh chóng và mạnh mẽ, tạo nên một hệ thống lý tưởng để nghiên cứusự tương tác giữa gen và các sản phẩm gen. Hầu hết các thí nghiệm mô tả dưới đâyđược thực hiện đầu tiên trên nấm men trước khi tiến hành trên các bộ gen lớn hơnnhiều sinh vật nhân chuẩn phức tạp.9.1 TOÀN BỘ SỰ BIẾN ĐỔI BIỂU HIỆN TRONG GEN

Các mức độ biểu hiện của mỗi gen có thể được điều chế để phù hợp với một loạtcác tín hiệu ngoại bào và nội bào. Bộ nhiễm sắc thể của các gen được biểu hiện trongtế bào ở một thời gian cụ thể cho một "snap-shot" của sản phẩm protein. Ví dụ, việcđiều trị về các tế bào của con người với một loại thuốc đặc biệt có thể gây ra nhữngthay đổi trong biểu hiện của gen bởi ảnh hưởng của thuốc đó, ví dụ như những proteincần thiết cho sự chuyển hóa thuốc có thể được sản xuất ở mức độ cao hơn. Chúng tôiđã thảo luận một số kỹ thuật nhằm mục đích theo dõi những thay đổi trong biểu hiệngen, ví dụ như thẩm tích Northern (Chương 2) và RT-PCR (chương 4).

Tuy nhiên, những phương pháp này đòi hỏi sự thay đổi trong mức độ biểu hiệncủa gen phải được quan sát cụ thể. Giới hạn số lượng gen của cách tiếp cận có thểđược phân tích và kết quả thu được thiên về các gen có biểu hiện mô hình được quansát. Các nhà nghiên cứu thực hiện các thí nghiệm phải thực hiện những yêu cầu như sựbiểu hiện của những gen có khả năng được thay đổi bởi một điều trị cụ thể. Một cáchtiếp cận có hệ thống hơn là để kiểm tra mức độ biểu hiện của tất cả các gen trong bộgen và để xem cách các cấp độ này được thay đổi theo hoàn cảnh cụ thể. Điều này chophép thay đổi biểu hiện gen được quan sát. Một số phương pháp đã được thiết kế đểtheo dõi những thay đổi biểu hiện gen ở cấp độ toàn bộ gen.9.1.1. Biểu hiện sự khác biệt

Mặc dù không đòi hỏi hiểu biết trước của các trình tự bộ gen, hiển thị vi phân làmột phương pháp để theo dõi những thay đổi toàn bộ ở mức độ biểu hiện gen dựa vàosự khuếch đại có hệ thống của 3’- kết thúc của phân tử mRNA (Liang và Pardee,1992) Như chúng ta đã thấy trước đó, 3’- kết thúc của hầu hết các phân tử mRNA cómột cái đuôi poly (A). Mồi xuôi được thiết kế để liên kết với các ranh giới 5’ của đuôiPoly A và hoạt động như là điểm bắt đầu cho một phản ứng phiên mã ngược (Hình10.1). sợi cDNA đơn được tổng hợp sau đó được khuếch đại bằng PCR sử dụng mồixuôi và mồi ngược bất kỳ nhưng được biết trình tự. Mồi tùy ý khác nhau được sửdụng để khuếch đại một vài phân tử cDNA bắt nguồn từ một số phân tử mARN. Sảnphẩm PCR sản xuất bằng phương pháp này sau đó được tách ra sử dụng bằng cáchbiến tính điện polyacrylamide như gel sắp xếp trình tự DNA, chúng ta đã thấy ởchương 9. Số lượng của PCR được sản xuất từ mỗi phân tử mARN trong mẫu gốc cầnphải cân đối đối với số lượng của RNA mà từ đó nó chuyển hóa. Vậy thì, sự phongphú tương đối của các phân tử mARN riêng lẻ có thể được so sánh trực tiếp trongRNA mẫu khác từ những nguồn liên quan.

Sử dụng nhiều mồi kết hợp, hiển thị vi phân có thể hình dung tất cả các gen thểhiện trong một tế bào trong một hệ thống và chuỗi kiểu phụ thuộc.Một trong nhữngphương pháp gián tiếp sử dụng hiển thị vi phân là so sánh các mRNA từ những tế bàomô tuyến vú người có nguồn gốc bình thường và khối u, đã được nuôi cấy dưới cùng

Page 219: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

218

điều kiện. Việc phát hiện các gene đặc biệt thể hiện trong các tế bào khối u nhưngkhông phải trong tế bào bình thường (gen tiềm năng gây ung thư), hoặc những cái chỉthể hiện trong các tế bào bình thường (khả năng tiêu diệt gen khối u), là quan trọngcho sự hiểu biết cơ sở phân tử của ung thư .

Thứ tự được phát hiện bằng hiển thị vi phân như là một trong hai lên hoặcxuống có quy định trong các điều kiện cụ thể có thể được cắt ra từ gel trong đó chúngđược tách, chuẩn bị khuếch đại bằng PCR, nhân bản và sắp xếp theo trình tự.

Các đoạn làm theo cách này là thiên về đoạn cuối-3 của gen và do đó không thểcho là dòng vô tính cDNA có độ dài đầy đủ, những kiểu trình tự khác có thể, tuynhiên, được sử dụng như những đầu dò để cô lập đầy đủ độ dài cDNA và di truyềnDNA - hoặc kiểm tra qua sự sàn lọc từ thư viện hoặc tìm kiếm máy tính. Vi phân hiểnthị là một kỹ thuật mạnh mẽ cho việc phân tích những thay đổi biểu hiện gen. Tuynhiên, sự biểu hiện ít thay đổi khi điều kiện thay đổi. Ngoài ra, việc kết hợp nhiềumồi(>300) đòi hỏi phải phân tích hiệu quả tất cả các phân tử mRNA tiềm năng có thểsẽ được sản xuất trong một tế bào (Crawford và cộng sự, 2002.).

Hình 9.1. Hiển thị vi phân để phát hiện những thay đổi trong biểu hiện gen. (a)Chuyển đổi để cDNA đạt được bằng cách đầu tiên sử dụng một mồi xuôi Oligo-DT đểtạo ra một cDNAs sợi đơn tương ứng với kết thúc 3’ của mRNA. Mỗi của ba mồi xuôi(có 3’- kết thúc là hai G, A, C) sẽ sản xuất những phân tử cDNA thành sợi đơn dựatrên sự hiện diện và phong phú của các phân tử mRNA riêng lẻ trong mẫu. sự tổnghợp sợi thứ hai sau đó được thực hiện bằng cách sử dụng một vài mồi tùy ý của trìnhtự được biết.những sự kết hợp khác của những mồi tùy ý và mồi xuôi Oligo-dT sẽkhuếch đại tất cả các hoán vị có thể có của sợi cDNA trước. Các đoạn PCR sản xuấtđược ngăn cách bằng cách sử dụng gel apolyacrylamide và sự khác biệt trong biểu

Page 220: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

219

hiện của gen trong các mẫu mô có thể được phát hiện qua các phân tích về cường độvà băng riêng lẻ. (b) hiển thị của bốn mẫu RNA (một bình thường và ba ung thư) bằngcách sử dụng ba mồi xuôi khác nhau (G, A và C) kết hợp với ba mồi tùy ý (1,2 và 3).

Các hộp màu đỏ cho thấy một số sản phẩm gen được đánh giá cao thể hiệntrong các tế bào ung thư và không có trong các tế bào bình thường,và hộp màu xanh lácây cho thấy các gen chỉ biểu hiện ở tế bào bình thường .đã được sao chép với sự chophép từ công ty GenHunter www.genhunt.com

9.1.2 MicroarrayMicroarray là một giá thể rắn, trên đó có chứa các mẫu dò. Chúng ta đã thấy rằng

các mô hình của các gen thể hiện trong một ô là đặc trưng của một trạng thái phổ biến.Các gen có thể không chứa nhiều gen như đã từng nghĩ - ví dụ như số lượng của nấmmen là 6000 và có lẽ là ít hơn so với số lượng 30 000 ở người - mở ra khả năng biểuhiện phân tích của từng cá thể các của tất cả các gen trong sinh vật. Việc thí nghiệm 30000 cá thể vẫn là một số lượng lớn, nhưng những tiến bộ trong tự động hóa và mẫu chếbiến đã cho biết bây giờ đã thực hiện được và đạt được.

Hầu như tất cả những thay đổi trong trạng thái tế bào hoặc loài có thể tương quanvới thay đổi trong mức độ mRNA của gen. Trong một số trường hợp, thay đổi sốlượng lớn nhiều gen xảy ra. Ví dụ, trong nấm men, quá trình hình thành bào tử đượckết hợp với sự thay đổi trong biểu hiện của ít nhất 1000 gen khác nhau - đại diện chogần 20% tổng số của các gen (Chu và cộng sự, 1998). Trong trường hợp khác, thay đổitrong môi trường tế bào chỉ có thể làm thay đổi sự biểu hiện của một nhóm nhỏ củacác gen - ví dụ như điều trị tế bào nấm men với sunfat đồng đáng kể làm thay đổi sựbiểu hiện với số lượng ít khoảng 5 gen (Tổng và cộng sự, 2000). Sự hiểu biết về cácmô hình biểu hiện của nhiều gen trước đây không bình thường cũng có thể cung cấpnhững thứ quan trọng cho chức năng của chúng.

Page 221: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

220

Các phân tích những thay đổi trong biểu hiện của tất cả các hàng ngàn hoặc hàngchục hàng ngàn gen trong bộ gen là điều cần thiết nếu chúng ta muốn hiểu mối quanhệ qua lại giữa các gen và các sản phẩm gen.

Microarray DNA đã được phát triển như là một phương pháp trong việc phântích nhanh chóng sự biểu hiện của tất cả các gen trong một bộ gen (Shalon, Smith vàBrown, 1996).

Nó làm việc bằng cách cung cấp một chuỗi đơn cố định của DNA mà có nhãnđoạn cDNA có thể liên kết (hình 10.2). Các đoạn DNA là những chất gắn liền với mộtchất mang, trơ về mặt hóa học (được gọi là chip). Một số công nghệ khác nhau hiệnđang được sử dụng để thực hiện các thí nghiệm microarray. Những khác biệt trongcách thức mà các trình tự DNA là được gắn vào chip, và chiều dài các trình tự ADNcủa chính nó.

Hai hệ thống phổ biến nhất được sử dụng là phát triển trong phòng thí nghiệmcủa Patrick Brown tại Đại học Stanford và bán thương mại của công ty Affymetrix.Các chip Affymetrix tổng hợp hóa học DNA sợi đơn oligonucleotides (~ 25 cặp ởchiều dài) được gắn vào một bề mặt bằng cách sử dụng thạch anh và các tác nhânphotolabile và phương pháp in quang hoạt tương tự như được sử dụng trong sản xuất củasilicon vi mạch. Kết quả của quá trình có thể dẫn đến nhiều như là 500.000 cá thể phântử DNA được đặt chính xác trong một chip 1,28 cm2. Các chip Stanford được xây dựngbằng chấm robot của các đoạn ADN, xuất phát từ khuếch đại PCR của toàn bộ gen, vàođiểm chính xác của một măt nghiêng thủy tinh. Trong trường hợp của các bộ gen nấmmen riêng biệt phản ứng PCR 6116 được thực hiện để khuếch đại mỗi gen cá thể.

Những sản phẩm này sau đó được phát hiện PCR vào một mặt nghiêng thủy tinhđo khoảng 2 cm2. Mỗi sản phẩm PCR được phát hiện vào một vị trí chính xác. Do đó,các chuỗi DNA tại bất kỳ vết chấm cá thể nào cũng được biết đến. Khi phát hiện trênslide, DNA được sấy khô bằng cách nung nóng đến 100°C cho 2s, cố định bằng tia cựctím liên kết ngang, và sau đó biến tính (95°C, 2 phút) để tạo ra các DNA chuỗi đơn.

Việc chuẩn bị các chip sau đó được sử dụng làm mẫu cho các liên kết của nhãnđoạn cDNA. Đoạn cDNA được chuẩn bị như đã biết trong hình 10.3 mẫu RNA từ haibộ liên quan của các tế bào đang bị tách ra.

Page 222: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

221

Hình 9.2. Việc xây dựng một DNA microarray. PCR sản phẩm đại diện cho cáccá thể gen, các bộ phận của các gen hoặc những DNA khác được phát hiện trên mộtmặt nghiêng thủy tinh và sau đó cố định vào vị trí. Kết quả là DNA sợi đơn có thể hoạtđộng như một điểm gắn kết cho bổ sung, dán nhãn, trình tự DNA.

Các tế bào thường có thể liên quan với nhau để phần lớn các gen mà nó thể hiệnsẽ tương tự. Các tế bào có, tuy nhiên, đã hoặc nuôi dưới những điều kiện khác nhau,hoặc có nguồn gốc từ một mô bình thường và phiên bản ung thư của cùng một mô. Sợi

Page 223: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

222

đơn của cDNA được sản xuất bằng cách sử dụng sao chép ngược từ một đoạn mồiOligo (DT).

Việc tổng hợp cDNA có mặt của 3 triphosphate deoxynucleotide thường và mộtnhãn huỳnh quang đơn deoxynucleotide triphosphate. Một trong những mẫu cDNAđược sản xuất bằng cách sử dụng nhãn huỳnh quang màu xanh lá cây (nucleotide cónhãn với Cy3), trong khi khác được sản xuất sử dụng thuốc nhuộm huỳnh quang màuđỏ (nucleotide có nhãn với Cy5).

Do đó, các cDNA được cô lập từ mỗi loại tế bào khác nhau sẽ mang một huỳnhquang khác nhau. Các mẫu cDNA được trộn với số lượng bằng nhau và cho phép laicho các chip microarray. Các màu sắc và cường độ của từng vị trí trên microarray sauđó được theo dõi bằng cách sử dụng một kính hiển vi quét huỳnh quang tiêu điểm. Cácnhãn được kích thích bằng cách sử dụng một laser, và sự phát huỳnh quang tại chỗ đãđược phát hiện với các kính hiển vi để cung cấp cho một dấu hiệu liên quan khá lớncủa mỗi loài RNA trong mẫu gốc. Ví dụ, như trong hình 10,3, nếu các tế bào pháttriển trong điều kiện 1 thể hiện một gene đó không phải là thể hiện dưới điều kiện 2,sau đó hỗn hợp cDNA sẽ chỉ có các phiên bản Cy3 gắn nhãn của các cDNA tương ứngvà tại chỗ bổ sung về microarray sẽ được dán nhãn màu xanh lá cây.

Tương tự như vậy, một gen duy nhất thể hiện trong điều kiện tăng trưởng 2 sẽcho ra năng suất điểm đỏ trên giá thể ( mảng). Gen biểu hiện ở mức bằng nhau trongcả hai mẫu sẽ làm gia tăng cho cả hai màu xanh và đỏ cDNAs có nhãn, có thể cả hailiên kết với các trình tự bổ sung vào giá thể ( mảng). Trong trường hợp này là mộtđiểm màu vàng (hỗn hợp của màu xanh lá cây và màu đỏ) sẽ được tạo ra. Điều quantrọng là mỗi microarray được hiệu chuẩn để các cấp của mRNA từ mỗi của các mẫu cóthể được đánh giá chính xác (Bilban và cộng sự, 2002.). Các tỷ lệ giữa các tín hiệuhuỳnh quang màu xanh và đỏ được tính cho một số điểm tổng mảng có chứa DNA.Các máy dò huỳnh quang sau đó được điều chỉnh để những yếu tố này có một tỷ lệ đocường độ tương đối là 1.0. Các cường độ tương đối của tín hiệu màu xanh lá cây vàmàu đỏ sau đó có thể được sử dụng như một thước đo của sự phong phú tương đối củamột mRNA cụ thể trong mỗi mẫu. Hiện đã có một sự bùng nổ trong việc sử dụngmicroarray DNA để phân tích biểu hiện gen trên quy mô toàn bộ gen. Ở đây chúng tasẽ thảo luận về một số cụ thể ví dụ khi bản sao chép đã được sử dụng để giải quyết vấnđề sinh học, nhưng tài liệu có chứa rất nhiều thứ khác (Lockhart và Winzeler, 2000;Shoemarker và Linsley, 2002).

Biểu hiện gen liên quan đến sự thay đổi quá trình chuyển hóa. DNAmicroarrays đã được sử dụng làm tiêu chuẩn để đánh giá sự biểu hiện tương đối của tấtcả các gen trong nấm men trong diauxic shift (các thay đổi từ quá trình lên men đểtăng trưởng xảy ra khi lượng glucose đã suy giảm từ sự phát triển của vật trung gian).Tế bào nấm men được thu hoạch từ việc nuôi cấy mỗi hai giờ trong một khoảng thờigian và được sử dụng để so sánh các gen được biểu hiện trong đó với các mẫu biểuhiện ban đầu. Từ các mRNA bị cô lập, huỳnh quang nhãn cDNA đã được chuẩn bịbằng cách sử dụng Cy5, trong khi các tế bào thu được tại các thời điểm đầu tiên (mộtmẫu tham khảo) đã được gắn nhãn Cy3. Các cDNA từ từng thời điểm sau đó được trộn

Page 224: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

223

lẫn với cDNA và được lai với một con chip có chứa mỗi microarray của các gen nấmmen(~ 6000).

Khi lượng glucose đã cạn kiệt từ các vật trung gian, đánh dấu những thay đổitoàn bộ mô hình sự biểu hiện gen đã được tiến hành, quan sát. (Hình 10.4).

quang có thể

Hình 10.3. Xác định gen có biểu hiện khác nhau giữa hai mẫu RNA khi sử dụngvi mạng. (a) Các RNA từ các tế bào phát triển trong điều kiện 1 bị tách ra và chuyểnđổi để cDNA sử dụng một mồi Oligo-dT, chính nó có gắn nhãn với một chất nhuộmhuỳnh quang màu xanh lá cây (Cy3).

Tương tự , RNA từ các tế bào phát triển trong điều kiện 2 bị tách ra và chuyểnđổi thành cDNA bằng cách sử dụng một mồi Oligo-DT dán nhãn với một chất nhuộmhuỳnh quang màu đỏ (Cy5). Các mẫu cDNA được pha trộn theo tỷ lệ bằng nhau vàlai với vi mạng này. Xem vi mạng với một kính hiển vi huỳnh quang cho thấy một loạtcác chấm màu. Một chỗ màu xanh rằng gen tương ứng là chỉ có thể ở trong tìnhtrạng 1, trong khi một điểm màu đỏ cho biết rằng một gen chỉ thể hiện ở trong tìnhtrạng 2. Nếu số lượng bằng nhau của cDNA có nguồn gốc từ tế bào 1 và kết 2 vàoDNA chuỗi đơn trên giá thể ( mảng), sau đó lượng màu đỏ và màu xanh bằng nhau lácây sẽ liên kết với năng suất một điểm màu vàng. (B) Một vi mạng bắt nguồn từ trìnhtự gene chuột được sử dụng để màn hình khác nhau RNA mẫu cho sự biểu hiện củagen, lịch sự của Yanxia Hào và Christopher Barker, The Gladstone David J. ViệnGenomics Core Phòng thí nghiệm, San Francisco

Page 225: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

224

Hình 9.4. Microarray dùng để xác định thông qua con đường trao đổi chất. (A)Một microarray hệ gen nấm men trong đó RNA từ các tế bào phát triển trong môitrường giàu glucose được gắn nhãn Cy3 (màu xanh) và RNA từ tế bào phát triển trongmôi trường ít glucose được dán nhãn với Cy5 (màu đỏ). (B) Tái lập quá trình chuyểnhóa trong suốt diauxic shift. Các gen mã hóa các enzym làm tăng màu đỏ bởi các yếutố thể hiện trong diauxic shift, trong khi đa số là làm giảm màu xanh. Các mũi tên đỏcho thấy các bước trong con đường trao đổi chất có gen mạnh được suy ra dựa vào sựsuy giảm glucose. Những con số này đã được cung cấp bởi Joe DeRisi (UC SanFrancisco) và được tái bản với sự cho phép từ DeRisi, Iyer và Brown (1997). Bảnquyền 1997 của Hiệp hội Mỹ về sự tiến bộ của khoa học.

Khoảng 30% của các gen trong bộ gen cho thấy thay đổi các cấp độ sự biểu hiện.Những gen này được biểu hiện một trong hai chiều lên hoặc xuống, quy định bởi ítnhất một yếu tố trong hai yếu tố được so sánh với các vật liệu khởi đầu. Sự thay đổitrong quá trình trao đổi chất trong đó glucose bị suy giảm được tương quan với nhữngthay đổi rộng rãi trong các biểu hiện của gen liên quan đến nhiều quá trình cơ bản củatế bào, ví dụ: sự trao đổi chất carbon, tổng hợp protein và lưu trữ carbohydrate. Tuynhiên, ~ 50 phần trăm của các gen có sự biểu hiện khác nhau được xác định bởi các vidàn không có chức năng phân tích đã miêu tả trước đó.

Biểu hiện sự khác biệt giữa các tế bào bình thường và ung thư. DNA microar-rayđã được sử dụng rộng rãi để mô tả gen được biểu hiện khác nhau trong các tế bào ungthư. Ví dụ, việc phân tích ~ 5500 gen biểu hiện ở tế bào biểu mô vú của người bìnhthường được so sánh với những biểu hiện trong mô ung thư vú (Perou và cộng sự,1999.). Điều này đã cho phép bộ gen được xác định có thể sẽ được tham gia vào quátrình tăng sinh tế bào trong quá trình phát triển ung thư. Một công dụng quan trọng củavi dàn trong điều trị ung thư là việc phân loại các tế bào ung thư dựa trên các gen màchúng biểu hiện. Ví dụ, việc phân nhóm trước đây không xác định các tế bào khối u áctính có thể được thực hiện thông qua mô hình biểu hiện gen của chúng(Bittner và cộng

Page 226: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

225

sự, 2000). Những phân nhóm (hình 10.5) có thể được sử dụng để dự đoán kết quả lâmsàng của từng melanomas riêng biệt sẽ không được nếu không có thể. Việc phân tíchso sánh các gen tương tự với kết quả lâm sàng cũng đã được thực hiện cho một loạtcác bệnh ung thư vú (Sorlie và cộng sự, 2001.).

Page 227: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

226

Các đặc tính của bệnh ung thư da ác tính dựa trên hồ sơ về sự biểu hiện gen củachúng. Xem văn bản sẽ cho biết chi tiết. Hình minh họa của Mark Bittner (TheNational Human Genome Research Institute, NIH, USA), in lại với sự cho phép từNature (Bittner và cộng sự, 2000) bản quyền (2000) Các nhà xuất bản Macmillan Ltd.

Xác định loại tế bào. Các tế bào gốc, vấn đề sẽ thảo luận chi tiết hơn trongChương 13, khác với các tế bào khác nhất là ở động vật có vú, chúng có cả hai khảnăng tự đổi mới và có thể biệt hóa thành nhiều loại tế bào khác nhau. Các đặc tính tốtnhất của tế bào gốc đã được phân lập từ ba ngồn chính là từ mô phôi, thần kinh và tạomáu (Blau, Brazelton và Weimann, 2001). Sử dụng vi dàn, bản sao sơ lược của các loạitế bào gốc khác nhau đã cho thấy sự hiện diện của khoảng 200 gen được thể hiện trongcác tế bào gốc khác nhau mà không thể hiện trong các tế bào khác biệt (Ivanova và cộngsự, 2002;. Ramalho-Santos và cộng sự, 2002). Những gen này có thể mô tả một chươngtrình độc đáo về di truyền cho phép các tế bào có chức năng như tế bào gốc.

DNA microarray cung cấp cơ hội để phân tích sự biểu hiện của hàng ngàn gentrong một thí nghiệm duy nhất. Đã thực hiện, tuy nhiên, bị một số thiếu sót. Ví dụ,giống như tất cả các thí nghiệm chúng tôi đã thảo luận dựa trên acid nucleic lai, sự laichéo ở các trình tự tương tự cao có thể chứng minh một cách mơ hồ, khó giải quyêt.Các dữ liệu thu được từ thí nghiệm vi dàn phải được xác nhận bởi nhiều thí nghiệm

Page 228: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

227

phân tích biểu hiện gen truyền thống. Ngoài ra, độ nhạy tổng thể của thí nghiệm vi dànlà không cao. Thay đổi trong các biểu hiện của một gen duy nhất thường có thể đượcphát hiện nếu thay đổi bởi một, hai hoặc nhiều yếu tố xảy ra. Thay đổi khôn khéotrong sự biểu hiện, có thể có vai trò quan trọng sinh lý, có thể không bị phát hiện trongkhi phân tích vi dàn. Tất nhiên, việc sản xuất của một số protein không phải là quyđịnh ở mức độ phiên mã. Ví dụ, gen mã hóa phiên mã nấm men kích hoạt Gcn4p đượcquá trình phiên mã lập thành, nhưng việc sản xuất các protein được kiểm soát ở cấp độcủa sự dịch chuyển để đáp ứng với việc thiếu axit amin(Hinnebusch, 1997). Cuốicùng, số lượng tuyệt đối của dữ liệu được tạo bởi vi dàn đã dẫn đến khó khăn trongcách phân tích các thông tin,và được lưu trữ trong một định dạng dễ sử dụng. Cơ sở dữliệu của dữ liệu vi dàn đã được công khai và chuẩn hóa(chẳng hạn http://www.dnachip.org) cho phép kiểm tra vi mạng để xem gen mà bạn muốn là như thếnào và gen đó được quy định trong các điều kiện cụ thể.9.1.3 ChIP và mọi thứ có thể thực hiện

Trong điều kiện tự nhiên, những gen được biểu hiện là do các yếu tố trong quátrình phiên mã của gen điều chỉnh, kiễm soát và quyết định. Qua những thực nghiệmsinh hóa đã xác định được một số vị trí của DNA có ảnh hưởng đến quá trình phiên mã(ví dụ nhưng DNA footprinting hay gel retardation ). Kết quả là gen kiểm soát quátrình phiên mã đã được tìm thấy ở vị trí của đoạn DNA trong vùng promoters của gen.Tuy thành công trong việc tìm ra chức năng của đoạn gen mục tiêu, nhưng từ trongthực tế cho thấy nhiều yếu tố liên quan đến quá trình phiên mã có liên qua đến một sốbệnh từ DNA thì xảy ra thường xuyên hơn trong bộ gen hơn là so với những đoạn genđược điều chỉnh bởi protein. Để xác định chính xác những vị trí DNA có mối liên quanđến các yếu tố phiên mã mà chúng thực sự có ảnh hưởng đến tế bào. Chromatinimmunoprecipitation (ChIP) là một trong những phương pháp được thiết kế để làmviệc đó (Strahl-Bolsinger và cộng sự, 1997). Nuôi cấy những tế bào được xử lý bằngformaldehyde, đó là một tác nhân gây ra việc liên kết ngang, nó đính kèm vào proteinvà để cho quá trình sonication cắt DNA ra thành những đoạn nhỏ khoảng 500bp. Quátrình đó không làm ảnh hưởng đến những mối liên kết ngang của formaldehyde, do đóprotein vẫn còn gắn liền với các vị trí DNA tương đồng. Sau đó những đoạn DNA bịức chế bởi các protein đặc biệt bị tách ra thông qua sự tương tác của protein đó vớimột kháng thể được đưa ra để chống lại nó. Các phức hợp kháng thể và kháng nguyêntạo thành tủa bằng cách sử dụng các hạt có thể liên kết với các kháng thể. Nâng nhiệtđộ của các mẫu immunoprecipitated đến 650C và để yên trong khoảng thời gian từ 12– 18 giờ, kết quả của quá trình này là liên kết ngang của formandehyde bị bẽ gãy vàcũng là kết quả của việc tách ra của DNA từ phức hợp DNA với protein. Sự hiện diệncủa các trình tự promoter trong quá trình immunoprecipitated có thể được kiểm trabằng cách sử dụng PCR. Sử dụng các mồ cụ thể đối với promoters của các gen đặcbiệt sau đó được sử dụng để phát hiện sự hiện diện của trình tự DNA cụ thể trong phầnkết hợp kháng thể của DNA (Hecht và Grunstein, 1999). Phản ứng dương tính củaPCR là một dấu hiệu cho thấy 1 hoặc nhiều vị trí liên kết với protein mà kháng thểđược làm tăng lên với sự có mặt của promoter hiện đang được thử nghiệm.Thông qua

Page 229: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

228

việc thiết kế chương trình chạy PCR, những phần tương đối của những vị trí đặc biệtcủa promoter có thể được xác định. Ngoài ra, chúng ta có thể biết được những thay đổitrong vị trí promoter hay những biến đổi một số điều kiện bên trong tế bào thông quanhững biến đổi về cường độ của các sản phẩm PCR. Phân tích CHIP là một cách tối ưuđể xác định những điểm đặt biệt của DNA liên kết với Protein ở vị trí promoter. Tuynhiên, kỹ thuật này sẽ hữu ích hơn khi kết hợp với các microarray chip để nhận dạngcác vị trí protein liên kết trên quy mô toàn bộ gen.

Các đoạn DNA liên kết với một protein quan tâm được làm tăng thêm bằng cáchimmunoprecipitation với một kháng thể cụ thể. Sau khi bẽ gãy các liên kết ngang, làmtăng lượng DNA được khuếch đại và được đánh dấu bằng các chất nhuộm huỳnhquang (Cy5). Một mẫu DNA không được khuếch đại bằng cách immunoprecipitationthì được đánh dấu bằng một thuốc nhuộm huỳnh quang khác ( Cy3), và một hỗn hợpcác vùng chứa được làm gia tăng hay không làm tăng DNA được đánh dấu lai với mộtmicroarray có chứa tất cả trình tự hoạt động và promoter của DNA).

Điều này lần đầu tiên được sử dụng để xác định các vị trí liên kết di truyền củahai yếu tố phiên mã trên nấm men, Gal4p và Ste12p (Ren và cộng sự, 2000). Ba genmục tiêu chưa biết rõ sự biểu thị đặc trưng cho Gal4p đã được xác định bằng cách sửdụng phân tích CHIP-on-chip. Sau đó, các vị trí liên kết cho (và của suy luận các genquy định) 106 hoạt hoá men phiên mã đã được xác định (Lee và cộng sự, 2002). Mộtsố thí nghiệm khác đã mở rộng việc phân tích nhân tố phiên mã của các vị trí liên kếtcủa côn trùng (Berman và cộng sự, 2002) Và đối với tế bào của con người (Weinmannvà cộng sự, 2002). Có lẽ do tình cờ với kiểu phân tích này đã thể hiện được nhiều gentrong sinh vật nhân chuẩn có cấp độ cao hơn đó là có sự phối hợp thể hiện từ các yếutố phiên mã cùng một vị trí liên kết được đặt ở những vị trí bên cạnh nhau trên bộ gen(Roy và cộng sự, 2002). Tầm quan trọng của phát hiện này hoàn toàn không được hiểurõ, nhưng có nhiều đề nghị cho rằng với một cấp bậc cao hơn của tổ chức gen trong bộgen có thể sẽ trở nên phức tạp hơn trong việc kiểm soát sự biểu hiện của chúng.9.2 PROTEIN CHỨC NĂNG TRÊN QUY MÔ TOÀN BỘ GEN

Hiểu biết những gì được những thể hiện của gen trong tế bào ở bất kỳ thời giancụ thể cung cấp rất nhiều thông cần thiết, nhưng nó không cung cấp thông tin để tìm racác chức năng của các sản phẩm do gen cụ thể tạo ra . Do đó phương pháp được đưa rađể phân tích hàm lượng protein ở mức độ toàn bộ hệ gen. Dựa vào một trong hai tácnhân gây ảnh hưởng đến gen để các protein đặc biệt được loại bỏ khỏi tế bào, hoặc lậpbản đồ tương tác giữa các bộ phận của các protein.9.3 KNOCK-OUT ANALYSIS

Mặc dù qua nhiều thập kỷ để phân tích di truyền 1 cách rộng rãi, chỉ khoảng 1phần 3 của khoảng 6000 gen trong hệ gen của nấm men không có mang chức năng.Việc loại bỏ 1 sản phẩm gen đơn lẻ từ bộ gen có thể mang lại những manh mối quantrọng để biết rõ các chức năng của gen thông qua việc phân tích kiểu hình của các thểđột biến.

Trong nhiều năm, các nhà nghiên cứu đã có thể tách các gen riêng lẻ trong tế bàonấm men bằng cách tái tổ hợp tương đồng (Rothstein, 1983). Quá trình này, xảy ra ở

Page 230: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

229

tần số cao trong men, thay thế một gen mục tiêu với một kiểu gen có kiểu hình lựachọn. Một đoạn DNA tuyến tính mang gen lựa chọn được xây dựng như vậy mà nóđược bao quanh ở 5’ của nó-và 3’-kết thúc ít nhất 50 bp của chuỗi bắt nguồn từ gen bịphá vỡ. Biến đổi của nấm men với đoạn DNA, mà không thể tái tạo độc lập, kết quả làsự hội nhập vào hệ gen ở vị trí chính xác của các trình tự tương đồng. Do đó, các genmục tiêu ban đầu được đặt giữa các trình tự tương đồng, sẽ được loại bỏ và thay thếbằng gen lựa chọn. Sự giải thích của toàn bộ trình tự bộ gen nấm men đã dẫn đến sựrối loạn hệ thống của mỗi gen (Winzeler và cộng sự, 1999.). Phương pháp được sửdụng liên quan đến kĩ thuật PCR để tạo ra đột biến xóa ở mỗi gen từ codon bắt đầu đếncodon dừng của nó. Trong quá trình xóa, mỗi gen mục tiêu được thay thế bằng mộtcassette KanMX (Wach và cộng sự, 1994.). Cassette này chứa các ORF KANR của E.coli Tn903transposon kết hợp để tự kiểm soát phiên mã và dịch mã ở gen TEF củanấm sợi Ashbya gossypii. Việc chèn cassette vào hệ gen của nấm men cho phép lựachọn hiệu quả của biến nạp kháng thể với các kháng sinh geneticin (G418).

Sự gián đoạn của một gen có thể dẫn đến một trong các kiểu hình sau đây.Gây chết: Các tế bào bị xóa không thể phát triển. Gen này là rất cần thiết đối với

một số phần của quá trình tăng trưởng. Gen cần thiết trong nấm men có thể được phânbiệt bởi cách thức mà họ phân biệt trong quá trình hình thành bào tử.

Kiểu ban đầu: Không có sự khác biệt phát hiện giữa các đột biến và ban đầu. Nếukhông có sự khác biệt có thể được phát hiện dưới nhiều điều kiện, nó có thể cho thấyrằng gen khác có khả năng bồi thường thiệt hại, hoặc điều kiện cụ thể chưa được tìmthấy ở những bị trí bị xóa có thể thay đổi kiểu hình.

Tăng trưởng khác biệt. Chủng bị xóa có thể phát triển chậm hơn (hoặc nhanhhơn) so với chủng ban đầu chưa được thay thế. Một mức tăng trưởng khác nhau trongthử nghiệm, dưới mỗi điều kiện khác nhau, sau đó có thể được sử dụng để xác định vaitrò tiềm năng của protein mã hóa bởi các gen này

Việc phân tích những đột biến và gián đoạn của nấm men cho thấy gần 20 phầntrăm gen trong hệ gen của nấm men cần thiết cho sự tăng trưởng trên môi trường giàuđường và, ở một mặt khác, sự gián đoạn ở mức 15% đã có một ảnh hưởng trên kíchthước tổng thể hoặc hình thái của tế bào (Giaever và cộng sự, 2002). Sàng lọc như thếnày là khá thô thiển để xác định chức năng của các gen riêng lẻ, nhưng phân tích khácnhau về bộ gen cần thiết cho sự tăng trưởng trong những điều kiện khác nhau có thểđược nhiều thông tin hơn. Ngoài ra, việc phân tích các đột biết xóa có thể được kếthợp với một số biểu hiện sơ lược của gen. (microarrays, xem ở trên) để so sánh cácmẫu biểu hiện, chủng ban đầu và các chủng đột biến với nhau để cung cấp thêm cáchiểu biết về chức năng của gen. Ví dụ, việc xoá vùng ức chế phiên mã TUP1, kết qủalà tăng 3% mức độ phiên mã của các ở gen nấm men (DeRisi, Iyer và Brown, 1997).Những gen này có thể sẽ được áp dụng như protein TUP1 trong các tế bào ban đầu.

Bước đầu tiên: tách các gen trong nấm men. Sự biến đổi của nấm men vớimột đoạn DNA tuyến tính có chứa một gen lựa chọn (URA3 là một phần của các uraciltrong con đường sinh tổng hợp) bên sườn của trình tự DNA của bộ gen được chèn tại

Page 231: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

230

các vị trí tương đồng ở trong khu vực của bộ gen (biểu thị bằng các đường nét đứt). Cácgen giữa các trình tự tương đồng được loại bỏ và thay thế bằng các gen lựa chọn

9.4 ANTISENSE VÀ RNA INTERFERENCE (RNAi)Việc xây dựng gen Knockouts ở sinh vật nhân chuẩn hoặc cao hơn không

đơn giản như mô tả ở trên cho nấm men, kết quả tái tổ hợp tương đồng thấp, hoặcthiếu sự phù hợp về mặt di truyền. Đối với một thời gian, tuy nhiên, điều đó đã đượcbiết rằng sự biểu hiện của 1 antisense RNA (đại diện cho 1 chuỗi có thể bắt cặp bổsung với mRNA) và có thể ức chế sự biểu hiện của gen (Green, Pines và Inouye,1986). Trình tự của antisense có thể được sản xuất trong các tế bào bằng cách đảongược trình tự mã hóa của một gen đối với promoter của nó như là sợi bổ sung đượcphiên mã.

Sự hình thành của một base mạch đôi RNA-ghép nối giữa các mRNA vàantisenseRNAis nghĩ là can thiệp vào quá trình dịch mã và phiên mã của RNA, và cácprotein được mã hóa sẽ không được tổng hợp hay tổng hợp ít đi. Ví dụ, cây cà chuabiểu hiện một antisense polygalacturonaza của các gen tạo sản phẩm tham gia vào việclàm mềm và chín quả, từ đó sản xuất khoảng năm phần trăm polygalacturonaza proteinbình thường vào quả và làm cho quả có thời gian chín lâu hơn và sức đề kháng các vếtthâm tím tăng lên ( Smith và cộng sự, 1988).

Những biểu hiện của RNA trong các tế bào, hoặc quá trình đưa cácoligonucleotides antisense vào các tế bào, có thể có tác động rất lớn đến việc sản xuấtcác protein được mã hóa bởi các mRNA tương ứng. Tiêm một chất cảm ứng antisensebiểu hiên tuyến tính vào tế bào có thể làm cho đoạn gen có biểu hiện không hoạt động.Ví dụ, các biểu hiện của antisense RNA từ tetracycline gây cảm ứng với promoter và(xem Chương 8) có thể gây ra sự ức chế đặc trưng trong việc sản xuất protein với sựhiện diện của tetracycline (Handler và Iozzo, 2001). Hiệu quả sự ức chế của antisense

Page 232: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

231

có thể rất khác nhau giữa các loài và các gen đặc biệt, các trình tự antisense cụ thể cóthể dẫn đến việc ức chế sự sản xuất của các protein cụ thể (Cohen, 1991).

Nó cũng đã được phát hiện ra rằng sự biểu hiện của gen đặc biệt trong một loạtcác sinh vật nhân chuẩn có thể bị giảm đáng kể thông qua việc đưa vào các phân tửRNA sợi kép vào các tế bào. Hiện tượng này, được gọi là can thiệp RNA (RNAi), lầnđầu tiên được nhận thấy là trong quá trình thử nghiệm tiêm RNA vào giun trònCaenorhabditis elegans. Việc tiêm mỗi một mẫu dò hoặc các sợi antisense RNA củamột gen đặc biệt vào cơ thể thì mức độ biểu hiện của gen chỉ giảm đi rất ít. Tuy nhiên,nếu ta tiêm cả hai là sợi antisen RNA và mẫu dò vào cơ thể thì sẽ làm giảm một giảmsự biểu hiện của gen xuống rất nhiều (Fire và cộng sự, 1998).

Một số quan sát khác có được từ thực nghiệm đã được thực hiện.Việc tiêm RNA sợi đôi cho những gen cụ thể vào C. Elegans gây ra một sự biến

mất một số sản phẩm ở một số gen cụ thể tương ứng từ tất cả các tế bào soma và đếnđời F1. RNA sợi đôi có khả năng ức chế chức năng của gen ở một tầm xa từ chỗ tiêmvà xuất hiện để có thể vượt qua ranh giới của tế bào, điều đó cho thấy một phân tử nhỏcó khả năng khuếch tán và có trách nhiệm ức chế những ảnh hưỡng.

Chỉ có các trình tự mạch đôi RNA từ exon mới có ảnh hưởng đến quá trình tổnghợp protein và các trình tự từ intron thì không có khả năng đó.

Trình tự RNA sợi đôi tương đối nhỏ - ít hơn so với các trình tự của toàn bộ gen-có hiệu quả tắt quá trình sản xuất protein mã hóa bởi các mRNA tương ứng

Một lượng rất nhỏ các RNA sợi đôi, và chỉ có một vài phân tử RNA sợi đôitrong mỗi tế bào, được yêu cầu để ức chế quá trình tổng hợp protein, từ đó cho thấymột quá trình xúc tác hoặc khuếch đại đã xảy ra.

RNAi còn có thể được biểu hiện trong C. elegans qua quá trình thực bào sợi đôiRNA. Tế bào Ecoli có biểu hiện của RNA sợi đôi khi được cho giun ăn, và 40-80 %giun cho thấy các kiểu hình cụ thể liên quan tới sự im lặng (Timmons, Court, 2001).RNA im lặng đã được sử dụng rộng rãi để phân tích chức năng của các gen trong giunC. elegans. Sự im lặng có thể dễ dàng đạt được và hiệu quả tổng thể của nó đã trởthành 1 công cụ có đầy quyền năng trong phân tích gen. C. elegans có sáu nhiễm sắcthể, và hầu như tất cả các gen trên hai trong số 6 nhiễm sắt thể này đã bị loại bằng cáchsử dụng RNA (onczy và cộng sự, 2000;. Fraser và cộng sự, 2000). Kết quả Knock-outscủa 1 số gen trong việc không hình thành phôi hoặc kiểu hình gây chết làm cho phântích thêm phần khó khăn, nhưng nhiều gen khác có thể được cho là chức năng khácnhau dựa trên loại phân tích này (Kamath và cộng sự, 2003).

Như với sự giới thiệu của RNA, sợi kép các phân tử RNA cũng có thể được sảnxuất bên trong tế bào thay vì được bổ sung. Ví dụ, trong trypanosomes, plasmid tíchhợp đã được xây dựng trong đó một gen trypanosome đang được tetracycline (Tet)kiểm soát và phiên mã một đầu đến đầu đoạn gen với một miếng đệm giữa các đoạn đểtổng hợp một sợi đôi RNA mà gây ra can thiệp vào RNAi (Shi và cộng sự, 2000). Banđầu, người ta nghĩ rằng can thiệp RNA có thể bị giới hạn trong phạm vi của nó nhưngkể từ khi sự biểu hiện của sợi đôi RNA trong tế bào động vật có vú các xuất hiện ở hầuhết các kết quả thì mức độ làm giảm mức độ tổng hợp protein cao hơn khi so với sự

Page 233: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

232

ảnh hưởng một gen cụ thể (Hope, 2001).Tuy nhiên, nó đã được tìm thấy thì sau đó làsự biểu hiện của RNA có 21 nucleotide, gọi là RNA ức chế nhỏ(siRNAs), kết hợp vớiviệc đó để họ có 2 nucleotide 3 - chồng lên nhau, để có thể giảm sự biểu hiện của cácgen cụ thể trong các tế bào động vật có vú (Elbashir và cộng sự, 2001). Việc ức chế cácquá trình tổng hợp do sự can thiệp của RNA ở tế bào động vật có vú thường không lớnnhư ở ruồi hay sâu, nhưng can thiệp RNA có tiềm năng lớn để xác định chức năng gen ởtrong một loạt những sinh vật khó chữa trị mà có liên quan đến cấu trúc di truyền.9.5 SÀNG LỌC 2 CON LAI TOÀN BỘ HỆ GEN

Chúng tôi đã thảo luận việc sử dụng sự sàng lọc 2 con lai (hệ thống 2 con lai) đểphát hiện protein cụ thể-protein tương tác và sao chép các đối tác tương tác tiềm năngtừ các thư viện cDNA (Chương 6). Để thực hiện các loại phân tích này trên quy môtoàn bộ gen yêu cầu mọi thể 'mồi' (hình 6.8) được thử nghiệm chống lại mọi "con mồi"tiềm năng từ một sinh vật để cho một protein hoàn chỉnh-bản đồ protein tương tác chosinh vật có thể biết được nguồn gốc. Hơn nữa, nếu tất cả các gen trong bộ gen đã đượcxác định qua phân tích trình tự, sự cần thiết phải xây dựng và sàng lọc một thư việncDNA phức tạp là không cần. Một cách tiếp cận có hệ thống hơn là để nhân bản vàphân tích riêng từng gen mã hóa protein trong hệ gen. Vì vậy, trong trường hợp của sựsàng lọc 2 con lai, mỗi gen mã hóa protein tiềm năng phải được hợp nhất, đọc đúngtrong khung, để mã hóa miền kích hoạt phiên mã. Trong trường hợp của nấm men,khoảng 6.000 plasmid riêng lẻ phải được xây dựng để tất cả các mồi có thể được kiểmtra. Điều này không có nghĩa là một công việc tầm thường. Nhân bản vô tính trênthang điểm này có thể đạt được, tuy nhiên, thông qua việc khuếch đại PCR của gennấm men ~ 6000 từ ADN hệ gen bằng cách sử dụng một mồi cụ thể đối với từng gen(hình 10,9). Các đoạn mồi được xây dựng sao cho mỗi mồi phía trước có đuôi 5' chungcủa 20 nucleotide, và mỗi mồi ngược lại đã có một đuôi chung khác nhau. Các đuôichung sau đó có thể phục vụ như là các mồi cho vòng thứ hai của PCR sử dụng mồiđơn cài đặt cho tất cả các sản phẩm 6000 ~ PCR (Uetz và cộng sự, 2000.). Trong vònghai của PCR, mỗi sản phẩm khuếch đại 50 bp trình tự chung thêm vào đuôi 5'củachúng và 50 bp trình tự chung khác gắn vào đuôi 3'của chúng. Các sản phẩm PCR sauđó được trộn với một plasmid tuyến tính có chứa những trình tự chung này ở hai đầucủa nó và chuyển thành tế bào nấm men. Trong nấm men, các trình tự thông thườngtrong các sản phẩm PCR trải qua tái tổ hợp tương đồng với các plasmid tuyến tính đểchuyển thành một plasmid tròn mà sau đó có thể nhân rộng. Điều này dẫn đến trongquá trình chèn của từng sản phẩm PCR, và gen mã hóa, vào plasmid nấm men màkhông cần thao tác với DNA bổ sung. Tương tự như phương pháp tách dòng độc lậpcũng đã được nghĩ ra để xây dựng plasmid trong tế bào E. coli (Donahue, Turczyk vàJarrell, 2002). Một lần xây dựng, ~ 6000 chủng nấm men sản xuất miền kích hoạtphiên mã khác nhau (con mồi), sau đó có thể được giao phối với một chủng nấm menduy nhất thể hiện một mồi duy nhất (hợp nhất với một miền DNA liên kết) để tạo ramột loạt các tế bào nấm men lưỡng bội là tất cả sản xuất một mồi duy nhất và sản xuấtriêng rẽ một con mồi khác nhau. Như vậy tất cả các đối tác tiềm năng tương tác củamột mồi duy nhất có thể được xác định trong một thí nghiệm (hình 10,10). Các dữ liệu

Page 234: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

233

thu được bằng cách lặp lại sự sàng lọc bằng cách sử dụng mồi khác nhau có thể đượcsử dụng để xây dựng một bản đồ protein-protein tương tác toàn diện (Uetz và cộng sự,2000.). Đến nay, các bản đồ trong cách thức này chỉ được sản xuất cho các proteintương tác xảy ra bên trong tế bào nấm men, nhưng thông tin quan trọng về số lượngcác hợp protein khác nhau mà tồn tại bên trong tế bào đã xuất hiện. Nhiều vấn đề củasàng lọc 2 con lai mà chúng tôi thảo luận trong Chương 6 cũng được áp dụng ở đây.

Hình 9.9. Việc xây dựng các plasmid sản xuất protein mồi khác nhau để sử dụng trong sàng lọc 2con lai toàn bộ gen. Các gen được khuếch đại bằng cách sử dụng mồi có chứa các trình tự chungở đuôi 5’. Điều này cho phép sự tái khuếch đại của chúng lại sử dụng một cặp hai mồi như vậy màtất cả các gen được đánh dấu tại đuôi 5’ và 3’ của chúng (Hudson và cộng sự, 1997). Các genđược đánh dấu này sau đó được trộn với một plasmid tuyến tính và chuyển đổi thành nấm men.Tái tổ hợp tương đồng giữa các plasmid và sản phẩm PCR xảy ra trong tế bào nấm men thôngqua bổ trợ giữa các chỗ đánh dấu và các đầu của các plasmid tuyến tính. Điều này dẫn đến sựchèn của sản phẩm PCR vào plasmid và sự sản xuất tiếp theo là của protein con lai

Page 235: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

234

9.6 NHỮNG ĐOẠN DÒ TÌM PROTEINThay vì dựa vào sự hiện diện của một bản sao RNA để suy ra sự có mặt hay vắng

mặtcủa một protein trong một tế bào đặc biệt, cách tiếp cận tốt hơn là để phát hiện sựhiện diện của protein trực tiếp. Có lẽ một cách tiếp cận thậm chí còn nghiêm ngặt hơnsẽ là để phát hiện các hoạt động của các protein, sản xuất riêng rẽ bởi một tế bào(Kodadek, 2002). Việc phát triển các xét nghiệm protein, giống như các đối tácmicroarray DNA của chúng, vẫn còn trong giai đoạn phôi thai. Một số chíp nhận dạngProtein, tuy nhiên, đó là các protein đã có sẵn (Fung và cộng sự, 2001). Đây được baogồm những phối tử, ví dụ như các kháng thể hoặc các phân tử nhỏ, nhúng vào một bềmặt như vậy mà chúng đang cố định, nhưng vẫn có thể ràng buộc cụ thể với protein.Những đoạn trích Tế bào này sau đó được rửa qua bề mặt của chíp và những Proteinranh giới có thể được phát hiện bởi sự phân tích quang phổ khối lượng...9.7 CẤU TRÚC HỆ GEN

Tầm quan trọng của cấu trúc sinh học trong việc thúc đẩy sự hiểu biết về quátrình phân tử có thể không được quy định rõ ràng. Khả năng hình dung những phân tửprotein ba chiều với mức độ phân giải cao hiểu biết của chúng rất lớn vào cơ chế củahành động đó không thể có nếu không thu được.

Sự quyết định cao về cấu trúc thu được thường sử dụng một trong hai phươngpháp kết tinh X-ray hoặc cộng hưởng từ hạt nhân (NMR). Trong cả hai trường hợp,sựquyết định về cấu trúc có thể mất nhiều thời gian và công sức.Các cấu trúc protein đầutiên được giải quyết bằng X-ray là những protein của myoglobin và haemoglobin.MaxPerutz bắt đầu làm việc trên cấu trúc của hemoglobin (trọng lượng phân tử 67 kDa)vào năm 1936 và cuối cùng giải quyết cấu trúc vào năm 1959 và công bố năm 1960.Những ngày này, xác định cấu trúc protein bằng X ray thì nhanh hơn nhiều, chủ yếu là

Hình 10.10: Sàng lọc 2 con lai để xác định protein-protein tương tác. Tế bào nấm men, từngsản xuất một loại protein mồi đơn (trong trường hợp này Pcf11p hợp nhất với miền DNA liênkết của Gal4p), đã được giao phối với một trong 6000 sản xuất một con mồi khác nhau (hợpnhất vào miền kích hoạt phiên mã của Gal4p) và phát triển trong 384 sơ đồ chuẩn độ tốt vimô. Sự tăng trưởng của nấm men sẽ chỉ xảy ra trong điều kiện chọn lọc, nếu một sự tươngtác giữa các mồi và con mồi xuất hiện để kích hoạt các phiên mã của gen phóng. Các gen thểhiện trong bảng phía dưới là những con mồi Fusions có tiềm năng tương tác với Pcf11p.Hình ảnh của Stan Fields (Đại học Washington), in lại với sự cho phép từ Natural (et alUetz., 2000) bản quyền xuất bản Macmillan Ltd 2000

Page 236: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

235

do tiến bộ trong khả năng tính toán, nhưng vẫn còn phụ thuộc vào rất nhiều các kỹthuật mà Perutz và các đồng nghiệp đã khám phá. Nhìn chung, cả hai X-ray và NMRphụ thuộc vào giá trị của một lượng lớn protein tinh sạch cao.

Theo truyền thống, cấu trúc protein đã được giải quyết trên cơ sở từng phần. Cóngười làm việc trên một protein sinh học thú vị thấy rằng họ có thể sản xuất số lượnglớn và sau đó cố gắng phân tích cấu trúc.Giá trị của trình tự bộ gen , tuy nhiên, đềnghị một phương pháp khác thay thế để giải quyết các protein cấu trúc, chỉ dựa vào bộgen trình tự DNA (Hình 9.11). Phương pháp này hiện đang được cố gắng trên một loạtcác sinh vật được sắp xếp theo trình tự. Phân tích loại này chỉ có thể thực hiện đượcthông qua việc tự động hóa của gần như mọi phần của sơ đồ xác định cấu trúc thể hiệntrong hình10.11.ví dụ, 1376 -1877 gen (73%) của vi khuẩn ưa nhiệt Thermotogamaritime đã được nhân bản vô tính vào một vector biểu hiện E.coli, như vậy mà cácprotein được sản xuất mang một tag poly-histidine (Chương 8). 542 các dòng vô tínhđã có thể sản xuất đủ protein tinh sạch để cố gắng kết tinh, và các điều kiện kết tinhthành công đã được xác định cho 432 protein, chiếm 23% T.maritime proteome. Đó làkhông phải tất cả của những tinh thể này sẽ mang cấu trúc protein, dẫn đến tiêu haohơn nữa. Dữ liệu trên cho thấy rằng trở ngại lớn để xác định cấu trúc thành công là giátrị của các protein tinh sạch được sản xuất bằng cách sử dụng protein tinh chế. Nhiềuprotein được sản xuất theo những phương pháp tổng hợp như thế này sẽ không hòatan và do đó không tuân theo sự phân tích cấu trúc. Những giới hạn màng protein vànhững thứ khác có thể có hại cho tăng trưởng tế bào E coli có thể khó khăn để sảnxuất. Một phương pháp khác là làm những protein để phân tích cấu trúc in vitro, nơicác vấn đề tế bào liên quan có thể được khắc phục. Trong phiên mã in vitro / dịch mãcác hệ thống đã được sử dụng chung nhiều năm.

Nói chung chúng hoạt động bằng cách sử dụng DNA plasmid trong đó các genđược thể hiện là nhân bản vô tính cùng dòng của một vị trí RNA polymerase liên kếthoạt hóa, ví dụ T7 hoặc SP6. plasmid này sau đó được trộn với một hình thức tái tổhợp của polymerase để sản xuất RNA.RNA được dịch mã in-vitro bằng cách sử dụngtế bào hình thành từ một trong hai E.coli hoặc tế bào thỏ (Turner và Foster, 1998) tuynhiên,. giới hạn trong số lượng protein mà có thể sản xuất được và thường sẽ không đủđể phân tích cấu trúc. Hệ thống cùng phiên mã / dịch mã gần đây đã được phát triển,nơi mà phản ứng xảy ra trong một khoảng không tách khỏi chất nền và các thành phầnnăng lượng cần thiết cho một phản ứng ổn định thông qua một màng bán thấm.Phiênmã và dịch mã có thể xảy ra đồng thời trong khoảng không phản ứng, trong khi ức chếphản ứng các sản phẩm được pha loãng bằng cách khuếch tán qua màng vào khoảngkhông.Điều này có thể dẫn đến mức độ biểu hiện protein bằng cách cho phép proteintổng hợp để tiếp tục trong thời gian dài đến 24h.

Cấu trúc bộ gen hứa hẹn sẽ gia tăng đáng kể kiến thức của chúng ta về các loạinếp gấp protein mà polypeptide có thể chấp nhận.Nguy hiểm là chỉ có những proteinđó hoặc rất dễ kết tinh, hoặc là phù hợp nhỏ để có thể nghiên cứu bằng NMR, sẽ cócấu trúc của chúng được giải quyết.những cố gắng sẽ vẫn còn được yêu cầu để phântích những quan tâm về mặt sinh học, nhưng cấu trúc khó, protein.

Page 237: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

236

Chương 10Kỹ thuật tế bào động vật

Những khái niệm chính Các tế bào nhân chuẩn cao thì việc nuôi cấy là tương đối khó khăn - hầu hết các

tế bào sẽ chỉ chia một vài lần trước khi chết Dòng tế bào bất tử có thể được sản xuất sau khi chuyển đổi virus DNA ngoại lai có thể được đưa vào (transfected) các tế bào nuôi cấy bằng cách

sử dụng nhiều loại hóa chất, phương pháp vật lý hoặc virus.Không giống như các tế bào thực vật, hầu hết các tế bào động vật hoặc là đã

hoàn toàn khác biệt hoặc đã được xác định qua con đường biệt hóa cụ thể. Do đó, tếbào động vật mà được chuyển vào DNA ngoại lai thì không thể dễ dàng được sử dụngđể tái tạo toàn bộ động vật. Một ngoại lệ rõ ràng cho điều này là việc tạo ra các độngvật nhân bản từ tế bào trưởng thành bằng cách sử dụng chuyển giao công nghệ hạtnhân. Chúng ta sẽ thảo luận về chuyển giao hạt nhân ở độ sâu hơn trong Chương 10,nhưng ở đây chúng ta sẽ tập trung vào các phương pháp để giới thiệu DNA vào trongtế bào soma và đặc biệt vào các dòng tế bào động vật được nuôi cấy.10.1. Nuôi cấy tế bào

Để thiết lập một tế bào động vật nuôi cấy, một lượng nhỏ mô (thường là mộtmẫu nhỏ khoảng 2mm3) được lấy ra từ một cơ quan cụ thể (da, gan, v.v…) và được đặttrong một đĩa vô trùng. Mô được điều trị bằng protease để phá vỡ một số các proteinmà nó giữ các tế bào với nhau và sau đó được tháo rời nhau ra để phân tách các tế bàoriêng lẻ. Sau đó, những tế bào này được đặt trong một đĩa có chứa môi trường nuôi cấyvới huyết thanh và được phân chia. Các tế bào sư cấp được sản xuất theo cách nàykhông dễ dàng chia bên ngoài cơ thể động vật, và thường sẽ trải qua một vài phânđoạn trước khi trải qua quá trình lão hóa. Nếu các tế bào có thể được tạo ra để tái sảnxuất cho hơn một vài thế hệ, một dòng tế bào thứ cấp có thể được sản xuất. Dòng tếbào chứa nhiều tế bào cơ bản giống nhau. Hầu hết các dòng tế bào sẽ phân chia mộtlượng thời gian tương đối nhỏ (10-20) trước khi vào lão hóa. Bởi vì những tế bào nàysẽ chết, nó được gọi là tế bào chết. Tuy nhiên một số dòng tế bào không tiến tới lãohóa và được mô tả như là bất tử. Những tế bào này được cho là "chuyển đổi" trong đónó đã trải qua một sự thay đổi để làm cho nó ác tính hoặc bất tử. Ví dụ về các dòng tếbào bất tử bao gồm: Các tế bào HeLa (bắt nguồn từ một người phụ nữ da đen 31 tuổi tên là Henrietta

Lacks, những người chết vì ung thư cổ tử cung vào năm 1951) và Tế bào buồng trứng chuột đồng Trung Quốc (CHO).

Những thay đổi xảy ra trong các tế bào làm cho nó bất tử có thể do nhiễm virushoặc do những thay đổi khác trong các tế bào dẫn đến sự phân chia không được kiểmsoát và tăng trưởng trong tế bào. Ở đây, việc chuyển đổi hạn dùng để chỉ quá trình nàyhơn là sự hấp thu của DNA ngọai lai như chúng tôi đã sử dụng nó trước đây. Ở sinhvật nhân chuẩn cao hơn quá trình chèn DNA ngoại lai vào các tế bào được gọi làtransfection.

Page 238: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

237

10.2 Transfection tế bào động vậtViệc chèn DNA ngoại lai vào tế bào động vật là một quá trình gồm hai giai đoạn,

trong đó, trước hết DNA được đưa vào bởi các tế bào (transfection), sau đó nó đượctích hợp vào bộ gen. Nó có thể tạo ra các dòng tế bào động vật ổn định.

Ví dụ, plasmid mang các kháng nguyên virus hạt nhân Epstein-Barr (EBNA-1)và có thể được duy trì trong một số dòng tế bào động vật linh trưởng và chó nhưngkhông có trong các dòng tế bào động vật gặm nhấm (Yates và cộng sự, 1985.). Tuynhiên, các dòng tế bào ổn định nhất đó là vĩnh viễn. Việc transfection các tế bào hiệuquả hơn so với chèn DNA ngoại lai vào bộ gen.

Do đó, số lượng lớn các tế bào có thể được transfected với DNA ngoại lai, nơi nóđược duy trì trong nhân, nhưng không tích hợp nó vào hệ gen của họ. Quá trình hấpthu DNA vào tế bào động vật do đó có thể được mô tả hoặc tạm thời hoặc ổn định, phụthuộc vào thời gian DNA được duy trì bên trong tế bào.• Transient transfection.

Nếu các DNA ngoại lai được transfect vào các tế bào không được tích hợp vàobộ gen, các tế bào sẽ duy trì nó trong một thời gian ngắn trước khi nó được hoặc bị suythoái hoặc pha loãng từ các tế bào trong quá trình phân chia. Trong khoảng thời gianmà các DNA ngoại lai vào bên trong tế bào, nó được xử lý chỉ như bất kỳ 1 trình tựDNA khác - gen chứa bên trong nó có thể được biểu hiện, miễn là chúng được kiểmsoát của một promoter thích hợp, thời gian DNA được duy trì bên trong tế bào, và cácprotein mã hóa.

Transient transfection đại diện cho phân tích gen một cách nhanh chóng và cácgen ngoại lai trong các tế bào.

Nhìn chung, các hình thức Transient transfection cần phải được tối ưu hóa chotừng loại tế bào được phân tích do sự khác biệt vốn có hiệu quả của việc hấp thu DNA.• Ổn định transfection.

Thay vì được duy trì trong một ngoài nhiễm sắc thể trong hạt nhân của một tế bàochủ, DNA ngoại lai trở nên tích hợp vào một vị trí dường như ngẫu nhiên trong bộ gen.

Sau khi tích hợp, các DNA ngoại lai được nhân rộng cùng với các nhiễm sắc thểchủ, nơi mà nó cư trú và biểu hiện gen có thể xảy ra, cung cấp cho ghen ngoại lai đượcđiều khiển bởi các yếu tố kiểm soát phù hợp cho việc phiên mã. Dòng tế bào ổn định cầnthiết cho việc sản xuất số lượng lớn của một protein tái tổ hợp trong một thời gian dài.

Khó khăn gặp phải trong kỹ thuật sản xuất các dòng tế bào ổn định, phát sinh chủyếu từ việc kém hiệu quả của quá trình chèn, thâm nhập vào tế bào, có nghĩa là có thểmất vài tháng để tạo một dòng tế bào vô tính. Các transfection tế bào động vật với gencủa các sinh vật khác có từ hơn 40 năm (Szybalska và Szybalski, 1962). Trong thínghiệm này, sự hấp thu của DNA thường thành các tế bào động vật là một sự kiện vôcùng hiếm.

Tế bào động vật được bao bọc bởi một màng đơn, được gọi là cả hai màng tế bàovà màng huyết tương. Nó bao gồm một lớp kép lipid có chứa nhiều protein. màngtương đối không thấm nước và, trong trường hợp bình thường, chỉ cho phép vật liệunhất định để vượt qua vào và ra khỏi tế bào.

Page 239: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

238

Trong các mô, tế bào cũng được bao quanh bởi ma trận ngoại bào (ECM) - mộthỗn hợp protein và proteoglycans - đó là tham gia vào các tế bào tín hiệu tế bào, vếtthương, sửa chữa, độ bám dính tế bào và chức năng mô. Hầu hết các tế bào động vậtnuôi không có một ECM và do đó tương đối dễ dàng chèn vào DNA so với các đối tácbản địa của họ. Như chúng ta đã thấy với các hình thức chuyển đổi, hiệu quả của quátrình này có thể được tăng lên rất nhiều bởi phương pháp điều trị khác nhau, được thảoluận dưới đây.10.2.1. Hóa chất Transfection

Hiệu quả của DNA Transfection có thể được cải thiện đáng kể nếu việc làm kếttủa cùng với sự có mặt của tế bào. Điều này có thể thực hiện một cách đơn giản bằngviệc rửa tế bào nuôi cấy trong đệm phosphat, cho vào đó các DNA, sau đó cho thêmcalci clorua vào hỗn hợp. trong trường hợp này người ta cho rằng kết tủa sẽ bám vàobề mặt của những tế bào tế bào và sau đó được hấp thụ dần qua các endocytosis(orantia và chang, 1990). Một vài DNA sẻ phóng thích vào trong hạt nhân, nơi màchúng sẻ biểu hiện, hoặc biến đổi thành thể thống nhất đi vào bộ gen. Hiệu quả củatransfection khi sử dụng chất calci được đánh giá bằng tỷ lệ phần trăm (%) của nhữngtế bào chứa DNA, tỷ lệ này khá thấp, chỉ nằm trong khoảng 1% - 2% (Graham và vander Eb, 1973), nhưng có thể được cải thiện nếu sủ dụng DNA có độ tinh khiết cao vàquá trình kết tủa được diển ra từ từ (Chen và Okayama, 1988).

10.2.2. Điện diChúng tôi đã thảo luận trước đây thì việc thay đổi hiệu điện thế của tế bào vi

khuẩn là cơ sở của điện di. Phương pháp kỷ thuật này cũng hoạt động tốt trên tế bàocủa động vật ( Wong và Niumann, 1982). Bằng việc thay đổi cường độ điện trường vàtăng thời gian đặt trong điện trường của tế bào, nó có thể thực hiên một cách đơn giảnviệc điện di cho tất cả các loại tế bào.

Page 240: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

239

10.2.3. Liposome-mediated TransfectionLiposome là một dạng của lipid, có hình cầu, có thể được sử dụng để vận

chuyển các phân tử vào tế bào. Classical liposome được cấu thành bởi một bilayerlipid hình cầu, và bao quanh nó là các phân tử được vận chuyển, chúng được vậnchuyển vào tế bào sau khi Classical liposome hòav được sử dụng cho việc vận chuyểnacid nucleic(do acid nucleic mang điện tích âm). Cationic lipid tự nhiên dẫn đến sựhình thành các túi unilamellar liposome, thay vì đóng gói các DNA trong liposome,đây là cách để gắn các túi lên bề mặt của DNA tích điện âm để tạo thành cụm túi tổnghợp (hình 10.2).

Hình 10.2. giới thiệu cách DNA đi vào trong tế bào bằng cách sử dụngliposome cation. (A)cấu trúc hóa học của DOTMA (N-[1 - (2,3-dioleyloxy) propyl]-N,N, N-trimethylammonium), một cationic lipid cấu trúc nên một liposome. (B) cấu trúccủa một cationic liposome. Thể mang có một đầu mang lõi kỵ nước hướng ra ngoàihình thành bởi lipid ‘tails’, một lipid cation được sử dụng trong việc hình thànhliposome (Felgner và cộng sự, 1987). (C). Xung quanh của một đoạn DNA củaliposome cation trước khi đưa nó vào trong tế bào, sau khi dung hợp với màng tế bào.

Cationic liposomes được cấu thành từ các cationic lipids khác nhau, ví dụ nhưDOTAP (N-1(-(2,3-dioleoyloxy) propyl)-N,N,N-trimethylammoniumethyl sulphate)và DOTMA (N-(1-(2,3-dioleoyloxy) propyl)-N,N,N-trimethylammonium chloride).

Page 241: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

240

Liposome thường bao gồm một chất béo trung tính như Dope(dioleoylphosphatidyl ethanolamine) để tạo điều kiện hình thành liposome và tính hòatan của màng tế bào.

Cationic liposome có thể tương tác với các màng tế bào tích điện âm dễ dànghơn so với các liposome không mang điện, với sự hợp nhất giữa cationic liposome vàbề mặt các tế bào dẫn đến việc phân phối của DNA xuyên qua màng plasma.

Ngoài ra, vật liệu đưa vào tế bào xuyên qua liposome cation xuất hiện để có thểgiải phóng endosome nếu không có một rào cản lớn nào đối với việc vận chuyển nhờendocytosis. Liposome qua một bước trung gian nữa là kỹ thuật DNA, nhằm khuếchđại lên nhiều lần và rất hiệu quả. Do đó, phương pháp này thường được lựa chọn chocác tế bào DNA transferase.10.2.3. Peptides

Một số chuỗi peptide đã được xuất hiện để có thể bám vào, và ngưng tụ, DNAlàm cho nó bám vào tế bào chặt chẽ hơn, ví dụ như các promotor DNA transfectionserine tetrapeptide-proline-lysine-lysine.Liên kết phía các chuỗi acid amin lysinemang điện tích dương (xem phụ lục A) giúp ngăn những ảnh hưởng đến bộ khungphosphate và cho phép các phân tử DNA để đóng gói chặt chẽ với nhau.Thiết kế hợplý của chuỗi peptide cũng được được sử dụng để phát triển liên kết peptide của DNAtổng hợp. Ví dụ, peptide-sin-lysine-alanine-(lysine) 8-tryptophan lysine-đã đượcchứng minh là rất hiệu quả ở chỗ hình thành phức hợp với DNA. Liên kết peptideDNA có thể đi đôi với cấu tử tế bào cụ thể, bằng cách cho phép các trung tâm củareceptor gắn với phức hợp DNA. Một trong những cách tiếp cận để tổng hợp nên mộtpeptide cation dựa trên 16 lysine và acid một chuỗi peptide gồm arginine-glycine-aspartic (rgd). Trình tự rgd tạo điều kiện ràng buộc của các peptide/phức hợp DNA vớimột thụ thể integrin trên CaCO2 trong ống nghiệm (Harbottle và cộng sự, 1998).Peptide tổng hợp cũng đã được phát triển để tăng cường việc phóng thích cácpeptide/phức hợp DNA từ endosome tiếp sau endocytosis..10.2.4. Chuyển DNA trực tiếp (Direct DNA Transfer)

DNA có thể được tiêm trực tiếp vào nhân tế bào nuôi cấy (Capecchi, 1980).Cách tiếp cận hơi khó khăn và đòi hỏi lao động kỹ thuật chuyên sâu trong đó nhân tếbào phải được tiêm với DNA ngoại trên thể đơn bào, nhưng đặc biệt hữu ích cho các tếbào lớn. Ví dụ, các tế bào trứng của loài ếch Xenopus laevis châu Phi, có thể được thuhoạch với số lượng lớn từ buồng trứng của loài ếch nữ trưởng thành, có đường kínhkhoảng 1 mm và có một hạt nhân tương đối lớn.

DNA, hay RNA, tiêm vào nhân thường được diễn tả trong một mô hình khảmtrong sự phát triển của ếch (Melton, 1987). Sự hòa nhâp của DNA ngoại xảy ra ở mộttần số rất thấp, nhưng sự biểu hiện của gen ngoại. Hiệu quả của quá trình hòa nhậpthay đổi đáng kể trong những sinh vật khác nhau.

Việc tiêm trực tiếp DNA vào trong mô động vật nhất định, đặc biệt vào các cơvà da, cũng đã cho hiệu quả cao trong việc biểu hiện gen chuyển (Wolff và cộng sự,1990). Ví dụ, bệnh nhân bị các điều kiện di truyền ichthyosis da phiến mỏng (trong đóda là quy mô và ửng đỏ), gây ra bởi sự thiếu hụt transglutaminase 1 (TGase1), cho

Page 242: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

241

thấy một số tái tạo da lại sau tiêm DNA plasmid mã hóa gen TGase1 (Choate vàKhavari, 1997). Sự phục hồi của biểu thức TGase1 xảy ra ở các vị trí chính xác của da.Tuy nhiên,quá trình phân tích thêm đã tiết lộ rằng mẫu của biểu hiện không đồng nhấtvà không đúng các mô và chức năng bất thường tiềm ẩn của bệnh. Phun trực tiếp DNAcũng đã được áp dụng cho các liệu pháp gen (xem bên dưới) của bệnh ung thư, nơi màDNA có thể được tiêm trực tiếp vào khối u hoặc có thể được tiêm vào tế bào cơ để thểhiện kháng nguyên khối u có thể có chức năng như một thuốc chủng ngừa ung thư.Mặc dù trực tiếp tiêm DNA plasmid đã được hiển thị để dẫn đến biểu hiện gen, mứcđộ biểu hiện tổng thể nói chung là thấp hơn so với thu được với liposome. Chúng tôisẽ trở lại để tiêm trực tiếp DNA sau đó khi chúng ta nhìn vào việc sản xuất các độngvật biến đổi gen.10.3 Virus là Vectors

Việc chuyển DNA ngoại vào tế bào động vật có quả tương đối thấp, dẫn đếncác thao tác của virus như là các vectơ khả năng chuyển đổi gien10.3.1 SV40

Vector virus được chuyền vào tế bào động vật được phát triển dựa trên virus ởkhỉ 40 (SV40) (Hamer và Leder, 1979). SV40 là một sợi đôi DNA virus tạo khối u linhtrưởng có bộ gen là 5243 bp kích thước (Hình 10.3)

Hình 10.3. Các bộ gen SV40. SV40 có hai đơn vị phiên mã, mà biểu hiện là cácvùng hoạt động (promoter). Cả hai đều tạo ra protein qua nối thay thế. T lớn và khángnguyên t nhỏ được cho nhân lên trong quá trình nhân lên của các protein capsid VP mẫuvirus. Các trình tự intron loại bỏ trong quá trình cắt nối được thể hiện trong màu đỏ

Gen được mã hóa trên cả hai sợi của các gen mà chúng chồng lên nhau. Viralnhiễm chủ yếu xảy ra ở tế bào thận khỉ, nhưng virus có khả năng lây nhiễm nhiều loạitế bào động vật có vú và, tùy thuộc vào loại tế bào bị nhiễm bệnh. SV40 có hai bộ genbiểu hiện.

Page 243: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

242

Gen sớm được thể hiện ngay lập tức sau khi nhiễm và được virus yêu cầu chonhân lên. Các gen đầu bao gồm các kháng nguyên T lớn và nhỏ T kháng nguyên.

Gen muộn được thể hiện ở một thời gian sau trong chu kỳ nhiễm khuẩn và mãhóa các protein capsid virus cần thiết cho sự hình thành virus mới. Những gen này làdưới sự kiểm soát của promoter SV40 lớn (MLP).

Gen ngoại có thể được đưa vào hệ gen SV40 để thay thế cho đầu sớm hoặc genmuộn. Nếu một gen ngoại thay thế, ví dụ, một gen muộn, sau đó là virus có thể khôngtái tạo đúng cách. tuy nhiên, tiến hành bằng cách sử dụng một helper SV40 virus cókhiếm khuyết ở một gen sớm để cung cấp 'muộn' chức năng trong chuyển hóa.tương tưtrong thực khuẩn (chương 3), SV40 có công suất hạn chế cho việc bổ sung các DNAngoại. Ngay cả với việc thay đổi gen hiện có, kích thước tối đa của đoạn DNA đượcgiới hạn trong bp 2300 ~ (Naim và Roth, 1994).10.3.2. Adenoviruses

Adenoviruses chịu trách nhiệm cho khoảng 25% gây ra các chứng cảm lạnhthông thường. Có rất nhiều loại khác nhau có thể gây nhiễm trùng ở người, nhưng tấtcả họ virus không có màng bao icosohedral (khoảng 60-90 nm dài) có chứa bộ genDNA sợi đôi tuyến tính kích thước ~ 36 kbp (Hình 10.4).

Hình 10.4. Adenovirus. (a) Electron micrograph of a human faecal adenovirus.Image courtesy of Tony Oliver (IBMS London Region Virology DiscussionGroup). (b) The adenoviral genome. The approximate location of some of the early (E)and late (L) genes are shown, along with the site of the major late promoter (MLP),and an approximately 300 bp packaging site (), which is essential for the packaging of

Page 244: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

243

viral genome into the assembled capsid. Both ends of the genome are composed of 100bp inverted terminal repeats (ITRs). ITRs serve as origins of DNA replication bypriming the replication process and acting as assembly points for the proteins of thereplication complex. The adenovirus genome also encodes several viral associatedRNAs (VA RNAs) that are transcribed constitutively at a high level using RNApolymerase III. VA RNAs are ~160 nucleotides in length and have a high GC contentand a high degree of secondary structure. They may serve to regulate mRNAsplicing or to control of the rate of translation of late genes (Mathews, 1995)

Các phiên mã bộ gen của adenovirus xảy ra trong hai giai đoạn - đầu và cuối -diễn ra trước hoặc sau khi sao chép DNA virus, tương ứng. Phiên mã được đi kèm vớimột loạt các sự kiện nối phức tạp, với bốn khu vực đầu tiên của phiên mã gen (E1-E4,cần thiết để nhân lên của virus), và một MLP sản xuất các gen cuối (L1-L5, sản xuất racác lớp vỏ của virus) ( Logan và Shenk, 1984). Các virus này sẽ tái tạo trong các dòngtế bào động vật có vú khác nhau khi di truyền DNA thường là transfected vào chúng.Ngoài ra, virus này tạo ra số lượng lớn các con cháu (lên đến 105 virion mỗi tế bào bịnhiễm), có nghĩa là các hạt siêu vi, tái tổ hợp hoặc cách khác, có thể được tinh chế vớisố lượng lớn một cách dễ dàng.

Hầu hết các vector có nguồn gốc từ các hệ gen được sao chép thiếu adenoviral.Họ thiếu E1 gen thiết yếu và thường có gen không cần thiết E3. Kể từ chúng được saochép lỗi, chúng phải được tuyên truyền trong các dòng tế bào có cũng được transfectedvới DNA chứa gene E1 - ví dụ: con người dòng tế bào thận phôi 293 - E1 cung cấpchức năng trong trans (Graham và cộng sự, 1977). Đây là loại vector có công suất tốiđa cho DNA ngoại khoảng 7 kbp. vectơ khác adenoviral hoặc thiếu các gen E2 hoặcE4 tại Ngoài E1 và E3 để tăng khả năng mang DNA ngoại, các chức năng một lần nữa,được cung cấp ở dòng tế bào (Gorziglia và cộng sự, 1996).

Adenoviruses mang DNA ngoại có thể được sử dụng để sản xuất các proteinngoại trong các loại tế bào khác nhau, nhưng biểu hiện gen này thường thoáng qua vìDNA của virus không tích hợp vào hệ gen của vật chủ. Việc thiếu tích hợp có thể, tuynhiên, có lợi thế nếu vectơ adenoviral được sử dụng trong những liệu pháp gen (xembên dưới). Ngoài ra, các mô biểu hiện gen cụ thể là có thể với vectơ adenoviral nếugene ngoại được đặt dưới sự kiểm soát của promoter di động cụ thể và các yếu tốenhancer, ví dụ: các myosin chuỗi ánh sáng 1promoter (Shi, Wang và Worton, 1997)hoặc cơ promoter mịn tế bào SM22a (Kim và cộng sự, 1997), hoặc bằng cách phânphối trực tiếp tới một khu vực trong cơ thể (Rome và cộng sự, 1994).

Adenoviral vector rất hữu ích bởi vì nó được đánh giá cao hiệu quả đưa đượcDNA vào trong tế bào. Họ có khả năng chứa DNA chèn lên đến kích thước khoảng 8kbp và họ có thể lây nhiễm sang cả sao chép và các tế bào khác biệt. Ngoài ra, kể từ họkhông tích hợp vào hệ gen của chủ, họ không thể mang lại hiệu ứng gây đột biến gây rabởi các sự kiện hòa nhập ngẫu nhiên. Những khó khăn của adenoviral vectơ bao gồm.

Biểu hiện là thoáng qua, DNA của virus không tích hợp vào máy chủ.

Page 245: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

244

Vectơ Adenoviral được dựa trên một tác nhân gây bệnh rất phổ biến của conngười và trong cơ thể có bị cản trở bởi những phản ứng miễn dịch của tế bào chủvới một loại virus.10.3.3 Liên quan đến Adeno-Virus (AAV)

Adeno virus-liên lần đầu tiên được phát hiện như là một chất gây ô nhiễm củacác chế phẩm adenovirus (Atchison và cộng sự, 1965). Mặc dù tên của nó, AAVkhông cho biết sự liên quan đến adenovirus nhưng nó là một virus thuộc họparvovirus, trong đó có một sợi đơn DNA trong bộ gen của nó có kích thước khoảng5000 nucleotide. Các virus thường được tìm thấy trong mô amidan con người, mặc dùkhông có bệnh nào của con người có sự liên hệ với nó. Các AAV không thể tồn tạimột cách độc lập, mà đòi hỏi sự hiện diện của virus khác, ví dụ như adenovirus, đểhoàn thành replicative chu kỳ của mình. Một số các gen adenovirus đầu cần thiết choviệc thúc đẩy sự nhân rộng AAV. Tuy nhiên, việc điều trị các tế bào nhiễm AAV vớiánh sáng cực tím, hoặc một số chất gây ung thư cycloheximide có thể được dùng đểthay thế virus helper (Bantel-Schaal, 1991). Vì vậy cần phải có một loại virus trợ giúpcho sự thay đổi môi trường cellulase tốt hơn protein của một virus.

Trong trường hợp không có virus helper, bộ gen AAV tích hợp vào trong tế bàochủ, nơi mà nó vẫn còn là một provirus tiềm ẩn. Không có sự tích hợp của DNA virusvào bộ gen tế bào vật chủ, tuy nhiên, một quá trình ngẫu nhiên, nó được tích hợpvào cùng một vị trí di truyền trên nhiễm sắc thể 19 (Kotin và cộng sự, 1990.).AAV dựa vào vectơ khai thác hai chuỗi ITR 145 được tìm thấy trong bộ gen củavirus, đó là những yếu tố DNA chỉ cần thiết cho sao chép, vận chuyển, hội nhậpprovirus và cứu hộ. Các cấu trúc lặp đi lặp lại vòng lặp formhairpin là rất cần thiết chonhân bản của virus.

Việc nhân bản vô tính vào hệ gen của AAV được hỗ trợ bởi việc lắp lặp đi lặplại đầu cuối, đảo ngược thành một vector plasmid và sau đó nhân bản foreign DNAgiữa chúng. Đoạn linear DNA chứa foreign gene hai bên là ITRs có thể được chuẩn bịtừ plasmid tiếp theo quá trình cắt bằng các enzyme giới hạn. Sau đó các DNA nàyđược vận chuyển vào tế bào, cùng với helper plasmid để cung cấp các gen cần thiếtcho sự hội nhập AAV virus. Viral có thể dư sau khi chuẩn bị bằng cách tiêm nhiễmcác tế bào với adenovirus để kích thích AAV lytic nhân bản và đóng gói. Cuối cùng,một phần các virus AAV có thể được tinh chế từ các adenovirus gây ô nhiễm bằngcách sử dụng phương pháp hóa sinh (Gao và cộng sự, 2000).

Đây là loại phương pháp tiếp cận làm mất chất lượng được sử dụng củaadenovirus để phục hồi AAV các hạt. Khả năng ô nhiễm cao và do đó tái tổ hợp sảnxuất AAV không thể được sử dụng để thử nghiệm liệu pháp gen của con người.An cách tiếp cận khác để sản xuất tái tổ hợp hạt AAV được hiển thị trong Hình 12.5. Ởđây, các gene ngoại hai bên là ITRs là đồng transfected vào con người 293 tế bào thậncùng với hai mảnh DNA khác - một có chứa các gen cần thiết cho việc sản xuất sợiđơn AAV di truyền DNA, và mang các gen adenoviral khác cần thiết cho lytic nhânrộng và bao bì (Matsushita và cộng sự, 1998).

Page 246: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

245

Hình 10.5. Việc sản xuất tái tổ hợp hạt AAV mà không nhiễm adenoviral. Mộtđoạn DNA tuyến tính có chứa một gen nước ngoài, dưới sự kiểm soát của mộtpromoter thích hợp để nó có thể được thể hiện, là transfected vào dòng tế bào thận293ở người (trong đó thể hiện gen E1 adenoviral) cùng với DNA có chứa các RepAAV và Cap gen, và một đoạn DNA mang E2A adenoviral, E4 và RNA gen VA. CácRep và Cap protein được yêu cầu để sản xuất sợi đơn AAV và để đóng gói chúng trongcác protein . Các helper protein từ adenovirus cần thiết để nhân rộng lytic AAV (E1,E2A, E4 và VA RNA) được sản xuất trong các tế bào để thúc đẩy sự hình thành củacác hạt virus có chứa các gen ngoại. Những sau đó có thể được sử dụng để lây nhiễmcác tế bào mục tiêu.

Các hạt AAV tái tổ hợp đượcthu từ thủ thuật này sau đó có thể được sử dụngđể lây nhiễm các tế bào mục tiêu, trong đó các gen ngoại sẽ được thể hiện. vectorAAV đã được sử dụng để chuyển DNA ngoại vào nhiều loại tế bào, bao gồm cả tế bàothần kinh (Davidson và cộng sự, 2000), cơ (Pruchnic và cộng sự, 2000) và các tế bàobiểu mô (Pajusola và cộng sự, 2002). Các vị trí dự đoán của hội nhập DNA vào trongtế bào chủ, khả năng biến đổi cả hai phân chia, sự phân chia tế bào, và tiến bộ trongkhả năng lây nhiễm nhiều loại tế bào trong cơ thể đã thực hiện các vector AAV rất hứahẹn cho liệu pháp gen (Sanlioglu và cộng sự , 2001).10.3.4 Retrovirus

Retroviruses là virus động vật duy nhất hoà nhập vào bộ gen của tế bào chủtrong chu kỳ sinh trưởng bình thường. Có hai nhóm retrovirus gây bệnh con người -retroviruses HTLV (ví dụ virus bệnh bạch cầu tế bào T ở người, HTLV- 1) (yoshida vàseiki, 1987) và lentiviruses (ví dụ virus gây bệnh xi - đa ở người, HIV - 1) (Luciw vàcộng sự, 1984) - nhưng retroviruses đã tìm thấy trong rất nhiều sinh vật, bao gồm cảđộng vật có xương sống và động vật không xương sống. Chúng được bao bọc bởi lớpvỏ (đường kính khoảng 100 nm), lớp vỏ bọc ở dạng màng kép lipid chiết xuất từ tếbào của chính nó. Lớp vỏ bao bọc cũng chứa một số protein mã hoá cho virus.Sự

Page 247: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

246

nhiễm trùng xảy ra do tương tác thuốc của protein bao bọc với thụ quan cụ thể trên bềmặt của tế bào chủ (sommerfelt, 1999). Thụ quan ràng buộc dẫn đến sự hoạt hoá củahạt virus (Hình 10.6).

Hình 10.6 Retroviruses. (a) cấu trúc của hình thành tích hợp của bộ gienretroviral điển hình. Và lặp lại thiết bị cuối dài, phải trái (ltrs) cạnh sườn gien cấutrúc (bịt miệng, pol và env). (b) chu kỳ sống retroviral.

Uncoating từng phần của hạt xảy ra trước khi enzyme transcriptase đảo ngượcbiến RNA bộ gen thành bản sao sợi ADN kép thẳng. Tổng hợp ADN bắt đầu từ phântử tRNA cụ thể (mak và kleiman, 1997) từ tế bào chủ trong đó virus đã được hìnhthành, như transcriptase đảo ngược, được bao bọc trong hạt virus của nó. DNAproviral mới hình thành sau đó hợp nhất ngẫu nhiên vào bộ gen vật chủ nơi gen virusđược thể hiện để làm mới protein của virus và dẫn đến hình thành hạt virus mới. Sựtạo ra hạt virus mới không trực tiếp dẫn đến chết tế bào chủ, nhưng hạt mới hình thànhchồi từ bề mặt tế bào.

Bệnh liên quan đến nhiễm trùng retroviral thường là hậu quả của đầu bámretroviral vào bộ gen vật chủ, hoặc do sự biến đổi tế bào gây bệnh của chúng, ví dụnhư sự xâm nhập của hệ miễn dịch bởi HIV - 1 dẫn đến bệnh AIDS.

Bộ gien của retrovirus được tạo thành từ sự đồng nhất chuỗi axit ribonucleicphân tử (giữa 8000 và 11000 nucleotid), giống với mRNA phân tử.

Bộ gen axit ribonucleic virus không thể được dùng làm mẫu dịch mã trước khitổng hợp vào vật chủ. Phiên mã và dịch mã tiếp theo chỉ xảy ra sau khi DNA phiên bản

Page 248: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

247

bộ gen đã được tổng hợp vào vật chủ. Tất cả retroviruses chứa ba cấu trúc gen chính,mỗi một trong những cái ấy mã hoá một số protein hoạt tính (Katz và skalka, 1994): Mã hoá một dạng của capsid protein Mã hoá transcriptase đảo ngược biến RNA bộ gen thành bản sao DNA,

integrase cần cho đầu bám của DNA vào vật chủ bộ gen và đôi khi protease cần cho sựphân cắt của gen trong sự chín. Mã hoá bề mặt và xuyên màng protein thấy trong bao bọc

Một số retroviruses cũng chứa các gen khác; ví dụ protease có thể mã hoá bằnggen riêng biệt. Mọi protein mã hoá bằng bịt miệng, pol và protease được thể hiện từbản sao axit ribonucleic của hệ gen hoàn chỉnh. Để nén số này của gen vào bộ gen nhỏ,virus sử dụng một số chiến lược như là nối và ribosomal frameshifting (Farabaugh,1996). Ví dụ như, gen protease thường nằm gối lên bịt miệng hoặc pol nhưng vẫn cònđược tạo ra từ cùng phân tử mRNA. Gen cấu trúc retroviral là cạnh sườn trong bộ gienbằng ltrs, trở thành lặp lại như một phần của quy trình sự nhân bản trước khi tích hợpvào bộ gen vật chủ. Tổng hợp ARN virus bắt đầu từ người tổ chức đơn trong lefthandLTR và kết thúc bằng tín hiệu polyadenylat trong LTR bên phải.

Gói hàng ràng buộc vào lượng thêm acid nucleic có thể duy trì trong bộ genvirus nghĩa là vật chủ trung gian dựa trên retroviruses thường là sự nhân bản khônghoàn chỉnh. Do đó, khi chúng tôi thảo luận cho vật chủ trung gian adenoviral trên, hạtvirus nhiễm khuẩn phải tạo ra trong dòng tế bào xây dựng đặc biệt để có thể cung cấpprotein của virus cần thiết. Chẳng hạn như, gen ngoại có thể là dòng vô tính vào plasmitchứa DNA phiên bản thành phần mô tả ở trên sao cho nó nằm giữa và bên phải-trái ltrs,Virus tạo ra từ dòng tế bào này có thể sau đó dùng để gây bệnh tế bào đích, nơi vật chủtrung gian sẽ tích hợp vào bộ gen và gen ngoại được thể hiện. Ngoài gen ngoại, thì cácgen khác cũng dùng để đánh giá tế bào riêng đã lấy DNA tái kết hợp.

Ưu thế chủ yếu để sử dụng vật chủ trung gian bazơ retroviral phát sinh từ ổnđịnh của tích hợp của bộ gen virus vào vật chủ. Tích hợp của bản sao duy nhất củaDNA virus ở địa điểm ngẫu nhiên trong bộ gen của vật chủ cho phép cách diễn đạt lâudài của gen ngoại tích hợp. Ngoài ra, retroviruses đại diện cho cơ chế truyền ADN vàotế bào rất hiệu quả. Sự bất lợi của các vật chủ trung gian là bản chất ngẫu nhiên củaquy trình tích hợp, có thể có ảnh hưởng độc trên tế bào chủ, và yêu cầu tổng quát củaretroviruses phải gây bệnh chỉ phân chia tế bào. Chỉ lentiviruses, ví dụ HIV1, cũng sẽgây bệnh và sao chép ở tế bào không phân chia. Do đó, nhiều nỗ lực đã được hướngdẫn vào làm vật chủ trung gian lentivirus an toàn một cách phù hợp (zufferey và cộngsự, 1998)10.4 Bút đánh dấu có thể chọn được và Gene Amplification trong tế bào động vật

Như mọi DNA khác quy trình chúng tôi đã thảo luận, sát nhập ADN ngoại laivào tế bào động vật cần đi theo bởi kiểu hình biến thành phân biệt tế bào transfectedvới các tế bào không lấy ở ADN ngoại lai (Hình 10.7)

Page 249: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

248

Hình 10.7 Cấu trúc của bleomycin-bleomycin ràng buộc prôtêin phức hợp(almaruyama sâu trong bên prôtêin nhị trùng (xanh và xanh dương)

Một vài thí nghiệm đầu tiên để nhận biết tế bào động vật transfected liên quanbổ sung của dinh dưỡng khuyết điểm ở dòng tế bào. Chẳng hạn như, tế bào của conngười có khuyết điểm trong gen mã hoá phosphoribosyltransferase guaninehypoxanthine (HPRT ; bộ phận của chu kỳ inosinate cho giá trị thu hồi của vòng purincác bazơ và sản xuất của inosine monophosphate) và do đó không thể tăng trưởng ởhypoxanthine, aminopterin và thymidine một hợp chất có chứa thymin và đườngribose. Rất hiếm khi, tế bào có thể cô lập tăng trưởng, biểu lộ rằng chúng có phải khảnăng để làm HPRT từ tế bào dạng tự nhiên (szybalska và szybalski, 1962). Tương tự,chuột nhắt tế bào thiếu hụt enzyme kinase thymidine một hợp chất có chứa thymin vàđường ribose( TK, là một phần của chuỗi các phản ứng hóa sinh có giá trị thu hồi sinhtổng hợp nucleotide) không thể phát triển trên HAT trung bình, nhưng có thểtransfected với virus bệnh mụn rộp (HSV). Tk gen để cho phép sinh trưởng trên trungbình này (wigler và cộng sự, 1977). Một số bút đánh dấu chuyển hóa khác chẳng hạncũng đã được kiểm soát quy trình transfection, nhưng tất cả đều bị yêu cầu của dòng tếbào đột biến để phát hiện biến đổi tế bào.

Điều này đã được khắc phục bằng cách sử dụng bút đánh dấu có thể chọn đượckiểu hình trội kháng thuốc đến tế bào transfected (bảng 10.1). Kháng sinh như làampicillin không có ảnh hưởng trên tế bào có nhân điển hình do thiếu thành tế bàođộng vật. Vài kháng sinh khác, đặc biệt là các sự tổng hợp protein chất ức chế, đangtích cực chống lại cả hai sinh vật có nhân điển hình và sinh vật chưa có nhân điểnhình. Chẳng hạn như, trực khuẩn E.coli chuyển gen vị trí tn5 mã hoá thuốc kháng sinh- gen kháng lại (yamamoto và yokota, 1980). Thuốc kháng sinh là kháng sinhaminoglycoside cản trở dịch mã và gây ra sự chết của tế bào vi khuẩn, cụ thể việcnhắm vào mục tiêu của ribosomal 16S axit ribonuclenic. Ở nồng độ cao,aminoglycosides cũng ức chế sự tổng hợp protein trong tế bào ở động vật có vú có lẽqua ràng buộc không rõ ràng để ribôxôm có nhân điển hình và / hoặc acid nucleic(mingeot - leclercq, tulkens và glupczynski, 1999). Để đạt được sức đề kháng khiphương pháp của chọn lọc, một gen khác mã hoá trong Tn5 gen chuyển vị (tạo rakháng sinh phosphotransferase) được đặt vào dưới kiểm soát người tổ chức ở động vậtcó vú, ví dụ như HSV Tk người tổ chức hoặc người tổ chức sớm SV40. Chúng ta sẽ

Page 250: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

249

thảo luận người tổ chức thường điều khiển cách diễn đạt của gen trong tế bào động vậtchi tiết hơn bên dưới.

Bảng 10.1 Bút đánh dấu cho chọn lọc của đoạn ADN bổ sung lên tế bào cónhân điển hình cao hơn.

Phơi tế bào động vật ra mức độ cao của thuốc độc quá lâu nhằm các mục đíchchọn lọc tái kết hợp có thể cho tăng giá, tần số thấp rất, đến hình thành của tế bào đãtrở thành một cách tự phát. Chẳng hạn như, chuột nhắt tế bào tiếp xúc đếnmethotrexate (mô phỏng loại vitamin B rất quan trọng trong tổng hợp acid nucleic đólà chất ức chế của enzyme dihydrofolate reductase, DHFR) đã được cho thấy để trảiqua ba kiểu đột biến để tạo ra sức đề kháng (Schimke và cộng sự, 1978) : Đột biến trong DHFR enzyme để tạo ra chất ức chế sức đề kháng, Đột biến ngăn ngừa sức hấp dẫn tế bào của thuốc và Sự khuếch đại của dhfr vị trí để tăng bản sao của số dhfr gen để tạo ra số lượng

đủ của enzyme để vượt qua ảnh hưởng của thuốc. Quy trình sự khuếch đại có vẻ khángẫu nhiên, với vùng lớn của cạnh sườn DNA xung quanh dhfr vị trí. cũng trở thànhthổi phồng

Đột biến trong lớp cuối cùng này đặc biệt quan trọng đối với cách diễn đạt cao cấpcủa gen dị vật. ADN ngoại lai là dòng vô tính vào vật chủ trung gian plasmit cũng cóDhfr gen. Sau đó transfected vào methotrexate - tế bào đề kháng và tái kết hợp chọncho với sự có mặt của mức độ cao của thuốc. Tế bào thổi phồng dhfr cũng chứa nhiềubản sao của ADN ngoại lai (Wigler và cộng sự, 1980).10.5 Biểu hiện gen trong các tế bào động vật

Chúng tôi đã từng quan sát biểu hiện bên ngoài của gen trong các tế bào bịnhiễm Baculovirus (Chương 8), nhưng các protein tái tổ hợp cũng có thể được sản

Page 251: SẢN XUẤT PROTEIN TRONG Y HỌC - dspace.elib.ntt.edu.vndspace.elib.ntt.edu.vn/dspace/bitstream/123456789/4379/3/sanxuatp... · Các khái niệm cơ bản về di truyền và

Sản xuất protein trong y học

250

xuất trong các tế bào động vật có vú. Việc chèn của một gen ngoại lai vào một tế bàođộng vật thường không đủ để biểu hiện hiệu quả trực tiếp của nó và sản xuất cácprotein được mã hóa. Các gene ngoại lai được biểu hiện phải được kết hợp với các yếutố kiểm soát phiên mã và dịch mã phù hợp cho các loại tế bào, trong đó protein sẽđược sản xuất. Hầu hết các promoter sử dụng để biểu hiện gen ngoại lai trong tế bàođộng vật được tha nh lập. Chúng tôi đã từng thảo luận về hệ thống biểu hiện Tet đểsản xuất protein trong tế bào động vật có vú (Chương 8). Nhiều promoter đượctha nh lập sử dụng để biểu hiện gen các tế bào chuyển đổi trong hoạt động phiên mãtrong một loạt các loại tế bào và mô, nhưng hầu hết là một số mức độ đặc hiệu mô. Vídụ, sử dụng rộng rãi cytomegalovirus (CMV), promoter biểu hiện độ hoạt động thấptrong tế bào gan (Najjar và Lewis, 1999). Một promoter mạnh được tha nh lập nhằmbiểu hiện gen cho nhiều loại tế bào bao gồm các adenovirus MLP…

Ngoài một promoter thích hợp, gen được biểu hiện trong các tế bào động vậtcũng yêu cầu một trang Polyadenylation, kết thúc phiên mã tín hiệu và một loạt cácyếu tố kiểm soát tịnh tiến. Nói chung, nó đã được lưu ý rằng các gen có chứa intronđược thể hiện ở mức cao hơn so với các bản sao cDNA tương đương của gen(Buchman và Berg, 1988). Điều này có thể là do các khớp nối của phiên mã, nối và tạora mRNA trong tế bào nhân chuẩn cao hơn (Maniatis và Reed, 2002).