BỘ GEN CỦA NGƯỜI

BỘ GEN CỦA NGƯỜI

1. BỘ GEN LÀ GÌ? Ý NGHĨA CỦA VIỆC DỰNG BẢN ĐỒ GEN NGƯỜI

Bộ gen (genome) chỉ toàn bộ các đơn vị di truyền chứa trong một bộ đơn bội (n) NST của loài. Mỗi giao tử bình thường chứa một bộ gen, mỗi tế bào soma chứa 2 bộ gen.

Bộ gen của người là sự phân bố ở các vị trí xác định của các gen trên chuỗi ADN trên 24 NST của người (22 NST thường và NST X, Y).

Ngày nay người ta còn quan tâm đến các gen ngoài nhân, các gen nằm trên ADN của ty thể. Trong một tế bào sinh dưỡng bình thường, gen trong nhân chỉ có hai bản nhưng gen trong ty thể phải có hàng ngàn bản, vì mỗi tế bào chỉ có một nhân nhưng có tới trên một ngàn ty thể.

Bản đồ bộ gen người là kết quả mô tả định vị các gen trên NST của người. Theo truyền thống thì bản đồ được phân chia theo các vùng tương ứng với các băng trên 24 NST (22 NST thường + X + Y).

Trước khi di truyền học phân tử ra đời, việc xây dựng bản đồ gen được tiến hành rất chậm chạp. Sự ra đời của di truyền học phân tử đã gỡ được mối bế tắc trong nghiên cứu xây dựng bản đồ gen người, đã vạch ra được những đường nét cơ bản cho nghiên cứu.

Tháng 10 năm 1990, nước Mỹ lần đầu tiên chính thức công bố Dự án bộ gen người (Human genome project). Một loạt các quốc gia khác như Anh, Pháp, Nhật, Canada và Đức cũng có những đầu tư đáng kể cho Dự án bộ gen người. Ba mục tiêu chính của dự án này là:

- Dựng bản đồ di truyền (Genetic map).

- Dựng bản đồ hình thể (Physical map).

- Xác định trình tự của cả ba tỷ đôi base của bộ gen người.

Xây dựng được bộ gen của người với việc hoàn thành cả ba mục tiêu nêu trên sẽ cung cấp những kiến thức, cơ sở khoa học để:

- Giải thích rõ được nguyên nhân, cơ chế của nhiều tính trạng bình thường hoặc bệnh lý từ đó sẽ có những chẩn đoán, điều trị chính xác hơn, hiệu quả hơn.

- Tách được dòng gen để nghiên cứu, để sửa chữa gen phục vụ điều trị gen (Gene therapy).

- Sản xuất được các sản phẩm của gen (các loại protein) phục vụ đời sống, chẩn đoán, điều trị.

2. ĐẶC ĐIỂM BỘ GEN CỦA NGƯỜI

Khoa học đã ước tính được bộ gen đơn bội của người gồm ba tỷ đôi base. ADN của người cũng như ADN của các Eukaryota khác bao gồm những trình tự mã hóa (các exon) xen kẽ với những trình tự không mã hóa (intron). Tùy mức độ có mặt của chúng trong nhân mà các trình tự ADN được chia làm ba loại:

- ADN có trình tự duy nhất: là các gen mã hóa cho các protein, chiếm khoảng 10% bộ gen. Thuật ngữ gen đã có gần một thế kỷ (Johansen, 1909) nhưng khái niệm về gen, thực thể nó như thế nào thì thật là bí ẩn, sự khám phá về nó vẫn còn tiếp tục.

Theo nghĩa truyền thống, gen là vật chất di truyền quyết định một tính trạng xác định, hay nói tương đối chính xác hơn, sau Mendel, gen là một đoạn ADN mã hóa một protein xác định. Nhưng sau này người ta thấy không nhất thiết một gen quyết định một tính trạng mà có thể có nhiều gen cùng quyết định một tính trạng và sự biểu hiện của gen phụ thuộc nhiều nhân tố nên hình thành loại tính trạng di truyền đa nhân tố. Thế nhưng đây chỉ là sự biểu hiện của gen qua tính trạng, qua kiểu hình, còn bản thân gen, chân dung của nó ra làm sao thì cho đến nay, ngay cả khi di truyền học phân tử đã phát triển cao độ thì khái niệm về gen vẫn chưa thực sự hiểu biết hết được. Các gen này sẽ được dịch ra protein bằng ARN polymerase II và gen được gọi là gen nhóm II. Các gen này chỉ mã hóa ra một loại protein. Gen ở sinh vật bậc cao bị gián đoạn bởi những vùng không mã hóa. Thường thì gen bắt đầu từ phía 5 ’ bằng một vùng chứa các yếu tố điều chỉnh, kế đó là vùng khởi động, cả hai vùng này gộp lại thành vùng điều chỉnh. Tiếp theo là các vùng mã hóa. Các vùng mã hóa gọi là exon bị gián cách bởi các vùng

không mã hóa gọi là intron. Exon đầu tiên có thêm một vùng gọi là vùng khởi đầu dịch mã, exon cuối có thêm về phía sau một vùng kết thúc dịch mã. Hai vùng này cũng thuộc về exon. Số lượng exon trong các gen khác nhau không giống nhau. Ví dụ như gen fetoprotein của huyết thanh chuột nhắt gồm 15 exon: exon ngắn nhất gồm 53 đôi base, exon dài nhất gồm 280 đôi base, tổng chiều dài của các exon là 2229 đôi base.

Gen cấu trúc ở người (đoạn ADN) gồm các đoạn exon xen kẽ intron. Toàn bộ các đoạn intron và exon này sẽ phiên mã thành phân tử mARN tiền thân. Phân tử mARN tiền thân này sẽ cắt loại các đoạn mRAN phiên mã từ intron và nối các đoạn mARN phiên mã từ exon để tạo thành phân tử mARN thuần thục. Số lượng các intron trong một gen cũng giống như số lượng exon của nó, không giống nhau ở các gen.

Kích thước của các gen nói chung rất biến thiên, có gen có thể lớn hơn 2 triệu đôi base (gen của Dystrophin). Không có mối tương quan trực tiếp giữa kích thước của protein với chiều dài của gen mã hóa ra nó, mặc dù người ta thấy các chuỗi peptid lớn tương ứng với những gen lớn.

- ADN có trình tự lặp lại nhiều lần (ADN vệ tinh): chiếm khoảng 10 - 15% bộ gen, đó là các trình tự không mã hóa. Phần lớn các ADN vệ tinh khu trú tại vùng tâm của NST, tương ứng với băng C tức là phần dị nhiễm sắc cấu trúc. Các chuỗi Nu này không phân tán trong NST mà khu trú tập trung, chức năng chưa rõ. ADN lặp lại nhiều lần được chia thành hai loại: loại thứ nhất có chuỗi nucleotid ngắn (5 - 10 đôi base) xếp nối đuôi nhau, số lượng bản sao có thể tới hàng trăm triệu. Các chuỗi này tăng methyl hóa ở tế bào soma và giảm methyl hóa ở tế bào tạo giao tử, tại NST Y. Loại thứ hai có chuỗi Nu dài hơn, từ 100 đến 200 đôi base, cũng xếp nối đuôi nhau. Ngoài hai loại có tính khu trú ở trên, còn có một loại nữa có tính phân tán gọi là vệ tinh nhỏ (minisatellite) không nằm trong vùng dị nhiễm sắc cấu trúc, loại này rất có ích cho việc lập bản đồ gen.

- ADN có trình tự lặp lại trung bình: chiếm khoảng 25 - 40% bộ gen của người, chúng cũng có cấu trúc gồm các đoạn chuỗi Nu lặp lại nhưng đoạn chuỗi dài hơn, từ 100 đến 1000 đôi base, kém đồng nhất hơn nhiều so với loại lặp lại nhiều lần. Loại ADN này phân tán trong toàn bộ gen, phần lớn chúng không thấy hoạt động phiên mã. Chúng không mã hóa nhưng cũng có thể có chức năng phiên mã: chúng là gen của các rARN, tARN và một số gen khác nữa.

Ngoài ba loại trình tự kể trên, trong bộ gen người còn có các gen nhẩy (transposon), đó là những đoạn ADN có khả năng tích hợp vào bất cứ đâu của bộ gen.

Như vậy, dựng bản đồ gen bao gồm xác định vị trí của các gen mã hóa protein (coding genes) đồng thời xác định vị trí của các đoạn ADN không mã hóa, có tính đa hình. Hình 4.2 giới thiệu số lượng các gen mã hóa đã được phát hiện theo thời gian.

Với các tiêu chuẩn lập bản đồ gen của người, người ta lập ra hai loại bản đồ: bản đồ di truyền và bản đồ hình thể. Bản đồ di truyền dựa vào kết quả phân tích tổ hợp lại bằng phương pháp thống kê gián tiếp. Bản đồ hình thể dựa vào đo đạc trực tiếp trên chiều dài của ADN.

3. MỘT SỐ PHƯƠNG PHÁP XÁC ĐỊNH BẢN ĐỒ DI TRUYỀN VÀ BẢN ĐỒ HÌNH THỂ

3.1. Bản đồ di truyền

Phương pháp phân tích gen liên kết

Phương pháp phân tích gen liên kết là phương pháp phân tích cốt yếu để lập bản đồ di truyền. Các gen trên cùng một NST tạo thành nhóm liên kết. Các gen liên kết thường phân ly cùng với nhau. Mức độ liên kết của các gen có thể xác định qua phân tích gia hệ. Khoảng cách di truyền được biểu thị bằng centimorgan (cM). Centimorgan còn gọi là một đơn vị tổ hợp lại, khoảng cách giữa hai locus là một đơn vị tổ hợp lại khi tần số tổ hợp lại giữa hai locus ấy bằng 1% qua phân bào giảm nhiễm.

Locus gen quy định tính trạng hoặc một bệnh nào đó đã được xác định (nhóm máu, các dạng protein, ADN -RFLP... ) được coi là các cột tiêu. Khi phân tích gia hệ, nếu các tính trạng cột tiêu và gen bệnh cần xác định vị trí (gen đích) phân ly độc lập, có thể kết luận các gen ở trên các NST khác nhau hoặc ở trên cùng một NST nhưng ở xa nhau (liên kết không hoàn toàn). Nếu sự di truyền của hai tính trạng luôn đi cùng nhau có thể cho rằng hai locus ở gần nhau trên cùng một NST. Sự trao đổi chéo xẩy ra trong giảm phân là cơ sở của sự tái tổ hợp lại. Ở người trung bình có khoảng từ 30 - 35 trao đổi chéo qua mỗi lần phân bào ở nam giới, nhưng con số đó ở nữ giới thì gần gấp đôi.

Khi dùng enzym giới hạn để cắt ADN, người ta phát hiện thấy tính đa hình chiều dài các đoạn ADN được cắt bởi enzym đó (Restriction Fragment Length Polymorphism = RFLP) ở các cá thể là khác nhau và sự đa hình ấy di truyền theo Mendel.

Việc phát hiện các đa hình ADN khác (vệ tinh nhỏ, minisatellite) và vệ tinh siêu nhỏ (microsatellite) đóng vai trò như những cột tiêu của gen. Bằng sử dụng enzym giới hạn và các ADN dò (DNA probe) thích hợp đã thúc đẩy nhanh việc xây dựng bản đồ gen liên kết.

Hình 4.3 dưới đây minh họa sự di truyền của nhóm máu ABO và MN trong một gia đình bị dị tật giảm sản xương bánh chè, loạn sản móng và viêm thận ở người trưởng thành (Nail - Patella syndrome).

Qua phân tích gia hệ thấy bệnh luôn đi kèm với nhóm máu A (thuộc ABO) mà không đi kèm với nhóm máu MN.

Các phân tích gần đây đã xác định locus của nhóm máu ABO nằm trên NST số 9 ở vị trí 9q34, locus của bệnh nêu trên cũng ở trên NST số 9 và gần vị trí 9q34, cách nhau 10 cM.

Gia hệ này cũng cho biết không có sự liên kết của locus bệnh nêu trên với locus chi phối nhóm máu MN.

Điều này cũng được chứng minh vì locus của nhóm máu MN nằm trên NST số 4.

3.2. Bản đồ hình thể

3.2.1. Phương pháp lai tại chỗ (In Situ Hybridization)

Phương pháp lai tại chỗ là phương pháp vừa di truyền tế bào vừa di truyền phân tử. Phương pháp thường được dùng là lai NST ở kỳ giữa hoặc NST trong nhân tế bào gian kỳ với ADN dò đã được đánh dấu bằng đồng vị phóng xạ hoặc bằng phẩm nhuộm huỳnh quang. Quan sát sự có mặt của đoạn ADN đích trong đoạn ADN lai bằng tự chụp hình phóng xạ hoặc bằng kính hiển vi huỳnh quang. Bằng phương pháp này chuỗi nhẹ kappa của globulin miễn dịch đã được xác định có locus trên nhánh ngắn của NST số 2.

3.2.2. Phương pháp lập bản đồ mất đoạn

Phương pháp này dựa vào sự có hoặc vắng mặt của một vùng đặc biệt nào đó hoặc của một locus trong ADN lấy từ bệnh nhân có bất thường NST hay từ mẫu lai các tế bào soma của người và gặm nhấm, trong mẫu có chứa đoạn ADN đã biết trước của NST người. Lập bản đồ mất đoạn đặc biệt có ích cho lập bản đồ NST X vì một số lượng lớn các bất thường trên NST X đã được xác định.

3.2.3. Thông tin về khoảng cách hình thể

Vẫn phải nhờ phương pháp lập bản đồ giới hạn với enzym giới hạn loại cắt đoạn ADN có độ dài lớn (từ 100 Kb đến trên 4 Mb).

Các đoạn ADN giới hạn (là đoạn ADN sau khi được cắt bởi enzym giới hạn) được lai với các mẫu đánh dấu ngoài tế bào bằng phương pháp Southern blotting, bao gồm các giai đoạn cắt ADN, tách ADN bằng điện di, thấm ADN từ gel agarose điện di lên màng nitrocellulose hoặc nylon và sau đó lai ADN và đọc bằng chụp hình phóng xạ nếu đánh dấu bằng đồng vị phóng xạ hoặc đọc theo phương pháp huỳnh quang nếu đánh dấu bằng nhuộm huỳnh quang.

3.2.4. Phương pháp dùng các nhiễm sắc thể nấm men nhân tạo (YAC) để tạo gen đơn dòng

Phương pháp này là phương pháp đặc biệt hữu hiệu để lập bản đồ hình thể. YAC là một NST nhân tạo cực nhỏ gồm đủ các tín hiệu đặc hiệu của một NST nấm men (các yếu tố phiên mã, phần tâm và các đầu mút) để làm vector đưa một gen lạ vào dòng gen trong tế bào Eukaryota là nấm men. YAC bảo đảm sự nhân lên trung thành và bền đoạn ADN lạ trong tế bào Eukaryota.

Ưu điểm của YAC là có thể tiếp nhận những đoạn dài hàng vài trăm Kb (100 - 1000 Kb) tức là khả năng lớn gấp từ 2 đến 40 lần khả năng của cosmid (cosmid là một vector dùng để tạo gen đơn dòng có nguồn gốc từ phage À). Với phương pháp nhân ADN có chiều dài lớn bằng YAC, tốc độ lập bản đồ hình thể được gia tăng gấp bội và dự án về bản đồ hình thể bộ gen người có nhiều hy vọng sớm được hoàn thành và trên cơ sở đó sự phân tích phân tử của bộ gen người cũng có thêm nhiều thuận lợi.

3.2.5. Phương pháp lai tế bào sinh dưỡng khác loài

Lai tế bào sinh dưỡng của người và của chuột nhắt thường được dùng. Tế bào lai ban đầu chứa cả bộ NST của người (46 NST) và của chuột (40 NST) nhưng trong khi nuôi cấy một số NST của người bị mất một cách ngẫu nhiên trong khi đó NST của chuột được giữ nguyên. Bộ NST của người còn lại được cấy truyền để duy trì. Bộ NST của người và của chuột có thể phân biệt bằng hình thái NST và bằng nhuộm giemsa.

Sau đây là ví dụ: tế bào của người lai với dòng tế bào của chuột nhắt thuần chủng về tính chất khiếm khuyết thymidin kinase. Enzym này cần cho sự sống sót của tế bào. Các tế bào của chuột sẽ chỉ sống sót khi có mang gen của người mã hóa thymidin kinase. Quan sát cho thấy rằng các tế bào lai chỉ sống sót khi còn NST số 17 của người. Điều này chứng tỏ gen mã hóa thymidin kinase nằm trên NST số 17 của người.

3.2.6. Phương pháp xác định liều gen (Gene - dosage methods)

Phương pháp xác định liều gen là phương pháp xác định số lượng bản sao của một gen, cụ thể là xác định số lượng bản sao của một gen hay cả một trình tự Nu chưa rõ bằng một loại mẫu dò duy nhất đặc hiệu và so sánh mật độ tín hiệu của gen đích đã được lai với mật độ của tín hiệu được dùng làm đối chứng. Mật độ của tín hiệu được đo bằng phương pháp tự chụp hình phóng xạ.

Các NST thường tồn tại từng cặp trong tế bào sinh dưỡng. Trong điều kiện bình thường cả hai alen của gen cùng hoạt động, nếu gen mã hóa một enzym nào đó, hoạt độ của enzym đạt 100%. Nếu một alen bị đột biến (mất đi) thì hoạt độ của enzym còn 50%; hoạt độ của enzym đạt 150% ở những người thể ba nhiễm

Phương pháp xác định liều gen được sử dụng trong dựng bản đồ gen, chủ yếu qua quan sát, xét nghiệm lâm sàng. Bằng phương pháp này người ta đã xác định được một số locus, ví dụ xác định gen mã hóa enzym phosphatase nằm trên nhánh ngắn NST số 2.

3.2.7. Phương pháp tạo gen đơn dòng định vị (Positional cloning)

Phương pháp tạo gen đơn dòng định vị là sự tạo gen đơn dòng một gen chưa biết bằng phương pháp lập bản đồ di truyền, rồi bản đồ hình thể từ đó định vị chính xác vị trí gen trên phần bản đồ liên quan, là một trong những thủ thuật hay được dùng nhất trong di truyền học ngược.

Khái niệm về di truyền học ngược (Reverse Genetics)

Theo kinh điển, muốn phân lập được một gen người ta bắt buộc phải xác định trước được sản phẩm đặc trưng của nó là protein. Từ protein suy ra mARN, cấu tạo ra các kháng thể, cấu trúc các mẫu dò có số lượng Nu rất ngắn nhờ các chuỗi polypeptid. Và như vậy đối với các bệnh về Hb, các bệnh máu khó đông nhờ biết trước được protein khuyết tật mà người ta tìm ra được gen khuyết tật. Quy trình nghiên cứu này được gọi là quy trình của di truyền học kinh điển.

Khi phát hiện ra các RFLP (các đa hình độ dài của các đoạn ADN giới hạn) thì người ta đã xây dựng được quy trình mới về phân lập gen. RFLP không những đã giúp cho người ta xây dựng được bản đồ gen người mà còn giúp khám phá ra các gen còn tiềm ẩn. Đầu tiên người ta phân lập các trình tự Nu đã được tạo dòng của ADN bộ gen có trong một bệnh phẩm di truyền (locus bệnh), trong một chức năng đang nghiên cứu (hình thái học phát sinh, sự biệt hóa trong chu kỳ tế bào) hay trong một kiểu hình (phenotyp) của tế bào (kiểu hình chuyển dạng của tế bào ung thư). Khi đoạn ADN nói trên đã được phân lập, người ta tìm hiểu thông tin của nó dưới dạng trình tự Nu mã hóa từ đó suy ra trình tự acid amin của protein. Trong quá trình nghiên cứu không loại trừ phân lập ra những chuỗi trình tự Nu vô nghĩa.

Quy trình nghiên cứu bắt đầu từ gen rồi mới đến protein nên người ta gọi là “Di truyền học ngược” (Reverse genetic) sau này gọi là phương pháp tạo gen đơn dòng định vị (Positional cloning).

Ví dụ về xác định bản đồ của gen bệnh mucoviscidose:

Về căn bệnh mucoviscidose, người ta biết rất rõ các biểu hiện lâm sàng nhưng protein liên quan đến bệnh thì người ta không biết.

Các nhà nghiên cứu đã biết, nhờ phân tích liên kết gen trong nội bộ các gia đình có trẻ bị bệnh mucoviscidose thấy gen bệnh nằm trên NST số 7, giữa vị trí Met và locus D758, nhưng hai chuỗi trình tự Nu ấy cách xa nhau tới 1600 Kb. Họ phải dùng phương pháp tiến dần theo chiều dọc NST. Kỹ thuật này gồm: cắt ADN thành nhiều đoạn nhờ enzym cắt. Họ để ý thấy đoạn ADN cắt nào nằm phía 5’ được nhận diện bởi mẫu dò của nó. Rồi họ dùng đầu mút 3 ’ của đoạn ấy là mẫu dò mới để tiếp tục định vị cho một đoạn ADN mới gối đoạn cũ, đoạn này kéo dài theo hướng tiếp đầu 3’ (và như thế là gần gen cần phân lập hơn) và cứ thế tiếp tục. Tất cả các đoạn ADN được cắt bằng enzym giới hạn đều định hướng lần lượt. Và các gen tiềm tàng phải được định vị. Cuối cùng là phải xác định được vùng nào trong khu vực mã hóa sẽ tương ứng với gen của bệnh mucoviscidose. Họ còn thận trọng làm việc so sánh các mARN phân lập trong các tế bào khác nhau của bệnh nhân mucoviscidose.

Kết quả là một gen gồm 280 Kb đã được xác định là gen của bệnh mucoviscidose. Nó chứa 27 exon và mã hóa một protein dài 1480 aa. Protein này được gọi tên là “CFTR” (Cystic fibrosis transmembrane conductance regulator) là một protein phụ trách vận chuyển các ion clo qua màng (từ trong ra ngoài tế bào). Nó gồm có từ đầu mút N đến đầu mút C của phân tử protein: một vùng gồm sáu đoạn xuyên màng, một vùng NBF (Nucleotid Binding Fold) nối gắn ATP, một vùng điều chỉnh R gồm các vị trí phosphoryl hóa, một vùng khác gồm sáu đoạn xuyên màng, và một vùng NBF khác nữa liên kết với ATP. Các vùng xuyên màng tạo nên những kênh vận chuyển clo. Khi một sự phosphoryl hóa của vùng R xẩy ra và các ATP liên kết với hai vùng NBF thì kênh clo mở ra, và các ion Cl" rời khỏi tế bào.

Ngày nay, trên 400 bất thường phân tử của gen bệnh mucoviscidose đã được mô tả. Đột biến hay gặp nhất là loại mất đoạn 3 Nu của exon 10 dẫn tới sinh ra một protein mất acid amin thứ 508 là phenylalanin - Đột biến này nằm trong vùng NBF đầu tiên. Do thiếu phenylalanin, ATP không gắn được, điều này gây nhiễu cho chức năng

kênh Cl, các ion Cl- tích tụ lại trong tế bào và cùng với chúng là các ion Na+, vì thế mà nước ở lại trong tế bào. Chất nhầy tiết ra bởi các tế bào ấy chứa không đủ lượng nước bình thường và trở nên rất nhớt. Thêm nữa, protein CFTR mang đột biến F508 không còn có trong màng tế bào. Khuyết tật về độ thuần thục của nó sẽ là nguyên nhân để nó tồn tại trong tế bào chất thay vì đến định cư trong màng tế bào.

Hình 4.5 sơ đồ phương pháp tạo gen đơn dòng định vị

3.2.8. Phương pháp phân tích hình thái nhiễm sắc thể

Phân tích hình thái NST có thể giúp cho xác định vị trí của gen.

- Bằng phân tích đa hình NST, Donahue đã xác định nhóm máu Duffy có locus trên NST số 1.

Phương pháp quan sát các mất đoạn NST được dùng để xác định gen đột biến của bệnh retinoblastoma, bệnh Prader - Willi...

- Hiện tượng trao đổi đoạn cũng được dùng để xác định locus, một ví dụ điển hình là sự chuyển đoạn giữa NST X và NST thường ở nữ bị bệnh loạn dưỡng cơ Duchenne (một bệnh rất hiếm gặp ở nữ). Qua phương pháp này người ta đã xác định gen chi phối bệnh loạn dưỡng cơ Duchenne ở Xp21.

3.3. Bản đồ gen bệnh (khi chưa có mARN trong tay)

Nhiều bệnh di truyền ngoài những triệu chứng hình thái ra (có thể có hoặc không thấy) còn biểu hiện ở mức độ phân tử protein tức là sản sinh ra các protein không bình thường về chất lượng hoặc về số lượng. Nếu là bất thường về chất lượng thì protein đó có thể là nguyên liệu khởi đầu để tìm ra gen đã mã hóa ra nó. Một phương pháp gọi là phiên mã ngược cho phép thông qua mARN được cấu trúc nhân tạo theo trình tự các acid amin của phân tử protein bất thường ấy, từ mARN nhân tạo này nhờ enzym phiên mã ngược tổng hợp được cADN (ADN bổ sung). cADN được đánh dấu và như vậy là người ta đã có được một mẫu dò đánh dấu dùng cho kỹ thuật lai tại chỗ hoặc Southern blotting để định vị gen gây bệnh trên NST mang nó. Đây là một trong những phương pháp được dùng để lập bản đồ gen bệnh.

4. CÁCH GHI TRONG BẢN ĐỒ GEN

Có bản đồ chung cho mọi gen của cơ thể, nhưng cũng có bản đồ riêng cho các gen liên quan với bệnh tật (Morbid gene - map).

Có nhiều cách ghi trong bản đồ gen: có thể ghi trong sơ đồ NST, nhưng cũng có thể ghi trong bảng thống kê. Dù ghi theo cách nào các thông tin sau đây cần có:

Tên bệnh hay tính trạng; tên gen chi phối bệnh hay tính trạng; ký hiệu của gen; mã số của bệnh hay tính trạng theo Mc Kusick (Mck); vị trí của gen.

5. XÁC ĐỊNH TRÌNH Tự NUCLEOTID CỦA ADN TRONG LẬP BẢN ĐỒ GEN NGƯỜI

Công việc này không phải chỉ là một lĩnh vực độc lập hoặc tương đối độc lập của bộ gen học hay của Bản đồ gen mà nó xẩy ra trong hầu hết các nghiên cứu về bộ gen, vì đã nói đến bộ gen là nói đến ADN, và nói đến ADN là nói đến Nu, mà “giải trình tự Nu của ADN” cũng là những công việc quen thuộc của các lĩnh vực nghiên cứu gen. Điếm khác là:

- “Giải trình tự Nu” nhằm gọi tên theo trình tự tất cả 3 tỷ Nu của 22 NST thường và NST giới X, Y của người.

- Cố gắng xác định nếu có thế chức năng của từng đoạn trình tự, những phần là gen, những phần không phải là gen, những phần đóng vai trò phụ hoặc điều chỉnh biếu hiện, những phần hoàn toàn chưa rõ chức năng...

Những tiến bộ của sinh học phân tử đặc biệt về mặt kỹ thuật đã tạo cho Dự án bản đồ gen người hoàn thành phần việc quan trọng nhất: xác định trình tự ba tỷ đôi base trong bộ gen của người. Việc phát hiện ra các loại enzym trong kỹ thuật di truyền, đặc biệt là enzym giới hạn, enzym nối, việc phát hiện và liên tục cải tiến phương pháp xác định trình tự gen, gần đây nhất là phương pháp thăm dò trình tự 4 màu huỳnh quang (Four - colour fluorescence - base - sequence detection), xác định trình tự vòng, phương pháp điện di mao quản... đã cung cấp những công cụ cần thiết và hữu hiệu cho xác định trình tự bộ gen người. Các kỹ thuật có nhiều nhưng có thế tóm tắt các bước cơ bản như sau:

- Phân lập được ADN.

- Tạo gen đơn dòng được ADN.

- Cắt đặc hiệu ADN.

- Nhân đoạn ADN invitro (PCR).

- Biến tính ADN.

- Đánh dấu ADN.

- Nối chính xác ADN.

- Đọc trình tự Nu, cần nhất là đọc tự động bằng máy, kết quả đọc được lưu giữ trong đĩa nhờ máy tính.

Sau đây là nguyên lý của phương pháp xác định trình tự Nu của ADN trong lập bản đồ gen người:

ADN dù dài ngắn có chức năng gì thì cũng chỉ có 4 loại Nu. Người ta dùng chất đánh dấu huỳnh quang 4 loại khác nhau đặc trưng riêng cho từng loại Nu.

Biến tính mẫu ADN cần xác định.

Chuẩn bị một lượng Nu 4 loại đã đánh dấu đủ cho lai bổ sung.

Lai bổ sung mẫu ADN sợi đơn cần nghiên cứu với các Nu đã đánh dấu.

Cho vào máy đọc trình tự Nu tự động (sequenceur). Nguyên lý đọc là máy có khả năng nhận diện từng màu huỳnh quang khác nhau và tự động ghi khi một Nu đi qua máy và lưu trữ số liệu vào máy.

Ngày 26 tháng 6 năm 2000 Dự án bộ gen người và công ty tư nhân Celera Genomics đã công bố phác thảo bộ gen người. Ngày 12 tháng 2 năm 2001 Dự án bộ gen người và Celera genomics đã công bố trình tự đầy đủ bộ gen người ở tạp chí Nature và Science. Theo công bố, loài người có 31780 gen mã hóa protein, số lượng này ít hơn nhiều theo dự đoán trước đó. Sau khi bản đồ gen của người được hoàn thành về cơ bản việc nghiên cứu sản

phẩm phiên mã và hệ protein càng được đẩy mạnh.

6. DỰ ÁN BỘ GEN NGƯỜI

Dự án bộ gen người là một trong những công trình to lớn nhất và là nhiệm vụ đầy tham vọng trong lịch sử nghiên cứu y sinh học. Khởi đầu năm 1990, dự án dự kiến thực hiện trong 15 năm gồm 3 mục tiêu: 1. Xây dựng bản đồ di truyền;

2. Xây dựng bản đồ hình thể; 3. Xác định trình tự của hơn 3 tỷ đôi base trong bộ gen người.

Khi Dự án bộ gen người hoàn thành sẽ thu được những tiến bộ vượt bậc. Bản đồ marker đã được hoàn thành vài năm trước đó với gần 20000 cấu trúc đa hình đã phát hiện phân bố trong toàn bộ bộ gen người. Đó là các cấu trúc đa hình của RFLPs, VNTRs và vệ tinh siêu nhỏ (microsatellite). Trung bình, với tác dụng của tính đa hình có thể phát hiện được cấu trúc trong khoảng 1 cM. Hơn nữa, các bệnh sẽ được phát hiện nhờ có các marker liên kết. Dự án có thể thu thập được trên 300000 tính đa hình của các nu đơn lẻ SNPs (single nuleotide polymorphism) phân bố trong toàn bộ bộ gen. SNPs là các nu đơn lẻ khác nhau và ít đa hình hơn cấu trúc vệ tinh siêu nhỏ và VNTR. Tuy vậy, chúng lại ít đột biến hơn các loại đa hình trên. Vì thế chúng có tác dụng đẩy mạnh việc xây dựng bản đồ di truyền người.

Mục tiêu thứ hai là xây dựng bản đồ hình thể để xác định được sự phân bố của STSs (sequence tagged sites) với chiều dài 100 kb phân bố trong toàn bộ bộ gen cũng được hoàn thành với hơn 68000 STSs vào khoảng đầu năm 2000. Các vị trí cột tiêu của bản đồ hình thể có giá trị to lớn trong những thí nghiệm nhân dòng gen bằng vị trí, nơi có thể gắn hàng loạt các đoạn chuỗi (ví dụ như gắn các đoạn chuỗi ADN vào YACs, BACs, PACs hoặc cosmids) trong một trật tự nhất định.

Mục tiêu cuối cùng là xác định vị trí của các nu trong bộ gen người với nhiều phương pháp và là nhiệm vụ khó khăn nhất. Bắt đầu từ thư viện NST đặc hiệu sẽ thu được hàng nghìn những đoạn chuỗi xen kẽ các đoạn dài 1000 bp hoặc nhỏ hơn. Tiếp đó là sắp xếp các chuỗi đó trong trật tự chuỗi nu của NST, đây là nhiệm vụ cực kỳ to lớn bởi vì vẫn tồn tại những khoảng trống gây trở ngại như là các đoạn lặp lại hay cấu trúc tương tự. Cần phải rất nhiều cố gắng mới phát triển được phương pháp này khi muốn rút ngắn thời gian và kinh phí. Để tiến tới có thể đạt được sự chính xác cao, hiện tại phải chấp nhận tỷ lệ sai số là 1/10.000 nu. Xác định trình tự nu trong bộ gen của một số loài có cấu trúc bộ gen nhỏ và đơn giản hơn (ví dụ như ở vi khuẩn (E.coli), nấm men (S.cerevisiae) và ở ruồi dấm (Drosophil melanogaster)) đã giúp cho việc tối ưu hơn các phương pháp thực hiện ở bộ gen lớn hơn của người. Hơn nữa, sự tương đồng giữa các sinh vật đó và người giúp cho chúng ta hiểu rõ hơn bản chất của các bệnh gen ở người.

Các bước của quá trình xác định trình tự chuỗi nu trong bộ gen người đã đẩy mạnh nhanh chóng. Chuỗi nu của NST đầu tiên được hoàn chỉnh là NST số 22 đã được công bố đầu tiên năm 1999 (toàn bộ chuỗi nu thực chất chưa thực sự hoàn chỉnh vì còn có những khoảng trống nhỏ, những vùng dị nhiễm sắc nơi không chứa gen vẫn chưa xác định cấu trúc). Dự thảo của bộ gen người trong đó có trên 90% ADN được biết cấu trúc dự kiến hoàn thành vào khoảng năm 2000 và sẽ có tác dụng rất tốt vì chứa hầu hết các gen của bộ gen người. Dự kiến hoàn thành chính xác dự án bộ gen người không sau năm 2003, chính xác là hoàn thành 50 năm sau khi Watson và Crick tìm ra cấu trúc của ADN.

Khi Dự án bộ gen người hoàn thành sẽ có rất nhiều lợi ích. Trước hết, dự án bản đồ gen sẽ được hoàn chỉnh nhờ các ứng dụng to lớn của bản đồ các marker. Sự nhân dòng gen bằng vị trí là một thủ thuật hay được dùng đã rất khả thi khi có hiệu quả của bản đồ hình thể. Số thời gian cần thiết để xác định vị trí gen nhờ nhân dòng gen bằng vị trí đã giảm đi nhiều và số gen bệnh tìm được bằng cách này đã tăng lên hàng năm. Sự nhân dòng gen bệnh có rất nhiều lợi ích quan trọng: cải thiện được chẩn đoán bệnh tật di truyền, sản xuất các sản phẩm gen nhờ kỹ thuật tái tổ hợp ADN, cải thiện các phương pháp điều trị nhờ các thuốc đặc hiệu hơn và liệu pháp gen.

Khi hoàn thành, Dự án bộ gen người sẽ làm sáng tỏ những trường hợp khó khăn trước đây. Khi có trong tay cấu trúc của các nu trong bộ gen người và đưa ra “bản thiết kế di truyền” cuối cùng của con người. Với số lượng khổng lồ các cấu trúc ADN không mã hóa sẽ làm chúng ta ngạc nhiên về những bằng chứng mà trước đây chúng ta chưa được biết rõ về sinh học và nguồn gốc của chúng ta.

Thật là thiếu sót nếu chúng ta nghĩ rằng, hoàn thành cấu trúc các nu trong bộ gen người là kết thúc nghiên cứu của kỷ nguyên. Cấu trúc các nu trong chuỗi ADN với giá trị vô cùng to lớn của nó vẫn không thể lớn hơn được chiều dài cấu trúc của chuỗi ADN. Nhiệm vụ to lớn của chúng ta là tiếp tục xác định cấu trúc, sự điều hòa và sự biểu hiện của gen cũng như sự tương tác phức tạp giữa gen và yếu tố môi trường để cuối cùng biểu hiện ra tính trạng. Cấu trúc của các chuỗi nu trong bộ gen người mới chỉ là sự khởi đầu, sự tiếp tục sau đó là sự khám phá của kỷ nguyên trong lĩnh vực nghiên cứu sinh học vô cùng to lớn và đầy lý thú.

TỰ LƯỢNG GIÁ

1. Nêu khái niệm bộ gen người, mục tiêu và ý nghĩa của dự án bản đồ gen người.

2. Trình bày đặc điểm bộ gen người.

3. Trình bày phương pháp phân tích gen liên kết.

4. Trình bày các phương pháp xây dựng bản đồ hình thể (phương pháp lai tại chỗ, phương pháp lập bản đồ mất đoạn, phương pháp lai tế bào sinh dưỡng khác loài, phương pháp xác định liều gen, phương pháp tạo gen đơn dòng bằng vị trí, phương pháp phân tích hình thái NST).

Từ khóa » Bản đồ Adn