KẾT QUẢ NGHIÊN CỨU BỘ GENE CỦA NHÂN LOẠI :
BẢN ÐỒ SINH-HỌC CỦA THẾ KỶ 21
Nguyễn Ðức Thái, PhD
(TS Nguyễn Ðức Thái, DS khoá 72 Dược Khoa Saigon là người đã khám phá ra gene cua bệnh glaucoma. Hiện nay anh làm "Glaucoma Research" tại "Department of Ophthalmology/UCSF". Ðây là một bài đã được anh gữi lên Diễn Ðàn Dược Khoa tháng 7 vừa qua. Chúng tôi thấy hữu ích vì là một vấn đề vừa thời sự , vừa mới lạ, vừa liên quan đến nghề nghiệp nên đã ghi lại, nhờ anh Thái sữa chữa đễ phổ biến với các bạn trong nghề. Ngoài ra cũng có một bản anh ngữ cho giới trẻ.)
Viết để nhớ ơn các Thầy, Cô vŕ
thân gửi các Bạn Dược Khoa mới, cũ trong và ngoài nướcThân gửi các Bạn trong Diễn Ðàn Dược Khoa.
Một thời điểm đặc biệt cho những nhŕ
nghiên cứu Sinh-học nói riêng, và cho toàn thể thế giới nói chung đã xảy ra trong tuần qua. Ðó là việc công bố kết quả công trình nghiên cứu bộ Gene của con người do Celera Genomics va Chương Trình Nghiên Cứu Bộ Gene Nhân Loại của Viện Nghiên cứu Quốc Gia Hoa Kỳ (National Institute of Health's National Human Genome Research Institute) hoàn thành. Trong mục đích thông tin Dược Khoa, nhân dịp này tôi xin đóng góp vài nét về tin thời sự và tóm lược những điểm chính về thành quả khoa học quan trọng và có tầm ảnh hưởng rộng lớn đến Y và Dược khoa.A- MỤC ÐÍCH NGHIÊN CỨU BỘ GENE :
Gene là đơn vị nền tảng của SINH-HỌC, cho nên việc tìm hiểu Bộ Gene của con người là điều tất yếu. Gene nằm trong nhân tế bào de DNA (DeoxyNucleotide Acid) tạo nên và gồm bốn acid amin căn bản : A (adenine), C (cytosine), G (guanine) và T (thymine) . Có rất nhiều loại gene và gene nắm vai trò then chốt từ việc tạo hình (structure) cho đ
ến chức năng (function) đa dạng của tế bŕo. Việc tìm hiểu số lượng gene cũng như tổ chức của các hệ thống gene trong con người là điều tất yếu để mang lại những sự hiểu biết hoŕn hảo và từ đó đi đến những tiến bộ mớiViệc nghiên cứu Bô Gene đã qua nhiều tiến trình. Ư¨ng dụng kỷ thuật cloning DNA, các gene được tìm kiếm theo từng bệnh và theo từng chương trình nghiên cứu của mỗi phòng thí nghiệm. Gene về bệnh ung thư do những nhóm nghiên cứu về ung thư tìm ra, gene về bệnh cao huyết áp, phôi sinh, lão già v.v& do mỗi chuyên khoa từng ngành thu hoạch đ
ược. Từ việc phát triển kỷ thuật DNA đầu thập nięn 1980 đến nay, đă có một số gene dược khám phá, và sự nghiên cứu về những gene này mang lại nhiều tiến bộ cho sự hiểu biết về bệnh lý và những ứng dụng hữu ích về trị liệu trong y học. Sự phát triển rất nhanh của kỷ nghệ sinh học (biotechnology companies) là những dẫn chứng điển hình.Tuy nhiên số lượng gene này còn rất ø ít ỏi so với số gene tiềm tàng trong tế bào chưa được khám phá. Tới nay, có khoảng vài ngàn gene được báo cáo lẻ tẽ do công trình nghiên cứu từ các phòng thí nghiệm trong khoảng tổng số tới 100,000 gene được ước lượng cho tế bào.Trên thực tế, số gene rất khó xác định vì gene chỉ chiếm một tỷ lệ rất nhỏ của tổng số lượng lớn DNA của tế bào. Nếu dùng phương thức cổ điển nghĩa là clone từng gene một, thì người ta ước tính sẽ cần nhiều thế kỷ và rất tốn kém. Ðể đáp úng nhu cầu tiến bộ, Chương Trình Nghiên Cứu Toàn Bộ Gene Nhân Loại (The Human Genome Project) đã đ
ược hoạch định giữa thập nięn 1980 và ra đời vào tháng 10 năm 1990 do sự khởi xướng của Tiến sĩ James Watson, ông cũng là mot trong hai người cha đẻ của cấu trúc DNA. Chương trình này nhằm mục đích thiết lập trình tự (sequence) toàn thể DNA của tế bào, sắp xếp trình tự này cho đúng thứ tự và từ đó kết hợp với các phương thức khác để đi đến việc xáůc định số lượng gene, vị trí vŕ cấu trúc của cac gene trong tế bào.Về phương
diện kỷ thuật, đây lŕ một chương trình có tầm mức vĩ đại và có sự phối hợp nhiều trung tâm Nghiên Cứu Bộ Gene (human genome center) trên thế giới gồm Hoa Kỳ, Nhật Bản, Anh, Pháp, Ðức, Trung Hoa và một số nước khác. Ngân khoản là 3 tỷ và qua nhiều giai đoạn từ hơn mười năm qua.Ngoài Chương Trình Nghiên Cứu Toàn Bộ Gene Nhân Loại, gần đây một số hãng sinh học chuyên về Bộ Gene (genomic companies) được thành hình vì giá trị kinh tế quan trong của hệ thống Bộ Gene. Sự nhập cuộc của các hãng này đã tạo nên mộ
t bầu không khí thi đua ngoạn mục cho việc khai phá bí mật về bộ gene của nhân loại.
B- KẾT QUẢ VỀ BỘ GENE CỦA NHÂN LOẠI :
Tại Tòa Bạch ốc, ngày 26 tháng 6, năm 2000, hai khoa học gia Hoa Kỳ, Craig Venter, J. và Francis Collins, đã cho công bố kết quả Bộ Gene Nhân Loại vơiù sự hiện diện của Tổng thống Bill Clinton. Một đ
iểm đặc biệt lŕ Tiến sĩ Venter là đại diện của Celera Genomics, một hãng tư mới được thiết lập năm 1997. Việc tham gia của Tiến sĩ Venter đă làm thay đổi cuộc diện tranh đua đă sẵn sôi động của chương trěnh nghiên cứu rộng lớn nàỵ Tiến sĩ Venter đã nghiên cứu về Bộ Gene tại NIH và sau đó tại The Human Genome Sciences, Inc.,trước khi lập ra hãng Celera Genomics (tiếng latin có nghĩa là rất nhanh). Tuy nhập cuộc sau và với ngân khoản giới hạn 200 triệu cho dự án, Tiến sĩ Venter đă đạt thŕnh quả với kỷ lục sau 3 năm ở hăng Celera Genomics để dẫn đầu việc báo cáo cho cộng đồng khoa học vŕ thế giới về cấu trúc Bộ Gene Nhân Loại. Bí quyết mang lại thành công độc nhất vô nhị này của Tiến sĩ Venter : quyết chí, nhiệt tâm (determination, enthusiasm) và sáng kiến (visionary). Một điềy lư thú đối với người Việt lŕ, Tiến sĩ Venter đă ở Việt Nam trong giai đoạn Tết Mậu Thân, 1968. Kinh nghiệm Việt Nam đă tạo ông trở thành một người gang thép tron những thử thách và nhiệt tâm trong đơiø sống. Ông cho biết chiến tranh Việt Nam đã giúp ông biết quý trọng từng giờ phút của đời sống và công việc. Châm ngôn sống của Tiến sĩ Venter :"Bạn hãy coi mỗi giây phút, mỗi ngày của đời sống như một mục tiêu hoàn hảo bạn cần đạt được". Về tổ chức, ông đă kết hợp với PE Biosystems để có một bộ máy điện toán cực mạnh cho việc thiết lập Bộ Gene. Giám đốc Tiến Si Francis Collins lŕ giám đốc của Chương Trěnh Nghiên cứu Bộ Gene Nhân Loại của Hoa Kỳ, một chương trình có đóng góp từ nguyęn thủy và có ảnh hưởng lớn về phương diện quốc tế.Theo kết quả công bố của hai người, thi Bộ Gene của chúng ta có 3.12 tỷ nucleotides và 97% tổng số nucleotides đã được xác nhận trình tự (sequence), trong đó 85% số trình tự này đã được
đặt đúng thứ tự (map). Khoảng 3% tổng số lượng DNA có genes, phần cňn lại là DNA "không có công dụng" (non-functional DNA). Trong tỷ số DNA này có khoảng 60,000-100,000 genes. Theo một hãng genomics khác, The Human Genome Sciences, Inc., thì số lượng gene có thể trên 120,000. Bộ gene của chúng ta rất giống nhau tới 99.9% dù khác biệt chủng loại. Người ta hy vọng số trình tự còn lại sẽ có được giải đáp trong thời gian 2 năm tới. Số lương nŕy tuy nhỏ nhưng nằm ở phần rất khó lập trình tự (sequence). Việc xác định các gene dựa tręn các trình tự vừa thiết lập sẽ cần một thời gian dài nghiên cứu vì các trình tự này cần được chứng minh có hoạt tính (function) gene.Ðể có khái niệm về mức độ phức tạp của Bộ Gene, chúng ta có thể tưởng tượng là nếu các trình tự (se
quence) của Bộ Gene được in ra chữ thě sẽ cần khoãng 200 bộ sách và mỗi bộ dày 500 trang. Trong đó có khoãng 3 ngàn trang sách có gene, và nằm rải rác trong 200 bộ sách. Gene của chúng ta gần giống với gene của nhiều động vật khác về số lượng và cấu trúc, như chuột cũng co khoãng 80,000 gene. DNA gần nhất với người là của chimpanzees có 98% đồng số (sequence homology). Số lượng gene của tế bào giảm đi trong các sinh vật hạ đẳng trong đó kư sinh trůng có khoảng 20,000 gene, nấm (yeast) có 6,000 gene và vi khuẩn Koch của bệh lao có 4,000 gene. Có báo cáo mới đây cho biết těm được gene ở vị trí "không có công dụng" (tức lŕ nơi không hy vọng có gene). Ðây có thể là một khám phá lý thú vì nó cho biết còn nhiều bí ẩn tiềm tàng trong bộ gene và có thể rất giá trị. Hy vọng bản đồ gene sẽ dẫn chúng ta těm được giải đáp cho những bí ẩn đó. Nhiều tin tức tręn rất gần với các ước tính từ những nghiên cứu trước của Chương Trình Nghiên cứu Bộ Gene Nhân Loại. Tuy nhiên những ước tính này không được hệ thống hoá và không có dữ kiện thiết thực để được ứng dụng.Thành quả của chương trình nghiên cứu toàn Bộ Gene Nhân Loại đã giúp thiết lậ được hầu hết mọi trình tự (sequence) DNA và đã giúp xác định sự sắp xếp (map) của cac trình tự này theo đúng chi tiết của bộ gene ở trong tế bào. Nói giản dị hơn, ngay nay chúng ta có một bản đ
ồ chi tiết về bộ gene để những nhŕ nghiên cứu có thể đi từ điểm nŕy đến điểm kia mŕ không bị lạc. Ngoài ra gene cũng như 1 xã hội, có từng khu vực và từng nhóm, bản đồ gene giúp các nhà nghiên cứu biết được đặc tính từng khu vực vŕ sự liên kết của các nhóm genes với nhau. Một bản đồ như vậy, đương nhięn là một kim chỉ nam quan trọng và thiết yếu cho nhiều chương trình nghiên cứu và hứa hẹn sẽ mang lại những khám phá tân kỳ. Những ứng dụng của các khám phá này được tiên đoán là sẽ làm cách mạng khoa sinh vật để mang đến những tiến bộ mới cho xă hội trong kỷ nguyên này.C- NHỮNG ỨNG DỤNG:
Sẽ có hằng hà sa số những ứng dụng của Bộ Gene Nhân Loại trong các công trình nghiên cứu hiện tại và tương lai. Như nói trên, kết quả của trình tự (sequence) bộ gene là 1 bản đ
ồ chỉ đường, nęn nó cần được phối hợp với những hệ thống nghięn cứu khác trong việc tìm tòi khảo cứu. Sự phối hợp này có thể ỏ địa hạt tế bào (cell biology) để hiểu biết chi tiết về chức năng của tế bào; hoặc ở địa hạt bệnh lư (pathology), di truyền (genetics) để těm kiếm các gene liên hệ đến bệnh lý. Những áp dụng ở lãnh vực trị liệu (therapeutics) hoặc ở lãnh vực môi sinh (ecology) sẽ giúp làm gia tăngsự hoàn bị của việc điều trị, cũng như gia tăng phẩm chất đời sống. Các ảnh hưởng của bản đồ Bộ Gene Nhân Loại trong khía cạnh xă hội học cũng sẽ rất đa dạng tuy vấn đề nŕy nằm ngoài khả năng nhận xét của người viết. Trong bài này, tôi xin tóm lược mot số những ứng dụng có liên hệ đến Y và Dược Khoa để cůng chia sẽ với các Bạn về kết quả bộ gene của chúng ta.1- Bản đồ gene vŕ việc chẩn đoán bệnh lư:
Gene là nền tảng của tế bào, tế bào là đ
ơn vị căn bản của cơ thể, cho nęn có thể nói rằng khi biết được bản đồ gene thě cũng biết được těnh trạng của cơ thể. Có những thay đổi tręn bản đồ gene lięn hệ đến těnh trang bệnh lý của con người và sẽ giúp các chuyên gia tiên đoán được bęnh lý trước khi bệnh phát hiện. Từ gần hai thập niên qua, nghiên cứu di tryền học đã đóng góp nhiều trong việc xác định sự thay đổi (mutation) của các gene. Những thay đổi nŕy bao gồm nhiều hình thức bệnh lý từ ung thư, huyết áp, tiểu đường cho đến các bệnh tâm thần. Ngoŕi ra, trong bộ gene của mỗi cá nhân có những thay đổi rất nhỏ. Sự thay đổi nŕy được goiď là "thay đổi mot đơn vị nucleotide" hay single nucleotide polymorphism (SNP, phát âm là snip). Về phương diện phân tích, những thay dổi nhỏ này có mot giá trị đặc biệt vì SNP có thể liên hệ đến các gene quan trọng. Giới y khoa thường gặp khó khăn trong vấn đề dược phẩm trị liệu, khi dùng cho một số cá nhân thì có kết quả, nhưng đối với một số cá nhân khác thì không hiệu quả hoặc có tác hại. Ngày nay SNP được coi là 1 trong những yếu tố chính và di truyền gây sự khác biệt này. Quan niem nay da co trong Dong y, theo do thi moi nguoi co mot tang va can duoc cat thuoc rieng. SNP đang được khảo cứu chi tiết cho dược phẩm trị liệu ở các chủng tộc vŕ cá nhân, ngoài việc khảo cứu những gene mới.Từ những thành quả đ
ạt được, trong tương lai việc xửu dụng bản đồ gene, SNP của mỗi bệnh nhân sẽ trở thành thông dụng và là 1 văn kiện chủ yếu của hồ sơ bệnh lý (clinical data) ở các trung tâm y tế. Các Y, Nha, Dược sĩ sẽ dựa trên bản đồ gene để tham đoán bệnh lư vŕ chọn lựa phương cách chữa trị cùng với những phương thức thường qui (conventional methods).2- Tìm các gene liên hệ đến bệnh lý:
Còn rất nhiều bệnh lý mà chưa biết được ngyên nhân, theo nghĩa sinh học phân tử là chưa tìm đ
ược gene. Bản đồ gene sẽ đóng vai trň quan trọng trong việc khám phá các gene. Ngày nay nhiều bệnh di truyền đã có số phỏng đoán (gene loci) ở trên bản đồ gene, nhưng số phỏng đoán nŕy thường rất lớn và có thể mất nhiều năm mới xác định được gene. Bản đồ gene sẽ giúp cho biết các gene ở trong loci vŕ sẽ được coi lŕ gene khả nghi (candiate genes) để xác định lięn hệ của gene với bệnh lý.Ở mục nghiên cứu rộng lớn hơn, DeCODE, một trung tâm genome, dùng những mẫu gene (gene markers) của bản đồ và kết hợp với văn kiện bệnh lý toàn nước Iceland (Iceland national clinical database) đ
ể xác định gene lięn quan đến rất nhiều loại bệnh. Với kỷ thuật DNA-chip và chuỗi (microarray), hàng chục ngàn gene markers từ bản đồ gene có thể được xét cho một mẫu phẩm bệnh lư. Sự thay đổi của các mẫu gene nŕy cũng là một phương cách hữu hiệu để xác định lięn quan của các nhóm gene và bệnh.2- Tìm các gene và dược phâm có tính chất trị liệu:
Trong khi một số gene gây bệnh, có nhiều gene có khả năng ngừa hoặc kháng bệnh. Bản đồ gene sẽ giúp cho phương cách těm gene có tính chất trị liệu được thực hiện ở qui mô rộng lớn hơn so với phương thức thông thường. Pharmacogenomics đă được ra đời để đáp ứng những kháma phá mới của Bộ Gene Nhân Loại cho nghŕnh Dược Khoa. Với khả năng có thể hoạt hoá (express) tất cả mọi protein của tế bŕo, việc khảo cứu dược khoa đang bước vŕo kỷ nguyên mới. Các phương pháp này nhằm tìm những dược phẩm có dược tính chuyên biệt hơn và cũng nhằm giảm thiểu tổn phí cũng như thời gian của việc nghiên cứu (thường là từ 10 tới 20 năm và tốn kém nhiều triệu dollar). Về kỷ thuật, dựa trên nguyên tắc các dược liệu cần tác động tręn protein để biểu hiện hoạt tính, một số chương trěnh thí nghiệm đă áp dụng thành công hệ thống protein chip dể khảo cứu các hoá chất có giá trị về trị liệu. Theo đó, hàng chục ngàn protein có thể duoc đặt lên 1 chip và hàng trăm hoá chất có thể cho phản ứng với protein chip. Ngoài việc tìm kiếm dược liệu mới, người ta cũng tiên liệu rằng các phương thức nghiên cứu này sẽ giúp loại được nhũng dược phẩm có những hiệu quả không tốt (side effects). Việc sử dụng kỷ thuật SNP cũng sẽ có 1 vị thế quan trọng trong việc ứng dụng bản đồ gene để xác định những gene thuận vŕ kháng thuốc cho dược khoa tri kiệu.
Gene cũng có thể tìm được dựa trên những tiêu chuẩn chọn lọc. Thí dụ điển hình là phương thức chọn gene dựa trên tính ngoại tiết (secretion) hoặc có t
ính tác đông với nhau (protein-protein interaction). Tůy theo hệ thống tế bào thử nghiệm, các protein của những gene này được tinh chế để xác định chức n(ang của nó. Cňn nhiều phương thức khác như dùng hoạt tính của gene (functional genomics) để xác định gene có tính chất trị liệu. Vì cấu trúc của protein (protein structure) đóng vai trò quan yếu trong hoạt tính của gene, nên phương pháp khảo cứu cấu trúc protein (proteonomics) cũng sẽ là một cống hiến quan trọng cho việc xác định gene và chức năng tri liệu.3- Ðiện toán sinh-học (bio-informatics):
Ðây là bộ môn rất mới mẽ của sinh học nhưng cũng là bộ môn có nhiều hứa hẹn nhất cho y học. Bộ môn này là sự kết hợp của sinh học và điện toán nên còn được gọi là computational biology. Chúng ta biết tế bào là
một mạng lưới sinh học (biological network) rất động năng vŕ phức tạp. Một trong những chú điểm của điện toán sinh học (bio-informatics) lŕ nhằm tìm hiểu cấu trúc và hoạt động của các gene trong mạng lưới sinh học này. Mạng lưới sinh học do sự hội tụ và tác động của nhiều gene. Với bản đồ gene vŕ với các tiến bộ kỷ thuật của gene chip, điện toán sinh học důng thiết lập mạng lưới này cho nhiều bệnh lý. Trong thực tế, các bệnh lý liên hệ đến nhiều gene, chứ không do một gene. Dược phẩm trong tương lai sẽ nhằm vào việc hoàn chỉnh cac gene của mạng lưới sinh học nhằm mục đích đạt được những kết quả trị liệu tối đa. Ngoŕi ra, điện-toán sinh-hoc cňn nhằm mục tiêu phân tích sự khác biệt gene và hoạt tính của gene ở từng cá nhân để đưa đến việc trị liệu chuyęn biệt cho từng cá thể (individualized therapy).Nói tóm lại, Bộ Gene Nhân Loại sẽ có những tương quan mật thiết đến sự tiến bộ của y học từ nghięn cứu đến ứng dụng lâm sŕng. Việc xử dụng các đột biến, SNPs sẽ mang lại nhiều tięn đoán vŕ chẩn đoán (prognostics & diagnostics hữu hiệu về bệnh lư; việc xác định được các gene gây bệnh hoặc trị bệnh sẽ giúp cho việc chữa trị được chuyęn biệt (specificity) để có hiệu quả cao. Sự phát triển cảa điện toán sinh học sẽ mang lại những kiến thức phân tử sinh học ở dạng p
hức hợp, và từ đó đưa đến việc trị liệu hoŕn hảo hơn.A- VÀI CẢM NGHĨ :
Việc công bố bản đồ gene của người kết thúc 1 thŕ
nh quả lớn của Celera Genomics và của Viện Nghiên Cứu Quốc Gia Hoa Kỳ. Ở khía cạnh rộng lớn hơn, đây cũng là thành công của rất nhiều trình tự (sequence) nghiên cứu sinh học ở khắp nơi trên thế giới vì đã có nhũng đóng góp liên tục vào tiến bộ của nghành tân sinh học, nhất là trong hai thập niên cuối thế kỷ 20. Ngoài tính chất khoa học qui mô, chương trình nghiên cứu bộ gene của con người còn mang 1 giá trị đặc biệt vì chương trình này khởi đầu đă là biểu tượng hợp tác đầy ý nghĩa giữa nhiều nước trên thế giới trên mười năm qua để phục vụ khoa học vŕ nhân loại.Bản đồ gene cho chúng ta thấy từ nguyęn thủy đă
có sự hoà hợp và liên hệ mật thiết của mỗi chủng tộc theo như chỉ số đồng nhất lŕ 99.9%. Chúng ta mong mỏi rằng ngoài những tiến bộ sâu rộng cho khoa học, bộ môn sinh học sẽ tiếp tục cống hiến cho nhân loại những nhận thức căn bản về nguyên thủy của mình để cùng chia sẽ, xây dựng một thế giới hoà bình và thịnh vượng trong kỷ nguyên mới.Ðối với Việt Nam chúng ta, kết quả chương trình nghiên cứu Bộ Gene của Nhân Loại là một tin phấn khởi để hướng về những sinh hoạt nghiên cứu trong tương lai liên hệ đến bản chất di truyền của người
Việt. Trong đó có việc ứng dụng những hệ thống di truyền để xác định bản chất nŕy; kỷ thuật SNPs cũng giúp khám phá những di tính của gene ở người Việt có liên hệ đến bệnh lý và trị liệu. Việc phân tích gene của các tài nguyên sinh học cũng sẽ là phần quan yếy về kinh tế vì bản tính đặc trưng của gene ở mỗi vùng. Những khám phá này sẽ là một đóng góp không nhỏ cho khoa học vì Việt Nam là một chủng tộc thuần nhất và địa dư nước ta có nhiều tài nguyên sinh học phong phú.
Tôi xin được dừng ở đây. Nếu có gě sơ sót, mong được các Bạn chỉ dẫn vŕ
nếu có gì cần thảo luận xin các Bạn cho biết. Thân chúc các Bạn mọi điều tốt đẹp nhất .
Thân chào,
Nguyễn Ðức Thái
June 30, 2000
The Human Genome Project :
Its Accomplishments and Applications in Medicine
Thai D. Nguyen, PhD
Glaucoma Research
Dept. of Ophthalmology/UCSF
On the occasion of the announcement of the near completion of The Human Genome Project by Celera Genomics and The National Institute of Health's Human Genome Program on June 26, 2000 in Washington DC.
An unprecedented landmark in the history of biological research as well as of mankind has been recently been achieved. It relates to the announcement of the near completion of The Human Genome Project by Celera Genomics and of the National Human Genome Research Institute of the National Institute of Health (NIH). Here, we review this special event and share some thoughts with the Pharmacy Forum on the Human Genome Project and the influences that it could have on the future of medical practice as well as pharmaceutical research.
A- Goals of The Human Genome Project:
Gene is the basic element of biology, accordingly research of the human genome is fundamental importance by nature. Genes reside within the cell's nucleus made up of DNA consisted of four basic chemicals A (adenine), C (cytosine), G (guanine) and T (thymine). The cell is regarded as a computer in which genes are located at its nuclei and continuously sending out signals that determine the cell structure as well as control its complex functions. In brief, there are enormous numbers of genes and each responsible for a cell function. Historically, the quest for knowledge of genes within the human genome has evolved via different stages. In the beginning, applications of cloning methodology, genes have been identified one by one from disease research and from research topics varied from laboratory to laboratory. Cancer genes were found by researchers working on oncology; similarly genes relating to high blood pressure, diabetic, development, aging etc. were obtained by experts in each of these areas. Since the development of recombinant DNA technology in the beginning of 1980s, a numerous genes have been discovered. From these, a wealth of knowledge on the mechanism of disease processes, have been established together with their effectiveness in treatments. The fast growing of biotechnology companies with time is a way of ascertaining the importance of genes and our society. Nevertheless, the numbers of gene discovered represent only a minor portion of the numbers of genes potentially found within our cells. Few thousands gene have been reported as compared to possibly nearly 100,000 genes estimated in the cell. In reality, the test to achieve the number of genes and their locations are enormous since genes occupy a very minor portion of the total cellular DNA. Searching for the total genes by classical cloning approach would require numerous centuries and associated with huge expenses. In response to the need of advancing the science with a fast pace, The Human Genome Project has been conceived in the mid-1980s and operated in October 1990 leading by Dr. James Watson, who is also one of the two who made the DNA discovery. The Human Genome Project aimed to gain a better knowledge of the human genetic makeup with focus on determining the exact order of the 3 billion base pairs of the human DNA at a cost estimated to be 3 billion dollars. The Human Genome Project has been a global research effort for nearly 15 years combining various human genome centers of industrialized nations including America, Japan, England, Germany, French, China and other countries. In addition to The Human Genome Project, a new type of biotechnology companies has emerged known as genomic companies due to the economical importance of the human genome. Their engagements have changed the landscape of the genome project and created a phenomenon competition environment in the race to uncover the secret code of man.
B-Announcement of the accomplishment for the Human Genome Project: The Winners
On Monday June 26, 2000 two genome research scientists both from America, Drs. Craig Venture, J. and Francis Collins have made announcements on the completion of their work for the Human Genome Project. The announcement was made at the White House in the presence of President Bill Clinton. Dr. Venter represented Celera Genomics, a newly formed company, and Dr. Collins represented the National Human Genome Research Institute of the NIH. The work of Dr. Collins' group represented the original efforts of the human genome research, which has an international status, however, its results are not as completed as those of Dr. Venter. Dr. Venture's participation in the human genome project has changed the structure of the already highly competitive of the project. Dr. Venter has worked on genomic studies at the NIH and at The Human Genome Sciences, Inc. prior to establishing Celera Genomics only recently in 1997. Although coming late into the game, Dr. Venter has made the accomplishment within a phenomenon record of 3 years (1 year earlier than his plan) to become the first to make the announcement for the completion of the human genome research. His secrecy for this once-and-for-all victory in the international race for mankind: determination, enthusiasm and visionary. Of particularly interest to us, is the fact that Dr. Venter has experienced the Vietnam War during the Tet offense in 1968. The Vietnam experience has made him a steel man at work and a whole hearted man in life. He mentioned that Vietnam has made him to appreciate every moment of life. His slogan: " Make every minute of your day and everyday of your life count". On his success, Dr. Venter undertook the shotgun DNA sequencing approach which involved breaking down the genome in random DNA fragments, sequence the fragments and resembling them by aligning overlapping pieces. In principle, this appears as a simple and direct approach, but in practice, it is a huge task for the size of over 3 billion base pairs of the human genome. To facilitate the task, Dr. Venter associated with PE Biosystems to have access to their super-computer system. Other human genome centers employed various methods, which required multiple stages. Some have laboriously cloned the genome DNA into large fragments (using BAC, or YAC, yeast artificial clone) to begin with, or established the physical map of the genome, mapping with the STS (satellite sequence tag) prior the sequencing work.
The announcement revealed that our genome has 3.12 billion base pair and 97% of these were sequenced, among these 85 % of the sequences were mapped by the orders that they are constructed in the cell. About 3% of our total DNA have genes, the remained 97% does not, thus termed "non-functional DNA". The 3% of DNA have between 60,000 to 100,000 genes. Other findings from The Human Genome Sciences, Inc. estimated the gene number could be over 120,000. Interestingly, our genomes are 99.9% identical among different ethnic. It is expected that the remained sequences and mapping would be achieved within the next two years. Although this is a small sequence, they happen to be in regions of the genome which is not readily for sequencing. The characterizations of genes based on the established sequences remain to be a long-term efforts for biological research since the genes are proven by its expression and functions, not by sequencing alone.
To get an idea about the complexity of the genome, one could imagine that it would need 200 books of 500 pages each to record all of the human genome sequences, among these, only 3 thousand pages has genes which scattered among the 200 books. Our genes are closely related to other animal kingdoms in numbers as well as in structures. The closest DNA to human is that of chimpanzees with 99% homology. The numbers of genes reduce in simpler forms of life among these worm has 20,000 genes, yeast has 6,000 and tuberculosis has 4,000 genes. In a recent report, a new gene was found within the "non-functional DNA region". This unexpected discovery could be quite interesting as it signified that more secrecy to be revealed and their nature could turn out to be novel and importance. The information obtained from these reports is quite close to estimations made in the past. The estimations, however, were neither verified nor documented as a data base for applications.
The Human Genome Project has accomplished its mission by providing a systematic establishment for the DNA database of the genome sequences. Simply speaking, the genome project has provided gene researchers with a map of the human genome that allows them to move from one part of the genome to the other parts without being lost. Besides, genes cluster together like the human society with varieties of sizes, shapes, culture and functions; in this regard, the genome map will provide sources of information for researchers to understand the characteristics of each gene group and how they are related. The genome map is thus an important and necessary direction for researchers to navigate their search, which is expected to be highly rewarded with novel discoveries and applications for mankind.
C-The Applications:
Applications from the human genome map is as many as one could imagine for. It is anticipated that various disciplines in biological sciences would benefit largely from the leads established from the human genomic map. The applications of the gene map for cell biology would help to advance our knowledge in the cell functions; for pathophysiology, genetics would advance our knowledge on disease genes. In therapeutic research, it is expected that the genome map would facilitate our research for therapeutic genes or methods of treatments to be more rapidly and effective. Ecology studies will also benefit from the gene map as we learn about which genes are response to the environment factors. Other applications relate to cultural values of our society such as genetic selection to create one type of species (eugenics) or human cloning already raised public attention. In this report, we would like to summarize the applications from the human genome project that involve current medical research and believed to have major impacts on the future of medicine.
1- Genome Map and Disease Diagnosis: Gene is the basis of the cell, and cell is a living unit of our body, therefore knowledge of the human gene map could provide significant information about our physiology. Importantly, there are changes on the genome map associated with disease processes that is regarded as signatures predicting the pathophysiology background of an individual. Within nearly two decades, genetics research has been the rosetta stone of disease related genes that have become valuable markers of the gene map due to the mutations that they imprinted. The genetic markers encompass large disease entities from cancer, cardiovascular, ophthalmic diseases, and diabetics to psychiatric disorders.
Another type of markers involving single chemistry changes in the genome, known as SNPs (pronounced snips) or single nucleotide polymorphism. Interestingly, SNPs could be critical markers of the gene map due to their possible associations with disease genes. A major challenge to the medical practice has been the variations in the outcome of drug response in individuals, for some, the medicine brings a cure, for others not or evens side effects. SNPs have been regarded as a major genetic factor responsible for the variations. In fact, this concept has been known in the oriental medicine by which each of us has distinct genetic entity; accordingly, various combination of herbs are prescribed individually. SNPs are being investigated in a large scale to establish information needed for effective therapeutics for individuals of different genetic background, besides researching for novel genes relating to disorders.
In the future medical practice, a genotype map would be common for each of us in which disease-related makers are established, the map would be a routine and key documentation in the clinical files of hospitals and medical offices. Doctors, dentists, pharmacists and other health practitioners will base their judgments on our gene map to make appropriate decisions for the treatments, together with other conventional tests.
2- Research for disease related genes: There are enormous numbers of disorders whose causes remained largely unknown, which in molecular term, the genes have not been found for the disorders. It is expected that this will be changed with a rapid pace, at least for diseases of genetics basis. There have been several gene loci established for genetic disease. It is expected that many of the genes within the loci could be revealed from established sequences of the genome map. They are candidate genes for mutation screenings to identify their possible associations with the disease.
On a larger scale, DeCODE, a genomic company, has been working on identifying genes for disorders of critical illness via deciphering markers of the genomic map using the national clinical database of the Icelander population.
Other methods of identifying disease genes involves screening expression of genes in disease state versus the control (healthy condition). Microarray, DNA/protein chips allow researchers to make distinction on genes relating to these conditions.
3-Research for genes and pharmacological compounds of therapeutic values: While a number of genes cause disease, many of them deliver medical benefits including prevention and treatments. Some of these genes provide benefits via pharmacological compounds, they are called target genes. Up to date, there are about 500 target genes being discovered ranging from G-proteins, metabolic enzymes to ion channels. It is estimated that a much larger numbers from 3,000-10,000 target genes in the human genome and these targets, once discovered, would lead to many new therapeutic applications. The gene map will play a major role in our efforts to identify these genes for medical uses. Researchers nowadays have tools to express a large numbers of proteins simultaneously from the genome, making pharmacological research a new era. The advancement aims to identify molecules of selective activities and also would help to reduce the time and cost (which used to run from 10-20 years with hundred of millions of dollars).
Based on the principle of drug and protein interactions are required for pharmacological effects, a number of projects have made achievements via the applications of protein chips for drug screenings. The chip technology allows depositions of several ten thousands of proteins on a chip and chemicals could be mixed together, a computer system is then employed to scan for possible interactions. SNPs technology is expected to be an important part among the applications of the gene map for pharmacological research. Pharmacogenomics has evolved from the genomics sciences to advance the research for safer and more effective pharmaceutical products.
In addition, genes of therapeutic values could also be found via selection criteria. For examples genes code for secretory proteins or proteins interacting with other proteins are of potentials. Other methods including assaying for gene functions known as functional geneomics or investigating the molecular shapes of the proteins known as proteonomics which identify functional motifs of the proteins.
4-Bio-informatics: A recent field of biological sciences, and is also the most promising for biomedical research. Bio-informatics combines biology and computer assisted approach, thus also known as computational biology. Cell is a network of biological dynamics and complexity. The biological network composed of genes and pathways that they interact to produce biological outcomes. Bio-informatics establishes the gene structures, functions and their interactions via computation of a large number of data. The genome map together with other technologies including the gene chips, differential display, SAGE (serial analysis of gene expression) are expected to be major tools for bio-informatic research to understand disease processes in the complex picture. A single gene does not, by itself, cause a cellular phenotypic change that resulting in disease, but rather a set of genes are involved. For therapeutic purposes, bio-informatics targets multiple genes and aims to reset the biological network to its healthy state. Bio-informatics also aims to characterize genetic variations of individuals and their differential gene expression profile to set stage for individualized therapies.
In summary, the human genome map will have pivotal impacts on biomedical research as well as its applications in medical practice. The use of mutation and SNP map would lead to prediction and effective diagnosis for various diseases; the identifications of disease genes or therapeutic genes would provide specific molecular targets for treatments. Bio-informatics will reveal the genes in their complex functions within the cell net work that will lead to a new paradigm in medical research.
The outcomes from the human genome research concluded a major achievement by Celera Genomics and The Human Genome Project of the NIH. On a broader view, this is also the achievement made from contributions of many research centers in various parts of the world, many of these occurred within the last two decades of the 20-century. Besides its colossal dimension, the human genome project has been an important symbolism of collaborative efforts for over a decade among many countries in serving science and mankind.
The human gene map reveals to us that from the beginning, there was a harmony and close connection among peoples on the planet earth, indicating from the 99.9% DNA homology among us. Looking toward the future, we all hope that besides its immense impacts on the future of sciences, the human genome research will continue to enlighten us with new knowledge about our origin, and form the foundation for continuing collaborative efforts among countries to build the world with peace, prosperity in the new millennium.
For Vietnam, we are particularly encouraged by the milestone set by the Human Genome Project for the potential opportunities and applications that it would offer to our future research. Among these, information on the genetic diversities of the genome map are of special importance to understand our origin at the genetic level; SNP technology would be of major interest to help study medical, pharmacological variations relating to our race; the technology could also be useful to investigate biological resources in Vietnam that are believed to be highly diversified and regional. From our research, we hope to offer the scientific communities knowledge on the genetic nature of the Vietnamese, which is a part of the variations that make our world a kaleidoscope wonder.
Thai D. Nguyen, PhD
Note:
- For references to the genomic research, please refer to information available in various genomic centers including Genome Database (GDB) (for genetic database); European Molecular Biology Laboratory Nucleotide Sequence (EMBL), DNA Database of Japan (DDBJ) (for gene structure data base); GeneMark, Genscan (for new gene discoveries); Merk Gene Index (for human gene expression); The Millenium Pharmaceuticals, Human Genome Sciences (for gene microarray and therapies); Orchid Biosciences, Variagenics (for SNPs); Lexicon Genetics, Exelixis (for functional genomics); Genomic Solution (for proteonomics); Caliper Technologies, Aclara (for protein/DNA chips); Incyte Pharmaceuticals, Inc., InforMax, Inc., Pangea System Inc. (for bio-informatics) and others. Many other functions related to genomic research are also expected to be found from these research centers.
- The underlines are terms relating to genome research.