Ngày 16/12/2021, Viện Nghiên cứu Dữ liệu lớn VinBigData (Tập đoàn Vingroup) công bố đã hoàn thành dự án “Xây dựng cơ sở dữ liệu về biến dị di truyền cho dân số Việt Nam”. Với quy mô hơn 1.000 bộ gen được giải trình tự, hơn 40 triệu biến thể gen được phát hiện, nghiên cứu không chỉ mở ra cơ sở dữ liệu quý giá cho cộng đồng mà còn tạo tiền đề cho việc phát triển nghiên cứu. y sinh và y học chính xác, góp phần cảnh báo điều trị sớm cho mỗi cá nhân Việt Nam trong tương lai.
Đây là bộ dữ liệu toàn bộ hệ gen đầu tiên của Việt Nam đảm bảo tính đại diện và tính phổ cập của dân số, phù hợp với phân bố dân cư theo địa lý (miền Bắc: 37%; miền Trung 22%; miền Nam: 41%) và giới tính (tỷ lệ nam nữ cân bằng). Đặc biệt, bộ dữ liệu hệ gen được chú thích đầy đủ về chức năng sinh học cũng như nguy cơ bệnh lý.
Dự án “Xây dựng cơ sở dữ liệu biến dị di truyền cho dân số Việt Nam” được VinBigData khởi động từ tháng 12/2018 với sự tham gia của hơn 40 nhà khoa học bao gồm các chuyên gia giàu kinh nghiệm của VinBigData, các chuyên gia tư vấn cao cấp đến từ các cơ sở nghiên cứu hàng đầu như Đại học Harvard, Đại học Chicago , Trung tâm Ung thư MD Anderson… cùng hàng trăm chuyên gia, tình nguyện viên tại Việt Nam và trên thế giới.
Trong ba năm, nhóm nghiên cứu đã giải mã trình tự toàn bộ bộ gen của hơn 1.000 người trưởng thành khỏe mạnh, từ 35-55 tuổi, không có quan hệ huyết thống và có đầy đủ thông tin về kiểu hình và nhân khẩu học; phân tích một phần bộ gen của hơn 4.000 trường hợp liên quan đến các bệnh thông thường và phản ứng với thuốc. Kết quả đã phát hiện hơn 40 triệu biến thể gen, trong đó có gần 2 triệu biến thể gen phổ biến đặc trưng cho dân số Việt Nam.
Quy trình phân tích dữ liệu gen và chú thích các biến thể gen của VinBigData được coi là tiên tiến nhất thế giới. Quá trình xử lý mẫu được thực hiện tại phòng xét nghiệm đạt tiêu chuẩn quốc tế ISO 15189 (tiêu chuẩn quy định các yêu cầu về năng lực và chất lượng đối với phòng xét nghiệm y tế) của Bệnh viện Đa khoa Quốc tế Vinmec. Lượng dữ liệu khổng lồ được xử lý bằng công nghệ hiện đại của Google, Illumina (công ty công nghệ hàng đầu thế giới về giải trình tự gen), NVIDIA (tập đoàn công nghệ đa quốc gia của Mỹ). Ngoài ra, VinBigData còn hợp tác với khoảng 20 tổ chức nghiên cứu và bệnh viện hàng đầu trong và ngoài nước như Đại học John Hopkins (Hoa Kỳ), Tổ chức The GoldenHelix (Anh), Đại học Y Hà Nội, Bệnh viện Trung ương Quân đội 108…
GS Vũ Hà Văn – Giám đốc Khoa học Công ty VinBigData (Tập đoàn Vingroup) cho biết: “Hầu hết các nghiên cứu và thực hành lâm sàng ở Việt Nam đều dựa vào cơ sở dữ liệu di truyền của các quần thể khác trên thế giới. Điều này ảnh hưởng đến kết quả công bố khoa học cũng như chất lượng của khám chữa bệnh trên người Việt Nam Với tiền đề là cơ sở dữ liệu về biến dị gen dành riêng cho người Việt Nam, VinBigData được kỳ vọng sẽ mở ra một hướng đi mới, góp phần phát triển nền y học chính xác tại Việt Nam. “
Với tổng vốn đầu tư hoàn thành hơn 4,5 triệu USD, dự án giải mã gen của Vingroup được đánh giá là có quy mô lớn nhất Việt Nam tính đến thời điểm hiện tại. VinBigData đã trở thành đơn vị tiên phong tại Việt Nam giải mã trình tự toàn bộ bộ gen người Việt Nam.
Đánh giá về ý nghĩa của nghiên cứu, GS.TS Tạ Thành Văn (Chủ tịch Hội đồng trường Đại học Y Hà Nội) chia sẻ: “Hiện nay, các bác sĩ chủ yếu dựa vào các xét nghiệm lâm sàng, sinh hóa hoặc bệnh sử để khám và đưa ra quyết định điều trị nếu thêm gen. đã có dữ liệu, đây sẽ là thông tin có giá trị, giúp tăng độ chính xác, hiệu quả trong chẩn đoán và điều trị bệnh, là tiền đề thúc đẩy sự phát triển của y tế dự phòng và y học chính xác, góp phần nâng cao sức khỏe cộng đồng. . “
Sau khi hoàn thành, một phần dữ liệu của dự án đã được mở để công chúng truy cập thông qua Hệ thống chia sẻ, phân tích và quản lý dữ liệu y sinh (MASH Portal) (https://genome.vinbigdata.org). Người dùng có thể tra cứu với mục đích tham khảo, phục vụ nghiên cứu y sinh. Hệ thống cũng cung cấp thử nghiệm một số công cụ phân tích tốc độ cao (từ 30 phút đến 1 giờ) cho toàn bộ dữ liệu bộ gen người.
Kết quả của dự án sẽ được VinBigData ứng dụng trực tiếp vào các sản phẩm giải mã gen, với độ chính xác và tốc độ vượt trội, dành riêng cho người Việt Nam. Nghiên cứu sẽ tạo tiền đề hỗ trợ việc phát hiện các đặc điểm tâm sinh lý của cá nhân, cũng như dự đoán nguy cơ mắc các bệnh thông thường, bệnh di truyền lặn, đánh giá mức độ đáp ứng thuốc trong tương lai.
Cổng dữ liệu MASH đang lưu trữ hơn 2500 Terabyte dữ liệu hệ gen Việt Nam có chú thích, bao gồm dữ liệu nhân khẩu học và dữ liệu phòng thí nghiệm, theo tiêu chuẩn của Viện Y tế Quốc gia (NIH). Trên thế giới, hiện chỉ có một số nước phát triển như Hoa Kỳ, Anh, Pháp, Nhật Bản, Trung Quốc… có tiềm năng giải mã toàn bộ bộ gen người trên quy mô lớn. Việc thúc đẩy khai thác bộ gen của các quần thể được kỳ vọng sẽ góp phần thiết lập nền tảng cơ bản của nhân chủng học, bệnh học và thúc đẩy y tế dự phòng và điều trị cá nhân hóa.
Tổng hợp: Công Nghệ Chính Nhân