“Vùng tối” của bộ gen người: Đột biến de novo trong các vùng điều hòa và vai trò trong rối loạn phát triển thần kinh
Trong những năm gần đây, lĩnh vực di truyền học thần kinh đã đạt nhiều tiến bộ quan trọng. Việc giải trình tự exome và giải trình tự toàn bộ bộ gen (WES/WGS) đã giúp xác định nguyên nhân di truyền ở một tỷ lệ lớn trẻ mắc các rối loạn phát triển thần kinh (neurodevelopmental disorders – NDD). Tuy nhiên, vẫn còn một nhóm đáng kể bệnh nhi không tìm được nguyên nhân dù đã làm đầy đủ xét nghiệm. Vậy, điều gì đang bị “bỏ sót”?
Một giả thuyết quan trọng là các đột biến nằm ngoài vùng mã hóa protein (non-coding DNA), đặc biệt là các vùng điều hòa (regulatory elements), có thể đóng góp vào các trường hợp chưa giải thích được này. Đây chính là “vùng tối” của bộ gen – nơi chứa rất nhiều thông tin nhưng khoa học vẫn chưa hiểu hết.
1. Vùng mã hóa chỉ chiếm <2% bộ gen, nhưng 85% bệnh đơn gen đã biết nằm ở đây. Mặc dù DNA mã hóa protein (protein-coding regions) chỉ chiếm <2% bộ gen người, phần lớn các bệnh đơn gen đã biết (khoảng 85%) có nguyên nhân nằm trong các vùng này. Đây là lý do các xét nghiệm như WES tập trung vào vùng mã hóa.
Tuy nhiên, 98% còn lại của bộ gen là vùng không mã hóa (non-coding DNA). Thành phần này bao gồm: intron, các trình tự lặp lại (LINEs, SINEs, satellite repeats), các vùng bảo tồn qua tiến hóa, các vùng điều hòa như promoter, enhancer, silencer
Các vùng điều hòa đóng vai trò kiểm soát biểu hiện gen: bật – tắt gen, điều chỉnh thời điểm và mức độ tạo protein. Vì vậy, đột biến tại đây có thể ảnh hưởng mạnh đến chức năng gen, dù không làm thay đổi trình tự protein.
2. Đột biến de novo trong vùng điều hòa: có ý nghĩa nhưng chỉ chiếm tỷ lệ nhỏ
Nghiên cứu của Short (thuộc dự án DDD (Deciphering Developmental Disorders) đã phân tích vùng DNA không mã hóa từ 6.000 mẫu (từ bệnh nhân và cha mẹ)- vùng phân tích trên mỗi trường hợp dài chiếm 4,6 Mb DNA không mã hóa (≈0,1% non-coding genome)
Kết quả cho thấy ở có một số điểm nóng nằm trong vùng không mã hóa- nơi phát hiện nhiều biến thể de novo (đột biến mới ở thế hệ con mà không có ở cha mẹ)
Tuy nhiên, chỉ một nhóm nhỏ vùng không mã hóa cho thấy vai trò quan trọng:
các vùng bảo tồn qua tiến hóa và hoạt động đặc hiệu ở não.
Tỷ lệ đóng góp vào NDD ước tính: 1–3%, thấp hơn rất nhiều so với:
42% trường hợp được giải thích bởi đột biến de novo trong vùng mã hóa protein.
Như vậy, các vùng điều hòa có vai trò, nhưng hiệu ứng nhỏ so với các gen mã hóa truyền thống.
3. Vì sao nghiên cứu vùng không mã hóa lại khó?
Các vùng điều hòa là “vùng tối” của bộ gen vì nhiều lý do:
(1) Không biết phải tìm ở đâu: Regulatory elements không nằm cố định cạnh gen. Chúng có thể ở xa hàng chục – hàng trăm kilobase, và không có đặc trưng dễ nhận biết bằng trình tự.
(2) Khó xác định chúng điều khiển gen nào: Các phương pháp dự đoán hiện tại (promoter capture, enhancer mapping…) cho kết quả không đồng nhất. Nghiên cứu của Short và cộng sự dùng bốn phương pháp nhưng độ tương đồng giữa các phương pháp rất thấp.
(3) Không thể nhóm chúng theo chức năng: Vì không biết chúng điều khiển gen nào, việc phân loại theo pathway hay chức năng tế bào gần như không khả thi.
Do đó, nghiên cứu vùng không mã hóa thật sự giống như tìm kim trong đống rơm – chúng ta biết rằng có kim ở đâu đó, nhưng rất khó thấy và khó chứng minh nó liên quan đến bệnh.
4. Ý nghĩa đối với lâm sàng và tương lai của di truyền học NDD
Dựa trên dữ liệu hiện tại: Các vùng điều hòa có thể đóng góp vào một tỷ lệ nhỏ các rối loạn phát triển thần kinh, đặc biệt khi vùng đó bảo tồn cao và hoạt động ở não.
Mặc dù tỷ lệ nhỏ (1–3%), những vùng này vẫn quan trọng, nhất là ở bệnh nhi có biểu hiện lâm sàng nặng mà WES không tìm thấy nguyên nhân.
Các công nghệ mới như WGS, phân tích biểu hiện gen, ATAC-seq, hoặc mapping enhancer–gene sẽ mở đường để hiểu rõ hơn vùng “non-coding genome”.
Tóm lại
Mặc dù đa số nguyên nhân rối loạn phát triển thần kinh vẫn đến từ các đột biến trong vùng mã hóa protein, nghiên cứu cho thấy các vùng không mã hóa, đặc biệt là vùng điều hòa, cũng đóng một vai trò nhất định.
Tuy nhiên, do: vị trí khó xác định, chức năng phức tạp và thiếu dấu hiệu đặc trưng, việc nghiên cứu phần “vùng tối” này của bộ gen vẫn là thách thức lớn trong di truyền học thần kinh.
Trong tương lai, khi các công nghệ giải trình tự và phân tích chức năng gen trở nên mạnh hơn, chúng ta sẽ có khả năng giải mã thêm những ca bệnh hiện nay vẫn còn “chưa tìm được lời giải”.
Short PJ, McRae JF, Gallone G, Sifrim A, Won H, Geschwind DH, Wright CF, Firth HV, FitzPatrick DR, Barrett JC, Hurles ME. De novo mutations in regulatory elements in neurodevelopmental disorders. Nature. 2018 Mar 29;555(7698):611-616. doi: 10.1038/nature25983. Epub 2018 Mar 21. PMID: 29562236; PMCID: PMC5912909