انقلاب در ژنتیک پزشکی: سرنخ‌های بیماری در مناطق غیرکدکننده DNA

پژوهشگران بیمارستان کودکان فیلادلفیا (CHOP) و دانشکده پزشکی پرلمن در دانشگاه پنسیلوانیا موفق شده‌اند با بهره‌گیری از یک الگوریتم یادگیری عمیق (Deep Learning)، جهش‌های ژنتیکی را در بخش‌هایی از  DNA انسان شناسایی کنند که گرچه نقشی در ساخت پروتئین ندارند، اما می‌توانند ریسک ابتلا به بیماری‌های مختلف را افزایش دهند. نتایج این تحقیق که در نشریه American Journal of Human Genetics  منتشر شده، می‌تواند بستری برای شناسایی عوامل ژنتیکی مؤثر در بسیاری از بیماری‌های شایع فراهم کند.

بخش اعظم ژنوم انسان – بیش از ۹۸ درصد – حاوی توالی‌هایی است که پروتئین‌ساز نیستند. این مناطق موسوم به «نواحی غیرکدکننده»، گرچه مستقیماً پروتئینی تولید نمی‌کنند، اما نقش مهمی در تنظیم زمان و میزان بیان ژن‌ها ایفا می‌کنند. شناسایی جهش‌های بیماری‌زا در این نواحی تاکنون دشوار بوده، چرا که «کدهای تنظیمی» آن‌ها هنوز به‌خوبی شناخته نشده‌اند. با این حال، مطالعات گسترده ژنومی (GWAS) در سال‌های اخیر گام‌های مهمی در روشن کردن نقش بالینی این نواحی برداشته‌اند.

یکی از چالش‌های اساسی این است که مطالعات GWAS معمولاً نواحی وسیعی را به‌عنوان مرتبط با بیماری شناسایی می‌کنند، اما تعیین اینکه کدام جهش دقیقاً مسئول بروز بیماری است، بسیار پیچیده باقی مانده. بسیاری از این جهش‌ها در اطراف توالی‌هایی قرار دارند که پروتئین‌های تنظیم‌کننده بیان ژن، به نام «فاکتورهای رونویسی»، به آن‌ها متصل می‌شوند. این پروتئین‌ها هنگام اتصال، ناحیه‌ای از DNA را موقتاً «مسدود» کرده و ردپایی از تعامل خود بر جای می‌گذارند که در داده‌های تجربی قابل شناسایی است.

دکتر استروان گرنت (Struan F.A. Grant)، نویسنده ارشد این مطالعه عنوان کرد: “این وضعیت مانند زمانی‌ست که چندین گزینه مشابه پیش روی شما قرار دارد، اما تنها یکی از آن‌ها عامل اصلی بیماری‌ست. روش ما به ما کمک کرد تا با دقت بالا، جهش ژنتیکی مسئول را از میان گزینه‌های متعدد شناسایی کنیم.”

در این پژوهش، دانشمندان از روش پیشرفته‌ای به نام ATAC-seq برای شناسایی نواحی باز در ژنوم (جایی که فاکتورهای رونویسی می‌توانند متصل شوند) استفاده کردند. آن‌ها همچنین از یک الگوریتم مبتنی بر یادگیری عمیق به نام PRINT بهره گرفتند که قادر است ردپای تعامل میان DNA و پروتئین را تشخیص دهد.

با بررسی داده‌های حاصل از ۱۷۰ نمونه بافت کبد انسان، آن‌ها موفق به شناسایی ۸۰۹ نقطه ژنتیکی شدند که «جای پای» این فاکتورهای رونویسی در آن‌ها دیده می‌شود – یعنی نواحی‌ای که به‌طور بالقوه محل تنظیم ژنی هستند و بسته به نوع جهش، میزان اتصال فاکتورهای رونویسی در آن‌ها تغییر می‌کند.

یافته‌های این مطالعه نه‌تنها به درک بهتر عملکرد نواحی غیرکدکننده کمک می‌کند، بلکه می‌تواند پایه‌ای برای تحلیل دقیق‌تر بیماری‌هایی باشد که منشأ ژنتیکی پیچیده دارند. محققان اکنون در نظر دارند این روش را به بافت‌ها و اندام‌های دیگر نیز گسترش دهند تا بتوانند نقش جهش‌های مشابه را در بیماری‌های متنوع شناسایی کنند.

ماکس دودک (Max Dudek)، دانشجوی دکترای ژنتیک و نویسنده اول مقاله، می‌گوید:”این روش به ما کمک می‌کند برخی از مشکلات بنیادی در شناسایی جهش‌های غیرکدکننده مرتبط با بیماری را برطرف کنیم. با بهره‌گیری از نمونه‌های بیشتر، می‌توانیم جهش‌های کلیدی مؤثر در بیماری‌ها را شناسایی کرده و از این دانش برای طراحی درمان‌های جدید استفاده کنیم.”

منبع:

Characterization of non-coding variants associated with transcription-factor binding through ATAC-seq-defined footprint QTLs in liver. The American Journal of Human Genetics, 2025; DOI: 10.1016/j.ajhg.2025.03.019

تهیه و تنظیم: سید طه نوربخش

تأیید و نظارت: فائزه محمدهاشم-متخصص ژنتیک