
پژوهشگران بیمارستان کودکان فیلادلفیا (CHOP) و دانشکده پزشکی پرلمن در دانشگاه پنسیلوانیا موفق شدهاند با بهرهگیری از یک الگوریتم یادگیری عمیق (Deep Learning)، جهشهای ژنتیکی را در بخشهایی از DNA انسان شناسایی کنند که گرچه نقشی در ساخت پروتئین ندارند، اما میتوانند ریسک ابتلا به بیماریهای مختلف را افزایش دهند. نتایج این تحقیق که در نشریه American Journal of Human Genetics منتشر شده، میتواند بستری برای شناسایی عوامل ژنتیکی مؤثر در بسیاری از بیماریهای شایع فراهم کند.
بخش اعظم ژنوم انسان – بیش از ۹۸ درصد – حاوی توالیهایی است که پروتئینساز نیستند. این مناطق موسوم به «نواحی غیرکدکننده»، گرچه مستقیماً پروتئینی تولید نمیکنند، اما نقش مهمی در تنظیم زمان و میزان بیان ژنها ایفا میکنند. شناسایی جهشهای بیماریزا در این نواحی تاکنون دشوار بوده، چرا که «کدهای تنظیمی» آنها هنوز بهخوبی شناخته نشدهاند. با این حال، مطالعات گسترده ژنومی (GWAS) در سالهای اخیر گامهای مهمی در روشن کردن نقش بالینی این نواحی برداشتهاند.
یکی از چالشهای اساسی این است که مطالعات GWAS معمولاً نواحی وسیعی را بهعنوان مرتبط با بیماری شناسایی میکنند، اما تعیین اینکه کدام جهش دقیقاً مسئول بروز بیماری است، بسیار پیچیده باقی مانده. بسیاری از این جهشها در اطراف توالیهایی قرار دارند که پروتئینهای تنظیمکننده بیان ژن، به نام «فاکتورهای رونویسی»، به آنها متصل میشوند. این پروتئینها هنگام اتصال، ناحیهای از DNA را موقتاً «مسدود» کرده و ردپایی از تعامل خود بر جای میگذارند که در دادههای تجربی قابل شناسایی است.
دکتر استروان گرنت (Struan F.A. Grant)، نویسنده ارشد این مطالعه عنوان کرد: “این وضعیت مانند زمانیست که چندین گزینه مشابه پیش روی شما قرار دارد، اما تنها یکی از آنها عامل اصلی بیماریست. روش ما به ما کمک کرد تا با دقت بالا، جهش ژنتیکی مسئول را از میان گزینههای متعدد شناسایی کنیم.”
در این پژوهش، دانشمندان از روش پیشرفتهای به نام ATAC-seq برای شناسایی نواحی باز در ژنوم (جایی که فاکتورهای رونویسی میتوانند متصل شوند) استفاده کردند. آنها همچنین از یک الگوریتم مبتنی بر یادگیری عمیق به نام PRINT بهره گرفتند که قادر است ردپای تعامل میان DNA و پروتئین را تشخیص دهد.
با بررسی دادههای حاصل از ۱۷۰ نمونه بافت کبد انسان، آنها موفق به شناسایی ۸۰۹ نقطه ژنتیکی شدند که «جای پای» این فاکتورهای رونویسی در آنها دیده میشود – یعنی نواحیای که بهطور بالقوه محل تنظیم ژنی هستند و بسته به نوع جهش، میزان اتصال فاکتورهای رونویسی در آنها تغییر میکند.
یافتههای این مطالعه نهتنها به درک بهتر عملکرد نواحی غیرکدکننده کمک میکند، بلکه میتواند پایهای برای تحلیل دقیقتر بیماریهایی باشد که منشأ ژنتیکی پیچیده دارند. محققان اکنون در نظر دارند این روش را به بافتها و اندامهای دیگر نیز گسترش دهند تا بتوانند نقش جهشهای مشابه را در بیماریهای متنوع شناسایی کنند.
ماکس دودک (Max Dudek)، دانشجوی دکترای ژنتیک و نویسنده اول مقاله، میگوید:”این روش به ما کمک میکند برخی از مشکلات بنیادی در شناسایی جهشهای غیرکدکننده مرتبط با بیماری را برطرف کنیم. با بهرهگیری از نمونههای بیشتر، میتوانیم جهشهای کلیدی مؤثر در بیماریها را شناسایی کرده و از این دانش برای طراحی درمانهای جدید استفاده کنیم.”
منبع:
Characterization of non-coding variants associated with transcription-factor binding through ATAC-seq-defined footprint QTLs in liver. The American Journal of Human Genetics, 2025; DOI: 10.1016/j.ajhg.2025.03.019
تهیه و تنظیم: سید طه نوربخش
تأیید و نظارت: فائزه محمدهاشم-متخصص ژنتیک