به گزارش پایگاه خبری خبرآنی به نقل از اینترستینگ انجیرینگ، ابزار مذکور «آلفاژنوم» نام دارد و کل بخش های کدگذاری و غیرکدگذاری ژنوم را دربر می گیرد و چشم اندازی یکپارچه از اثرات متغیرها ارائه میدهد که تاکنون بیسابقه بوده است. این روش چشم اندازی پایه ای برای تجزیه و تحلیل ژنومی دوربرد به وجود میآورد و تأثیر جهشها را با سرعت، مقیاس و عمق بیسابقهای رمزگشایی میکند.
این مدل تا یک میلیون جفت پایه را در یک مرحله پردازش میکند و هزاران ویژگی مولکولی، از جمله بیان ژن، الگوهای پیرایش، جایگاههای اتصال پروتئین و دسترسی به کروماتین در انواع مختلف سلول را پیشبینی میکند.
این نخستین باری است که چنین طیف گستردهای از ویژگیهای تنظیمی را میتوان به طور مشترک با استفاده از یک سیستم هوش مصنوعی مدلسازی کرد. ساختار آلفاژنوم ابتدا از لایههای کانولوشن برای شناسایی الگوهای کوتاه در توالی دی ان ای و سپس از مبدلها برای به اشتراک گذاشتن اطلاعات در کل کد ژنتیکی استفاده میکند. مجموعهای نهایی از لایهها، این الگوهای آموخته شده را به پیشبینیهایی در مورد ویژگیهای مختلف ژنومی تبدیل میکند.
طی مرحله آموزش تمام رایانش برای یک توالی واحد در چند واحد پردازش تانسور (TPU) به هم پیوسته توزیع میشود و امکان پردازش کارآمد در مقیاس بزرگ را فراهم میکنند.
این مدل واحد تنها در چهار ساعت و با استفاده از نیمی از بودجه رایانشی مورد نیاز برای مدل قبلی خود یعنی Enformer، آموزش داده شد. آلفاژنوم که به عنوان جانشین Enformer و مکمل AlphaMissense ساخته شده است، تنها مدلی است که میتواند به طور مشترک تمام روشهای مولکولی ارزیابی شده را پیشبینی کند و در ۲۴مورد از ۲۶ آزمایش معیار، از مدلهای تخصصی پیشی گرفته یا با آنها مطابقت داشته باشد. این مدل براساس مجموعه دادههای عمومی عظیم از جمله ENCODE، GTEx، ۴D Nucleome و FANTOM۵ آموزش داده شد.
هرچند آلفا ژنوم یک پیشرفت مهم به حساب می آید اما برای تعبیر ژنوم های شخصی یا مصارف کلینیکی طراحی یا تایید نشده است. این مدل با چالش های زیادی در مدلسازی تعاملات تنظیمی بسیار دوردست و همچنین در ثبت کامل الگوهای خاص سلول و بافت روبرو است.