رمزگشایی از پروتئین های ناپایدار با هوش مصنوعی
این مطالعه نشان میدهد که هوش مصنوعی میتواند تحقیقات را در زیستشناسی، زیستشناسی مصنوعی و پزشکی شخصیسازیشده سرعت بخشد.
به گزارش پایگاه علمی خبری دانه، به نقل از سایت psychologytoday پیشرفت تازهای در زیستشناسی، به کمک هوش مصنوعی (AI) و یادگیری ماشینی (machine learning )و فیزیک کاربردی به دست آمده است. مطالعهای جدید و داوریشده توسط پژوهشگران دانشگاه هاروارد (SEAS) و دانشگاه نورثوسترن نشان داده که میتوان با کمک هوش مصنوعی و قوانین فیزیک، پروتئینهای ناپایدار را طراحی کرد که بخشی از پروتئوم تاریک را تشکیل میدهند.
پروتئینهای ناپایدار و پروتئوم تاریک
پروتئوم به مجموعهای از پروتئینها گفته میشود که در یک سلول، بافت یا ارگانیسم خاص در یک زمان معین وجود دارند. این اصلاح بهطور خاص به مطالعه پروتئینها و ویژگیهای آنها، از جمله ساختار، عملکرد و تغییرات آنها در پاسخ به شرایط مختلف اشاره دارد.
طراحی پروتئین به منظور کاربردهای داروی، ساخت واکسن، محصولات تراریخته، پروتئینهای نانو، ساخت بیومارکرها برای تشخیص زودهنگام بیماریها و… انجام می شود.
طراحی پروتئینهای با ساختار پایدار در سالهای اخیر پیشرفت زیادی کرده است، اما بسیاری از پروتئینها و بخشهای آنها به طور ذاتی فاقد ساختار ثابت هستند. به عبارت دیگر، توالی این پروتئینها میتواند طیف وسیعی از شکلهای فضایی را ایجاد کند که عملکرد زیستی آنها را مشخص میکند. همین این ساختارهای ناپایدار سبب ایجاد عملکردهای متنوع و گسترده پروتئینها میشوند.
در زیستشناسی مانند جهانشناسی مدرن که مفهوم ماده تاریک وجود دارد، پروتئوم تاریک را داریم، شامل پروتئینهایی است که ساختار آنها ناشناخته است، کمتر مورد مطالعه قرار گرفتهاند، یا از ژنهای غیرمرسوم میآیند.( مانند ژنهای که در پایگاههای داده ژنتیکی به عنوان ژن کد کننده پروتئین ثبت نشدهاند.) این پروتئینها میتوانند منابع بالقوه درمانی برای داروهای جدید باشند.
پروتئینهای intrinsically disordered یا به اختصار IDP، پروتئینهایی هستند که ساختار مشخص و پایداری ندارند. به همین دلیل مطالعه آنها با ابزارهای سنتی زیستشناسی ساختاری، مانند بلورشناسی اشعه ایکس یا میکروسکوپ الکترونی کریو تقریباً غیرممکن است.
چرا مطالعه پروتئینها اهمیت دارد؟
درک پروتئینها برای حوزههای مختلفی از جمله تحقیقات بیماریهای عصبی، کشف دارو، طراحی داروهای دارویی، زیستفناوری، زیستشناسی مصنوعی،کاربردهای محیط زیستی، مهندسی پروتئین و پزشکی شخصی ضروری است. بسیاری از بیماریها و اختلالات عصبی ناشی از اشتباه در تا شدن پروتئینها یا تجمع پروتئینهای ناصحیح هستند.
برای مثال:
- تجمع پروتئینهای تاو (tau proteins)منجر به تودههای عصبی میشود که نشانهای از بیماری آلزایمر است.
- پروتئین آلفا-سینوکلئین (alpha-synuclein protein ) ناصحیح یک نشانگر بیماری پارکینسون است.
- پروتئین هانتینگتین ناصحیح با بیماری هانتینگتون مرتبط است.
- تجمع پروتئینهای ناپایدار در اسکلروز جانبی آمیوتروفیک(ALS) نیز دیده میشود.
هوش مصنوعی فراتر از جایزه نوبل
کاربرد موفق یادگیری عمیق مبتنی بر هوش مصنوعی در پیشبینی ساختار سهبعدی پروتئینها از سال ۲۰۱۸ آغاز شد، زمانی که «آلفافولد» (AlphaFold) از شرکت «گوگل دیپمایند» (Google DeepMind’s)مسیر را هموار کرد و در سیزدهمین رقابت «ارزیابی بحرانی پیشبینی ساختار پروتئین» (CASP13) بالاترین دقت را به دست آورد. (AlphaFold) یک مدل یادگیری عمیق هوش مصنوعی است که میتواند ساختار سهبعدی پروتئینها را بر پایهی توالی اسیدهای آمینه پیشبینی کند. دو سال بعد، در سال ۲۰۲۰، نسخهی دوم آن یعنی «آلفافولد ۲» (AlphaFold 2) در رقابت CASP14 نیز بالاترین دقت را کسب کرد و از سوی برگزارکنندگان CASP بهعنوان مدلی که مسئلهی «تاخوردگی پروتئین» را (که پنجاه سال است یکی از چالشهای بزرگ زیستشناسی به شمار میرود) حل کرده است، مورد تقدیر قرار گرفت.
جایزهی نوبل شیمی ۲۰۲۴ به «دیوید بیکر» برای طراحی محاسباتی پروتئین و به پیشگامان هوش مصنوعی در شرکت (Google DeepMind’s)، «دِمیس هاسابیس» و «جان جامپر»، برای پیشبینی ساختار پروتئین اهدا شد. این کار، نقطهی عطفی در پیشبینی ساختار سهبعدی پروتئینهای پایدار بود.
با این حال، استفاده از یادگیری عمیق برای طراحی «پروتئینهای ذاتاً بینظم» (intrinsically disordered proteins) بهطور ذاتی دشوار است، زیرا ذات یادگیری ماشین چنین اقتضایی دارد. شبکههای عصبی عمیق ویژگیها را از حجم عظیمی از دادههای آموزشی «میآموزند»، نه از برنامهنویسی صریح و کدگذاریشده. اگرچه مجموعهدادههایی که برای آموزش آلفافولد به کار رفت ممکن است شامل دادههایی از پروتئینهای بینظم نیز باشد، اما عمدتاً از اطلاعات مربوط به پروتئینهای ساختیافته تشکیل شدهاند که با ابزارهای استاندارد زیستشناسی مانند «پراش پرتو ایکس» (X-ray crystallography) به دست آمدهاند. افزون بر این، در مورد «ناحیههای ذاتاً بینظم» (intrinsically disordered regions, IDR) ــ بخشهایی از پروتئین که فاقد ساختار سهبعدی پایدار هستند ــ طبق دادههای پایگاه ساختار پروتئینی آلفافولد، این مدل معمولاً پیشبینیهایی با «اطمینان پایین» ارائه میدهد.
با وجود این، هرچند (AlphaFold 2)عمدتاً بر اساس پروتئینهای پایدار آموزش دیده است، اما طبق پژوهشی که توسط «مکبراید» و «تلاستی» در نشریهی Physical Review Letters منتشر شده، این مدل «اطلاعات قابلتوجهی دربارهی پایداری» را در خود رمزگذاری کرده است. این یافته دری تازه بهسوی درک پروتئینهای ناپایدار میگشاید.
رویکردی نوآورانه
در نگاه اول، شاید بدیهیترین روش برای انجام این پژوهش جدید آن باشد که پایگاهدادههایی را شناسایی کنیم که عمدتاً شامل پروتئینهای ذاتاً بینظم (Intrinsically Disordered Proteins) هستند و سپس با استفاده از آنها یک الگوریتم یادگیری عمیق (Deep Learning) را برای پیشبینی ساختار پروتئینها آموزش دهیم.
اما پژوهشگران دانشگاه هاروارد (Harvard University) و دانشگاه نورثوِسترن (Northwestern University) مسیر متفاوتی را برگزیدند؛ راهی کمتر پیمودهشده.
آنچه این مطالعهی جدید را متمایز میسازد این است که دانشمندان، مدلی از هوش مصنوعی ایجاد کردند که از بهینهسازی بر پایهی گرادیان (Gradient-Based Optimization) بهره میبرد و همزمان قوانین بنیادی فیزیک را با استفاده از شبیهسازیهای واقعگرایانهی دینامیک مولکولی (Molecular Dynamics Simulations) به کار میگیرد.
به گفتهی نویسندگان مقاله:
«ترکیب رویکردهای مبتنی بر فیزیک با پیشرفتهای اخیر در برنامهنویسی تفاضلی (Differentiable Programming)، چشماندازی امیدبخش برای طراحی و مهندسی محاسباتی طیف وسیعی از زیستمولکولها و عملکردهای آنها فراهم میکند.»
این پژوهش پیشگامانه با بهرهگیری از فیزیک کاربردی و هوش مصنوعی، نوری میتاباند بر یکی از مؤلفههای مهم پروتئوم تاریک (Dark Proteome) بخشی ناشناخته از جهان پروتئینها که شاید روزی به کشف اهداف دارویی جدید و درمانهای نوآورانه برای مقابله با مجموعهای گسترده از بیماریها بینجامد.



