اس سال کا لاسکر بیسک میڈیکل ریسرچ ایوارڈ ڈیمس ہسابیس اور جان جمپر کو الفا فولڈ مصنوعی ذہانت کے نظام کی تخلیق میں ان کی شراکت کے لیے دیا گیا جو امینو ایسڈ کے پہلے آرڈر کی ترتیب کی بنیاد پر پروٹین کی تین جہتی ساخت کی پیش گوئی کرتا ہے۔
ان کے نتائج ایک ایسے مسئلے کو حل کرتے ہیں جس نے طویل عرصے سے سائنسی برادری کو پریشان کر رکھا ہے اور بائیو میڈیکل فیلڈ میں تحقیق کو تیز کرنے کا دروازہ کھول دیا ہے۔ پروٹین بیماری کی نشوونما میں ایک اہم کردار ادا کرتے ہیں: الزائمر کی بیماری میں، وہ ایک ساتھ جوڑتے ہیں کینسر میں، ان کا ریگولیٹری فنکشن ختم ہو جاتا ہے۔ پیدائشی میٹابولک عوارض میں، وہ غیر فعال ہیں؛ سسٹک فائبروسس میں، وہ خلیے میں غلط جگہ میں چلے جاتے ہیں۔ یہ بہت سے میکانزم میں سے چند ایک ہیں جو بیماری کا سبب بنتے ہیں۔ تفصیلی پروٹین ڈھانچے کے ماڈل جوہری کنفیگریشن فراہم کر سکتے ہیں، اعلی تعلق والے مالیکیولز کے ڈیزائن یا انتخاب کو چلا سکتے ہیں، اور منشیات کی دریافت کو تیز کر سکتے ہیں۔
پروٹین کے ڈھانچے کا تعین عام طور پر ایکس رے کرسٹالوگرافی، جوہری مقناطیسی گونج اور کرائیو الیکٹران مائکروسکوپی کے ذریعے کیا جاتا ہے۔ یہ طریقے مہنگے اور وقت طلب ہیں۔ اس کے نتیجے میں موجودہ 3D پروٹین ڈھانچے کے ڈیٹا بیس میں صرف 200,000 ساختی ڈیٹا موجود ہے، جبکہ ڈی این اے کی ترتیب دینے والی ٹیکنالوجی نے 8 ملین سے زیادہ پروٹین کی ترتیب تیار کی ہے۔ 1960 کی دہائی میں، Anfinsen et al. نے دریافت کیا کہ امینو ایسڈ کا 1D تسلسل بے ساختہ اور بار بار ایک فعال سہ جہتی تشکیل (شکل 1A) میں جوڑ سکتا ہے، اور یہ کہ سالماتی "چیپیرونز" اس عمل کو تیز اور آسان بنا سکتے ہیں۔ یہ مشاہدات سالماتی حیاتیات میں 60 سالہ چیلنج کا باعث بنتے ہیں: امینو ایسڈ کے 1D تسلسل سے پروٹین کے 3D ڈھانچے کی پیش گوئی۔ ہیومن جینوم پروجیکٹ کی کامیابی کے ساتھ، 1D امینو ایسڈ کی ترتیب حاصل کرنے کی ہماری صلاحیت میں بہت بہتری آئی ہے، اور یہ چیلنج اور بھی ضروری ہو گیا ہے۔
پروٹین کے ڈھانچے کی پیشن گوئی کئی وجوہات کی بناء پر مشکل ہے۔ سب سے پہلے، ہر امینو ایسڈ میں ہر ایٹم کی تمام ممکنہ سہ جہتی پوزیشنوں کے لیے بہت زیادہ تلاش کی ضرورت ہوتی ہے۔ دوسرا، پروٹین اپنی کیمیائی ساخت میں تکمیل کا زیادہ سے زیادہ استعمال کرتے ہیں تاکہ ایٹموں کو مؤثر طریقے سے ترتیب دیا جا سکے۔ چونکہ پروٹین میں عام طور پر سیکڑوں ہائیڈروجن بانڈ "عطیہ دہندگان" (عام طور پر آکسیجن) ہوتے ہیں جو ہائیڈروجن بانڈ "قبول کرنے والے" (عام طور پر نائٹروجن ہائیڈروجن سے منسلک ہوتے ہیں) کے قریب ہونے چاہئیں، اس لیے ایسی صورتیں تلاش کرنا بہت مشکل ہو سکتا ہے جہاں تقریباً ہر عطیہ کنندہ قبول کنندہ کے قریب ہو۔ تیسرا، تجرباتی طریقوں کی تربیت کے لیے محدود مثالیں موجود ہیں، اس لیے متعلقہ پروٹینوں کے ارتقاء پر معلومات کا استعمال کرتے ہوئے 1D ترتیب کی بنیاد پر امینو ایسڈ کے درمیان ممکنہ سہ جہتی تعاملات کو سمجھنا ضروری ہے۔
طبیعیات کا استعمال سب سے پہلے ایٹموں کے باہمی تعامل کو بہترین شکل کی تلاش میں کرنے کے لیے کیا گیا تھا، اور پروٹین کی ساخت کی پیشین گوئی کرنے کے لیے ایک طریقہ تیار کیا گیا تھا۔ کارپلس، لیویٹ اور وارشیل کو کیمسٹری میں 2013 کا نوبل انعام ان کے پروٹین کے کمپیوٹیشنل تخروپن پر کام کرنے پر دیا گیا۔ تاہم، طبیعیات پر مبنی طریقے کمپیوٹیشنل طور پر مہنگے ہیں اور ان کے لیے تخمینی پروسیسنگ کی ضرورت ہوتی ہے، اس لیے درست سہ جہتی ڈھانچے کی پیش گوئی نہیں کی جا سکتی۔ ایک اور "علم پر مبنی" نقطہ نظر مصنوعی ذہانت اور مشین لرننگ (AI-ML) کے ذریعے ماڈلز کو تربیت دینے کے لیے معلوم ڈھانچے اور ترتیب کے ڈیٹا بیس کا استعمال کرنا ہے۔ حسابیس اور جمپر طبیعیات اور AI-ML دونوں کے عناصر کو لاگو کرتے ہیں، لیکن نقطہ نظر کی کارکردگی میں جدت اور چھلانگ بنیادی طور پر AI-ML سے ہوتی ہے۔ دونوں محققین نے تخلیقی طور پر بڑے عوامی ڈیٹا بیس کو صنعتی درجے کے کمپیوٹنگ وسائل کے ساتھ ملا کر الفا فولڈ بنایا۔
ہم کیسے جانتے ہیں کہ انہوں نے ساختی پیشین گوئی کی پہیلی کو "حل" کر لیا ہے؟ 1994 میں، ساخت کی پیشن گوئی کا تنقیدی جائزہ (CASP) مقابلہ قائم کیا گیا، جو ہر دو سال بعد ساختی پیشن گوئی کی پیشرفت کو ٹریک کرنے کے لیے میٹنگ کرتا ہے۔ محققین اس پروٹین کی 1D ترتیب کا اشتراک کریں گے جس کی ساخت انہوں نے حال ہی میں حل کی ہے، لیکن جس کے نتائج ابھی تک شائع نہیں ہوئے ہیں۔ پیشن گوئی کرنے والا اس 1D ترتیب کا استعمال کرتے ہوئے سہ جہتی ڈھانچے کی پیش گوئی کرتا ہے، اور تجزیہ کار تجربہ کار کی طرف سے فراہم کردہ سہ جہتی ڈھانچے سے (صرف تشخیص کنندہ کو فراہم کردہ) سے موازنہ کرکے پیش گوئی شدہ نتائج کے معیار کا آزادانہ طور پر فیصلہ کرتا ہے۔ CASP حقیقی نابینا جائزوں کا انعقاد کرتا ہے اور طریقہ کار کی جدت سے وابستہ وقفے وقفے سے کارکردگی کی چھلانگوں کو ریکارڈ کرتا ہے۔ 2020 میں 14 ویں CASP کانفرنس میں، AlphaFold کے پیشین گوئی کے نتائج نے کارکردگی میں ایسی چھلانگ دکھائی کہ منتظمین نے اعلان کیا کہ 3D ساخت کی پیشین گوئی کا مسئلہ حل ہو گیا ہے: زیادہ تر پیشین گوئیوں کی درستگی تجرباتی پیمائش کے قریب تھی۔
وسیع تر اہمیت یہ ہے کہ حسابیس اور جمپر کا کام یقین سے یہ ظاہر کرتا ہے کہ کس طرح AI-ML سائنس کو تبدیل کر سکتا ہے۔ اس کی تحقیق سے پتہ چلتا ہے کہ AI-ML ڈیٹا کے متعدد ذرائع سے پیچیدہ سائنسی مفروضے بنا سکتا ہے، توجہ کا طریقہ کار (ChatGPT کی طرح) ڈیٹا کے ذرائع میں کلیدی انحصار اور ارتباط کو دریافت کر سکتا ہے، اور یہ کہ AI-ML اپنے آؤٹ پٹ نتائج کے معیار کا خود فیصلہ کر سکتا ہے۔ AI-ML بنیادی طور پر سائنس کر رہا ہے۔
پوسٹ ٹائم: ستمبر 23-2023




