ومع اقترابنا من نهاية عام 2024، تنشر First Opinion سلسلة من المقالات حول حالة الذكاء الاصطناعي في الطب والصيدلة الحيوية.
هناك ما هو أكثر في الحياة من طي البروتين.
سوف يغفر لك الاعتقاد بخلاف ذلك بناءً على الأخبار مؤخرًا. ألفا فولد فقط فاز بجائزة نوبل، ويظهر نموذج مؤسسة آخر يوميًا تقريبًا وسط ضجة كبيرة وتمويل المشاريع.
لقد حصلت على هذا الضجيج. إن التنبؤ ببنية البروتين من خلال التسلسل يمهد الطريق لكل شيء بدءًا من هندسة الإنزيمات وحتى تصميم الأدوية العقلاني. كانت هذه الأهداف بمثابة أحلام بعيدة المنال عندما كنت أتبرع بدورات احتياطية على جهاز كمبيوتر Compaq الخاص بي لمشروع Folding@home. وبفضل الذكاء الاصطناعي، أصبح تحقيقها الآن أكثر سهولة.
ولكن لم يكن علم الأحياء بأي حال من الأحوال حلها. لا يستطيع AlphaFold الإجابة على كل سؤال. على سبيل المثال: هل اخترت دواءً آمنًا وفعالاً؟ حسنًا، في أي مكان في الخلية وأين يوجد البروتين الذي يهمك في الجسم؟ ما هو الدور الذي تلعبه في مسارات الإشارة؟ كيف يقود وظيفة الأنسجة (dys)، من تدفق السوائل إلى التليف؟ حظًا سعيدًا في الحصول على جهاز كمبيوتر ليخبرك بأي من ذلك.
في الوقت الحالي، لا يوجد نموذج أساسي يمكنه التنبؤ بما ستفعله الخلية أو النسيج أو الكائن الحي بأكمله. إن ما نسميه الذكاء الاصطناعي في علم الأحياء اليوم يدور في الغالب حوله كيمياء – كيف تنحني الجزيئات إلى شكلها وترتبط ببعضها البعض.
إذا كنت تريد معرفة أي الجزيئات مهمة في المقام الأول، فسوف تحتاج إلى الإجابة على هذا السؤال بنفسك. البيانات التي تحتاجها غير موجودة بعد. توقع أن تدفع مقابل التجارب، وربما حتى تلتقط ماصة. لقد رأيت عددًا كافيًا من الأشخاص (بما فيهم أنا) يدركون مؤخرًا حدود الذكاء الاصطناعي في علم الأحياء لدرجة أنني اعتقدت أنني سألخص الرحلة وأوفر على الجميع بعض الوقت. دعنا نسميها مراحل الحزن الخمس (نسخة techbio).
اسمحوا لي أن أضع المشهد. بطلنا المأساوي هو شخص أرقام، هل هو فيزيائي؟ مبرمج؟ – مليئون بالأمل والغطرسة بشأن ما يمكن أن تفعله أجهزة الكمبيوتر لهم.
- المرحلة الأولى تدور حول الإنكار. “الرياضيات الرائعة هي كل ما أحتاجه للعثور على معنى الحياة.”
- في المرحلة الثانية، يغلي الغضب. “هل يعرف علماء الأحياء ما هي الشبكة العصبية؟ البيانات غير متوفرة بناء على طلب معقول؟ ماذا لو لم أرغب في تصميم نموذج للبروتين؟!”
- المرحلة الثالثة ترى أن بطلنا يتفاوض مع آلهة الأحياء. “حسنًا، حسنًا – سأجري تجربة. أو سيفعل ذلك زميلي. بمجرد أن أجد واحدة…”
- في المرحلة الرابعة، ينغمس بطلنا في اكتئاب عميق بسبب الفشل تلو الآخر في المختبر. “ليس هناك قافية أو سبب للكائنات الحية. ربما كنت أفضل حالا التفكير في كيفية جعل الأشخاص ينقرون على الإعلانات.“
- وأخيرا، في المرحلة الخامسة يأتي القبول. “عليك أن تقيس الحياة قبل أن تتمكن من تصميمها.”
الذكاء الاصطناعي يتطلب بيانات حقيقية. البطل المجهول الكامن وراء AlphaFold هو بنك بيانات البروتينأو بي دي بي. منذ عام 1971، قام باحثو ما بعد الدكتوراه في جميع أنحاء العالم ببلورة وفهرسة هياكل ما يقرب من 250 ألف بروتين، في عملية تجميع مجموعة التدريب المثالية للشبكات العصبية الحالية. لسوء الحظ فإن PDB هو الاستثناء للقاعدة إلى حد كبير. وكلما اتجهت نحو الأعضاء والكائنات الحية بأكملها، قل احتمال وجود قاعدة بيانات عامة يمكن الاعتماد عليها.
لذلك، قامت العديد من الشركات الناشئة بتجميع قواعد بيانات كاملة بنفسها. الحيوانات الحيوية يعتقد أن لدينا الكثير لنتعلمه عن السمنة من الحيوانات التي تدخل في حالة سبات أثناء تأرجحها من الوليمة إلى المجاعة. قامت الحيوانات بإجراء قياسات متعددة الأوميك عبر مئات الأنواع من الثدييات للكشف عن الأسس الجزيئية لمرونتها الرائعة. ومن خلال إدخال هذه البيانات في الشبكات العصبية البيانية، تتنبأ الحيوانات وتسعى إلى تحقيق روابط جديدة بين الأمراض وأهداف الأدوية. لم يكن أي من هذا الذكاء الاصطناعي ممكنًا لو لم تقم الحيوانات بوصف عملية التمثيل الغذائي للكائن الحي بعناية 13- سنجاب مطحون. أنا متأكد من أن الكثير من الناس كتبوا ذلك على أنه حفرة أموال أكاديمية مفرطة. خمسمائة مليون دولار في biobucks من ايلي ليلي التسول تختلف.
وفي الواقع، يبدو التعلم من الطبيعة بمثابة استراتيجية ناجحة. إنفيدا يجمع الذكاء الاصطناعي مع الحكمة الشعبية لفك المحتويات الكيميائية للنباتات الطبية. نموذج إنفيدا الأساسي للكيمياء موشور، يعتمد على نموذج اللغة التأسيسي BERT، حيث تحل القمم في أطياف الكتلة محل الكلمات في الجمل. لم تكن إنفيدا أبدًا متوهمة بإمكانية تدريب برنامج PRISM على البيانات العامة فقط. جمعت الشركة 1.2 مليار طيفًا كتليًا لتغذية وحدات معالجة الرسومات الخاصة بها، وأنتجت 600 مليون من تلك الأمثلة التدريبية بنفسها. هذا النوع من البيانات لا يأتي بثمن زهيد، ولكن يبدو أن الاستثمار فيه قد أتى بثماره. لدى إنفيدا دواء واحد في العيادة وتسعة مرشحين للتطوير في طريقهم إلى هناك، وهي إنتاجية ملحوظة لشركة بدأت من الصفر قبل خمس سنوات.
(ملاحظة جانبية: علم النبات مليء بأفكار تبلغ قيمتها مليارات الدولارات. لن يكون هناك أسبرين بدون شجرة الصفصاف ولا النيلام بدون شجرة الصفصاف. البطونية الأرجوانية.)
في هذه المرحلة، قد تشعر بأن كل الأمل قد فقد إذا لم يكن لديك مئات الملايين من الدولارات أو نقاط البيانات. هذا بالتأكيد هو الإجماع بين أولئك الذين يعرفون: الذكاء الاصطناعي في علم الأحياء مقيد بشكل مؤسف بالبيانات، ومن المقدر له أن يكون كذلك. أكثر تطورية من الثورية.
لحسن الحظ، لا يزال لديك دماغك. لا تحتاج إلى نموذج أساس تنبؤي ومذهل إذا كان هناك شيء أبسط يمكن أن يساعدك في إجراء التجارب الصحيحة للعثور على إجابتك. أطلق عليه “الذكاء المعزز” – جهاز كمبيوتر مساعدًا للطيار.
هذا ما نعنيه عندما نقول الذكاء الاصطناعي في شركتي، Tessel Bio. هدفنا في Tessel هو عكس إعادة تشكيل الأنسجة و الذاكرة الالتهابية في الأمراض المزمنة. نحن نعطي الأولوية الصلاحية التنبؤية: نحن نقيس وظيفة الأنسجة في الثقافات “العضوية النمطية” المشتقة من المريض لنمذجة ما تم كسره في العضو الأصلي – وأعني الأنماط الظاهرية البيوفيزيائية الحقيقية مثل تصلب الأنسجة في أمعاء كرون ونقل المخاط في رئة مرض الانسداد الرئوي المزمن. هذه الأنواع من المقايسات ليست ذات إنتاجية عالية جدًا. لا يوجد نموذج أساسي حالي يمكنه الإجابة على أسئلتنا. ولكن يمكننا استخدام “التعلم النشط“منصة Tesselogic، لتحديد أولويات الاضطرابات وتوفير الوقت الثمين والمال والمواد. (من خلال أحد المعايير، التغلب على شاشة القوة الغاشمة بأقل من 3% من الجهد.) ببساطة، تتعلم Tesselogic مما فعلناه بالفعل لتقترح ما يجب اختباره بعد ذلك.
أنا متفائل بشأن قدرة الهجينة البشرية والذكاء الاصطناعي على جمع البيانات الصحيحة على النطاق الصحيح. لقد ظهرت مثل هذه الأساليب في كل مكان تكون فيه التجارب مكلفة، بدءًا من اكتشاف الهدف ل تصميم جزيء صغير.
لا تحتاج دائمًا إلى غلي المحيط لاستخلاص معنى الحياة.
نارين تالابراجادا هو الرئيس التنفيذي لشركة Tessel Bio، وهي شركة لاكتشاف الأدوية بمساعدة الذكاء الاصطناعي والتي تسخر القوة التنبؤية لعلم وظائف الأعضاء لتطوير علاجات للأمراض المزمنة.