معلومة

درجة الميل للأحماض الأمينية

درجة الميل للأحماض الأمينية


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

ما معنى درجة ميل الأحماض الأمينية؟ كيف يتم حسابها؟
(لم أدرس علم الأحياء منذ السنوات الثماني الماضية ، وأنا الآن أخوض فيه لأنني أحتاجه لبحثي. لذا إذا كان بإمكان شخص ما وصفه بلغة بسيطة ، فسيكون ذلك مفيدًا للغاية)


كاستجابة مبسطة: يتم استخدام درجة الميل للتنبؤ بالبنية الثانوية للبروتين. إنه مشتق من النظر إلى بقايا aa للسطح الذي يمكن الوصول إليه للبروتين وأيضًا الواجهة التي تتيح التفاعلات بين البروتينات الأخرى.

المعادلة كالتالي:

الميل = [احتمال وجود البقايا في السطح البيني / احتمال البقايا على السطح]

أين،

مشكلة البقايا في الواجهة = [عدد الأحماض الأمينية في الواجهة / العدد الإجمالي للأحماض الأمينية لأي نوع من الواجهة]

و،

مسبار البقايا على السطح = [عدد الأحماض الأمينية السطحية / العدد الإجمالي للأحماض الأمينية السطحية]

تحقق من ورقة PLOS هذه كمثال. بلوس واحد. 2014 ؛ 9 (5): e97158.


خادم DiscoTope 2.0

يتنبأ خادم DiscoTope بحلقات خلية B متقطعة من هياكل ثلاثية الأبعاد للبروتين. تستخدم الطريقة حساب إمكانية الوصول إلى السطح (المقدرة من حيث أرقام الاتصال) ودرجة جديدة من الأحماض الأمينية لاتجاه الحاتمة. يتم حساب الدرجات النهائية من خلال الجمع بين درجات الميل للمخلفات في القرب المكاني وأرقام الاتصال.

الجديد في الإصدار 2.0 من DiscoTope: تعريف جديد للجوار المكاني المستخدم في جمع درجات الميل والتعرض نصف الكروي كمقياس سطحي.

ملحوظة: تم تحديث خادم DiscoTope لتحسين سهولة الاستخدام. يتوقع الخادم الآن الحلقات في مجمعات من سلاسل متعددة. أيضًا ، يمكن الآن تنزيل ملفات إخراج DiscoTope واستيرادها بسهولة في جداول البيانات. علاوة على ذلك ، قمنا بتسهيل تصور نتائج التنبؤ.

اقتباسات

لنشر النتائج ، يرجى ذكر:

تنبؤات موثوقة لخلايا B: تأثيرات تطوير الطريقة وتحسين المقارنة المعيارية
جنس فيندال كرينجلوم ، كلاوس لونديجارد ، أولي لوند ، ومورتن نيلسن
بلوس للبيولوجيا الحاسوبية ، 2012
ارتباط بالورق


خلفية

يقدر أن حوالي 20-30٪ من جميع البروتينات المشفرة في جينوم نموذجي موضعية في الأغشية [1 ، 2] ، حيث تلعب تفاعلات البروتين الدهني دورًا مهمًا في الاستقرار التوافقي والوظائف البيولوجية لبروتينات الغشاء. اقترحت العديد من الدراسات التجريبية أن الخصائص الفيزيائية والكيميائية للطبقة الدهنية ثنائية الغشاء تؤثر على استقرار ووظيفة بروتينات الغشاء. تم إثبات أن الثبات الحراري [3 ، 4] والكيميائي [5] لقناة البوتاسيوم KcsA يختلف وفقًا للتركيب الدهني لطبقة الغشاء الثنائية. وقد ثبت أيضًا أن تركيبة الدهون تؤثر على وظائف البروتين بما في ذلك: نقل الأيونات في KcsA [6 ، 7] و Ca 2+ -ATPase من الشبكة الساركوبلازمية [8 ، 9] ، الفسفرة بواسطة diacylglycerol kinase [10] والمركب الكيميائي النقل بواسطة قناة حساسة للميكانيكا من الموصلية الكبيرة MscL [11]. لاستكمال هذه الدراسات التجريبية ، تم إجراء تحليلات إحصائية للكشف عن تفضيلات الأحماض الأمينية وأنماط الحفظ داخل بيئة طبقة ثنائية الدهون [12-16] باستخدام التسلسل المتاح والبيانات الهيكلية. يجب أن تعكس الأنماط الناشئة من هذه التحليلات الإحصائية بشكل ضمني آثار جزيئات الدهون على التكوين الهيكلي واستقرار بروتينات الغشاء. ومع ذلك ، فإن القليل من الدراسات الحسابية السابقة قد أخذت في الاعتبار التفاصيل الذرية لتفاعلات البروتين والدهون بشكل صريح. الاستثناء الملحوظ هو محاكاة الديناميكيات الجزيئية (MD) لجميع الذرات ، حيث أصبح من الممكن تطبيق التقنية على بروتينات الغشاء في ظروف تحاكي الأغشية البيولوجية (راجعها مؤخرًا خليلي أراغي والمؤلفون المشاركون [17]). تمكّننا محاكاة كل ذرات MD من فحص تفاعلات البروتين والدهون في التفاصيل الذرية [18 ، 19] ويمكن أن تكشف عن دور الدهون في وظيفة البروتين [20] ، وإن كان ذلك لمجموعة صغيرة من جزيئات البروتين والدهون المحددة.

في هذه الورقة ، نحاول فهم طبيعة تفاعلات البروتين والدهون باستخدام نهج حسابي. نظرًا للعدد المحدود من الهياكل البلورية التي تحتوي على جزيئات دهنية ، قررنا دمج جميع الدهون الفسفورية البيولوجية المعروفة معًا وتصنيف التفاعلات الذرية إلى تلك التي تتضمن أجزاء "الرأس" و "الذيل" من الدهون. يمكن العثور على مجموعات الرأس والذيل في معظم الدهون الفوسفورية التي تشكل غشاءًا بيولوجيًا وتحدد واحدة من أهم السمات الكيميائية لهذه الجزيئات. وبالتالي ، فإننا نسأل بشكل أكثر تحديدًا: "كيف يتم التعرف على أجزاء الرأس والذيل من جزيئات الدهون بواسطة بقايا الأحماض الأمينية في بروتينات الغشاء؟"

للإجابة على هذا السؤال ، استخدمنا مصدرين متاحين للبيانات ، الهياكل البلورية ومسارات MD. باستخدام بيانات التركيب البلوري ، يمكننا تضمين وفحص أنواع مختلفة من البروتينات والدهون ، على الرغم من أن عدد جزيئات الدهون التي لوحظت في كل بنية محلولة محدود. باستخدام بيانات MD ، يمكننا الحصول على معلومات مفصلة حول جميع جزيئات الدهون المحيطة بالبروتين ، على الرغم من أن مثل هذا التحليل ممكن فقط لمجموعة صغيرة من أنواع البروتين والدهون. يتيح لنا الجمع بين مصدري البيانات هذين تقييم التحيزات الناتجة عن مجموعة محدودة من البيانات في كل مصدر بيانات. كشفت النتائج عن نمط شائع لتفاعلات الذيل الدهني مع الأحماض الأمينية التي لوحظت في كل من الهياكل البلورية ومسارات MD. نظهر أن التعرف على ذيول الدهون يمكن تفسيره إلى حد كبير من خلال محبة الدهون العامة وأن هذا التأثير يهيمن في حالتين مختلفتين يمثلهما التركيب البلوري ومجموعات بيانات MD. في المقابل ، أظهرت مجموعات الرأس الدهنية نمطًا أكثر تعقيدًا وتنوعًا ونناقش كيف يمكن ربط ملاحظاتنا بالبيانات التجريبية المعروفة والمفاهيم المقترحة سابقًا فيما يتعلق بتفاعلات البروتين والدهون.


مقدمة

تعد معرفة هياكل البروتين ثلاثية الأبعاد أمرًا بالغ الأهمية عند فحص وظائف البروتين. تعتبر المعرفة الهيكلية مهمة عند تصميم الأدوية التي تتضمن وظائف البروتين [1]. بشكل عام ، يتم استخدام علم البلورات بالأشعة السينية والتحليل الطيفي بالرنين المغناطيسي النووي بشكل شائع لتحديد هياكل البروتينات. تم الحصول على ما يقرب من 80٪ من تراكيب البروتين في بنك بيانات البروتين (PDB) باستخدام طريقة التصوير البلوري بالأشعة السينية [2]. في الواقع ، يتضمن هذان النهجان عمليات معقدة للغاية وتستغرق وقتًا طويلاً ومرهقة ومكلفة. بسبب الصعوبات في تحديد الهياكل البلورية ، ينتج عن البروتوكول الحالي نسبة نجاح 30٪ فقط [3]. وبالتالي ، يستفيد العديد من الباحثين من الأساليب الحسابية للتنبؤ المباشر بتبلور البروتين.

كانافيس وآخرون. [4] وجوه وآخرون. [5] اقترحت طرقًا لاستخراج ميزات إعلامية للتنبؤ بتبلور البروتين. العديد من الطرق الحسابية القائمة على التسلسل ، بما في ذلك OB-Score [6] و SECRET [7] و CRYSTALP [8] و XtalPred [9] و ParCrys [10] و CRYSTALP2 [11] و SVMCRYS [12] و PPCpred [13] و RFCRYS [14] ، توقع تبلور البروتين ، كما هو موضح في الجدول 1. كل من آلة ناقلات الدعم (SVM) [7] ، [12] ، [13] وآلية المجموعة [13] ، [14] تقنيات معروفة جيدًا تعزيز دقة التنبؤ. نظرًا لاختلاف أهداف التصميم والمعايير المستخدمة ، ليس من السهل تقييم الطريقة والميزات الأكثر فعالية. من الدراسة في [14] والجدول 1 ، يمكننا أن نرى أن طريقة SVM_POLY (انظر العمل [13]) باستخدام SVM تتمتع بأعلى دقة بين الطرق غير المجمعة. هذه الطريقة هي واحدة من أربعة تنبؤات SVM مدمجة في PPCpred [13]. تتميز طرق التجميع الحديثة PPCpred و RFCRYS بدقة عالية في التنبؤ باستخدام مصنفات SVM و Random Forest ، على التوالي. تستخدم PPCpred مجموعة شاملة من المدخلات التي تستند إلى مؤشرات الطاقة والكاره للماء ، وتكوين أنواع معينة من الأحماض الأمينية ، والاضطراب المتوقع ، والبنية الثانوية ، وإمكانية الوصول إلى المذيبات ، ومحتوى بعض المخلفات المدفونة والمكشوفة [13]. يتنبأ RFCRYS بتبلور البروتين من خلال استخدام التراكيب أحادية وثنائية وثلاثية الببتيد وترددات الأحماض الأمينية في مجموعات كيميائية فيزيائية مختلفة تشير إلى الوزن الجزيئي وطول تسلسل البروتين [14]. ومع ذلك ، فإن آلية هاتين المصنفات الجماعية تعاني من ضعف التفسير لعلماء الأحياء. ليس من الواضح ما هي ميزات التسلسل التي توفر المساهمة الأساسية في دقة التنبؤ العالية.

بدلاً من زيادة كل من تعقيد طرق التنبؤ وعدد أنواع الميزات مع متابعة الدقة العالية ، فإن الدافع من هذه الدراسة هو توفير طريقة بسيطة وقابلة للتفسير بدرجة عالية مع دقة مماثلة من وجهة نظر علماء الأحياء. ال ص- أزواج AA المتراصة (ص = 0 لثنائي الببتيد) مهم في التأثير على تبلور البروتين أو تعزيزه بسبب تأثير الطي المقابل للتفاعل بين أزواج AA المحلية [8] ، [11]. ال صتوفر أزواج AA المتراصة المعلومات الإضافية التي ينعكس عليها التفاعل بين أزواج AA المحلية إلى جانب تركيبة AA البسيطة. تقترح هذه الدراسة طريقة التجميع ، SCMCRYS ، للتنبؤ بتبلور البروتين الذي يتم فيه بناء كل مصنف باستخدام طريقة بطاقة التسجيل (SCM) [15] مع تقدير درجات الميل لـ ص- أزواج AA المتراصة لتكون قابلة للتبلور. بالمقارنة مع SCM باستخدام تركيبة ثنائي الببتيد في [15] ، فإن المصنف الجماعي لـ SCMCRYS يحقق أفضل استخدام لأزواج AA المرتبطين بـ p. قواعد تحديد ما إذا كان البروتين قابلاً للتبلور في مصنف SCM و SCMCRYS بسيطة جدًا وفقًا لدرجة المجموع المرجح وطريقة التصويت من عدد من مصنفات SCM ، على التوالي. ومع ذلك ، تظهر النتائج التجريبية أن مصنف SCM يمكن مقارنته بـ SVM_POLY والمصنفات المستندة إلى SVM مع صأزواج AA المتراصة. طريقة SCMCRYS قابلة للمقارنة مع أحدث أساليب المجموعات PPCpred و RFCRYS.

ترتبط درجات نزوع الببتيدات والأحماض الأمينية القابلة للتبلور ارتباطًا وثيقًا بقدرة التبلور للتسلسلات ويمكن أن توفر نظرة ثاقبة حول تبلور البروتين. علاوة على ذلك ، يمكن أن تكشف درجات ميل الأحماض الأمينية أيضًا عن العلاقة بين قابلية التبلور والخصائص الفيزيائية والكيميائية مثل الذوبان والوزن الجزيئي ونقطة الانصهار والانتروبيا التوافقية للأحماض الأمينية. تقترح هذه الدراسة أيضًا طريقة تحليل الطفرات لتوضيح الميزة الإضافية لـ SCM. نحن نبحث في تحليل الطفرات لتحسين تبلور البروتين بناءً على درجات التبلور المقدرة ، ودرجات الذوبان [15] ، والخصائص الفيزيائية والكيميائية للأحماض الأمينية. تكشف نتيجة التحليل الفرضية القائلة بأن الطفرات في المخلفات السطحية Ala و Cys لها احتمالات كبيرة وصغيرة لتعزيز تبلور البروتين في تطبيق مناهج هندسة البروتين.


SCMCRYS: توقع تبلور البروتين باستخدام طريقة بطاقة تسجيل المجموعة مع تقدير درجات الميل لأزواج الأحماض الأمينية P-Collocated

تحصل الطرق الحالية للتنبؤ بتبلور البروتين على دقة عالية باستخدام أنواع مختلفة من الميزات المكملة ومصنفات المجموعات المعقدة ، مثل آلة ناقلات الدعم (SVM) ومصنفات الغابة العشوائية. من المستحسن تطوير طريقة تنبؤ بسيطة وسهلة التفسير مع ميزات تسلسل إعلامي لتقديم رؤى حول تبلور البروتين. تقترح هذه الدراسة طريقة التجميع ، SCMCRYS ، للتنبؤ بتبلور البروتين ، حيث يتم بناء كل مصنف باستخدام طريقة بطاقة التسجيل (SCM) مع تقدير درجات الميل لأزواج الأحماض الأمينية المتجانسة p (AA) (p = 0 لثنائي الببتيد ). يحدد مصنف SCM تبلور تسلسل وفقًا لدرجة المجموع الموزون. الأوزان هي تكوين أزواج AA ذات الترتيب p ، ويتم تقدير درجات الميل لأزواج AA هذه باستخدام إحصائية مع نهج التحسين. تتوقع SCMCRYS التبلور باستخدام طريقة تصويت بسيطة من عدد من مصنفات SCM. تظهر النتائج التجريبية أن مصنف SCM الفردي الذي يستخدم تكوين ثنائي الببتيد بدقة 73.90٪ يمكن مقارنته بأفضل مصنف قائم على SVM تم تطويره مسبقًا ، SVM_POLY (74.6٪) ، ومصنفنا المقترح المستند إلى SVM يستخدم نفس تركيبة الببتيد (77.55) ٪). طريقة SCMCRYS بدقة 76.1٪ يمكن مقارنتها بأحدث طرق التجميع PPCpred (76.8٪) و RFCRYS (80.0٪) ، والتي استخدمت مصنفات SVM و Random Forest ، على التوالي. تبحث هذه الدراسة أيضًا في تحليل الطفرات بناءً على SCM والنتيجة تكشف الفرضية القائلة بأن الطفرات في المخلفات السطحية Ala و Cys لها احتمالات كبيرة وصغيرة لتعزيز تبلور البروتين مع الأخذ في الاعتبار الدرجات المقدرة للتبلور والذوبان ، ونقطة الانصهار ، والوزن الجزيئي والانتروبيا التوافقية. من الأحماض الأمينية في حالة معممة. يمكن أن تساعد درجات ميل الأحماض الأمينية وثنائيات الببتيدات لتقدير تبلور البروتين علماء الأحياء في تصميم طفرة في المخلفات السطحية لتعزيز تبلور البروتين. الكود المصدري لـ SCMCRYS متاح على http://iclab.life.nctu.edu.tw/SCMCRYS/.


مقدمة

الببتيدات المضادة للسرطان (ACPs) هي ببتيدات صغيرة تمارس خصائص انتقائية وسامة تجاه الخلايا السرطانية. نظرًا لاختراقها العالي المتأصل ، والانتقائية العالية وسهولة التعديل ، فإن الأدوية واللقاحات القائمة على الببتيد الاصطناعي 1 & # x02013 3 تمثل فئة واعدة من العوامل العلاجية. يمكن لـ ACP المصممة تحسين التقارب والانتقائية والاستقرار لتعزيز القضاء على الخلايا السرطانية. يعتمد تأثير بقايا الأحماض الأمينية على النشاط المضاد للسرطان لـ ACPs على الخصائص الموجبة ، والطارئة للماء ، والبرمائيات ذات البنية الحلزونية لدفع نفاذية الخلية. على وجه الخصوص ، يمكن لبقايا الأحماض الأمينية الموجبة (أي ليسين ، أرجينين ، وهيستيدين) أن تعطل وتخترق غشاء الخلية السرطانية للحث على السمية الخلوية بينما توفر الأحماض الأمينية الأنيونية (أي الأحماض الغلوتاميك والأسبارتيك) نشاطًا مضادًا للتكاثر ضد الخلايا السرطانية. علاوة على ذلك ، فإن بقايا الأحماض الأمينية الكارهة للماء (مثل فينيل ألانين ، التربتوفان ، والتيروزين) تمارس تأثيرها على النشاط السام للخلايا السرطاني 1 ، 4 ، 5. علاوة على ذلك ، يلعب الهيكل الثانوي لـ ACPs الذي يتكون من الأحماض الأمينية الكاتيونية والطارئة للماء دورًا مهمًا في تفاعل غشاء الخلية السرطانية الببتيد الذي يؤدي بطبيعته إلى تمزق الخلايا السرطانية والموت 1 ، 6. لذلك ، من المستحسن تطوير متنبئ بسيط وقابل للتفسير وفعال لتحقيق تحديد دقيق لـ ACP بالإضافة إلى تسهيل التصميم العقلاني للببتيدات الجديدة المضادة للسرطان مع التطبيقات السريرية الواعدة.

في السنوات القليلة الماضية ، تم تطوير معظم الأساليب الموجودة من خلال استخدام التعلم الآلي (ML) والأساليب الإحصائية كما هو مطبق على معلومات تسلسل الببتيد لتمييز ACPs من غير ACPs 7 & # x02013 23. تم تلخيص المزيد من التفاصيل عن تلك الأساليب الحالية في ورقتي مراجعة شاملتين 2 و 3. من بين الأنواع المختلفة لنهج ML ، كل من آلة المتجه الداعمة (SVM) (مثل AntiCP 8 و Hajisharifi et al. & # x02019s الطريقة 9 و ACPP 24 و iACP 10 و Li and Wang & # x02019s method 11 و iACP-GAEnsC 12 و TargetACP 14 و ACPred 19) ونهج المجموعة (مثل MLACP 13 و ACPred 19 و PTPD 21 و ACP-DL 22 و PEPred-Suite 20 و ACPred-FL 15 و ACPred-Fuse 18 و PPTPP 23 و AntiCP_2.0 25) على نطاق واسع تستخدم لتطوير تنبؤات ACP. كما تم تلخيصه في مراجعة حديثة 2 ، يمكننا أن نرى أن TargetACP قد تم تطويره من خلال دمج تركيبة الأحماض الأمينية المنقسمة وأوصاف مصفوفة النقاط الخاصة بالموضع الزائف 14 ، والتي تبين أنها تتفوق على المتنبئين المستندة إلى SVM 8 & # x02013 12 ، 19 ، 24. في غضون ذلك ، قدمت أساليب المجموعة الحديثة التي تضم PEPred-Suite 20 و ACPred-Fuse 18 أعلى درجات دقة التنبؤ كما تم تقييمها في مجموعة البيانات التي تم جمعها بواسطة Rao et al. 18. في ACPred-Fuse ، تم تطويره باستخدام نموذج الغابة العشوائية (RF) بالتزامن مع 114 واصف ميزة. وبعد ذلك ، تم تدريب ما مجموعه 114 نموذجًا من نماذج الترددات الراديوية لتوليد معلومات الطبقة والمعلومات الاحتمالية المستخدمة لتطوير نموذج نهائي. في الآونة الأخيرة ، أجراوال وآخرون. اقترح إصدارًا محدثًا من AntiCP يسمى AntiCP2.0 وقدم أيضًا مجموعتين من مجموعات البيانات المعيارية عالية الجودة (أي مجموعات البيانات الرئيسية والبديلة) التي تحتوي على أكبر عدد من الببتيدات. تم تطوير AntiCP2.0 بواسطة خوارزمية الأشجار العشوائية للغاية (ETree) مع تكوين الأحماض الأمينية (AAC) وتكوين ثنائي الببتيد (DPC). على أساس نتائج الاختبار المستقلة التي تم الإبلاغ عنها بواسطة العمل السابق لـ AntiCP2.0 ، يمكن ملاحظة أن AntiCP2.0 كان متفوقًا على متنبئات ACP الأخرى الحالية (مثل AntiCP 8 و iACP 10 و ACPred 19 و ACPred-FL 15 و ACPred- فيوز 18 ، PEPred-Suite 20). بشكل عام ، تم إحراز تقدم كبير في الأساليب الحالية. ومع ذلك ، فقد حفزنا عيبان محتملان لتنبؤات ACP الحالية على تطوير متنبئ جديد لـ ACP في هذه الدراسة. أولاً ، آلياتها القابلة للتفسير ليست سهلة الفهم والتنفيذ من وجهة نظر علماء الأحياء والكيمياء الحيوية. لا تقدم نماذج ACP الحالية تفسيرًا مباشرًا للآلية الأساسية للنشاط البيولوجي لما يشكل ACPs. وفي الوقت نفسه ، فإن النماذج البسيطة التي يسهل تفسيرها تكون أكثر فائدة في التحليل الإضافي لخصائص الأنشطة المضادة للسرطان للببتيدات. ثانيًا ، لا تزال دقتها وقابليتها للتعميم تتطلب التحسين.

بالنظر إلى هذه المشكلات ، نقترح هنا تطوير متنبئ جديد قائم على ML يسمى iACP-FSCM لزيادة تحسين دقة التنبؤ بالإضافة إلى تسليط الضوء على الخصائص التي تحكم أنشطة الببتيدات المضادة للسرطان. تم تلخيص الإطار المفاهيمي لنهج iACP-FSCM المقترح هنا للتنبؤ وتحليل ACPs في الشكل # x000a0 1. يمكن تلخيص المساهمات الرئيسية لـ iACP-FSCM للتنبؤ وتوصيف ACPs على النحو التالي. أولاً ، اقترحنا هنا طريقة جديدة ومرنة لبطاقة التسجيل (FSCM) للتنبؤ الفعال والبسيط وتوصيف الببتيدات التي توفر نشاطًا مضادًا للسرطان باستخدام معلومات التسلسل فقط. طريقة FSCM هي نسخة محدثة من طريقة SCM التي طورها Huang et al. 26 وشارونكوان وآخرون. 27 من خلال الاستفادة من درجات الميل لكل من المعلومات المتسلسلة المحلية والعالمية. ثانيًا ، على عكس آليات التصنيف المعقدة نوعًا ما على النحو الذي توفره مناهج المجموعات الحديثة 15 ، 18 ، 20 ، تحدد طريقة iACP-FSCM المقترحة هنا ACPs باستخدام درجات المجموع الموزون فقط بين درجات التكوين والميل ، وهو يسهل فهمها وتنفيذها من قبل علماء الأحياء والكيمياء الحيوية. ثالثًا ، يمكن اعتماد درجات الميل المشتقة من FSCM لتحديد الخصائص الفيزيائية الكيميائية (PCPs) التي قد توفر معلومات مهمة تتعلق بالخصائص المحلية والعالمية لـ ACPs. أخيرًا ، كشفت النتائج المقارنة أن iACP-FSCM تفوق في الأداء على متنبئات ACP الحديثة لتحديد وتوصيف ACP. لقد ثبت أن خادم الويب iACP-FSCM المقدم هنا قوي كما تم استنتاجه من دقة التنبؤ الفائقة وقابلية تفسيره وإتاحته للجمهور ، وهو أمر مفيد في مساعدة علماء الأحياء في تحديدهم لـ ACPs ذات الأنشطة الحيوية المحتملة. علاوة على ذلك ، فإن طريقة FSCM المقترحة لديها إمكانات كبيرة لتقدير درجات نزوع الأحماض الأمينية وثنائيات الببتيدات التي يمكن استخدامها للتنبؤ وتحليل الأنشطة الحيوية المختلفة للببتيدات مثل الببتيدات الانحلالية 28 والببتيدات الخافضة للضغط 29 والببتيدات المضادة للفيروسات 20 ، 23.


المواد والأساليب

وظيفة التسجيل لتحديد بقايا الواجهة

1. درجة الطاقة سلسلة الجانب

2. درجة حفظ المخلفات

3. ميل واجهة المخلفات

خوارزمية PINUP للتنبؤ بمخلفات الواجهة

خوارزمية PINUP هي كما يلي:

تحديد المخلفات السطحية. كما هو الحال في دراسة سابقة (38) ، يتم تعريف المخلفات السطحية على أنها تلك السلاسل الجانبية التي تتمتع بإمكانية وصول نسبية تصل إلى gt6٪ (نصف قطر المسبار = 1.2 Å).

تحديد بقع سطحية ملزمة مرشح. تُعرَّف رقعة السطح على أنها بقايا سطحية مركزية و 19 من أقرب الجيران كما في دراسة سابقة (38). يتم إعطاء درجة التصحيح من خلال متوسط ​​قيمة الدرجات لجميع البقايا العشرين باستخدام وظيفة التسجيل الموصوفة أعلاه. يتم أخذ عينات من جميع المخلفات السطحية. يتم تطبيق قيود ناقل المذيبات (32) من أجل تجنب أخذ عينات البقع على جوانب مختلفة من سطح البروتين. تم تحديد أفضل التصحيحات التي تم تسجيلها بنسبة 5٪. إذا كان عدد المخلفات السطحية للبروتين أقل من 100 ، يتم اختيار خمس بقع ذات أعلى الدرجات ، بدلاً من ذلك.

تحديد مخلفات واجهة المرشح. عادةً ما تتداخل التصحيحات المحددة أعلاه مع بعضها البعض. أي أن بقايا واحدة يمكن أن تظهر في بقع متعددة. نقوم بترتيب المخلفات بناءً على عدد التصحيحات ذات الدرجات الأعلى التي تنتمي إليها (معدل الظهور في التصحيحات ذات الدرجات الأعلى). تم تعيين 15 من المخلفات الأعلى تصنيفًا كمخلفات واجهة مرشح. بالنسبة للبروتينات الكبيرة التي تحتوي على أكثر من 150 من المخلفات السطحية ، فإننا نحتفظ بما يصل إلى 10٪ من إجمالي المخلفات السطحية. إذا كان آخر بقايا مرشح (على سبيل المثال البقايا الخامسة عشر للبروتينات التي تحتوي على أقل من 150 وحدة بنائية) لها نفس معدل الظهور في البقع ذات أعلى الدرجات مثل العديد من المخلفات الأخرى غير المرشحة ، يتم تضمينها جميعًا في بقايا الواجهة المرشحة.

التنبؤ بواجهة ربط مستمرة. يتم تعريف الواجهة النهائية المتوقعة على أنها أكبر تصحيح مستمر مصنوع من بقايا واجهة المرشح "المتفاعلة". تعتبر البقايا متفاعلة إذا كانت المسافة بين أي ذرتين جانبيتين متتاليتين هي & lt1 Å زائد مجموع نصف قطر فان دير فالس للذرتين. إذا كانت المخلفات السطحية محاطة ببقايا الواجهة المتوقعة ولم تتفاعل مع مخلفات السطح الأخرى ، فسيتم تضمين البقايا كمخلفات واجهة. إن أنصاف أقطار van der Waals لجميع أنواع الذرة مأخوذة من مجموعة معلمات CHARMM21 (42).

هناك العديد من المعلمات ، مثل تعريف المخلفات السطحية [الخطوة (1)] وحجم بقع السطح [الخطوة (2)] في خوارزمية PINUP هذه. تتم مناقشة التأثيرات من تغيير هذه المعلمات في قسم النتائج.

مجموعات بيانات البروتين

نحن نستخدم مجموعة من 57 بروتينًا غير متماثل تم جمعها بواسطة Neuvirth وآخرون. (10) للتدريب والتحقق المتبادل. في هذه المجموعة ، لا يتم تضمين الأجسام المضادة والمستضدات نظرًا لأن وضع الارتباط المحدد لها يتم تحسينه من خلال طفرات الخلايا الجسدية السريعة بدلاً من التطور على مدار سنوات عديدة. تعتمد الخوارزمية الخاصة بنا على معلومات الحفظ ، وبالتالي فهي غير مناسبة للتنبؤ بواجهات بين مستضد وجسم مضاد. يتم الحصول على هياكل المونومرات والمجمعات غير المنضمة من PDB (43). يستخدم برنامج REDUCE (44) لإضافة ذرات الهيدروجين إلى جميع البروتينات. يتم حذف ذرات الهيدروجين غير القطبية وجميع جزيئات الماء. يتم توقع مواقع الربط بهياكل غير منضمة. تُستخدم الهياكل المعقدة لتحديد بقايا الواجهة التجريبية للمونومرات غير المنضمة. تعتبر المخلفات السطحية كمخلفات واجهة إذا انخفضت مساحة السطح التي يمكن الوصول إليها بأكثر من 1 2 عند التعقيد.

لمزيد من اختبار PINUP ، نستخدم معيار ربط البروتين والبروتين 2.0 الذي وضعه تشين وآخرون. (45). يحتوي هذا المعيار على 62 مركبًا بروتينيًا (باستثناء مستضد - جسم مضاد) ، حيث يمكن اعتبار 68 بروتينًا غير مرتبط كمجموعة اختبار مستقلة لأنها تشترك في هوية التسلسل بنسبة 35٪ مع أي بروتين في مجموعة البيانات المكونة من 57 بروتينًا الموضحة أعلاه. تحتوي هذه المجموعة المكونة من 68 بروتينًا على 42 و 18 و 8 بروتينات مع تغيرات توافقية طفيفة ومتوسطة وكبيرة الحجم عند التعقيد ، على التوالي.

توجد علاقة متجانسة كبيرة بين الـ 75 بروتينًا المستخدمة لاشتقاق ميل الواجهة والبروتينات الـ 57 المستخدمة للتحقق المتبادل. نحن نختبر اعتماد دقة التنبؤ على مجموعة البيانات المستخدمة لاشتقاق ميل الواجهة ونجد أن الاعتماد لا يكاد يذكر. يمكن العثور على التفاصيل في قسم النتائج.

تقييم دقة التنبؤ

يتم تقييم دقة التنبؤ من خلال تغطية الواجهة الفعلية بواسطة الواجهة المتوقعة ، وهي جزء من مخلفات الواجهة التي تم التنبؤ بها بشكل صحيح في العدد الإجمالي لمخلفات الواجهة المرصودة ، ودقة الواجهة المتوقعة ، وهي جزء من الواجهة المتوقعة بشكل صحيح المخلفات في العدد الإجمالي لمخلفات الواجهة المتوقعة. الدقة المتوقعة من التنبؤ العشوائي هي جزء مخلفات السطح المرصودة في العدد الإجمالي للمخلفات السطحية.

تحسين الأوزان

نحن نستخدم طريقة شبكة بسيطة لتحسين أوزان ثج و ثص. يقترح المسح الأولي القيم المثلى الموجودة عند 0 & lt ثج & lt 2 و 1 & lt ثص & lt 10. يتم الحصول على الأوزان النهائية من خلال بحث بسيط في الشبكة ضمن 0 & lt ثج & lt 2 بخطوة 0.2 و 1 & lt ثص & lt 10 بخطوة 1. تم تحسين المعلمات للحصول على أعلى دقة.


خلفية

في حين أن التجارب المعشاة ذات الشواهد (RCTs) هي المعيار الذهبي لتقييم آثار العلاج ، فإنها غالبًا ما تكون غير مجدية بسبب الوقت أو التكلفة أو القيود الأخلاقية. في مثل هذه الحالات ، قد توفر بيانات المراقبة معلومات قيمة. لسوء الحظ ، تخضع تحليلات البيانات القائمة على الملاحظة لتحيز مربك. يحدث هذا عندما يكون لخصائص المريض التي تؤثر على النتيجة توزيعات غير متوازنة عبر مجموعات العلاج. قد ترجع أي اختلافات لوحظت في النتيجة بين مجموعات العلاج جزئيًا إلى الاختلافات في خصائص المريض.

تقليديا ، يتم استخدام الانحدار متعدد المتغيرات لحساب الاختلافات في خصائص المريض بين مجموعات العلاج. ومع ذلك ، فإن هذا النهج ليس مناسبًا دائمًا. على سبيل المثال ، عندما تكون نتيجة الدراسة ثنائية ، تقترح قاعدة عامة أنه يجب ملاحظة 10 أحداث لكل متغير مشترك مدرج في نموذج الانحدار [1]. قد يكون هذا غير ممكن إذا كانت النتيجة نادرة وهناك العديد من المتغيرات المشتركة للتكيف معها. توفر درجات الميل حلاً محتملاً لهذه المشكلة. قدم روزنباوم وروبن [2] لأول مرة درجة الميل ، التي تم تعريفها على أنها احتمالية تعيين العلاج المشروط بخصائص خط الأساس. بالإضافة إلى ذلك ، أظهروا أن التكييف على درجة الميل سوف يوازن توزيع الخصائص بين مجموعات العلاج ، مما يقلل من فرصة التحيز المربك. تعتبر درجات الميل مفيدة في المواقف ذات النتائج الثنائية النادرة لأن تعديل درجة الميل يكفي فقط لتحسين التوازن في المتغيرات المشتركة المقاسة. كما أنها مفيدة في المواقف التي تكون فيها العلاقة بين المتغيرات المشتركة والعلاج مفهومة بشكل أفضل من العلاقة بين المتغيرات المشتركة والنتيجة ، حيث يتم نمذجة العلاج بدلاً من النتيجة. بالإضافة إلى ذلك ، يمكن أن تساعد مقارنة توزيعات درجات الميل بين مجموعات العلاج في تحديد مناطق عدم التداخل في التوزيعات المتغيرة ، والتي غالبًا ما يتم تجاهلها عند استخدام طرق الانحدار التقليدية [3]. ومع ذلك ، من المهم ملاحظة أن درجات الميل لا يمكن أن تفسر الارتباك غير المقيس: سيتم تحسين التوازن فقط على المتغيرات المشتركة المستخدمة لتقدير درجة الميل.

الأكثر شيوعًا ، يتم تقدير درجات الميل باستخدام الانحدار اللوجستي. يتم تراجع مهمة العلاج على خصائص خط الأساس والاحتمالات المتوقعة هي درجات الميل المقدرة. بافتراض عدم وجود ارتباك غير مقيس وعدم وجود خطأ في تحديد نموذج درجة الميل ، يمكن الحصول على تقديرات غير متحيزة لتأثيرات العلاج باستخدام واحدة من أربع تقنيات: المطابقة أو التقسيم الطبقي أو الترجيح أو تعديل المتغير المشترك. نصف هذه التقنيات بإيجاز هنا ، ولكن تتم إحالة القراء في مكان آخر لمزيد من التفاصيل [2 ، 4 ، 5 ، 6 ، 7 ، 8 ، 9]. تتضمن المطابقة تكوين مجموعات متطابقة من المرضى المعالجين والمراقبين ، على أساس وجود درجات نزوع مماثلة. يتضمن التقسيم الطبقي تقسيم المرضى إلى طبقات متساوية الحجم بناءً على درجة ميلهم ، ويتضمن الترجيح تعيين أوزان قائمة على الميل لكل مريض. يمكن بعد ذلك الحصول على تأثيرات العلاج المقدرة من خلال مقارنة النتائج في المجموعة المتطابقة ، داخل الطبقات (يمكن الحصول على تقدير إجمالي عن طريق تجميع التقديرات الخاصة بالطبقة) أو في العينة الموزونة. أخيرًا ، يتم تنفيذ تعديل المتغير المشترك من خلال تضمين درجة الميل كمتغير عند تراجع النتيجة على العلاج. تهدف كل من هذه التقنيات إلى موازنة خصائص المريض بين مجموعات العلاج ، ولكن التحديد الخاطئ لنموذج درجة الميل يمكن أن يمنع تحقيق التوازن الكافي ، مما يؤدي إلى التحيز المربك المتبقي. ومن ثم ، فإن إحدى الخطوات الأساسية لتنفيذ درجة الميل هي استخدام التشخيص المناسب لتقييم درجة الميل والتأكد من أنها قللت بشكل كاف من التحيز المربك. قدم العديد من المؤلفين [10،11،12،13،14،15،16،17] توصيات بشأن الاستخدام المناسب للتشخيص. وبشكل أكثر تحديدًا ، أوصوا بعدم استخدام اختبارات الفرضيات التي تقارن بين الوسائل المتغيرة أو النسب ودعوا إلى استخدام الفروق المعيارية.

على الرغم من تقديمها في عام 1983 ، لم يتم تطبيق درجات الميل بشكل شائع في الأدبيات الطبية إلا بعد حوالي 20 عامًا. في الآونة الأخيرة ، أصبحوا يتمتعون بشعبية متزايدة [10]. في العقد الماضي (2007-2017) ، تضاعف عدد المقالات التي تم إرجاعها من البحث عن "درجات الميل" في PubMed أكثر من ثلاثة أضعاف خلال كل فترة 5 سنوات. بعد الزيادة في استخدام درجات الميل ، تم نشر عدد من المراجعات [10 ، 11 ، 18 ، 19 ، 20 ، 21 ، 22 ، 23 ، 24 ، 25] لتقييم تنفيذها. للأسف ، وجدت كل مراجعة أن تنفيذ درجة الميل كان دون المستوى الأمثل ، خاصة فيما يتعلق باستخدام التشخيص. لم يبلغ العديد من المؤلفين عن استخدام أي تشخيص لدرجة الميل ، وكان أولئك الذين فعلوا ذلك يستخدمون غالبًا اختبارات الفرضيات ، والتي لا يُنصح بها على نطاق واسع. إذا لم يتم استخدام التشخيصات المناسبة لإثبات توازن الإرباكات المحتملة التي تحققت من خلال درجة الميل ، فإن قراء البحث ليس لديهم أي أساس للثقة في النتائج. من المراجعات الحالية لأدبيات درجة الميل ، هناك ثلاثة [11 ، 19 ، 21] فقط تنظر في المقالات من جميع مجالات الطب ، وتشمل هذه بشكل جماعي المقالات المنشورة حتى عام 2012. منذ عام 2012 ، كان هناك العديد من المنشورات التي تقدم إرشادات حول الاستخدام من تشخيصات درجات الميل [10،11،12 ، 14،15،16،17] ، أو اقتراح تشخيص جديد لدرجة الميل [26،27،28،29]. بالنظر إلى هذه التطورات الأخيرة في المنهجية والإرشادات حول الممارسة ، قد يكون استخدام تشخيص درجات الميل في الدراسات الطبية الحديثة قد تحسن. لذلك فإن الهدف من هذه المراجعة هو تحديث الأدبيات حول الاستخدام التشخيصي ، ولكن مع التركيز على المجلات عالية المستوى. يمكن اعتبار مثل هذه المجلات أكثر تأثيرًا حيث يُنظر إليها غالبًا على أنها منارة لأفضل الممارسات. Furthermore, it may beneficial to know which types of studies are more or less likely to report use of suboptimal diagnostics. This information could help us to identify pockets of good practice and areas where efforts to change practice should be focused. Bearing this in mind, the objectives of this review are to: (1) assess the use of propensity score diagnostics in medical studies published in high-ranking journals and (2) compare use of diagnostics between studies (a) in different research areas and (b) using different propensity score methods.


المواد والأساليب

Collection of annotations of crystallization trials

We only extracted X-ray crystallography-based experimental trials annotated with the most advanced experimental statuses. These statuses include ‘selected’, ‘cloned’, ‘expressed’, ‘soluble’, ‘purified’, ‘crystallized’, ‘diffraction’, ‘crystal structure’ or ‘in PDB’. We grouped the proteins with the status of ‘crystal structure’ or ‘in PDB’ as crystallizable proteins (defined as the ‘CRYS’ class), and grouped those with other statuses as non-crystallizable proteins (defined as the ‘NCRYS’ class).

We only selected the experimental trials annotated with two states: ‘work stopped’ ‘in PDB’ or ‘crystal structure’.

We did not extract the experimental trials both before 1 January 2009 and after 31 December 2014. This could ensure that we only extracted recent data and excluded trials that are potentially still ongoing at present.

We eliminated non-crystallizable proteins sharing >100% sequence identity with crystallizable proteins. The sequence identity was quantified by the CD-Hit program [ 49].

The constructed TTdata includes 81 279 non-crystallizable proteins and 103 247 crystallizable proteins.

Collection of functional annotations

We retrieved functional annotations of the proteins from UniProt (http://www.UniProt.org/), which included 549 008 proteins from the Swiss-Prot database and 50 011 027 proteins from the TrEMBL database (on 14 July 2015). Swiss-Prot is a collection of entries that are reviewed and manually annotated using a literature search and curator-evaluated computational analysis. TrEMBL is not reviewed in which proteins are annotated computationally. We mapped the proteins in TTdata to both Swiss-Prot and TrEMBL via one-by-one matching of sequences sharing 100% sequence identity. Totally, 5849 crystallizable proteins (positive samples) and 4907 non-crystallizable (negative samples) proteins were mapped to the Swiss-Prot database, constituting the Swiss-Prot data set. Additionally, 8491 crystallizable (positive samples) and 21 426 non-crystallizable (negative samples) proteins were mapped to the TrEMBL database, comprising the TrEMBL data set.

Training and benchmark test data sets

We eliminated sequence redundancy (proteins with >25% sequence identity) within crystallizable proteins contained in either Swiss-Prot or TrEMBL, also eliminated that within non-crystallizable proteins contained in each data set. The sequence identity was qualified by using a combination of CD-Hit [ 49] and BLAST [ 44]. Eliminating sequence redundancy within each data set was based on the observation that the proteins with similar sequences could possess distinct CPs [ 2]. Totally, the Swiss-Prot data set contains 2798 crystallizable and 3096 non-crystallizable proteins (denoted as the ‘SP’ data set), while the TrEMBL data set contains 4994 crystallizable and 9794 non-crystallizable proteins (denoted as the ‘TR’ data set).

Either the SP data set or the TR data set was randomly divided into six equally sized subsets. The first five subsets were merged together to form the training data set (denoted as ‘SP_train’ or ‘TR_train’), while the remaining sixth subset worked as the independent test data set (denoted as ‘SP_test’ or ‘TR_test’).

We further eliminated the proteins sharing >25% sequence identity with those used in other predictors. The resulting four data sets were named as ‘SP_train_nr’, ‘SP_test_nr’, ‘TR_train_nr’ and ‘TR_test_nr’, respectively. These data sets can be downloaded from http://nmrcen.xmu.edu.cn/crysf/.

To examine whether the functional features of similar proteins can be used to predict CP, we mapped TTdata-derived sequences to Swiss-Prot and TrEMBL data sets via one-by-one matching of sequences sharing >90% sequence identity. The resultant data sets were named ‘SP0.9’ and ‘TR0.9’, respectively. Hence, each protein in SP0.9 or TR0.9 is associated with one or more orthologous proteins in the Swiss-Prot data set or the TrEMBL data set.


مقدمة

Abnormal bitterness might be associated with dietary danger. In general, hydrolyzed proteins, plant-derived alkaloids and toxins exhibit unpleasant bitter taste. Thus, the bitter taste perception plays a crucial role in protecting animals from poisonous plants and environmental toxins [1]. The taste perception of humans can be categorized into four well-known groups: sweet, bitter, sour and salty, in addition to two controversial groups, i.e. fat taste and amino acid taste [2]. Although, abnormal or extreme bitterness tends to be associated with dietary danger, a number of diverse plant-derived food produce bitterness such as cucumber, pumpkin, zucchini, squash, lettuce, spinach and kale. In addition, many bitter compounds are important drugs or drug candidates encompassing ions, alkaloids, polyphenols, glucosinolates and peptides. Proteolytic hydrolysis of peptides and proteins have been known to make foods unfavorable [3,4]. In this process, caseins are digested into peptides containing bulky hydrophobic groups at their C-terminal region [3]. Hence, the hydrophobic property of the amino acid side chain at the C-terminus can be attributed to its bitterness. The successful identification and characterization of bitter peptides is essential for drug development and nutritional research.

High-throughput experimental approaches for identifying bitter peptides are time-consuming and costly, thus the development of accurate and fast computational methods is in great demand. Particularly, such computational approach is based on quantitative structure–activity relationship (QSAR) modeling. QSAR is a ligand-based approach that seeks to discern the mathematical relationship between various types of descriptors (X) and their investigated biological activity (Y) through the use of machine learning (ML) models [5]. As mentioned in the Organization for Economic Co-operation and Development (OECD) guideline [[6], [7], [8]], the development of robust QSAR models entails the following characteristics: (i) a defined endpoint (ii) an unambiguous algorithm (iii) a defined domain of applicability (iv) appropriate measures of goodness-of-fit, robustness, and predictive ability and (v) a mechanistic interpretation.


شاهد الفيديو: درس 3 الأحماض الأمينية--الخاصية الأمفوتيرية بالتفصيل-- (يوليو 2022).


تعليقات:

  1. Sajin

    يبدو لي ، لقد كنت مخطئا

  2. Ugutz

    أصلي. بحاجة إلى النظر

  3. Balabar

    لقد زارتها ببساطة فكر ممتاز

  4. Brock

    إليكم عقلية مجردة

  5. Zulujinn

    وقد صادفت مع هذا.

  6. Jareth

    أنا آسف ، ولكن ، في رأيي ، ترتكب أخطاء. نحن بحاجة إلى مناقشة. اكتب لي في رئيس الوزراء ، تحدث.

  7. Hern

    وافق على المعلومات الرائعة



اكتب رسالة