معلومة

هل هناك أي طريقة لمعرفة ما إذا كان الجين يعمل بالنسبة لفرد له تسلسل مرجعي فقط وتسلسل الفرد للجين؟

هل هناك أي طريقة لمعرفة ما إذا كان الجين يعمل بالنسبة لفرد له تسلسل مرجعي فقط وتسلسل الفرد للجين؟



We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لدي تسلسل جيني لعدد كبير من الأفراد ضمن نوع فرعي من cdna وتسلسل معرف ncbi أيضًا. هل هناك أي طريقة للإبلاغ باستخدام التسلسل فقط أن الجين للفرد لا يعمل أو يعمل بشكل جزئي فقط؟


بشكل عام ، لا. قد تكون هناك حالات محددة حيث يمكنك ، مثل ما إذا كان هناك كودون توقف ، أو طفرة تغيير الإطارات في وقت مبكر ، أو أن شخصًا آخر قد رأى متغيرك الدقيق وأثبت تجريبياً أنه ليس له وظيفة.

لكن بشكل عام ، لا يمكنك التنبؤ بالوظيفة من في السيليكو البيانات وحدها.


من الممكن الحصول على تنبؤ بالتغير الناجم عن طفرة باستخدام برامج مثل Sift أو polyphen (للبروتينات البشرية فقط) ، لكن هذه تقديرات تقريبية فقط


لا أعرف مستوى معرفتك ، لذلك قد يبدو هذا واضحًا جدًا بالنسبة لك ، ولكن ...

  • تمنحك ترجمتها إلى الإطارات الستة بعض التلميحات. إذا كان التسلسل متدهورًا ومليئًا بكودون الإيقاف ، فهو لا يعمل.

  • قم بمحاذاة التسلسلات مع Mega أو AliView أو أيًا كان ، ثم ترجمها. إذا كانت هناك طفرة تغيير الإطارات في التسلسل الخاص بك ، فإنها تصبح مرئية جدًا في المحاذاة ومن المحتمل أن التسلسل لم يعد يعمل.

  • ابحث عن معلومات حول مجال البروتين في Pfam وانظر عن كثب إلى المحاذاة في المجال الوظيفي. إذا تم تحوير المخلفات المحفوظة بطريقة أخرى ، فيجب أن يدق الجرس. (نظرًا لأن جميع التسلسلات الخاصة بك ستكون متشابهة جدًا مع بعضها البعض ، فقد ترغب في إضافة بعض متواليات بروتين الأنواع الأخرى ، بحيث يمكنك العثور بسهولة أكبر على المخلفات النشطة داخل المجال)


GOToolBox: التحليل الوظيفي لمجموعات البيانات الجينية على أساس علم الوجود الجيني

لقد طورنا طرقًا وأدوات تستند إلى مورد علم الوجود الجيني (GO) ، مما يسمح بتحديد المصطلحات ذات التمثيل الزائد أو الناقص إحصائيًا في مجموعة بيانات الجينات ، وتجميع الجينات ذات الصلة وظيفيًا داخل مجموعة واسترجاع الجينات التي تشارك التعليقات التوضيحية مع استعلام الجين. يمكن أيضًا تقييد التعليقات التوضيحية لـ GO في تسلسل هرمي رفيع أو مستوى معين من علم الوجود. الشفرات المصدرية متاحة عند الطلب ويتم توزيعها بموجب ترخيص GPL.


خلفية

لا يقتصر التباين الجيني على تعدد أشكال النوكليوتيدات المفردة أو عمليات الإدراج والحذف الصغيرة ولكنه يمتد أيضًا إلى الاختلافات الهيكلية (الكبيرة). تتضمن هذه الاختلافات الهيكلية اختلافات في عدد النسخ (CNVs) وتغيرات التواجد / الغياب (PAVs) ، والتي يمكن أن تسبب تباينًا كبيرًا في محتوى الجين بين الجينومات الفردية [1 ، 2]. يسمح التحليل المقارن للجينومات المتعددة لنفس كليد النشوء والتطور بتحديد PAVs المرتبطة بسمات النمط الظاهري. في حالة أنواع المحاصيل ، يكون تحديد PAVs الكامنة وراء سمات زراعية معينة والتي تحدث فقط في نوع واحد أو عدد قليل من الأنواع أمر ممكن [3،4،5]. مع توفر المزيد من متواليات الجينوم المتجاورة ، تكون pangenomes مناسبة لوصف والتحقيق في تنوع مجموعة الجينات في كليد بيولوجي ، على سبيل المثال الأنواع والجنس أو أعلى [6 ، 7].

يُعتقد أن جينات pangenome مقسمة إلى جوهر ومجموعة جينات يمكن الاستغناء عنها ، وغالبًا ما يشار إلى الأخير أيضًا باسم "ملحق" في الأدبيات. تحدث الجينات الأساسية في جميع الجينومات التي تم فحصها ، بينما تحدث الجينات التي يمكن الاستغناء عنها فقط في جينوم واحد أو عدد قليل من الجينوم [8]. في دراسات بانجينوم حقيقية النواة ، يتم تحديد الجينات الأساسية والقابلة للاستغناء في الغالب بناءً على تشابه التسلسل ، على سبيل المثال باستخدام مجموعة GET_HOMOLOGUES-EST Markov [9] ، مجموعة عائلة الجينات OrthoMCL [10] أو BLASTN [11]. في بعض الأحيان ، يتم استدعاء فئة ثالثة من الجينات "التي يمكن الاستغناء عنها بشروط" [12] أو يمكن تصنيف الجينات على أنها "سحابة" و "صدفة" و "لبنة ناعمة" و "جوهر" [13] أو حتى "جوهر" ، " شهوانية "،" يمكن الاستغناء عنها "و" خاصة "[14]. ومع ذلك ، فإن هذا التصنيف المتميز لا يعتمد على الاستغناء البيولوجي للجينات ويعتمد على قطع تعسفي واحد أو أكثر. تعتبر بعض الدراسات الجينات "جوهرية" إذا حدثت هذه الجينات في 90٪ على الأقل من الجينومات التي تم فحصها [11] في دراسات أخرى ، فقط الجينات الموجودة في جميع الجينومات هي جزء من الجينوم الأساسي [10]. بالإضافة إلى ذلك ، قد تؤثر مجموعات التبعية على الاستغناء عن جينات معينة. يجب النظر في إمكانية "استبدال" جينين بعدد محدد من الجينات الأخرى. بعض الجينات ، على سبيل المثال عائلة جينية ، قد تكون مطلوبة بنسبة معينة ، وبالتالي لا يمكن الاستغناء عنها إلا بشروط [12]. علاوة على ذلك ، قد تكون مجموعات الجينومات أو النسخ غير مكتملة مما يؤدي إلى فقدان الجينات بشكل مصطنع [15]. تتمثل إحدى طرق التحايل على هذا في الاعتماد فقط على تسلسل الجينوم المرجعي عالي الجودة ، وبالتالي تجنب التجميعات الإضافية التي تعتبر مصادر محتملة للأخطاء.

هنا ، نقدم QUOD - أداة معلوماتية حيوية لقياس قابلية الاستغناء عن الجينات. ان A. thaliana تم استخدام مجموعة بيانات من حوالي 1000 مُدخل لحساب درجة قابلية الاستغناء لكل جين مشتقة من تغطية جميع الجينات في الجينوم المحدد. تم التحقق من صحة هذه النتيجة من خلال مقارنة عشرات BUSCOs والتحقيق الوظيفي للجينات ذات درجات الاستغناء العالية. أداتنا سهلة الاستخدام لجميع أنواع النباتات. يوسع QUOD التصنيف المتميز للجينات على أنها "جوهرية" و "يمكن الاستغناء عنها" بناءً على عتبة تعسفية إلى درجة قابلية الاستغناء المستمرة.


الاضطرابات الوراثية

يمكن أن تحدث الاضطرابات الجينية لأسباب عديدة. غالبًا ما توصف الاضطرابات الوراثية بمصطلح الكروموسوم الذي يحتوي على الجين الذي تغير في الأشخاص المصابين بهذا الاضطراب. إذا كان الجين موجودًا على واحد من أول 22 زوجًا من الكروموسومات ، تسمى الجسيمات الذاتية ، فإن الاضطراب الوراثي يسمى حالة وراثية. إذا كان الجين موجودًا على كروموسوم X ، فإن الاضطراب يسمى X مرتبط.

يتم أيضًا تصنيف الاضطرابات الوراثية حسب كيفية تواجدها في العائلات. يمكن أن تكون الاضطرابات سائدة أو متنحية ، اعتمادًا على كيفية تسببها في الحالات وكيف تتوارث في العائلات.

مهيمن

يمكن أن تحدث الأمراض السائدة بسبب نسخة واحدة فقط من الجين الذي لديه طفرة في الحمض النووي. إذا كان أحد الوالدين مصابًا بالمرض ، فإن كل طفل لديه فرصة بنسبة 50٪ لوراثة الجين المتحور.

الصفة الوراثية النادرة

بالنسبة للأمراض المتنحية ، يجب أن تحتوي نسختا الجين على طفرة في الحمض النووي من أجل الحصول على أحد هذه الأمراض. إذا كان لدى كلا الوالدين نسخة واحدة من الجين المتحور ، فإن كل طفل لديه فرصة بنسبة 25٪ للإصابة بالمرض ، على الرغم من عدم إصابة أي من الوالدين به. في مثل هذه الحالات ، يُطلق على كل والد اسم حامل للمرض. يمكنهم نقل المرض إلى أطفالهم ، لكن ليس لديهم المرض بأنفسهم.


نتائج

الكشف عن التعبير الجيني الشاذ عبر أنماط ظاهرية متعددة النسخ

قمنا بتحديد ثلاثة أنماط ظاهرية نسخية لكل جين لالتقاط مجموعة واسعة من التأثيرات الوظيفية التي تسببها المتغيرات الجينية التنظيمية. باختصار ، لتحديد القيم المتطرفة للتعبير (eOutliers) ، أنشأنا ض الدرجات من بيانات التعبير المصححة لكل نسيج لتحديد ما إذا كان الجين في الفرد لديه تعبير مرتفع أو منخفض للغاية (الشكل S1) (15, 16). لتحديد الجينات ذات الاختلال الأليل المفرط [التعبير النوعي للأليل (ASE) القيم المتطرفة (aseOutliers)] استخدمنا ANEVA-DOT (تحليل اختلاف التعبير - اختبار التين الشاذة للجرعة. S2 و S3) (16, 17). تستخدم هذه الطريقة تقديرات للتنوع الجيني في جرعة كل جين في مجموعة سكانية لتحديد الجينات التي يمتلك الفرد لها متغيرًا متغاير الزيجوت مع تأثير قوي بشكل غير عادي على تنظيم الجينات (17). تم اكتشاف القيم المتطرفة للربط (sOutliers) باستخدام SPOT (الكشف عن التضفير الخارجى) ، وهو نهج تم تقديمه هنا يناسب توزيع Dirichlet-Multinomial مباشرة لتعداد القراءات المقسمة عبر تقاطعات exon-exon المقسمة بدلاً من ذلك لكل جين. ثم تحدد سبوت الأفراد الذين ينحرفون بشكل كبير عن التوقعات على أساس هذا التوزيع المناسب (الأشكال S4 إلى S6) (16). تم تطبيق كل طريقة من الطرق الثلاث في جميع عينات GTEx. كان يُطلق على الفرد اسم خارجي متعدد الأنسجة لجين معين إذا تجاوز متوسط ​​الإحصاء الخارجي عبر جميع الأنسجة المقاسة العتبة المختارة (الشكل 1 أ) (16). باستخدام هذا النهج متعدد الأنسجة لكل نمط ظاهري ، وجدنا أن كل فرد لديه متوسط ​​أربعة eOutlier وأربعة aseOutlier وخمسة جينات أخرى.

(أ) تم دمج بيانات تسلسل الحمض النووي الريبي (RNA-seq) في 838 فردًا عبر 49 نسيجًا واستخدامها لتحديد تعبير الأنسجة المشترك ، و ASE ، والقيم المتطرفة البديلة للربط. (ب) الخطر النسبي للمتغيرات الجديدة (ليس في gnomAD) ، المفرد ، الدوبلتون ، المتغيرات النادرة (MAF & lt1٪) ، والمتغيرات منخفضة التردد (MAF 1 إلى 5٪) في نافذة 10 كيلوبايت حول الجينات الخارجة عبر جميع أنواع البيانات مقارنة بـ الأفراد غير المتطرفين لنفس الجينات. تم تعريف القيم المتطرفة على أنها تلك التي تحتوي على قيم & gt3 SDs من المتوسط ​​(| الوسيط ض| & GT 3) أو ، على نحو مكافئ ، متوسط ص & lt 0.0027. تمثل الأشرطة مجال الثقة 95٪. (ج) عند تعيين كل عنصر خارجي له أكثر الأماكن المجاورة له أهمية ، فإن الخطر النسبي لفئات مختلفة من المركبات الترفيهية يقع في نطاق 10 كيلو بايت من كل نوع خارجي. تعرض اللوحة الداخلية عمليات إثراء لمجموعة فرعية من فئات المتغيرات في سجل (2) تم تحويله ذ-مقياس المحور لرؤية أفضل. (د) نسبة القيم المتطرفة عند عتبة معينة لها عربة سكن متنقلة قريبة في فئة معينة. eOutlier | الوسيط ض عشرات | تم تحويلها إلى ص القيم باستخدام دالة كثافة الاحتمال التراكمية للتوزيع الطبيعي. TE ، عنصر قابل للنقل INV ، انعكاس BND ، كسر نهاية DEL ، حذف DUP ، ازدواجية. (ه) نسبة RVs في فئة معينة التي تؤدي إلى الخارج في a ص- عتبة القيمة 0.0027 عبر الأنواع.

يتم إثراء الجينات ذات التعبير الشاذ ، ASE ، والربط من أجل RVs المتميزة وظيفيًا

لاحظنا أن القيم المتطرفة للأنسجة المتعددة لأي من الأنماط الظاهرية الثلاثة للنسخة كانت أكثر عرضة بشكل ملحوظ لحمل RV (MAF & lt1٪) في جسم الجين أو ± 10 كيلو بايت من الأفراد الذين ليس لديهم قيم متطرفة ، تم تقييمهم بين 714 فردًا من أصل أوروبي. كانت هذه التخصيب أكثر وضوحًا بشكل تدريجي بالنسبة للمتغيرات النادرة وكانت أقوى للمتغيرات الهيكلية (SVs) مقارنة بمتغيرات النوكليوتيدات المفردة (SNVs) والإندلس (الشكل 1 ب). لم تكن هذه الاتجاهات تعتمد على الاختيار المحدد للعتبة المستخدمة لتحديد القيم المتطرفة (الشكلان S7 و S8).

لقد وجدنا 35 حالة فقط كان فيها الجين الفردي عبارة عن مجموعة خارجية متعددة الأنسجة لجميع الأنماط الظاهرية النسخية الثلاثة. كان لدى جميع هذه الأجهزة باستثناء واحد منها عربة سكن متنقلة قريبة ، وقد تم شرح معظمها كمتغيرات لصق. من بين الجينات التي كانت قيمًا متطرفة لنمط ظاهري نسخي في الفرد (ن = 465) ، حدث أكبر تداخل بين قيم aseOutliers و eOutliers (ن = 319 شكل. S9A). وجدنا أن aseOutliers مع تغييرات متواضعة في التعبير (1 & lt | متوسط ض| & lt 3) إثراءًا أقوى لـ RVs القريبة من تلك التي لم تتغير في التعبير (الشكل S9) ، مما يبرز فائدة مهمة للجمع بين هذه الأنماط الظاهرية لاكتشاف تأثيرات RV المتنوعة. وجدنا أن الجينات التي لم يتم التعرف على الأفراد الخارجين عنها قد تم إثرائها لشروط العملية البيولوجية لـ Gene Ontology المتعلقة بالإدراك الحسي واكتشاف المحفزات الكيميائية لجميع الأنواع الخارجية (الشكل S10) (16) ، وهو ما يتوافق مع التخصيب المرئي للجينات التي لا تحتوي على أي مواضع سمات كمية لتعبير رابطة الدول المستقلة (eQTLs) تم اكتشافها في GTEx (18).

وجدنا أن أنواعًا مختلفة من المتغيرات الجينية تساهم في القيم المتطرفة للأنماط الظاهرية الجزيئية الثلاثة ، على الرغم من إثراء المتغيرات المتبرعة للواصق النادرة بالقرب من جميع الأنواع الخارجية (الشكل 1 ج). كانت أكبر الاختلافات في إثراء النوع المتغير بين الأنواع الخارجية الثلاثة هي اختلافات رقم النسخ (CNVs) والتكرار ، والتي كانت مرتبطة بشكل حصري تقريبًا بـ eOutliers ومتغيرات متقبلات لصق ، والتي تم إثرائها بشكل كبير داخل sOutliers (الشكل S11).

بالنسبة لجميع الأنماط الظاهرية ، زادت نسبة القيم المتطرفة ذات القيمة RV القريبة من أي فئة مع صرامة العتبة (الشكل 1 د). بالنسبة للمقيمين الإلكترونيين ، والمقاييس الاستيعابية ، والقيم الاستيعابية ، بأقصى حد لمتوسط ​​الشذوذ ص & lt 1.1 × 10 –7 ، كان معظم الأفراد يحملون على الأقل RV بالقرب من الجين الخارجي (82 إلى 94٪). عند النظر إلى RVs مع التعليقات التوضيحية الوظيفية (من التعليقات التوضيحية المدرجة في الشكل 1C) ، وجدنا أن القيم الإلكترونية غير المعبر عنها هي الأكثر قابلية للتفسير ، مع وجود 88٪ من RVs المرتبطة بها تعليقًا وظيفيًا إضافيًا ، في حين أن قيم aseOutliers كانت أقل نسبة في 56٪ (الشكل 1 د). يوفر هذا التحليل مزيدًا من التبصر في التوقعات لأنواع RV السببية عند ملاحظة تأثير غريب بحجم معين في الفرد.

على العكس من ذلك ، فإن نسبة كبيرة من الجينات ذات المتغيرات الجينية النادرة القريبة لم تظهر على أنها قيم متطرفة ، حتى بالنسبة للفئات الأكثر تنبؤية مثل متغيرات فقدان الوظيفة. كانت أكبر نسبة من المتغيرات التي أدت إلى أي حالة خارجية هي متغيرات متبرعة نادرة ومتغيرات متقبل لصق ، منها 7.2 و 6.8٪ فقط ، على التوالي ، أدت إلى حالة خارجية (الشكل 1E والشكل S11). بشكل عام ، في حين أن بعض التأثيرات النسخية قد تكون مفقودة ، فإن التردد المنخفض الذي أدت به RVs لهذه الفئات إلى تغييرات كبيرة في النسخ يعزز فائدة دمج البيانات الوظيفية في تفسير المتغير حتى بالنسبة لفئات المتغيرات المحددة المستخدمة بالفعل في التفسير السريري.

يتنبأ الموقع الجينومي لـ RVs بالتأثير على التعبير

على الرغم من أننا قمنا في المقام الأول بتقييم RVs التي تحدث إما داخل جين خارجي أو في نافذة محيطة تبلغ 10 كيلو بايت ، يمكن أن يحدث تنظيم الجينات على مسافات أكبر (19, 20). نظرًا لأننا لاحظنا أقوى عمليات إثراء للمتغيرات ذات التردد الأقل ، فقد تقاطعنا مع المتغيرات الفردية [(SVs) ، أي تلك التي تظهر مرة واحدة فقط في GTEx و SNVs و / أو indels التي لا تظهر في قاعدة بيانات تجميع الجينوم (gnomAD) (21)] بنوافذ طولها 200 كيلو بايت باستثناء النوافذ الأخرى والمنبع من الجينات الخارجية ومقارنة تواترها في الأفراد الخارجيين مقابل الأفراد غير الخارجين. انخفض تخصيب SNV بسرعة على مسافات أكبر من الجين ولكنه ظل ضعيف التخصيب بالنسبة لـ eOutliers حتى 200 كيلو بايت. كان الشيء نفسه ينطبق على indels النادرة ، مع التخصيب عند 200 كيلو بايت فقط للمقاييس. ظلت SVs مخصبة على مسافات أطول بكثير ، حيث تم تخصيبها بمقدار 2.33 ضعفًا بقدر 800 كيلو بايت إلى 1 ميجا بايت في المنبع وما يصل إلى 600 كيلو بايت في اتجاه مجرى الجسم الجيني (الشكل 2 أ والشكل S12A).

(أ) الخطر النسبي لـ SNVs و indels (غير موجود في gnomAD) ، و SVs (مفرد في GTEx) على مسافات متفاوتة منبع الجينات الخارجة (صناديق حصرية) عبر أنواع البيانات. (ب) نسبة eOutliers مع TSS RVs في أشكال المروج في حدود 1000 نقطة أساس. يتم تعريف الصناديق السفلية والإضافية بمتوسط ض عتبة الدرجة 3 ، والضوابط هم جميع الأفراد بمتوسط ض يسجل & lt3 لنفس مجموعة الجينات الخارجية. (ج) رسم يلخص التسميات الموضعية بالنسبة لمواقع لصق المتبرع والمقبول المرصودة. (د) المخاطر النسبية (ذ-محور) لمجموعة sOutlier (مجموعة LeafCutter الوسيطة ص & lt 1 × 10 −5) يقع RV في موضع محدد بالنسبة إلى موقع لصق (x-المحور) مقارنةً بـ RVs غير الخارجية. تم إجراء حساب المخاطر النسبية بشكل منفصل لمواقع لصق الجهات المانحة والمقبولة. (ه) مصفوفات وزن الموضع المستقل التي تعرض أطياف الطفرات في sOutlier (مجموعة LeafCutter الوسيطة ص & lt 1 × 10 −5) RVs في المواضع المتعلقة بمواقع لصق ذات استخدام تقاطع سلبي (على سبيل المثال ، تستخدم مواقع لصق أقل في الأفراد الخارجين عن القيم غير المتطرفة). (F) استخدام تقاطع موقع لصق هو السجل الطبيعي لجزء القراءات في تعيين مجموعة LeafCutter إلى موقع لصق الاهتمام في sOutlier (مجموعة LeafCutter الوسيطة ص & lt 1 × 10 −5) نسبة إلى الكسر في العينات غير الإضافية المجمعة عبر الأنسجة بأخذ الوسيط (16). استخدام مفرق (ذ-محور) لأقرب مواقع لصق إلى RVs التي تقع داخل مسلك بوليبيريميدين (A - 5 ، A - 35) مرتبًا بنوع المتغير (x-محور).

تم ربط RVs في مناطق المروج سابقًا بالتعبير الخارجي (5, 15). لتوسيع نطاق هذه الملاحظات ولتقييم أنواع مواقع ربط عامل النسخ (TF) التي يمكن أن تؤدي إلى القيم المتطرفة ، قمنا باختبار إثراء المتغيرات القريبة لموقع بدء النسخ النادر (TSS) في أشكال TF محددة بالقرب من القيم الإلكترونية السفلية والمفرطة. بالنسبة إلى القيم المنخفضة لـ eOutliers ، رأينا إثراءً للمتغيرات في جاب، TF الذي ينشط الجينات التي تتحكم في دورة الخلية ، والتمايز ، والوظائف الهامة الأخرى (22). بالنسبة إلى قيم eOutliers المفرطة ، رأينا إثراءً لـ RVs تتقاطع مع E2F4 عزر ، TF تم الإبلاغ عنه كعامل قمع نسخي (23). في كل من القيم الإلكترونية السفلية والإضافية ، رأينا RVs في YY1، والتي يمكن أن تعمل كمنشط أو كمقمع ، اعتمادًا على السياق (24) ، وقد ارتبطت بـ جاب في شبكات التنظيم (الشكل 2 ب والشكل S12B) (25). وبالتالي ، فإن اضطرابات RV التي تحدث بشكل طبيعي يمكن أن توفر معلومات حول كيف يمكن لـ TFs المحددة زيادة أو خفض تنظيم الجينات المستهدفة.

يمكن أن تؤثر RVs على جينات متعددة وتؤدي إلى اندماج جيني جديد

لاحظنا أن RVs يمكن أن تؤثر أيضًا على جينات متعددة في الفرد. لقد وجدنا إثراءًا قويًا للتأثيرات متعددة الجينات بين قيم eOutliers ، وبدرجة أقل ، aseOutliers (الشكل S13). كما هو متوقع ، لم نشهد تخصيبًا للأزواج الخارجية القريبة ، والتي تكون أقل عرضة للتنظيم (26). ضمن نافذة 100 كيلوبايت ، كانت جينات eOutlier المجاورة أكثر تكرارا 70 مرة مما هو متوقع بالصدفة إذا سحبت أزواج خارجية بشكل عشوائي. كما تم إثرائهم بشكل كبير من أجل CNVs النادرة ، والازدواجية ، ومتغيرات TSS القريبة من أحد الجينات أو كليهما مقارنة بالأفراد الذين لديهم تعبير خارجي ولكن لجين واحد فقط (الشكل S13). وجدنا أيضًا أن تخصيب SV نادرًا كان موجودًا بالقرب من eOutliers بغض النظر عما إذا كان SV يتداخل مع الجين نفسه (الشكل S14). لاحظنا 27 نموذجًا من SVs النادرة ، بما في ذلك عمليات الحذف والتكرار ونهايات الكسر المرتبطة بـ eOutliers في جينين على الأقل في نفس الفرد (الشكل S15 والجدول S1). بالنسبة لأحد هؤلاء ، لاحظنا دليلًا على وجود نسخة من الاندماج ناتجة عن حذف يمتد إلى نهاية الجين SPTBN1 و TSS لـ EML6. أدى هذا الحذف إلى نقص التعبير عن SPTBN1 (متوسط ض النتيجة = –4.67) والإفراط في التعبير عن EML6 (متوسط ض الدرجة = 8.12) مقارنة مع جميع الأفراد الآخرين. دعمًا لوجود نسخة جديدة من اندماج السلالة الجرثومية ، وجدنا دليلًا على نسخة محددة تغطي كل من SPTBN1 و EML6 في أنسجة متعددة للفرد مع الحذف (الشكل S16). لكل من هذين الجينين ، أظهر هذا الفرد أيضًا إشارة أكثر خطورة (متوسط ​​سبوت ص = 0.0005 لـ EML6 و 0.0035 لـ SPTBN1). كان تحديد نصوص الاندماج ذا أهمية خاصة في تشخيص السرطان والتنبؤ به (2730) ، وقد سبق أن تورط كل من جينات EML و SPTBN1 في الاندماج المرتبط بالسرطان (31, 32).

RVs في الربط بين القيم المتطرفة لتسلسل الإجماع

أظهرت الدراسات السابقة أن المركبات الترفيهية التي تعطل مواقع الوصل تؤدي إلى أنماط تضفير بديلة متباعدة (33, 34). استخدمنا مكالمات sOutlier تم إجراؤها لكل مجموعة LeafCutter (16, 35) لتقييم إثراء المتغيرات المتعلقة بالربط بشكل أكثر دقة. لاحظنا تخصيبًا شديدًا لـ RVs بالقرب من مواقع لصق في sOutliers. كان sOutlier أكثر احتمالا بمقدار 333 مرة من غيره في إيواء عربة سكن متنقلة داخل نافذة 2-bp حول موقع لصق (الشكل S17A) (16) ، مع اضمحلال الإشارة على مسافات أكبر ولكن لا يزال مخصبًا حتى 100 نقطة أساس (الخطر النسبي = 7.43). للحصول على إثراء دقة الزوج الأساسي ، قمنا بحساب الخطر النسبي لـ RVs الخارجية الموجودة في مواقع محددة بالنسبة لمواقع لصق المتبرع والمقبول المرصودة (16). أظهرت عشر مواقع بالقرب من موقع لصق إثراءً كبيرًا لـ RVs في sOutliers مقارنةً بعناصر التحكم (الشكل 2 و C و D). تتوافق هذه المواقف بدقة مع المواقف التي ثبت أيضًا أنها غير متسامحة مع الطفرات بسبب دورها المحفوظ في التضفير (سنشير إلى هذه المواقف على أنها تسلسل توافق الربط) (34). من بين أكثر المواضع إثراءً ضمن تسلسل إجماع الربط كانت المواضع الأربعة الأساسية لمواقع لصق (D + 1 ، D + 2 ، A - 2 ، A - 1) (36) ، والذي أظهر متوسط ​​خطر نسبي قدره 195.

استحوذت sOutliers أيضًا على عواقب النسخ لكل من المتغيرات التي عطلت تسلسل إجماع الربط المرجعي وتلك التي خلقت تسلسل إجماع جديد على الربط. أظهر الأفراد الذين لديهم متغيرات sOutlier حيث انحرف الأليل النادر بعيدًا عن تسلسل إجماع الربط انخفاضًا في استخدام الوصلات لموقع لصق بالقرب من المتغير ، في حين أظهر الأفراد الذين لديهم متغيرات حيث أنشأ الأليل النادر تسلسل إجماع على التضفير زيادة استخدام تقاطع لموقع لصق بالقرب من المتغير بالنسبة لغير القيم العليا (الشكل 2E والتين. S17B و S18) (16). لقد رأينا نمط تخصيب ذي صلة بعد فصل مواقع لصق مشروحة وجديدة (غير مشروحة) (الشكل S19). تم إثراء sOutliers أيضًا من أجل RVs الموضوعة داخل المسالك بوليبريميدين (PPT) ، وهي منطقة غنية بالبيريميدين محفوظة للغاية ،

من 5 إلى 35 نقطة أساس في المنبع من مواقع لصق المتقبل (37). كان من المرجح أن يتم تحديد موقع RV في PPT بالقرب من sOutlier بالنسبة إلى nonoutlier بنسبة 6.25 مرة. أظهرت قيم sOutliers مع RV التي غيرت موضعًا في PPT من بيريميدين إلى البيورين (أي تعطيل PPT الحالي) استخدام تقاطع منخفض لموقع لصق بالقرب من المتغير ، بينما كان العكس صحيحًا للمتغيرات التي غيرت موضعًا في PPT من البيورين إلى بيريميدين (الشكل 2F والتين. S20).

يمكن أن تؤدي RVs في المناطق التنظيمية الخاصة بالأنسجة إلى تعبير خارجي خاص بالأنسجة

على الرغم من أن القيم المتطرفة للأنسجة المتعددة توفر قوة محسّنة لاكتشاف تأثيرات RV ، فقد قمنا أيضًا بتقييم RVs من القيم المتطرفة التي تم اكتشافها في الأنسجة الفردية. تخضع قياسات الأنسجة المفردة لتباين أكبر من القياسات المتكررة عبر الأنسجة ولكنها تمثل معظم التصميمات التجريبية. أولاً ، أجرينا تحليل النسخ المتماثل عبر جميع الأفراد الذين لديهم بيانات متاحة للطرق الثلاث لتقييم درجة تكرار الحالة الخارجية المكتشفة في نسيج واحد للفرد في أنسجة أخرى (16). في المتوسط ​​، وجدنا أنه تم اكتشاف الحالة السابقة الإلكترونية ، والأخيرة ، والأكثر خطورة في أنسجة الاكتشاف في أنسجة اختبار 5.1 و 10.7 و 8.7٪ من الوقت ، على التوالي (الشكل 3 أ والشكل S21). وهذا يتفق مع النتائج الأخرى التي تفيد بأن قياسات ASE أكثر اتساقًا عبر الأنسجة (18). بالنظر إلى الأنسجة التي يمكن الوصول إليها سريريًا ، أي الدم الكامل ، والخلايا الليفية ، والخلايا الأرومية اللمفاوية ، إذا أخذنا في الاعتبار القيم المتطرفة التي لوحظت لجين في اثنين على الأقل من هذه الأنسجة في نفس الفرد ، فقد رأينا متوسط ​​معدلات النسخ عبر جميع الأنسجة الأخرى من 14.1 ، 20.9 ، و 15.0٪ لـ eOutliers و aseOutliers و sOutliers ، على التوالي (الشكل S22). يعد كل من معدل النسخ الأعلى لـ aseOutliers والزيادة في التكرار الخارجي في الأنسجة التي يتعذر الوصول إليها عند النظر في أكثر من قياس يمكن الوصول إليه مفيدًا لتحليل البيانات الوظيفية من الأنسجة التي يسهل الوصول إليها لفهم حالات المرض الأكثر صلة بالأنسجة الأخرى.

(أ) متوسط ​​تكرار القيم المتطرفة التي تم تحديدها لكل نسيج عبر كل نسيج آخر لكل نوع شاذ. (ب) تقدير نقطة الخطر النسبية لـ SNVs القريبة النادرة للقيم المتطرفة في جميع الأنسجة على حدة. (ج) التخصيب بالمخاطر النسبية لاحتمال تعطيل الجينات RVs المجاورة للقيم المتطرفة للأنسجة المفردة عند عتبة |ض| & gt 4 (بشكل مكافئ SPOT أو ANEVA-DOT ص & lt 0.000063) ، بنقطة واحدة لكل نسيج. (د) توزيع عدد الأنسجة ذات القيم المتطرفة للتعبير الأساسي للتعبير الشاذ المحدد بواسطة الوسيط ض النتيجة (eOutliers) أو مسافة Mahalanobis ص القيمة (الارتباط). (ه) الخطر النسبي للارتباط المتطرف مدفوعًا بنسيج واحد ، يُعرَّف على أنه قيم شاذة للارتباط ذات مغزى يُلاحظ فيها تغيير تعبير عن الدرجة المشار إليها بواسطة لون النقطة في نسيج واحد فقط (16) تحمل RV في معززات مشروحة على هذا النسيج داخل نافذة 500 كيلو بايت من الجين الخارجي. يتم تعريف لا مثيل له على أنه جميع مناطق المحسن الخاصة بالأنسجة بغض النظر عن الأنسجة الخارجية.

قمنا بعد ذلك بتقييم قدرة القيم المتطرفة للأنسجة المفردة من كل طريقة لتحديد أولويات RVs بالقرب من الجينات الخارجية. تم إثراء القيم الفردية للأنسجة للعربات RV القريبة ، متبوعة بـ sOutliers ثم eOutliers ، عبر جميع عتبات القطع الخارجية (الشكل 3 ب والشكل S21 و S23A). لاحظنا أيضًا أن إثراء المتغيرات من المحتمل أن تؤدي إلى تحلل هراء بوساطة بين قيم eOutliers أحادية النسيج ، والمقاييس السيئة ، والمقاييس sOutliers (الشكل 3C والشكل S23B). بالإضافة إلى ذلك ، وجدنا أن القيم الخارجية للأنسجة المفردة لا تزال تُظهر إثراءًا قويًا لـ RVs في تسلسل إجماع الربط و PPT (الشكل S24).

باستثناء SVs النادرة التي تم إثرائها بشكل ملحوظ عند عتبات مماثلة إلى eOutliers متعدد الأنسجة ، تُظهر القيم الإلكترونية أحادية الأنسجة إثراءًا أضعف بكثير بالنسبة إلى القيم المتطرفة للأنسجة المتعددة لـ SNVs النادرة و indels القريبة عبر جميع العتبات (الشكل S25). لتحسين اكتشاف القيم المتطرفة الخاصة بالأنسجة ، استفدنا من اتساع بيانات الأنسجة المتاحة واستخدمنا أنماطًا ملحوظة من الارتباط عبر الأنسجة لاكتشاف القيم المتطرفة التي تنحرف عن التغاير المتوقع للتعبير في مجموعة فرعية من الأنسجة (16). تم تنفيذ نهج مماثل لتحديد RVs الوظيفية على أساس ارتباط التعبير بين الجينات في نسيج واحد (5). وجدنا أن القيم المتطرفة التي تم تحديدها باستخدام هذا النهج كانت مدفوعة غالبًا بتغييرات التعبير في واحد أو عدة أنسجة مقارنةً بالقيم الإلكترونية متعددة الأنسجة بناءً على الوسيط ض عشرات (الشكل 3D). تم إثراء القيم المتطرفة الخاصة بنسيج الارتباط أيضًا لـ RVs القريبة في نافذة 10 كيلو بايت حول الجين (الشكل S26C). ومع ذلك ، تم إثراء هذه القيم المتطرفة أيضًا لـ RVs في المعززات التي كانت نشطة في الأنسجة (الأنسجة) التي أدت إلى التأثير الشاذ (الجدول S2) ، على النحو الذي تحدده الأنسجة المفردة ض يسجل وضمن نافذة 500 كيلو بايت حول الجين (الشكل 3E). والجدير بالذكر أن هذه القيم المتطرفة الخاصة بالأنسجة قد استنفدت من أجل تباين نادر في المعززات المشروحة في أنسجة أخرى لا مثيل لها.

تحديد أولويات RVs من خلال دمج التعليقات التوضيحية الجينومية مع إشارات النسخ الشخصية المتنوعة

لدمج إشارات النسخ المتنوعة في طريقة لتحديد أولويات RVs ، قمنا بتطوير Watershed ، وهو نموذج رسومي احتمالي غير خاضع للإشراف يدمج المعلومات من التعليقات التوضيحية الجينومية للجينوم الشخصي (الجدول S3) مع إشارات متعددة من نسخة شخصية متطابقة. يوفر Watershed الدرجات التي يمكن استخدامها لتفسير الجينوم الشخصي أو لفهرسة الأليلات النادرة التي يحتمل أن تكون مؤثرة ، وتحديد الاحتمال اللاحق بأن يكون للمتغير تأثير وظيفي على كل نمط ظاهري نسبي استنادًا إلى كل من تسلسل الجينوم الكامل (WGS) وتسلسل الحمض النووي الريبي ( إشارات RNA-seq) (الشكل 4 أ). يمكن تكييف نموذج مستجمعات المياه مع أي مجموعة متاحة من الأنماط الظاهرية الجزيئية ، بما في ذلك المقايسات المختلفة ، والأنسجة المختلفة ، أو الإشارات المشتقة المختلفة. علاوة على ذلك ، يتعلم Watershed تلقائيًا أوزان حافة مجال ماركوف العشوائي (MRF) التي تعكس قوة العلاقة بين الأنسجة المختلفة أو الأنماط الظاهرية المتضمنة والتي تسمح معًا للنموذج بالتنبؤ بالتأثيرات الوظيفية بدقة.

(أ) رسم لوحة تلخيص تدوين لنموذج مستجمعات المياه عندما يتم تطبيقه على ثلاث إشارات خارجية متوسّطة (التعبير ، ASE ، والربط). (ب) خريطة حرارية متماثلة تعرض معلمات حافة مستجمعات المياه (الأوزان) المكتسبة بين أزواج من الإشارات الخارجية بعد تدريب مستجمعات المياه على ثلاث إشارات خارجية متوسّطة. (ج) نسبة RVs مع الاحتمال الخلفي لمستجمعات المياه & gt0.9 (يمين) ومع احتمالية GAM أكبر من الحد المعين لمطابقة عدد متغيرات مستجمعات المياه لكل إشارة خارجية (يسار) تؤدي إلى قيمة خارجية عند متوسط ص- قيمة عتبة 0.0027 عبر ثلاث إشارات خارجية (ألوان). تم تقييم نماذج مستجمعات المياه و GAM على أزواج صامدة من الأفراد. (د) منحنيات الاسترجاع الدقيقة التي تقارن أداء مستجمعات المياه ، و RIVER ، و GAM (الألوان) باستخدام أزواج معلقة من الأفراد لثلاث إشارات خارجية متوسّطة. (ه) خريطة حرارية متناظرة تُظهر معلمات حافة مستجمعات المياه (أوزان) المكتسبة بين أزواج من الإشارات الخارجية للأنسجة بعد تدريب مستجمعات المياه على eOutliers عبر الأنسجة المفردة. يمكن العثور على لون الأنسجة لتعيين اسم الأنسجة في الشكل. S21D. (F) المنطقة الواقعة تحت منحنيات الاسترجاع الدقيقة [AUC (PR) ذ-محور] في نسيج واحد بين الأنسجة- GAM ، ونسج ريفر ، ومستجمعات المياه (x-محور) عند تطبيقه على القيم المتطرفة عبر الأنسجة المفردة في جميع الإشارات الخارجية الثلاثة (الألوان). تم إنشاء منحنيات استدعاء دقيقة في كل نسيج باستخدام أزواج من الأفراد.

قمنا أولاً بتطبيق Watershed على بيانات GTEx v8 باستخدام الإشارات الخارجية الثلاث التي تم فحصها هنا ، والتعبير ، و ASE ، والربط (الشكل 4 أ) (16) ، والتي تم تجميع كل منها أولاً عن طريق أخذ الوسيط عبر الأنسجة للفرد المقابل. بالاتفاق مع الأدلة الموجودة على التشابه بين الإشارات الخارجية (الشكل S9) ، كانت معلمات حافة مستجمعات المياه المكتسبة أقوى بين ASE والتعبير ، متبوعة بـ ASE والربط ، ولكنها إيجابية تمامًا لجميع أزواج الإشارات الخارجية (أي ، كانت كل إشارة خارجية) بالمعلومات عن جميع الإشارات الأخرى الشكل 4 ب). لتقييم نموذجنا ، استخدمنا أزواجًا معلقة من الأفراد الذين يتشاركون نفس RV ، مما يجعل تنبؤات مستجمعات المياه في الفرد الأول وتقييم تلك التنبؤات باستخدام الحالة الشاذة للفرد الثاني كتسمية (15, 16). يتفوق مستجمعات المياه على الأساليب القائمة على تسلسل الجينوم وحده [نموذج الشرح الجينومي (GAM) والاستنفاد المعتمد على التعليق التوضيحي (CADD) الشكل 4C والتين. S27] (38, 39). قمنا أيضًا بمقارنة أداء مستجمعات المياه مع RIVER [تأثير متغير مستنير من RNA على التنظيم (15)] ، وهو تبسيط لنموذج مستجمعات المياه حيث يتم معالجة كل إشارة خارجية بشكل مستقل. وجدنا أن النمذجة الصريحة للعلاقة بين الأنماط الظاهرية الجزيئية المختلفة قدمت مكاسب أداء لمستجمعات المياه (الشكل 4 د ، التين. S28 و S29 ، والجدول S4) (16). لاحظنا أنه حتى التعليقات التوضيحية الجينومية الأكثر تنبؤًا نتج عنها فقط قيم eOutliers و aseOutliers و sOutliers 2.8 و 7.9 و 14.3 ٪ من الوقت ، على التوالي (الشكلان 1E و 4 C). ومع ذلك ، فإن دمج إشارات النسخ مع التعليقات التوضيحية الجينومية من مستجمعات المياه (عند عتبة خلفية 0.9) اكتشف SNVs التي أدت إلى قيم eOutliers و aseOutliers و sOutliers بتردد أكبر 11.1 و 33.3 و 71.4 ٪ من الوقت ، على التوالي (الشكل 4C والشكل. . S30).

لقد قمنا بتوسيع إطار مستجمعات المياه لتحديد أولويات المتغيرات على أساس تأثيرها المتوقع على الأنسجة. قمنا بتدريب ثلاثة نماذج "مستجمعات الأنسجة" (نموذج لكل تعبير ، ASE ، والربط بشكل منفصل) ، حيث يأخذ كل نموذج في الاعتبار التأثيرات في جميع الأنسجة بشكل مشترك ، ومشاركة المعلومات في MRF ، وفي النهاية ينتج 49 درجة خاصة بالأنسجة لـ كل RV (الشكلان S29 و S31) (16). لاحظنا أن المعلمات التي تم تعلمها لكل من النماذج الثلاثة لمستجمعات المياه تشبه الأنماط المعروفة لتشابه الأنسجة (الشكل 4E والشكل S32) (18). علاوة على ذلك ، باستخدام الأفراد المعلقين ، تفوق نموذج مستجمعات المياه في الأنسجة على نموذج RIVER الذي يتم فيه معالجة كل نسيج بشكل مستقل تمامًا (ص = 2.00 × 10 −5 , ص = 2.00 × 10 −5 ، و ص = 5.90 × 10 −3 for expression, ASE, and splicing, respectively one-sided binomial test Fig. 4F and figs. S33 and S34) and a collapsed RIVER model trained with single median outlier statistics (ص = 0.0577, ص = 0.251, and ص = 0.00128 for expression, ASE, and spicing, respectively one-sided binomial test figs. S35 and 36). Critically, integrative models that incorporated transcriptomic signal and genomic annotations from a single tissue still outperformed methods based only on genome sequence annotations (Fig. 4F), supporting the benefit of collecting even a single RNA-seq sample to improve personal genome interpretation.

Replication and experimental validation of predicted RV transcriptome effects

We first assessed the replication of “candidate causal RVs” previously identified by the SardiNIA Project (6), using GTEx Watershed prioritization. Of five SardiNIA candidate causal RVs that were also present in a GTEx individual, four had high (>0.7) GTEx Watershed expression posterior probabilities (table S5). Next, we tested replication of GTEx RVs, prioritized by Watershed, in an independent cohort evaluating 97 whole-genome and matched transcriptome samples from the Amish Study of Major Affective Disorders (ASMAD) (40). We evaluated GTEx RVs also present in this cohort at any frequency, quantifying eOutlier, aseOutlier, and sOutlier signal in each ASMAD individual harboring one of the GTEx variants (16). For all three phenotypes, ASMAD individuals with variants having high (>0.8) Watershed posterior probability based on GTEx data had significantly more extreme outlier signals at nearby genes compared with individuals with variants having low (<0.01) GTEx Watershed posterior probability (expression: ص = 2.729 × 10 −6 , ASE: ص = 2.86 × 10 −3 , and splicing: ص = 5.86 × 10 −13 Wilcoxon rank-sum test fig. S37). Every variant with a high GTEx Watershed splicing posterior probability (>0.8) resulted in an sOutlier (ص ≤ 0.01) in the ASMAD cohort. Furthermore, ASMAD individuals with variants having high (>0.8) GTEx Watershed posterior probability had significantly larger outlier signals relative to equal size sets of variants prioritized by GAM (expression: ص = 0.00129, ASE: ص = 0.0287, and splicing: ص = 0.00058 Wilcoxon rank-sum test fig. S37). Overall, RVs prioritized by Watershed using GTEx data displayed evidence of functional effects in ASMAD individuals.

We further applied both a massively parallel reporter assay (MPRA) and a CRISPR-Cas9 assay to assess the impact of Watershed-prioritized RVs. We experimentally tested the regulatory effects of 52 variants with moderate Watershed expression posterior (≥0.5) and 98 variants with low Watershed expression posterior (<0.5) using MPRA (16). We observed increased effect sizes for RVs with high Watershed expression posterior relative to variants with low expression posterior (ص = 0.025 one-sided Wilcoxon rank-sum test fig. S38 and table S6). Next, we assessed the functional effects of 20 variants by editing them into inducible-Cas9 293T cell lines. These included 14 rare stop-gained variants and six non-eQTL common variants as negative controls. Of the 14 rare stop-gained variants, 13 had expression or ASE Watershed posterior >0.8, with the remaining variant [previously tested in (41)] having a posterior of 0.22. All control variants had Watershed posteriors <0.03. Of the 13 variants with a Watershed posterior >0.8, 12 showed a significant decrease in expression of the rare allele (ص < 0.05, Bonferroni corrected fig. S39 and table S7) (16).

Aberrant expression informs RV trait associations

We found that each individual had a median of three eOutliers, aseOutliers, and sOutliers (median outlier ص < 0.0027) with a nearby RV. When filtering by moderate Watershed posterior probability (>0.5) of affecting expression, ASE, or splicing, individuals had a median of 17 genes with RVs predicted to affect expression, 27 predicted to affect ASE, and nine predicted to affect splicing (Fig. 5A). From the set of outlier calls, we found multiple instances of RVs influencing well-known and well-studied genes, including APOE و FAAH (table S8). In particular, for APOE, which has been associated with numerous neurological diseases and psychiatric disorders (42), we found two aseOutlier individuals both carrying a rare, missense variant, rs563571689, with ASE Watershed posteriors >0.95, not previously reported. ل FAAH, which has been linked to pain sensitivity in numerous contexts (43, 44), we found two eOutlier individuals with a rare 5′ untranslated region variant, rs200388505, with ASE and expression Watershed posteriors >0.9.

(أ) Distribution of the number of outlier genes, outlier genes with a nearby RV, and genes with a high Watershed posterior variant per data type. We added one to all values so that individuals with 0 are included. (ب) Distribution of effect sizes, transformed to a percentile, for the set of GTEx RVs that appear in UKBB and are not outlier variants, those that are outlier variants, and those outlier variants that fall in colocalizing genes for the matched trait across 34 traits. Percentiles were calculated on the set of rare GTEx variants that overlap UKBB. The set of genes was restricted to those with at least one outlier individual in any data type and a nearby variant included in the test set (4787 variants and 1323 genes). ص values were calculated from a one-sided Wilcoxon rank-sum test. (ج) Proportion of variants filtered by Watershed posterior that fell in the top 25% of effect sizes for a colocalized trait (red) and the proportion of randomly selected variants of an equal number that also fall in these regions over 1000 iterations (black). (د) Manhattan plot (top) across chromosome 9 for asthma in the UKBB, filtered for non–low-confidence variants, with two high-Watershed variants, rs149045797 and rs146597587, shown in pink and the lead colocalized variant, rs3939286, shown in blue. The variants’ effect size ranks were similarly high for both self-reported and diagnosed asthma, but the summary statistics are shown for asthma diagnosis here. The UKBB MAF versus absolute value of the effect size for all variants within 10 kb of the Watershed variant is also shown (bottom). (ه) Manhattan plot across chromosome 22 for self-reported high cholesterol in the UKBB, filtered to remove low confidence variants, with the high-Watershed variant rs564796245 shown in pink. The UKBB MAF versus absolute value of the effect size for all variants within 10 kb of the Watershed variant is also shown (bottom).

To assess whether identified rare functional variants from GTEx associate with traits, we intersected this set with variants present in the UKBB (12). We focused on a subset of 34 traits for which GWAS association for a UKBB trait had evidence of colocalizations with eQTLs and/or alternative splicing QTLs (sQTLs) in any tissue (table S9) (16, 45). GTEx has demonstrated that genes with RV associations for a trait are strongly enriched for their eQTLs colocalizing with GWAS signals for the same trait (18), indicating that QTL evidence can be used to guide RV analysis. Furthermore, RVs near GTEx outliers had larger trait association effect sizes than background RVs near the same set of genes in the UKBB data (ص = 3.51 × 10 −9 one-sided Wilcoxon rank-sum test), with a shift in median effect size percentile from 46 to 53%. Notably, outlier variants that fell in or nearby genes with an eQTL or sQTL colocalization had even larger effect sizes (median effect size percentile 88%) than nonoutlier variants (ص = 1.93 × 10 −5 one-sided Wilcoxon rank-sum test) or outlier variants falling near any gene not matched to a colocalizing trait (ص = 4.88 × 10 −5 one-sided Wilcoxon rank-sum test Fig. 5B).

Although most variants tested in UKBB had low Watershed posterior probabilities of affecting the transcriptome (fig. S40A), we hypothesized that filtering for those variants that do have high posteriors would yield variants in the upper end of the effect size distribution for a given trait. For each variant tested in UKBB, we took the maximum Watershed posterior per variant and compared this with a genomic annotation-defined metric, CADD (38, 39). We found that Watershed posteriors were a better predictor of variant effect size than CADD scores for the same set of RVs in a linear model (Table 1). Across different Watershed posterior thresholds, we found that the proportion of variants falling in the top 25% of RV effect sizes in colocalized regions exceeded the proportion expected by chance (Fig. 5C). Whereas filtering by CADD score did return some high effect size variants, this proportion declined at the highest thresholds (fig. S40D). Furthermore, there was very little overlap between variants with high Watershed posteriors and high CADD variants (fig. S40D), with CADD variants more likely to occur in coding regions and Watershed variants more frequent in noncoding regions (fig. S40D). Thus, the approaches largely identified distinct and complementary sets of variants for these traits.

Shown are the coefficient estimates and 95% confidence intervals from separate linear models with variant effect size percentile as the response and CADD score or Watershed posterior (scaled to have a mean of 0 and an SD of 1 so that values are of comparable range) as the predictor for all tested variants in colocalized regions (ن = 5277).

We identified 33 rare GTEx variant trait combinations in which the variant had a Watershed posterior >0.5 and fell in the top 25% of variants by effect size for the given trait (table S10). We highlight two such examples, for asthma and high cholesterol (Fig. 5, D and E), showing that although RVs usually do not have the frequency to obtain genome-wide significant ص values, when they are prioritized by the probability of affecting expression, we could identify those with greater estimated effect sizes on the trait (table S11). In the case of asthma, the RV effect sizes in UKBB were three times greater than the lead colocalized variant. These variants included rs146597587, which is a high-confidence loss-of-function splice acceptor with an overall gnomAD AF of 0.0019, and rs149045797, an intronic variant with a frequency of 0.0019, both of which were associated with the gene IL33, the expression of which has been implicated in asthma (46, 47). Previous work has identified the protective association between rs146597587 and asthma (48, 49), and we found that this is potentially mediated by outlier allelic expression of IL33 leading to moderate decreases in total expression, with median ض scores ranging from –1.08 to –1.77 in individuals with the variant, and median single-tissue ض scores across the six individuals exceeding –2 in 10 tissues. An asthma association had also been reported recently for the other high Watershed asthma-associated variant rs149045797 and was in perfect linkage disequilibrium with rs146597587 (50). An additional high Watershed variant, rs564796245, an intronic variant in TTC38 with a gnomAD AF of 0.0003, had a high effect size for self-reported high cholesterol in the UKBB but was not previously reported. We were able to test this variant against four related blood lipids traits in the MVP (51). We found that for these traits, which included high-density lipoprotein (HDL), low-density lipoprotein, total cholesterol, and triglycerides, among rare (gnomAD AF <0.1%) variants within a 250-kb window of rs564796245, this variant was in the top 5% of variants by effect size for HDL specifically, it was in the top 1% (fig. S41). We also assessed this variant’s association with the same four traits in the JHS (14), an African American cohort in which four individuals carried the RV. Here, we found that the direction of effect was consistent with MVP and UKBB for all four traits (tables S11 and S12), and the variant fell in the top 28th to 38th percentile of all rare (gnomAD AF <0.1%) variants in this region (fig. S42). Only four of the variants tested in UKBB had Watershed posterior probabilities >0.9 for colocalized genes, but of those, three showed high effect sizes for a relevant trait (table S10).


What do the new ‘gay genes’ tell us about sexual orientation?

Didn’t we already know there were “gay genes”?
We have known for decades that sexual orientation is partly heritable in men, thanks to studies of families in which some people are straight and some people are gay. In 1993, genetic variations in a region on the X chromosome in men were linked to whether they were heterosexual or homosexual, and in 1995, a region on chromosome 8 was identified. Both findings were confirmed in a study of gay and straight brothers in 2014. However, these studies didn’t home in on any specific genes on this chromosome.

What’s new about the latest study?
For the first time, individual genes have been identified that may influence how sexual orientation develops in boys and men, both in the womb and during life. Alan Sanders at North Shore University, Illinois, and his team pinpointed these genes by comparing DNA from 1077 gay and 1231 straight men. They scanned the men’s entire genomes, looking for single-letter differences in their DNA sequences. This enabled them to home in on two genes whose variants seem to be linked to sexual orientation.

What genes did they find and what do they do?
One of the genes, which sits on chromosome 13, is active in a part of the brain called the diencephalon. Interestingly, this brain region contains the hypothalamus, which was identified in 1991 as differing in size between gay and straight men. This was discovered by neuroscientist Simon LeVay, who says he is excited that the gene discovery seems to fit with what he found.

الإعلانات

Other research has found that this gene, called SLITRK6, is active in the hypothalamus of male mice fetuses a few days before they are born. “This is thought to be a crucial time for sexual differentiation in this part of the brain,” says LeVay. “So this particular finding is a potential link between the neuroanatomy and molecular genetics of sexual orientation.

What is the other gene?
This gene is found on chromosome 14 and is mainly active in the thyroid, but also the brain. مسمى TSHR, it makes a type of receptor protein that recognises and binds to a hormone that stimulates the thyroid. In this way, the gene plays an important role in controlling thyroid function.

حقيقة ان TSHR seems to be involved in sexual orientation fits with evidence that thyroid function seems to be linked to sexuality. على سبيل المثال، TSHR function is disrupted in a genetic condition called Grave’s disease, which causes the thyroid gland to become over-active, accelerating metabolism and leading to weight-loss. Grave’s disease is more common in gay than straight men, and some research suggests that gay men tend to be thinner – which might possibly be a result of thyroid overdrive.

Are all men who have the “gay” variants of these genes gay?
No, says Sanders, because many other factors play a role, including the environment. “There are probably multiple genes involved, each with a fairly low effect,” he says. “There will be men who have the form of gene that increases the chance of being gay, but they won’t be gay.”

Because many genes and other factors seem likely to play a role in sexual orientation, this may explain why some people are bisexual or see sexual orientation as a spectrum.

What about women who are gay? Are there “lesbian genes”?
Our biological understanding of homosexuality in women lags behind. Some researchers say this is partly because women who have sex with women tend to be more fluid in their sexual orientation.

There have been studies suggesting that there is a genetic element to homosexuality in women, but more research has been done in men, says Sanders.

Why should we care about the genetics of being gay?
The latest findings open the prospect to identifying the whole pathway of genes involved in both homosexual and heterosexual orientation, says Dean Hamer at the US National Institutes of Health, who led the study that pinpointed chromosome X back in 1993. “It adds yet more evidence that sexual orientation is not a ‘lifestyle choice’. But the real significance is that it takes us one step closer to understanding the origins of one of the most fascinating and important features of human beings.”

Journal reference: Nature Scientific Reports, DOI: 10.1038/s41598-017-15736-4


مراجع

Edwards Stacey L, Beesley J, French Juliet D, Dunning Alison M. Beyond GWASs: illuminating the dark road from association to function. Am J Hum Genet. 201393(5):779–97.

Cavalli M, Pan G, Nord H, et al. Allele-specific transcription factor binding to common and rare variants associated with disease and gene expression. Hum Genet. 2016135:485–97.

MacArthur J, Bowler E, Cerezo M, et al. The new NHGRI-EBI catalog of published genome-wide association studies (GWAS catalog). الدقة الأحماض النووية. 201745(D1):D896–901.

The ENCODE Project C. An integrated encyclopedia of DNA elements in the human genome. طبيعة سجية. 2012489(7414):57–74.

Maurano MT, Humbert R, Rynes E, et al. Systematic localization of common disease-associated variation in regulatory DNA. علم. 2012337(6099):1190–5.

Younesy H, Möller T, Heravi-Moussavi A, et al. ALEA: a toolbox for allele-specific epigenomics analysis. المعلوماتية الحيوية. 201430(8):1172–4.

Yang XD, Xiang DX, Yang YY. Role of E3 ubiquitin ligases in insulin resistance. Diabetes Obes Metab. 201618(8):747–54.

Marfella R, D’Amico M, Di Filippo C, et al. The possible role of the ubiquitin proteasome system in the development of atherosclerosis in diabetes. Cardiovasc Diabetol. 20076:35.

Magee N, Zhang Y. Role of early growth response 1 in liver metabolism and liver cancer. Hepatoma Res. 20173(11):268.

Gokey NG, Lopez-Anido C, Gillian-Daniel AL, Svaren J. Early growth response 1 (Egr1) regulates cholesterol biosynthetic gene expression. J بيول كيم. 2011286(34):29501–10.

Shen N, Yu X, Pan F-Y, Gao X, Xue B, Li C-J. An early response transcription factor, Egr-1, enhances insulin resistance in type 2 diabetes with chronic hyperinsulinism. J بيول كيم. 2011286(16):14508–15.

Wang F, Kuang Y, Salem N, Anderson PW, Lee Z. Cross-species hybridization of woodchuck hepatitis viral infection-induced woodchuck hepatocellular carcinoma using human, rat and mouse oligonucleotide microarrays. J Gastroenterol Hepatol. 200924(4):605–17.

Pollak NM, Hoffman M, Goldberg IJ, Drosatos K. Krüppel-like factors: crippling and uncrippling metabolic pathways. JACC. 20183(1):132–56.

Kumadaki S, Karasawa T, Matsuzaka T, et al. Inhibition of ubiquitin ligase F-box and WD repeat domain-containing 7α (Fbw7α) causes hepatosteatosis through Krüppel-like factor 5 (KLF5)/peroxisome proliferator-activated receptor γ2 (PPARγ2) pathway but not SREBP-1c protein in mice. J بيول كيم. 2011286(47):40835–46.

Bernon C, Carré Y, Kuokkanen E, et al. Overexpression of Man2C1 leads to protein underglycosylation and upregulation of endoplasmic reticulum-associated degradation pathway. Glycobiology. 201121(3):363–75.

Andersson R, Gebhard C, Miguel-Escalada I, et al. An atlas of active enhancers across human cell types and tissues. طبيعة سجية. 2014507:455.

Hynds RE, Vladimirou E, Janes SM. The secret lives of cancer cell lines. Dis Model Mech. 201811(11):dmm037366.

Brodt P. Role of the microenvironment in liver metastasis: from pre- to prometastatic niches. Clin Cancer Res. 201622(24):5971.

McGranahan N, Rosenthal R, Hiley CT, et al. Allele-specific HLA loss and immune escape in lung cancer evolution. زنزانة. 2017171(6):1259–71 e11.

Kassel R, Cruise MW, Iezzoni JC, Taylor NA, Pruett TL, Hahn YS. Chronically inflamed livers up-regulate expression of inhibitory B7 family members. Hepatology. 200950(5):1625–37.

Amiot L, Vu N, Samson M. Biology of the immunomodulatory molecule HLA-G in human liver diseases. J Hepatol. 201562(6):1430–7.

Kundaje A. A comprehensive collection of signal artifact blacklist regions in the human genome. 2013. ENCODE [hg19-blacklist-READMEdoc - EBI] Available online at: https://sites.google.com/site/anshulkundaje/projects/blacklists.

Boyle AP, Hong EL, Hariharan M, et al. Annotation of functional variation in personal genomes using RegulomeDB. الدقة الجينوم. 201222(9):1790–7.

Ernst J, Kellis M. ChromHMM: automating chromatin state discovery and characterization. طرق نات. 20129(3):215–6.


The Gene for Big Brains

Scientists, led by Max Planck Institute’s Wieland Huttner, have identified a gene that triggers a human embryo to grow the vast supply of brain cells that largely forms the foundation for our braininess.1 The same gene is found in modern humans, Neanderthals, and Denisovans. Called ARHGAP11B, Huttner says this is “the first human-specific gene where we could show that it contributes to the pool of basal brain stem cells and can trigger a folding of the neocortex. In that way, we managed to take the next step in tracing evolution.”2

Searching for the link between this human gene and the genes of our supposed ape cousins, Marta Florio and colleagues on a team led by Huttner report in Science Advances that the nucleotide sequence in human-specific ARHGAP11B differs from a similar gene in apes by just one nucleotide.3 A nucleotide is the equivalent of a letter in the genetic language. That difference in spelling might well be the genetic basis for one of the greatest physical differences between apes and humans.

Florio’s team genetically engineered a form of ARHGAP11B with a spelling error. They believe this misspelled human gene is the ancestral form of ARHGAP11B because it is spelled like a similar gene in the chimpanzee, which they firmly believe to be the human’s cousin. When tested on mouse embryos,4 this “ancestral” gene was unable to trigger proliferation of basal progenitor cells. (Basal progenitor cells are the cells that differentiate into neurons as embryonic development continues.) This simple spelling error nips any big-brained potential in the bud. Therefore, Florio’s team concludes that the ability of the human ARHGAP11B gene to stimulate stem cell production in a human embryo’s brain evolved “from a change that is tiny on a genomic scale but substantial in its functional and evolutionary consequences.”5


Keep this in mind

Gene sequencing is already contributing to the development of better, more targeted, and potentially safer medicines. Its use to inform treatment decisions, reduce the use of less effective treatments, and possibly reduce the risk of relapse or provide functional cures is revolutionary.

In the future, we may see more blurring of the lines separating gene-sequencing system manufacturers like Illumina, drug developers like Novartis, and genetic services companies like Guardant. We're already seeing collaborations that cut across these individual market segments, such as Grail, a company spun out of Illumina that's using gene sequencing to develop next-generation cancer tests that could catch disease at its earliest stage. Since these companies may wind up competing more aggressively with one another in the future, investors will want to keep close tabs on this market.


Considering interactions between genes, environments, biology, and social context

Kristen Jacobson received her Ph.D. in Human Development and Family Studies from the Pennsylvania State University in 1999. She spent a year as a postdoctoral scholar in psychiatric genetics under the direction of Dr. Kenneth Kendler at the Virginia Institute for Psychiatric and Behavioral Genetics, where she later served as faculty from 2000-2005. Dr. Jacobson is currently an Assistant Professor of Psychiatry at the University of Chicago, and serves as the Associate Director for Twin Projects and the Associate Director of the Clinical Neuroscience and Psychopharmacology Research Unit. Dr. Jacobson is a collaborator on a number of twin studies of children, adolescents, and adults, and is currently conducting a multidisciplinary, multi-level study of adolescent development, From Neighborhoods to Neurons and Beyond, funded by an NIH New Innovator Award . She is editor of a special issue of Behavior Genetics entitled Pathways between Genes, Brain, and Behavior (expected publication January, 2010). New areas of research involve pilot studies of epigenetics in both mice and humans.

Bronfenbrenner’s bioecological model (Bronfenbrenner & Ceci, 1994) highlights the need to consider interactions between individual, family, peer, school, and community characteristics in understanding individual differences in human development. In order to obtain a complete understanding of the processes involved in individual differences, multidisciplinary studies that measure risk and protective factors at multiple levels of analysis are required. With recent advances in human molecular genetics, the need to integrate environmental measures into genomic studies is of even greater importance. While the mapping of the human genome and the corresponding availability of genome-wide association analysis (GWAS) techniques has led to a flurry of research activity trying to discover “genes for” particular disorders and traits, a significant body of research, both historic as well as quite recent, cautions that efforts to uncover specific genetic variants that ignore the effects of social and contextual environments in genetic studies of individual differences in human behavior and traits may be futile. This essay briefly reviews some of the most interesting work regarding the interplay of genes and environments on individual differences in human development.

طبيعة سجية عكس Nurture

For years, behavioral genetic studies using twin or adoptive samples have been considered the gold standard for assessing the joint effects of nature and nurture in accounting for individual differences in human behaviors and traits. Decades of behavioral genetic research have demonstrated the importance of genetically-influenced characteristics on individual differences in child, adolescent, and adult behaviors and traits. At the same time, behavioral genetic studies have revealed that generally over half of the variation in individual behaviors and traits is due to environmental factors, typically environmental factors that are unique across people within the same family or that have different effects on behavior (i.e., nonshared environmental influence).

Genetic influence has been found on “environmental” measures, suggesting the presence of gene à environment correlations. Gene à environment correlations arise because exposure to certain risk and protective environments is not random, but rather is influenced by inherited characteristics of the individual, and also because children “inherit” both genes and environments from their parents. The role of genes and environments in mediating pathways between risk and behavior is complex, however. For example, recent quasi-longitudinal work using twins to understand the relationship between peer group deviance and adolescent problem behavior found that while genetic factors accounted for most of the relationship between earlier problem behavior and later peer group deviance (consistent with genetic characteristics of an individual relating to peer selection), the relationship between prior peer group deviance and later problem behavior was largely environmentally mediated (consistent with peer influence effects (Kendler, Jacobson, Myers, & Eaves, 2008).

طبيعة سجية و Nurture

While the nature versus nurture debate may have attenuated in recent years with consensus from many fields regarding the importance of both genes and environments, other areas of research have further identified interactions between nature and nurture as important components of individual differences. A host of adoption studies in the 1980s and 1990s have shown that genetic liability to antisocial behavior (as indexed through biological parent psychopathology and substance abuse) is only associated with the development of adult criminality and aggression under adverse adoptive environmental conditions, indicating that neither nature nor nurture was sufficient in and of itself to cause pathology (Cadoret, Yates, Troughton, Woodworth, & Stewart, 1995 Cloninger & Gottesman, 1987).

Alternatively, gene X environment (gXe) interactions may be implicated when the relative importance of genetic influence on behaviors and traits as measured through standard twin designs varies across social and ecological context. For example, a study by Rowe, Almeida, and Jacobson (1999) integrated genetically-informative regression models within a hierarchical linear modeling design to show that levels of parental warmth, measured at the aggregate school level, moderated the heritability (i.e., proportion of individual differences due to genetic factors) of adolescent aggression. Heritabilities of delinquent behavior are increased among adolescents living in families with high rates of dysfunction (Button, Scourfield, Martin, Purcell, & McGuffin, 2005), while the heritability of adolescent smoking decreases with higher levels of parental monitoring (Dick et al., 2007). Family and personal religiosity has been shown to decrease the importance of genetic variance on adolescent substance use behaviors (Koopmans, Slutske, Heath, Neale, & Boomsma, 1999 Timberlake et al., 2006), and urban-rural differences in the heritability of adolescent alcohol use were found to be mediated by contextual factors such as alcohol sales and neighborhood migration (Dick, Rose, Viken, Kapiro, & Koskenvuo, 2001). These latter areas of research may be of particular importance in generalizing results from prior twin studies to minority individuals or individuals in socially and economically disadvantaged environments, as most large-scale twin registries are based on primarily middle-class, Caucasian or Asian samples.

More recently, attention has turned to using measured genotypes and measured environments to investigate ”classic” gXe interactions for a number of important behaviors. Caspi et al.(2002) have elucidated an important and highly replicated (Kim-Cohen et al., 2006) gXe interaction using measured genotype (MAO-A gene) and environmental risk (child abuse) variables, demonstrating that the relationship between child maltreatment and various indices of aggressive and antisocial behavior is attenuated among individuals with the high MAO-A activity genotype.

Another highly replicated interaction has been found between a serotonin transporter gene (5-HTTPLR) and stressful life events in predicting depression (Canli & Lesch, 2007). Further studies have found interactions between the 5-HTTPLR genotype and socioeconomic status (SES) for aggression in preadolescents (Nobile et al., 2007), between the 5-HTTPLR genotype and lab-induced stress for lab measures of aggression in adult males (Verona, Joiner, Johnson, & Bender, 2006) and between life stress and the 5-HTTPLR genotype for individual differences in amygdala activation (Canli et al., 2006). There is also emerging evidence for environmental modification of dopaminergic genes related to impulsivity and aggression, with studies finding significant interactions among the DRD4-7 repeat polymorphism and caregiver quality in predicting higher levels of aggression and impulsive traits in infants and preschoolers (Bakermans-Kranenburg & van Ijzendoorn, 2006 Sheese, Voelker, Rothbart, & Posner, 2007), and interactions between SES and the DRD4 gene for aggression in pre-adolescents (Nobile et al., 2007). Thus, genes implicated in multiple neurotransmitter pathways work in conjunction with a host of social and environmental experiences to alter individual differences across multiple behaviors and traits.

Additional Gene-Environment Interplay

While the above section concerns statistical interactions between genes and environments which may represent genetic sensitivity to environmental stressors, or, alternatively, environmental exacerbation of genetic effects, another potentially important avenue for research concerns the dynamic interplay between genes and environments, that is, genetic influence on البيئات and environmental influences on genes. By now, it is fairly common knowledge that when measures of family environment are treated as ‘phenotypes’ in traditional behavioral genetic models, significant genetic influences on these measures are often detected (Plomin & Bergeman, 1991). Decades of behavioral genetic studies have provided considerable evidence for significant genetic influence for measures such as various dimensions of parenting, indices of SES such as income and educational level, social support, and stressful life events (see Kendler & Baker [2007] for a recent review). What has been slower to develop, however, is the notion that environmental influences and experiences can have profound effects on genetic influence. While the underlying DNA structure and sequence individuals are born with does not change over time, a newer area of research in epigenetics is beginning to identify factors that may alter gene expression and function across the lifespan.

Epigenetics, defined formally as changes in gene expression caused by mechanisms other than changes in the underlying DNA sequence, offers an exciting new frontier in the study of human psychiatric and medical diseases, and psychological behaviors and traits. Epigenetic mechanisms include DNA methylation and chromatin remodeling, the latter via post-translational modifications (e.g. methylation, acetylation, phosphorylation and ubiquitylation) to histone proteins which form the scaffold for the DNA helix. Although some epigenetic processes are essential to organism function (e.g., differentiation of cells in the developing embryo during morphogenesis), other epigenetic processes can have major adverse effects on health and behavioral outcomes. While some epigenetic changes only occur within the course of one individual organism's lifetime, animal models suggest that other epigenetic changes can be inherited from one generation to the next (see Champagne [2008] for a review), contributing, in part, to the heritability of behavioral traits and psychiatric disease.

However, a growing field of research suggests that environmental experiences, particularly those related to stress, have the capacity to alter biological and genetic mechanisms associated with increased risk of problem behavior. Again, the notion that environmental experience can change biological processes has important historical precedence. Harlow’s seminal deprivation studies of non-human primates have shown that disruptions in early rearing environments have the capacity to disrupt psychobiological regulatory functions, leading to behavioral changes. Other important animal research has begun to identify the precise mechanisms by which social environmental factors can alter epigenetic programming. Relatively recent research using animal models offers an elegant demonstration of how early environmental stressors can alter neurobiological responsivity to future stressful conditioning (Meaney, 2001). Meaney’s model highlights how individual differences in maternal behaviors can cause regulatory changes in the corticotropin releasing hormone (CRH) system at the level of the central nucleus of the amygdala, and how these changes relate further to changes in adrenocortical and autonomic effects of later stressful events. Importantly, his work suggests that these effects can be altered through intervention (Weaver et al., 2005). Differences in early maternal care have also been associated with differences in methylation of the glucocorticoid receptor gene promoter in the hippocampus (Meaney & Szyf, 2005). Most critically, a recent comparison of post-mortem brain tissue from a sample of patients with a history of child abuse and/or neglect and who died by suicide indicated DNA hypermethylation of the rRNA promoter region in the hippocampus relative to controls who experienced sudden, accidental death (McGowan et al., 2008), supporting the hypothesis that epigenetic changes due to social and environmental experiences are related to behavioral traits.

Other studies of monozygotic twins have identified variations in DNA methylation levels in certain target gene promoter regions. Because identical twins share identical genomes and experience many of the same family environmental factors, this indicates that environmental experiences that are not shared among children in the same family have an important causal role in gene expression, and may further be related to behavioral differences among identical twin pairs. Importantly, within-pair differences in DNA methylation and histone acetylation patterns were increased in older twin pairs, especially those who had different lifestyles and had spent fewer years of their lives together, strongly supporting epigenetic processes as a part of nonshared environmental influence on individual differences (Fraga et al., 2005). This suggests that epigenetic processes represent a fundamental gene-environment interface in the development and ongoing plasticity of the human brain.

الاستنتاجات

While there is no doubt that genetic studies of individual behaviors and traits will increase our understanding of both normal human variation and pathological disorders, there is increasing recognition that the interplay between genes and environments is remarkably complex. Not only are both genes and environments important for both normal and abnormal human development, but genes and environments operate interactively to produce both risk and resilience to specific behavioral and psychiatric disorders. More importantly, emerging lines of research from epigenetics suggest that not only can nature alter nurture, but nurture, in turn, has the power to modify nature. Thus, genomic studies that incorporate a range of social and environmental influences will further our understanding of the complex dance between nature and nurture in human development.

Bakermans-Kranenburg, M. J., & van Ijzendoorn, M. H. (2006). Gene-environment interaction of the dopamine d4 receptor (drd4) and observed maternal insensitivity predicting externalizing behavior in preschoolers. Dev Psychobiol, 48(5), 406-409.

Bronfenbrenner, U., & Ceci, S. J. (1994). Nature-nurture reconceptualized in developmental perspective: A bioecological model. Psychol Rev, 101(4), 568-586.

Button, T. M., Scourfield, J., Martin, N., Purcell, S., & McGuffin, P. (2005). Family dysfunction interacts with genes in the causation of antisocial symptoms. Behav Genet, 35(2), 115-120.

Cadoret, R. J., Yates, W. R., Troughton, E., Woodworth, G., & Stewart, M. A. (1995). Genetic-environmental interaction in the genesis of aggressivity and conduct disorders. Arch Gen Psychiatry, 52(11), 916-924.

Canli, T., & Lesch, K.-P. (2007). Long story short: The serotonin transporter in emotion regulation and social cognition. Nat Neurosci, 10(9), 1103.

Canli, T., Q. M., Omura, K., Congdon, E., Haas, B.W., Amin, Z., Herrmann, M.J., et al. (2006). Neural correlates of epigenesis. Proc Natl Acad Sci, 103, 16033-16038.

Caspi, A., McClay, J., Moffitt, T. E., Mill, J., Martin, J., Craig, I. W., et al. (2002). Role of genotype in the cycle of violence in maltreated children. علم, 297(5582), 851-854.

Champagne, F. A. (2008). Epigenetic mechanisms and the transgenerational effects of maternal care. Front Neuroendocrinol, 29(3), 386-397.

Cloninger, C. R., & Gottesman, I. (1987). Genetic and environmental factors in antisocial behavior disorder. In S. A. Mednick, T. E. Moffitt & S. A. Stack (Eds.), The causes of crime: New biological approaches (pp. 99-102). Cambridge: Cambridge University Press.

Dick, D. M., Rose, R. J., Viken, R. J., Kaprio, J., & Koskenvuo, M. (2001). Exploring gene-environment interactions: Socioregional moderation of alcohol use. J Abnorm Psychol, 110(4), 625-632.

Dick, D. M., Viken, R., Purcell, S., Kaprio, J., Pulkkinen, L., & Rose, R. J. (2007). Parental monitoring moderates the importance of genetic and environmental influences on adolescent smoking. J Abnorm Psychol, 116(1), 213-218.

Fraga, M. F., Ballestar, E., Paz, M. F., Ropero, S., Setien, F., Ballestar, M. L., et al. (2005). Epigenetic differences arise during the lifetime of monozygotic twins. Proc Natl Acad Sci U S A, 102(30), 10604-10609.

Kendler, K. S., & Baker, J. H. (2007). Genetic influences on measures of the environment: A systematic review. Psychol Med, 37(5), 615-626.

Kendler, K. S., Jacobson, K., Myers, J. M., & Eaves, L. J. (2008). A genetically informative developmental study of the relationship between conduct disorder and peer deviance in males. Psychol Med, 38(7), 1001-1011.

Kim-Cohen, J., Caspi, A., Taylor, A., Williams, B., Newcombe, R., Craig, I. W., et al. (2006). MAOA, maltreatment, and gene-environment interaction predicting children's mental health: New evidence and a meta-analysis. Mol Psychiatry, 11(10), 903-913.

Koopmans, J. R., Slutske, W. S., Heath, A. C., Neale, M. C., & Boomsma, D. I. (1999). The genetics of smoking initiation and quantity smoked in dutch adolescent and young adult twins. Behav Genet, 29(6), 383-393.

McGowan, P. O., Sasaki, A., Huang, T. C., Unterberger, A., Suderman, M., Ernst, C., et al. (2008). Promoter-wide hypermethylation of the ribosomal rna gene promoter in the suicide brain. PLoS ONE, 3(5), e2085.

Meaney, M. J. (2001). Maternal care, gene expression, and the transmission of individual differences in stress reactivity across generations. Annu Rev Neurosci, 24, 1161-1192.

Meaney, M. J., & Szyf, M. (2005). Maternal care as a model for experience-dependent chromatin plasticity? Trends Neurosci, 28(9), 456-463.

Nobile, M., Giorda, R., Marino, C., Carlet, O., Pastore, V., Vanzin, L., et al. (2007). Socioeconomic status mediates the genetic contribution of the dopamine receptor d4 and serotonin transporter linked promoter region polymorphisms to externalization in preadolescence. Development and Psychopathology, 19(4), 1147-1160.

Plomin, R., & Bergeman, C. S. (1991). The nature of nurture: Genetic influence on "environmental" measures. Behavioral & Brain Sciences, 14, 373-427.

Rowe, D. C., Almeida, D. M., & Jacobson, K. C. (1999). School context and genetic influences on aggression in adolesceence. Psychological Science, 10, 277-280.

Sheese, B., Voelker, P., Rothbart, M., & Posner, M. (2007). Parenting quality interacts with genetic variation in dopamine receptor d4 to influence temperament in early childhood. Developmental Psychopathology, 19, 1039-1046.

Timberlake, D. S., Rhee, S. H., Haberstick, B. C., Hopfer, C., Ehringer, M., Lessem, J. M., et al. (2006). The moderating effects of religiosity on the genetic and environmental determinants of smoking initiation. Nicotine Tob Res, 8(1), 123-133.

Verona, E., Joiner, T. E., Johnson, F., & Bender, T. W. (2006). Gender specific gene-environment interactions on laboratory-assessed aggression. Biol Psychol, 71(1), 33-41.

Weaver, I. C., Champagne, F. A., Brown, S. E., Dymov, S., Sharma, S., Meaney, M. J., et al. (2005). Reversal of maternal programming of stress responses in adult offspring through methyl supplementation: Altering epigenetic marking later in life. J Neurosci, 25(47), 11045-11054.


شاهد الفيديو: إختبار الحمض النووي لمعرفة أصلي. نتيجه غير متوقعه (أغسطس 2022).