عينات مترابطة – correlated samples

مدرس الدكتور محمد لوتي

المحتويات:

العينات المترابطة (Correlated Samples)

التخصصات الأساسية: الإحصاء، منهجيات البحث التجريبي، علم النفس، الاقتصاد القياسي.

1. التعريف الجوهري والسياق المنهجي

تُعرف العينات المترابطة، التي يُشار إليها أحياناً باسم “العينات التابعة” أو “القياسات المتكررة”، بأنها مجموعات من البيانات الإحصائية حيث توجد علاقة نظامية أو تبعية غير عشوائية بين الملاحظات في مجموعة بيانات واحدة والملاحظات المقابلة في مجموعة بيانات أخرى. على النقيض من العينات المستقلة، التي يتم سحبها بشكل عشوائي تماماً بحيث لا يؤثر اختيار عنصر في مجموعة على اختيار أي عنصر في المجموعة الأخرى، تنشأ العينات المترابطة عندما يتم أخذ ملاحظتين أو أكثر من نفس الوحدة الإحصائية أو عندما يتم إقران وحدات مختلفة بناءً على سمة معينة. هذا الارتباط غالباً ما يكون نتيجة لتصميم البحث نفسه، مما يجعله اختياراً منهجياً واعياً يهدف إلى تقليل التباين وزيادة القوة الإحصائية.

يُعد تصميم القياسات المتكررة (Repeated Measures Design) هو الشكل الأكثر شيوعاً لتوليد العينات المترابطة، حيث يتم تعريض نفس الأفراد لظروف علاجية مختلفة أو قياسهم في نقاط زمنية متعددة. وفي هذه الحالة، يكون كل فرد بمثابة ضابط لنفسه، مما يضمن أن أي اختلافات ملاحظة بين الظروف العلاجية لا يمكن أن تُعزى إلى اختلافات فردية سابقة بين المشاركين (مثل الذكاء، أو الخلفية الاجتماعية)، وهو ما يحدث عند استخدام مجموعات مستقلة. إن القدرة على التحكم في التباين الناجم عن الفروق الفردية هي السمة المميزة والدافع الرئيسي وراء استخدام هذا النوع من التصاميم في الأبحاث التجريبية، خاصة في مجالات العلوم الاجتماعية والطبية التي تتعامل مع التباين البشري الكبير.

من المهم التمييز بين الارتباط الناتج عن القياسات المتكررة على نفس الوحدة، والارتباط الناتج عن الإقران أو المطابقة (Matching). في حين أن كلاهما ينتج عينات مترابطة، فإن المطابقة تنطوي على اختيار أفراد مختلفين وإقرانهم بناءً على متغيرات “مربكة” (Confounding Variables) محتملة، مثل العمر أو مستوى التعليم، لضمان تكافؤ المجموعات قدر الإمكان قبل تطبيق العلاج. ومع ذلك، فإن النتيجة الإحصائية في كلتا الحالتين هي وجود معامل ارتباط (Correlation Coefficient) غير صفري بين المجموعات، مما يتطلب استخدام اختبارات إحصائية مصممة خصيصاً للبيانات التابعة، مثل اختبار ت للمجموعات المزدوجة (Paired Samples t-test) أو تحليل التباين للقياسات المتكررة (Repeated Measures ANOVA).

2. الأسس الرياضية والإحصائية للارتباط

يعتمد التحليل الرياضي للعينات المترابطة على مفهوم التغاير (Covariance) والارتباط. عندما تكون العينات مترابطة، فإن التباين المشترك بين المجموعتين (أي مدى تغيرهما معاً) لا يكون صفراً. يتم التعبير عن هذه العلاقة كمياً باستخدام معامل الارتباط (مثل معامل ارتباط بيرسون)، حيث تشير القيمة القريبة من +1 أو -1 إلى ارتباط قوي، بينما تشير القيمة القريبة من الصفر إلى ضعف الارتباط أو استقلالية العينات.

إن السمة الإحصائية الحاسمة للعينات المترابطة هي أن تباين الفرق بين المجموعتين (Variance of the Difference) يكون أقل بكثير مما لو كانت العينات مستقلة. رياضياً، تباين الفرق بين متوسطي مجموعتين مستقلتين يساوي مجموع تباين كل مجموعة على حدة. ولكن في حالة العينات المترابطة، يتم طرح ضعف التغاير (2 * Covariance) من هذا المجموع. ونظراً لأن التغاير عادةً ما يكون إيجابياً في تصاميم القياسات المتكررة (لأن الفرد الذي يسجل درجة عالية في القياس الأول يميل إلى التسجيل عالياً في القياس الثاني)، فإن طرح هذا التغاير يقلل بشكل كبير من الخطأ المعياري للفرق (Standard Error of the Difference). هذا التخفيض في الخطأ المعياري هو ما يمنح تصميمات العينات المترابطة قوتها الإحصائية المتزايدة.

تؤثر آلية التبعية هذه على حساب درجات الحرية (Degrees of Freedom) المستخدمة في الاختبارات الإحصائية. ففي اختبار تاء (t-test) للعينات المزدوجة، لا يتم التعامل مع المجموعتين كـ (ن1 + ن2) من الملاحظات الإجمالية، بل يتم التعامل معها كـ (ن – 1) من أزواج الفروق، حيث ن هي عدد الأزواج. هذا التركيز على توزيع الفروق بدلاً من توزيع الملاحظات الخام هو جوهر التحليل الإحصائي للبيانات التابعة. ويضمن هذا التعديل أن الافتراضات الإحصائية، وخاصة افتراض الاستقلال (Independence Assumption) الذي تفرضه معظم الإحصائيات البارامترية، لا يتم انتهاكها، لأنه يتم التعامل مع الفرق بين الأزواج كمتغير مستقل واحد.

3. أنواع تصميمات العينات المترابطة

تنقسم تصميمات العينات المترابطة إلى فئتين رئيسيتين، لكل منهما مزاياها وتحدياتها المنهجية:

التصميمات داخل الموضوع (Within-Subjects Designs): وهي الحالة الأكثر شيوعاً، حيث يتعرض نفس المشاركين لجميع مستويات المتغير المستقل. يتم قياس سلوك أو خاصية المشارك قبل وبعد التدخل (Pre-test/Post-test)، أو مقارنة استجاباتهم لظروف علاجية متعددة. هذا النوع يضمن أعلى درجة من التبعية والتحكم في الفروق الفردية.
تصميمات المطابقة أو الإقران (Matched-Pairs Designs): في هذه التصميمات، يتم استخدام مشاركين مختلفين، ولكن يتم إقرانهم على أساس خصائص معينة يعتقد الباحث أنها قد تؤثر على المتغير التابع. على سبيل المثال، إقران مرضى بناءً على شدة المرض، أو إقران الطلاب بناءً على معدل الذكاء. هذا يحاكي جزئياً مزايا التصميمات داخل الموضوع دون تعريض نفس الفرد لجميع الظروف.
العينات الطبيعية المترابطة (Naturally Occurring Correlated Samples): تحدث هذه عندما تكون الوحدات مرتبطة بطبيعتها، مثل دراسة الأزواج، التوائم المتماثلة، أو أفراد العائلة الواحدة. في هذه الحالات، يكون الارتباط ناتجاً عن عوامل وراثية أو بيئية مشتركة، وليس عن تدخل الباحث، لكن التحليل الإحصائي يظل يتطلب منهجية التعامل مع البيانات التابعة.

يُعد اختيار التصميم المناسب مسألة توازن بين الكفاءة المنهجية والمخاطر. ففي التصميمات داخل الموضوع، على الرغم من تقليل التباين، يجب على الباحث أن يتصدى لمشكلة “تأثيرات الحمل” (Carryover Effects)، حيث قد يؤثر التعرض للعلاج الأول على استجابة الفرد للعلاج الثاني. وللتخفيف من هذه المشكلة، غالباً ما يتم استخدام أساليب الموازنة المعاكسة (Counterbalancing)، مثل تغيير ترتيب تقديم الظروف التجريبية.

بالمقابل، يوفر تصميم الإقران حلاً وسطاً مفيداً عندما يكون تصميم القياسات المتكررة غير ممكن (كما هو الحال في الدراسات التي قد يكون فيها العلاج الأول دائماً أو لا رجعة فيه). ومع ذلك، فإن المطابقة الكاملة للوحدات أمر صعب، وغالباً ما يستطيع الباحثون المطابقة على عدد محدود فقط من المتغيرات، مما يعني أن العينات قد تظل غير متكافئة بالنسبة للمتغيرات المربكة الأخرى غير المقاسة.

4. القوة الإحصائية ومزايا استخدام العينات التابعة

تُعد القوة الإحصائية (Statistical Power) هي الميزة الأبرز والأكثر أهمية لاستخدام العينات المترابطة. تُعرف القوة الإحصائية بأنها احتمالية رفض فرضية العدم الخاطئة (أي احتمالية اكتشاف تأثير حقيقي إذا كان موجوداً). ونظراً لأن تصميمات العينات المترابطة تقلل بشكل كبير من تباين الخطأ، فإنها تؤدي إلى خطأ معياري أصغر، مما ينتج عنه قيمة اختبار إحصائي (مثل قيمة T) أكبر، وبالتالي زيادة في القوة الإحصائية.

هذا الارتفاع في القوة الإحصائية له آثار عملية كبيرة. فهو يسمح للباحثين باستخدام أحجام عينات أصغر مع الحفاظ على نفس القدرة على اكتشاف التأثيرات مقارنة بتصميم المجموعات المستقلة. وهذا أمر بالغ الأهمية في الأبحاث التي تكون فيها عملية جمع البيانات مكلفة، أو تستغرق وقتاً طويلاً، أو تتضمن مجموعات سكانية نادرة أو يصعب الوصول إليها. وبالتالي، فإن الكفاءة الاقتصادية والزمنية هي ميزة مباشرة لتصاميم العينات المترابطة.

إضافة إلى ذلك، توفر العينات المترابطة حساسية منهجية عالية للتغيرات داخل الأفراد. فبدلاً من النظر فقط إلى متوسطات المجموعات، تسمح هذه التصاميم للباحثين بفحص مدى استجابة كل فرد للتدخل. هذه القدرة على عزل التغيرات الناتجة عن المعالجة التجريبية عن التباين الناتج عن الفروق الفردية تجعل الاستنتاجات المتعلقة بالسببية (Causality) أكثر قوة ودقة، خاصة عند التعامل مع الظواهر التي تتسم بتقلبات فردية عالية.

5. التحديات المنهجية وقيود العينات المترابطة

على الرغم من المزايا الإحصائية، تواجه العينات المترابطة، خاصة في تصميم القياسات المتكررة، تحديات منهجية معقدة يجب معالجتها بعناية لضمان صحة النتائج. التحدي الأهم هو “تأثير الترتيب” (Order Effects) أو “تأثير الحمل” (Carryover Effects). يحدث تأثير الترتيب عندما يؤثر مجرد ترتيب تقديم الظروف التجريبية، بغض النظر عن محتوى الظروف، على النتائج (مثل التعب أو التعلم من المهمة السابقة). ويحدث تأثير الحمل عندما يستمر تأثير علاج معين ليؤثر على استجابة المشارك للعلاج اللاحق.

لمواجهة هذه الآثار، يجب على الباحثين استخدام تقنيات الموازنة المعاكسة، مثل الموازنة المعاكسة الكاملة (حيث يتم اختبار جميع الترتيبات الممكنة) أو استخدام المربع اللاتيني (Latin Square) عندما يكون عدد الظروف كبيراً جداً بحيث لا يمكن اختبار جميع الترتيبات. ومع ذلك، حتى مع الموازنة المعاكسة، قد لا يتم إلغاء تأثيرات الحمل بشكل كامل، خاصة إذا كان تأثير العلاج الأول لا رجعة فيه أو دائماً.

في التحليل الإحصائي المتقدم (مثل تحليل التباين للقياسات المتكررة)، يظهر قيد إحصائي مهم يُعرف باسم “افتراض الكروية” (Sphericity Assumption). يتطلب افتراض الكروية أن تكون الفروق بين جميع أزواج مستويات العامل داخل الموضوع متساوية. إذا تم انتهاك هذا الافتراض، فإن ذلك يؤدي إلى زيادة معدل الخطأ من النوع الأول (Type I Error Rate)، مما يعني أن الباحث قد يستنتج وجود تأثير في حين أنه غير موجود بالفعل. ولتصحيح هذا الانتهاك، يتم استخدام تعديلات إحصائية مثل تعديل غرينهاوس-غايسر (Greenhouse-Geisser) أو هويينفيلدت (Huynh-Feldt)، والتي تقوم بتخفيض درجات الحرية لتقليل احتمالية الخطأ.

بالإضافة إلى ذلك، قد تؤدي التصاميم المترابطة إلى “تأثير ممارسة” (Practice Effect) أو “تأثير إجهاد” (Fatigue Effect). فكلما زاد عدد المرات التي يتم فيها قياس المشارك، زادت احتمالية أن يتحسن أداؤه بسبب التعلم من التجربة السابقة (الممارسة)، أو أن ينخفض أداؤه بسبب التعب والإرهاق (الإجهاد). هذه الآثار المنهجية تعقد تفسير النتائج وتتطلب من الباحثين تصميم فترات راحة كافية بين الظروف التجريبية أو الحد من عدد القياسات المتكررة التي يتعرض لها المشارك الواحد.

6. الاختبارات الإحصائية المرتبطة بالعينة المترابطة

تتطلب العينات المترابطة مجموعة خاصة من الاختبارات الإحصائية التي تأخذ التبعية في الاعتبار، سواء كانت بارامترية (تفترض توزيعاً طبيعياً) أو غير بارامترية (لا تفترض توزيعاً طبيعياً):

اختبار تاء للعينات المزدوجة (Paired Samples t-test): يُستخدم عندما يكون هناك مجموعتان مترابطتان فقط (مثل قبل وبعد). هذا الاختبار يحسب متوسط الفرق بين الأزواج ويقارنه بالصفر.
تحليل التباين للقياسات المتكررة (Repeated Measures ANOVA): يُستخدم عندما يكون هناك ثلاث مجموعات مترابطة أو أكثر. هذا التحليل يسمح للباحث بتقييم ما إذا كانت متوسطات القياسات المتعددة تختلف بشكل كبير، مع التحكم في التباين بين الأفراد.
اختبار مكنيما (McNemar’s Test): وهو اختبار غير بارامتري يُستخدم لتحليل البيانات الفئوية (الاسمية) المترابطة، وغالباً ما يُستخدم لتقييم التغيرات في الاستجابة (نعم/لا) قبل وبعد التدخل.
اختبار ويلكوكسون للرتب الموقعة (Wilcoxon Signed-Rank Test): وهو البديل غير البارامتري لاختبار تاء للعينات المزدوجة، ويُستخدم عندما تفشل البيانات في تلبية افتراضات اختبار تاء، خاصة افتراض التوزيع الطبيعي للفروق.

إن الاختيار الصحيح للاختبار الإحصائي أمر حيوي لضمان صحة الاستدلال. فاستخدام اختبار تاء للمجموعات المستقلة لتحليل البيانات المترابطة يشكل انتهاكاً صارخاً لافتراض الاستقلال، مما يؤدي عادةً إلى تضخيم الخطأ المعياري، وبالتالي تقليل القوة الإحصائية بشكل غير مبرر، وقد يؤدي إلى فشل الباحث في اكتشاف تأثير حقيقي.

7. التطبيقات العملية والمجالات البحثية

تنتشر تطبيقات العينات المترابطة في مجموعة واسعة من المجالات البحثية نظراً لكفاءتها العالية في التحكم بالمتغيرات المربكة:

علم النفس التجريبي: دراسة تأثير دواء جديد على أداء الذاكرة (القياس قبل الدواء وبعده)، أو مقارنة سرعة استجابة المشارك لمؤثرين بصريين مختلفين داخل نفس الجلسة.
الطب والصيدلة: تقييم فعالية علاج طبي من خلال قياس مستوى مؤشر حيوي معين لدى نفس المريض في بداية العلاج ونهايته. هذه التصاميم أساسية في التجارب السريرية لتقليل الحاجة إلى أعداد كبيرة من المرضى.
التعليم: قياس تحصيل الطلاب قبل وبعد تطبيق منهج تدريسي جديد، أو مقارنة أداء التوائم المتماثلة الذين تعرضوا لبيئات تعلم مختلفة (عينات مترابطة طبيعياً).
الاقتصاد القياسي: تحليل بيانات السلاسل الزمنية (Time Series Data) حيث تكون الملاحظات المتتالية لنفس الوحدة الاقتصادية (مثل سعر السهم أو الناتج القومي) مترابطة بشكل واضح مع القياسات السابقة.