عينات مرتبطة – dependent samples

مدرس الدكتور محمد لوتي

المحتويات:

العينات المعتمدة (Dependent Samples)

المجال (المجالات) التخصصية الرئيسية: الإحصاء، ومنهجية البحث العلمي

1. التعريف الجوهري

تمثل العينات المعتمدة، والتي يُشار إليها أحياناً باسم العينات المقترنة أو القياسات المتكررة، تصميماً بحثياً إحصائياً حيث تكون الملاحظات في مجموعة بيانات واحدة مرتبطة بشكل منهجي أو متطابق مع الملاحظات في مجموعة بيانات أخرى. هذا الارتباط ليس مصادفة، بل هو نتيجة مباشرة لاستخدام نفس الوحدات التجريبية (الأفراد، الأزواج، الكائنات) في ظروف مختلفة أو عبر نقاط زمنية متباينة. يكمن جوهر هذا المفهوم في أن كل نقطة بيانات في إحدى المجموعتين تقابلها نقطة بيانات فريدة ومقترنة في المجموعة الأخرى، مما يلغي التباين الناتج عن الاختلافات الفردية بين المشاركين، وهو ما يعد ميزة منهجية كبرى مقارنة بتصاميم العينات المستقلة. إن فهم طبيعة هذا الاعتماد أمر حاسم لأنه يحدد الاختبار الإحصائي المناسب المستخدم لتحليل الفروق بين المجموعات، حيث تتطلب العينات المعتمدة أدوات إحصائية مصممة خصيصاً للتعامل مع التباين المشترك (Covariance) بين الأزواج.

يتمثل الهدف الأساسي من استخدام تصميم العينات المعتمدة في زيادة القوة الإحصائية للبحث، وذلك عبر عزل تأثير المعالجة أو التدخل عن الضوضاء الإحصائية التي تسببها الفروق الفردية الكامنة بين المشاركين. ففي حالة العينات المستقلة، يتم توزيع التباين الكلي الناتج عن الفروق بين الأفراد على الخطأ العشوائي، مما يقلل من قدرة الباحث على اكتشاف التأثير الحقيقي للمعالجة. في المقابل، يتيح تصميم العينات المعتمدة إمكانية قياس الفرق داخل الفرد الواحد أو الزوج المتطابق، مما يسمح باستبعاد هذا التباين الداخلي من تقدير الخطأ، وبالتالي يؤدي إلى مقياس أكثر دقة لتأثير المتغير المستقل. هذا التركيز على الفرق بدلاً من المتوسطات المطلقة هو السمة المميزة التي تحدد طريقة التحليل الإحصائي اللاحقة.

من الناحية العملية، يمكن أن يتخذ الاعتماد شكلين رئيسيين: القياسات المتكررة (Repeated Measures)، حيث يتم قياس نفس المجموعة من الأفراد قبل وبعد تدخل معين أو تحت ظروف مختلفة؛ أو الأزواج المتطابقة (Matched Pairs)، حيث يتم اختيار فردين مختلفين وتطابقهما بعناية فائقة بناءً على متغيرات ديموغرافية أو سلوكية ذات صلة (مثل العمر، الجنس، مستوى الذكاء) قبل تعريض كل منهما لمعالجة مختلفة. وفي كلتا الحالتين، يكون الافتراض الأساسي هو وجود ارتباط إحصائي إيجابي بين قيم القياسات المقترنة، مما يعني أن معرفة قيمة القياس للفرد (أ) في الظرف الأول تسمح بتوقع قيمة قياسه في الظرف الثاني بدرجة ما من الدقة.

2. السياق المنهجي والتطور التاريخي

نشأ استخدام العينات المعتمدة وتطور بشكل ملحوظ بالتوازي مع نمو الإحصاء الاستدلالي في أوائل ومنتصف القرن العشرين، خاصة في مجالات علم النفس التجريبي والطب الحيوي. كان الدافع وراء هذا التطور هو الحاجة إلى تصميمات بحثية أكثر كفاءة وقدرة على التحكم في المتغيرات المربكة (Confounding Variables). قبل تبني هذه المنهجيات على نطاق واسع، كانت التصاميم البحثية تعتمد بشكل كبير على العينات المستقلة (المجموعات الضابطة والعلاجية المختلفة)، والتي كانت تتطلب أعداداً كبيرة جداً من المشاركين لتحقيق القوة الإحصائية الكافية، نظراً للتباين الكبير بين الأفراد.

تجسد التقدم المنهجي الأكبر في إدخال اختبار تاء للعينات المزدوجة (Paired Samples t-test)، الذي كان تطويراً منطقياً لاختبار تاء المخصص للعينات المستقلة. لقد أتاح هذا الاختبار، الذي يركز على توزيع فروق الدرجات بدلاً من توزيع الدرجات نفسها، إمكانية تحليل البيانات المقترنة بطريقة إحصائية سليمة. وقد أدى هذا التحول إلى ثورة في البحث التجريبي، حيث أصبح الباحثون قادرين على استخدام الأفراد كضوابط لأنفسهم، مما قلل الحاجة إلى مجموعات ضابطة منفصلة وزاد من كفاءة التجارب، خاصة في البيئات التي يكون فيها حجم العينة محدوداً أو يصعب الحصول عليها، كما هو الحال في التجارب السريرية المعقدة أو الدراسات الطولية.

لم يقتصر التطور على الاختبارات المعيارية (Parametric)، بل امتد ليشمل الأساليب غير المعيارية (Non-parametric) للتعامل مع العينات المعتمدة عندما لا تتحقق الافتراضات الإحصائية الضرورية (مثل التوزيع الطبيعي). ويعتبر اختبار ويلكوكسون للرتب الموقعة (Wilcoxon Signed-Rank Test) مثالاً بارزاً على هذا التطور، مما أتاح للباحثين أدوات قوية للتعامل مع البيانات الترتيبية أو تلك التي تنتهك بشدة افتراضات اختبار تاء. ومع تطور القدرات الحاسوبية في أواخر القرن العشرين، أصبح من الممكن تطبيق امتدادات أكثر تعقيداً للعينات المعتمدة، مثل تحليل التباين للقياسات المتكررة (Repeated Measures ANOVA)، الذي يسمح بتقييم تأثيرات متغير مستقل على متغير تابع عبر أكثر من نقطتين زمنيتين.

3. الخصائص الرئيسية والأشكال

تتميز العينات المعتمدة بعدة خصائص منهجية رئيسية تميزها عن العينات المستقلة، وأبرزها وجود معامل ارتباط (Correlation Coefficient) غير صفري بين المجموعتين المقارنتين. هذا الارتباط هو ما يسمح للتحليل الإحصائي باستبعاد التباين بين الأفراد. إذا كان الارتباط بين القياسات المقترنة ضعيفاً أو معدوماً، فإن استخدام تصميم العينات المعتمدة قد لا يوفر ميزة إحصائية كبيرة على العينات المستقلة، بل قد يؤدي إلى تعقيد التحليل دون مبرر. لذلك، فإن القوة الإحصائية لهذا التصميم تتناسب طردياً مع قوة الارتباط بين القياسات المقترنة.

تتجسد العينات المعتمدة في شكلين أساسيين ومتميزين، ولكل منهما سياقه البحثي المثالي. أولاً، تصميم القياسات المتكررة (Within-Subjects Design)، وهو الأكثر شيوعاً، حيث يخضع نفس الأفراد لجميع مستويات المتغير المستقل. مثال كلاسيكي هو تصميم ما قبل الاختبار/ما بعد الاختبار (Pre-test/Post-test) لتقييم فعالية برنامج تدريبي أو دواء جديد، حيث يتم قياس المتغير التابع مرتين على نفس المجموعة. الميزة هنا هي التحكم المطلق في جميع متغيرات الفروق الفردية غير المقاسة (مثل الذكاء، الدافع، الخلفية الشخصية) لأن الفرد يخدم كمرجع لنفسه.

ثانياً، تصميم الأزواج المتطابقة (Matched-Pairs Design)، حيث يتم تعيين أفراد مختلفين ولكنهم متطابقون بشكل منهجي في أزواج بناءً على متغيرات معينة يُعتقد أنها تؤثر على المتغير التابع. على سبيل المثال، في دراسة مقارنة بين طريقتي تدريس، قد يتم مطابقة الطلاب بناءً على معدلاتهم السابقة وذكائهم، ثم يتم تعيين فرد من كل زوج بشكل عشوائي لإحدى الطريقتين. وعلى الرغم من أن هذا التصميم لا يتحكم بشكل مثالي في جميع الفروق الفردية كما في القياسات المتكررة، إلا أنه مفيد عندما لا يكون إجراء قياسات متكررة ممكناً أو مرغوباً فيه (لتجنب تأثيرات الممارسة أو التعب)، ويوفر مستوى تحكم أعلى بكثير مما توفره العينات المستقلة العشوائية.

4. الاختبارات الإحصائية المرتبطة

تتطلب العينات المعتمدة مجموعة خاصة من الاختبارات الإحصائية التي تأخذ في الاعتبار الارتباط بين الملاحظات. إن تطبيق اختبارات العينات المستقلة على بيانات معتمدة يعتبر خطأ إحصائياً جسيماً يؤدي إلى تضخيم معدلات الخطأ من النوع الأول (Type I Error) أو فقدان القوة الإحصائية. يعتبر اختبار تاء للعينات المزدوجة (Paired Samples t-test) هو الأداة الأكثر استخداماً في حالة البيانات المعيارية وتوفر افتراضات التوزيع الطبيعي للفروق، ويتمحور هذا الاختبار حول اختبار فرضية أن متوسط الفروق بين أزواج القياسات يساوي صفراً.

يعتمد اختبار تاء المزدوج على حساب الفرق (D) بين كل زوج من القياسات (القياس 2 – القياس 1)، ثم يتم التعامل مع مجموعة الفروق هذه كأنها عينة واحدة يتم اختبارها مقابل قيمة مرجعية صفرية. إن حقيقة أن التحليل يركز على الفروق هي ما يسمح بإلغاء التباين بين الأفراد. وتشمل الافتراضات الرئيسية لهذا الاختبار: أن تكون القياسات المقترنة على مقياس فاصل أو نسبي، وأن يتم اختيار الأزواج عشوائياً، والأهم هو أن يكون توزيع فروق الدرجات (D) طبيعياً. إذا تم انتهاك افتراض التوزيع الطبيعي بشكل كبير، خاصة في أحجام العينات الصغيرة، يجب اللجوء إلى البدائل غير المعيارية.

أما بالنسبة للبيانات التي لا تستوفي افتراضات المعيارية أو تكون على مقياس ترتيبي (Ordinal)، يتم استخدام اختبار ويلكوكسون للرتب الموقعة (Wilcoxon Signed-Rank Test). هذا الاختبار هو المكافئ غير المعياري لاختبار تاء المزدوج. بدلاً من استخدام قيم الفروق الفعلية، يقوم اختبار ويلكوكسون بترتيب القيم المطلقة للفروق، ثم يعطي إشارة موجبة أو سالبة لكل رتبة بناءً على اتجاه الفرق الأصلي. ويتمثل جوهر الاختبار في مقارنة مجموع الرتب ذات الإشارة الموجبة بمجموع الرتب ذات الإشارة السالبة لتحديد ما إذا كانت الفروق تتجه بشكل منهجي في اتجاه واحد (أي أن المعالجة كان لها تأثير). بالإضافة إلى ذلك، عند التعامل مع تصاميم القياسات المتكررة التي تشمل أكثر من مجموعتين (على سبيل المثال، قياسات في الزمن 1، الزمن 2، والزمن 3)، يُستخدم تحليل التباين للقياسات المتكررة (Repeated Measures ANOVA)، والذي يعد امتداداً معقداً لهذه المنهجية، ويتطلب افتراضات إضافية مثل افتراض الكروية (Sphericity) الذي يجب اختباره باستخدام اختبار ماوتشلي (Mauchly’s Test).

5. مزايا وعيوب استخدام العينات المعتمدة

تقدم تصاميم العينات المعتمدة مزايا إحصائية ومنهجية واضحة تجعلها الخيار المفضل في العديد من البحوث التجريبية والسريرية. الميزة الأكثر أهمية هي زيادة القوة الإحصائية (Increased Statistical Power). من خلال التحكم في التباين بين الأفراد، يتم تقليل الخطأ المتبقي، مما يزيد من حساسية الاختبار الإحصائي لاكتشاف تأثير حقيقي للمعالجة، حتى لو كان هذا التأثير صغيراً. وهذا يعني أن الباحث قد يحتاج إلى عينة أصغر لتحقيق نفس القوة الإحصائية التي قد تتطلبها العينات المستقلة.

من الناحية الاقتصادية والعملية، تساهم هذه التصاميم في كفاءة جمع البيانات. استخدام نفس المشاركين في ظروف متعددة يقلل من الوقت والتكلفة اللازمين لتوظيف ومعالجة عدد كبير من الأفراد كما هو مطلوب في تصاميم المجموعات المستقلة. كما أن تقليل عدد المشاركين الكلي قد يكون ضرورياً في الدراسات التي تتعامل مع مجموعات سكانية نادرة أو ذات متطلبات خاصة (مثل المرضى بمرض معين أو الأفراد ذوي القدرات المعرفية العالية).

ومع ذلك، لا تخلو العينات المعتمدة من العيوب والتحديات المنهجية، خاصة في تصميم القياسات المتكررة. التحدي الأبرز هو تأثيرات الترتيب (Order Effects) وتأثيرات الترحيل (Carryover Effects). يحدث تأثير الترتيب عندما يؤثر الترتيب الذي يتم به تقديم المعالجات على استجابة المشارك (مثل التعب، الملل، أو الممارسة). أما تأثيرات الترحيل فتحدث عندما لا يزول تأثير المعالجة الأولى تماماً قبل تقديم المعالجة الثانية، مما يؤدي إلى تلوث البيانات. لمواجهة هذه المشكلات، غالباً ما يستخدم الباحثون تقنية تسمى الموازنة (Counterbalancing)، حيث يتم تقديم المعالجات بترتيبات مختلفة لمجموعات فرعية من المشاركين.

6. مجالات التطبيق والأمثلة

تجد العينات المعتمدة تطبيقات واسعة النطاق في العديد من التخصصات العلمية، وخاصة تلك التي تركز على التغيير بمرور الوقت أو مقارنة الاستجابات لنفس الكائن الحي في ظل ظروف مختلفة. في مجال علم النفس التجريبي والمعرفي، تُستخدم القياسات المتكررة بشكل أساسي لدراسة التعلم والذاكرة والتحيز، حيث يتم تعريض المشارك لسلسلة من المهام أو المنبهات المختلفة لقياس كيفية تغير أدائه. على سبيل المثال، قد يقيس الباحث سرعة استجابة المشارك لنوعين مختلفين من المحفزات البصرية، مع التأكد من أن الاختلافات في الاستجابة تعود فقط إلى نوع المحفز وليس إلى اختلافات فردية في سرعة المعالجة الأساسية.

في الأبحاث الطبية والصيدلانية، تعتبر التصاميم المعتمدة حيوية لتقييم فعالية الأدوية أو التدخلات العلاجية. التصميم النموذجي هو تجربة ما قبل/بعد، حيث يتم قياس المؤشر الحيوي للمريض (مثل ضغط الدم، مستوى السكر) قبل إعطاء الدواء، ثم قياسه مرة أخرى بعد فترة من العلاج. وفي كثير من الأحيان، يتم استخدام تصميم متقاطع (Crossover Design)، وهو شكل معقد من القياسات المتكررة، حيث يتلقى المشاركون علاجين مختلفين في فترات زمنية منفصلة (مع فترة غسيل فاصلة)، مما يسمح بمقارنة تأثيرات العلاجين على نفس الأفراد.

أما في العلوم التربوية والاجتماعية، فيُستخدم تصميم الأزواج المتطابقة بشكل متكرر. على سبيل المثال، عند مقارنة برنامج تعليمي جديد ببرنامج تقليدي، قد يكون من المستحيل تعريض نفس الطلاب لكلا البرنامجين. بدلاً من ذلك، يتم مطابقة الطلاب في مدارس مختلفة بناءً على عوامل مثل الخلفية الاجتماعية والاقتصادية ومعدل الذكاء، ثم يتم تعيين زوج واحد لكل طريقة تدريس. يضمن هذا التطابق أن تكون المجموعتان متساويتين في البداية قدر الإمكان فيما يتعلق بالمتغيرات المربكة قبل البدء في التدخل، مما يتيح للباحث عزو أي فرق لاحق في الأداء الأكاديمي إلى طريقة التدريس المستخدمة.

7. القضايا والتحفظات المنهجية

على الرغم من القوة الإحصائية الكبيرة التي توفرها العينات المعتمدة، إلا أن هناك قضايا منهجية يجب على الباحثين أخذها في الاعتبار لضمان صحة النتائج. في تصميم القياسات المتكررة، يمثل خطر تأثير الاختبار (Testing Effect) تهديداً كبيراً للصحة الداخلية. قد يؤدي إجراء القياس الأول (ما قبل الاختبار) إلى تغيير سلوك المشاركين أو معرفتهم بطريقة تؤثر على استجابتهم في القياس اللاحق (ما بعد الاختبار)، بصرف النظر عن فعالية التدخل. على سبيل المثال، قد يصبح المشاركون أكثر حساسية للمتغير المقاس أو يخمنون هدف الدراسة.

بالإضافة إلى ذلك، هناك مشكلة التسرب أو الاستنزاف التفاضلي (Differential Attrition)، وهي أكثر شيوعاً في الدراسات الطولية التي تستخدم القياسات المتكررة. يحدث هذا عندما لا يكمل بعض المشاركين جميع مراحل الدراسة، ويكون هذا التسرب غير عشوائي؛ أي أن الأفراد الذين يتسربون يختلفون منهجياً عن الأفراد الذين يبقون. إذا كان الأفراد الذين تسربوا هم الأكثر تأثراً بالتدخل أو الأقل استجابة له، فإن النتائج النهائية للعينة المتبقية ستكون منحازة ولا تمثل السكان الأصليين الذين بدأت عليهم الدراسة، مما يهدد صلاحية التعميم الخارجي للنتائج.

في تصميم الأزواج المتطابقة، تكمن الصعوبة في تحقيق التطابق المثالي. نادراً ما يتمكن الباحثون من مطابقة الأفراد على جميع المتغيرات المربكة ذات الصلة. فكلما زاد عدد المتغيرات التي يحاول الباحث مطابقتها، أصبح العثور على أزواج متطابقة تماماً أمراً صعباً للغاية أو مستحيلاً. وغالباً ما يتم الاكتفاء بالتطابق على متغير أو متغيرين رئيسيين، مما يترك المتغيرات المربكة غير المقاسة لتؤثر على الفرق بين المجموعتين، وبالتالي فإن الميزة المنهجية لتصميم الأزواج المتطابقة لا تكون مطلقة بقدر ما هي في تصميم القياسات المتكررة، وتعتمد بشكل كبير على دقة وجودة عملية المطابقة الأولية.