جدول التوافق: مفتاح فهم العلاقات في بياناتك النفسية

مدرس الدكتور محمد لوتي

المحتويات:

جدول التوافق (Contingency Table)

Primary Disciplinary Field(s): الإحصاء الوصفي والاستدلالي، تحليل البيانات الفئوية، الاحتمالات، العلوم الاجتماعية والبيولوجية.

1. التعريف الجوهري

جدول التوافق (أو جدول الاقتران) هو ترتيب إحصائي مصفوفي يستخدم لتسجيل وتحليل العلاقة بين متغيرين أو أكثر من المتغيرات الفئوية (الاسمية أو الترتيبية). يمثل هذا الجدول أداة أساسية في الإحصاء الوصفي والاستدلالي، حيث يلخص توزيع التكرارات المشتركة لمتغيرين أو أكثر، مما يسهل تقييم ما إذا كانت المتغيرات المستقلة عن بعضها البعض أم لا. يتميز جدول التوافق ببساطته وقدرته الفائقة على تنظيم البيانات الأولية المعقدة في هيئة يمكن من خلالها استخلاص الاستنتاجات الإحصائية المباشرة.

في جوهره، يعرض جدول التوافق التوزيع متعدد المتغيرات للتكرارات. فإذا كان لدينا متغيران فئويان، فإن صفوف الجدول تمثل فئات المتغير الأول، وأعمدته تمثل فئات المتغير الثاني. كل خلية داخل الجدول تسجل التكرار المشترك (أو العدد المشترك للملاحظات) الذي يقع ضمن فئة محددة من كلا المتغيرين في وقت واحد. على سبيل المثال، قد يستخدم الباحثون جدول توافق لتحليل العلاقة بين “الجنس” (ذكر/أنثى) و”تفضيل المنتج” (منتج أ/منتج ب)، حيث يحتوي كل تقاطع على عدد الأفراد الذين يمثلون التركيبة المعينة.

إن الأهمية التحليلية لجدول التوافق تكمن في أنه يوفر الأساس لاختبار فرضيات الاستقلال الإحصائي. فبمجرد حساب التكرارات الهامشية (مجموع الصفوف ومجموع الأعمدة) والتكرار الكلي، يصبح من الممكن حساب التكرارات المتوقعة (تحت فرضية عدم وجود علاقة). المقارنة بين التكرارات المشاهَدة فعلياً والتكرارات المتوقعة تتيح تطبيق اختبارات إحصائية قوية، أبرزها اختبار مربع كاي، لتحديد ما إذا كانت العلاقة الملحوظة بين المتغيرات ذات دلالة إحصائية أم أنها ناتجة عن الصدفة العشوائية.

2. التطور التاريخي والجذور الإحصائية

تعود جذور جداول التوافق إلى بدايات الإحصاء الحديث، وتحديداً مع تزايد الاهتمام بتحليل البيانات التي لا يمكن قياسها كمياً بسهولة، أي البيانات الفئوية. قبل ظهور هذه الجداول بشكلها الرسمي، كان الإحصائيون يستخدمون طرقاً أولية لتجميع التكرارات، ولكن الافتقار إلى إطار منهجي موحد منع إجراء استدلالات إحصائية موثوقة حول العلاقة بين المتغيرات الاسمية.

يُنسب الفضل في التأسيس الرسمي والمنهجي لاستخدام جداول التوافق كأداة اختبار إلى عالم الإحصاء البريطاني البارز كارل بيرسون في مطلع القرن العشرين. لقد كان بيرسون رائداً في تطوير مقاييس الارتباط واختبارات الملائمة، وفي عام 1900، قدم اختبار مربع كاي (Chi-squared test)، الذي يعتمد بشكل أساسي على مقارنة التكرارات المشاهَدة في خلايا جدول التوافق بالتكرارات المتوقعة، وبالتالي توفير آلية رياضية لتقييم مدى انحراف البيانات عن حالة الاستقلال التام. هذا العمل وضع جداول التوافق في صميم الإحصاء الاستدلالي.

لاحقاً، ساهم رونالد فيشر في تعزيز استخدام جدول التوافق، خاصة في سياق الجداول الصغيرة (2×2)، من خلال تطوير اختبار فيشر الدقيق (Fisher’s Exact Test) في ثلاثينيات القرن الماضي. هذا الاختبار قدم حلاً دقيقاً عندما تكون أحجام العينات صغيرة جداً أو عندما تكون التكرارات المتوقعة منخفضة، وهي ظروف لا يستطيع اختبار مربع كاي التعامل معها بكفاءة. ومنذ ذلك الحين، تطورت جداول التوافق لتشمل نماذج أكثر تعقيداً، بما في ذلك نماذج لوغاريتمية خطية للتعامل مع ثلاثة متغيرات فئوية أو أكثر، مما رسخ مكانتها كأداة لا غنى عنها في تحليل البيانات الفئوية المعقدة في مجالات مثل الوبائيات والعلوم الاجتماعية.

3. الهيكل والمكونات الأساسية

يتكون جدول التوافق من هيكل منظم يسهل الحساب والتحليل. الجدول الأكثر شيوعاً هو الجدول ثنائي الاتجاه (R x C table)، حيث تمثل R عدد الصفوف و C عدد الأعمدة. يتكون الهيكل الأساسي من المكونات التالية:

الخلايا الداخلية (Joint Frequencies): وهي المكونات المركزية للجدول. كل خلية داخلية تسجل عدد الملاحظات التي تشترك في خاصية محددة من المتغير الأول (الصف) وخاصية محددة من المتغير الثاني (العمود). هذه الأرقام هي التكرارات المشاهَدة (Observed Frequencies).
التكرارات الهامشية (Marginal Totals): وهي المجموع الكلي للتكرارات في كل صف وفي كل عمود. مجموع الصفوف يمثل التوزيع التكراري للمتغير الأول (الصف)، ومجموع الأعمدة يمثل التوزيع التكراري للمتغير الثاني (العمود). هذه التكرارات ضرورية لحساب التكرارات المتوقعة.
التكرار الكلي (Grand Total): وهو مجموع جميع الخلايا الداخلية، أو مجموع جميع التكرارات الهامشية للصفوف (أو الأعمدة). يمثل هذا الرقم حجم العينة الكلي (N).
التكرارات المتوقعة (Expected Frequencies): وهي القيم النظرية التي كان من المفترض أن تظهر في كل خلية إذا كان المتغيران مستقلين تماماً عن بعضهما البعض. يتم حساب التكرار المتوقع لكل خلية باستخدام صيغة: (مجموع الصف * مجموع العمود) / التكرار الكلي.

إن العلاقة بين التكرارات المشاهَدة والمُتوقعة هي جوهر التحليل. عندما تكون هذه القيم متطابقة تقريباً، فإن هذا يشير بقوة إلى الاستقلال الإحصائي. وكلما زاد التباين بين التكرارات المشاهَدة والمتوقعة، زادت الأدلة على وجود ارتباط أو توافق بين المتغيرين، وهو ما يتم قياسه كمياً باستخدام إحصائيات الاختبار مثل مربع كاي.

4. أنواع جداول التوافق

تتنوع جداول التوافق بناءً على عدد المتغيرات وعدد الفئات لكل متغير، مما يحدد مدى تعقيد التحليل الإحصائي المطلوب.

النوع الأكثر بساطة والأكثر استخداماً هو جدول 2×2. هذا الجدول ثنائي المتغيرات وثنائي الفئات، حيث يمتلك كل متغير فئتين فقط (مثل: نعم/لا، ذكر/أنثى، نجاح/فشل). جداول 2×2 حيوية بشكل خاص في البحث الطبي والوبائي لحساب مقاييس الارتباط مثل نسبة الأرجحية (Odds Ratio) والخطر النسبي (Relative Risk)، والتي تقارن احتمالية حدوث نتيجة معينة في مجموعة معرضة بعكسها في مجموعة غير معرضة. التحليل في جداول 2×2 سهل التفسير ويشكل حجر الزاوية في فهم الارتباطات البسيطة.

النوع الأكثر عمومية هو جدول R x C، حيث R أكبر من 2 أو C أكبر من 2 (مثل جدول 3×4 أو 5×5). هذا النوع من الجداول يتعامل مع متغيرات فئوية تحتوي على ثلاث فئات أو أكثر. فمثلاً، قد يكون المتغير الأول يمثل “مستوى الدخل” (منخفض، متوسط، مرتفع) والمتغير الثاني يمثل “الانتماء السياسي” (أ، ب، ج). تتطلب جداول R x C تطبيق اختبار مربع كاي مع درجات حرية (R-1)(C-1)، وتفسيرها يصبح أكثر تعقيداً حيث يجب تحديد أزواج الخلايا المسؤولة عن الارتباط الكلي الملحوظ.

وهناك أيضاً جداول التوافق متعددة الأبعاد (أو متعددة الطرق)، والتي تتعامل مع ثلاثة متغيرات فئوية أو أكثر في وقت واحد (مثل جدول 2x2x3). هذه الجداول لا يمكن تمثيلها بسهولة في شكل ثنائي الأبعاد وتتطلب تقنيات إحصائية متقدمة مثل النماذج اللوغاريتمية الخطية (Log-linear Models) أو نماذج الانحدار اللوجستي المتعدد، لتقييم ليس فقط الارتباطات بين أزواج المتغيرات، بل أيضاً تفاعلات الدرجة الثالثة (التي تشير إلى أن العلاقة بين متغيرين تتغير بناءً على مستوى المتغير الثالث).

5. تطبيقاته الإحصائية الرئيسية

تتجاوز أهمية جداول التوافق مجرد تلخيص البيانات؛ فهي تشكل الأساس لعدد من الإجراءات الإحصائية الاستدلالية الحاسمة في مختلف التخصصات البحثية.

أولاً، وأبرزها، هو اختبار الاستقلال باستخدام اختبار مربع كاي (Chi-squared Test of Independence). هذا الاختبار هو التطبيق الأكثر شيوعاً لجدول التوافق، ويهدف إلى تحديد ما إذا كان هناك دليل كافٍ لرفض فرضية العدم (التي تفترض أن المتغيرين مستقلان إحصائياً). إذا كانت قيمة مربع كاي المحسوبة كبيرة وتتجاوز القيمة الحرجة عند مستوى دلالة محدد، فإن الباحث يستنتج أن هناك ارتباطاً ذا دلالة إحصائية بين المتغيرين، مما يعني أن التوزيع الفئوي لأحد المتغيرات يعتمد على فئة المتغير الآخر.

ثانياً، تُستخدم جداول التوافق في الإحصاء الحيوي والوبائيات لحساب مقاييس حجم التأثير. في جداول 2×2، يمكن حساب نسبة الأرجحية (Odds Ratio) والخطر النسبي (Relative Risk). نسبة الأرجحية تقيس قوة الارتباط بين التعرض والنتيجة، وهي حاسمة في دراسات الحالات والشواهد. أما الخطر النسبي فيقيس احتمالية حدوث النتيجة بين المجموعة المعرضة مقارنة بالمجموعة غير المعرضة، وهو أساسي في الدراسات الاستقصائية. هذه المقاييس لا تكتفي بتحديد وجود علاقة، بل تقيّم قوتها واتجاهها.

ثالثاً، تُستخدم جداول التوافق كأساس لاختبارات الارتباط غير البارامترية عندما تكون المتغيرات ترتيبية. فإذا كانت المتغيرات مرتبة، يمكن استخدام مقاييس ارتباط متقدمة مثل معامل جاما (Gamma) أو معامل تاو-ب (Kendall’s Tau-b) التي تعتمد على مقارنة أزواج الملاحظات المتوافقة وغير المتوافقة داخل خلايا الجدول، مما يوفر مقياساً لقوة واتجاه العلاقة الترتيبية.

6. المفاهيم المرتبطة: الاستقلال والارتباط

يعد مفهوم الاستقلال الإحصائي والارتباط (أو التبعية) هو الإطار النظري الذي يدور حوله استخدام جدول التوافق. جدول التوافق هو الأداة المنهجية التي تسمح للباحثين بالانتقال من الملاحظة الوصفية للبيانات إلى الاستدلال حول هذه المفاهيم الأساسية.

الاستقلال الإحصائي: يتحقق الاستقلال الإحصائي بين متغيرين فئويين إذا كان التوزيع الاحتمالي الشرطي لأحدهما هو نفسه التوزيع الاحتمالي غير الشرطي له. بعبارة أخرى، فإن معرفة فئة المتغير الأول لا تقدم أي معلومات حول فئة المتغير الثاني. في سياق جدول التوافق، يترجم هذا إلى أن التكرارات المشاهَدة في كل خلية تتطابق تقريباً مع التكرارات المتوقعة المحسوبة بافتراض الاستقلال. فإذا كان المتغيران مستقلين، فإن نسبة الملاحظات في كل صف (أو عمود) تكون متساوية تقريباً عبر جميع فئات المتغير الآخر.

الارتباط (أو التبعية): يشير الارتباط إلى أن هناك علاقة منهجية بين المتغيرين، بحيث أن التوزيع الفئوي لأحدهما يختلف باختلاف فئات المتغير الآخر. عندما تظهر التكرارات المشاهَدة انحرافاً كبيراً عن التكرارات المتوقعة، فإن ذلك يشير إلى وجود ارتباط. يمكن أن يكون الارتباط قوياً أو ضعيفاً، ويتم قياس قوته بواسطة مقاييس مثل معامل فاي (Phi coefficient) لجداول 2×2، أو معامل V لكريمر (Cramer’s V) للجداول الأكبر، والتي توفر قيمة موحدة تشير إلى مدى قوة العلاقة المكتشفة.

إن القدرة على تكميم هذا الارتباط وتحديد دلالته الإحصائية هي ما يجعل جدول التوافق قوياً. فبينما قد تظهر الأرقام الخام في الجدول علاقة عابرة، فإن تطبيق اختبار مربع كاي يسمح للباحث بتحديد ما إذا كان هذا الارتباط قوياً بما يكفي لرفض فرضية الصدفة العشوائية والادعاء بوجود علاقة حقيقية في المجتمع الإحصائي الأكبر.

7. القيود والانتقادات المنهجية

على الرغم من القيمة الكبيرة لجداول التوافق، إلا أن هناك قيوداً منهجية وعملية يجب مراعاتها عند استخدامها في التحليل الإحصائي.

أولاً، حساسية النتائج لحجم العينة. في جداول التوافق، يميل اختبار مربع كاي إلى أن يكون حساساً بشكل مفرط لحجم العينة الكلي (N). فإذا كانت العينة كبيرة جداً، يمكن أن يصبح حتى الارتباطات الضعيفة وغير المهمة عملياً ذات دلالة إحصائية عالية (قيمة P صغيرة). ولذلك، يجب على الباحثين دائماً إكمال اختبار الدلالة الإحصائية بحساب مقاييس حجم التأثير (مثل V لكريمر أو نسبة الأرجحية) لتحديد ما إذا كانت العلاقة المكتشفة لها أهمية عملية حقيقية تتجاوز مجرد الدلالة الإحصائية.

ثانياً، افتراضات اختبار مربع كاي. يتطلب تطبيق اختبار مربع كاي أن تكون الملاحظات مستقلة عن بعضها البعض وأن تكون التكرارات المتوقعة في الخلايا ليست صغيرة جداً. القاعدة الشائعة هي أنه يجب ألا تقل نسبة كبيرة من الخلايا (عادة 80%) عن تكرار متوقع قدره 5. إذا كانت التكرارات المتوقعة منخفضة (مشكلة البيانات المتفرقة أو “الخلايا الفارغة”)، فإن توزيع مربع كاي لا يكون تقريباً جيداً، مما يؤدي إلى نتائج غير موثوقة. في هذه الحالة، يجب اللجوء إلى بدائل مثل اختبار فيشر الدقيق أو دمج الفئات لزيادة التكرارات المتوقعة.

ثالثاً، فقدان المعلومات عند التعامل مع البيانات المستمرة. يُستخدم جدول التوافق حصرياً للمتغيرات الفئوية. إذا كان الباحث يتعامل مع متغيرات مستمرة (مثل العمر أو الدخل) وقام بتقسيمها قسراً إلى فئات (مثل “شباب”، “متوسطي العمر”، “كبار”) لإنشاء جدول توافق، فإنه يخاطر بفقدان قدر كبير من المعلومات القيمة حول التباين داخل كل فئة. هذا الإجراء يمكن أن يؤدي إلى نتائج تحيزية وغير دقيقة، ولذلك يفضل استخدام تحليل الانحدار للمتغيرات المستمرة بدلاً من تصنيفها.