اختبار مربع كاي: دليلك لفهم البيانات النفسية بدقة

مدرس الدكتور محمد لوتي

المحتويات:

مربع كاي (Chi-square)

Primary Disciplinary Field(s): الإحصاء الرياضي، الإحصاء التطبيقي، القياس النفسي، البيولوجيا الإحصائية

1. التعريف الجوهري والمفاهيم الأساسية

يمثل مفهوم مربع كاي (Chi-square)، الذي يُرمز له عادةً بالرمز χ²، ركيزة أساسية في التحليل الإحصائي، خاصة في مجال الإحصاء الاستدلالي. يتمحور هذا المفهوم حول دراسة التباين بين التكرارات المشاهَدة فعليًا في عينة ما والتكرارات المتوقعة نظريًا بموجب فرضية محددة، غالبًا ما تكون الفرضية الصفرية (H₀). إن مربع كاي ليس مجرد اختبار، بل هو أيضًا اسم لتوزيع احتمالي مهم يُعرف بتوزيع مربع كاي، والذي يشكل الأساس النظري للعديد من الاختبارات الإحصائية غير المعلمية. تُستخدم قيمة مربع كاي الناتجة عن الاختبار لتحديد مدى احتمالية أن يكون الفرق الملحوظ بين المشاهَد والمتوقع ناتجًا عن الصدفة العشوائية وحدها، مما يمنح الباحثين أداة قوية لتقييم العلاقات بين المتغيرات الفئوية (Categorical Variables) أو لتقييم جودة مطابقة توزيع ما للبيانات الفعلية.

تعتبر القدرة على التعامل مع البيانات الفئوية هي السمة المميزة لاختبارات مربع كاي، حيث لا تتطلب هذه الاختبارات افتراضات صارمة حول شكل توزيع البيانات الأساسي (مثل الافتراضات المطلوبة في الاختبارات المعلمية كاختبارات T أو Z). يتم حساب قيمة مربع كاي عبر تجميع الفروق المربعة بين التكرارات المشاهَدة (O) والتكرارات المتوقعة (E)، مقسومة على التكرارات المتوقعة نفسها. رياضياً، يتم التعبير عن هذا المجموع بالصيغة: χ² = Σ (O – E)² / E. إن طبيعة هذه الصيغة تضمن أن تكون قيمة χ² موجبة دائمًا أو تساوي الصفر، وهي تساوي الصفر فقط عندما تتطابق التكرارات المشاهَدة تمامًا مع التكرارات المتوقعة، مما يشير إلى دعم قوي للفرضية الصفرية.

المتغير الحاسم الآخر المرتبط بمربع كاي هو مفهوم درجات الحرية (Degrees of Freedom)، والذي يحدد شكل التوزيع. تشير درجات الحرية إلى عدد القيم المستقلة في حساب إحصائي معين والتي يمكن أن تتغير بحرية، وهي ضرورية لتحديد القيمة الحرجة (Critical Value) من جدول التوزيع ومقارنتها بالقيمة المحسوبة لتحديد القيمة الاحتمالية (P-value). بشكل عام، في سياق اختبارات مربع كاي، ترتبط درجات الحرية ارتباطًا مباشرًا بعدد الفئات أو الصفوف والأعمدة المستخدمة في تحليل البيانات، وتؤثر درجات الحرية بشكل كبير على شكل منحنى توزيع مربع كاي، حيث يصبح التوزيع أكثر تناظراً ويقترب من التوزيع الطبيعي كلما زادت درجات الحرية.

2. السياق التاريخي والتطور الإحصائي

على الرغم من أن المفاهيم الأساسية لتقييم التباين كانت موجودة في وقت سابق، إلا أن الترسيم الرسمي وتطوير اختبار مربع كاي كأداة إحصائية قياسية يُنسب بشكل رئيسي إلى عالم الإحصاء البريطاني البارز كارل بيرسون (Karl Pearson). في عام 1900، نشر بيرسون ورقته المؤثرة التي قدم فيها اختبار مربع كاي كطريقة لحساب مدى جودة مطابقة التوزيع النظري للتوزيعات التجريبية المشاهَدة، وهو ما يعرف الآن باسم اختبار جودة المطابقة (Goodness of Fit Test). مثّل هذا التطور قفزة نوعية في مجال الإحصاء، حيث وفر أداة موضوعية وموحدة لتقييم الفرضيات في مجموعة واسعة من المجالات العلمية، خاصة تلك التي تتعامل مع البيانات الفئوية (Categorical Data) مثل علم الوراثة وعلم الاجتماع.

قبل عمل بيرسون، كانت المقارنات بين التوزيعات النظرية والعملية غالبًا ما تتم بطرق وصفية أو غير موحدة. وقد أدرك بيرسون الحاجة إلى مقياس كمي يمكن أن يحدد بدقة احتمالية أن تكون الفروق بين التوزيعات ناتجة عن الصدفة. وقد أدى هذا التأسيس الرياضي لاختبار χ² إلى توحيد منهجيات التحقق من الفرضيات، مما سمح للباحثين بتحديد ما إذا كان نموذجهم النظري (مثل التوزيع الطبيعي أو توزيع بواسون) يتوافق بشكل مقبول مع البيانات التي جمعوها من العالم الحقيقي. كان هذا الإطار حاسماً في تطوير الإحصاء الحديث كعلم استدلالي.

لاحقًا، تم توسيع استخدامات مربع كاي لتشمل تقييم الاستقلالية بين متغيرين فئويين، وهو ما يعرف باسم اختبار مربع كاي للاستقلالية (Test of Independence). هذا التوسع، جنبًا إلى جنب مع عمل رونالد فيشر (R. A. Fisher) في تطوير المفاهيم المرتبطة بـدرجات الحرية، عزز من مكانة مربع كاي كأداة لا غنى عنها في تحليل جداول التوافق (Contingency Tables). لقد أصبح اختبار مربع كاي حجر الزاوية في المناهج الإحصائية، حيث يتم تدريسه كأحد المفاهيم الأساسية التي يجب على كل باحث إتقانها لفهم العلاقات غير المعلمية بين البيانات.

3. توزيع مربع كاي (The Chi-square Distribution)

توزيع مربع كاي هو عائلة من التوزيعات الاحتمالية المستمرة التي تنشأ بشكل طبيعي عند التعامل مع مجاميع المربعات للمتغيرات العشوائية المستقلة الموزعة توزيعًا طبيعيًا قياسيًا. بعبارة أدق، إذا كانت لدينا مجموعة من المتغيرات العشوائية المستقلة Z₁، Z₂، …، Zₖ، حيث يتبع كل منها التوزيع الطبيعي القياسي (بمتوسط صفر وتباين واحد)، فإن مجموع مربعات هذه المتغيرات، أي χ² = Σ Zᵢ²، يتبع توزيع مربع كاي بـ k من درجات الحرية. هذه الخاصية الرياضية هي ما يمنح توزيع مربع كاي أهميته، خاصة في استدلالات التباين واختبارات الفرضيات.

يتميز توزيع مربع كاي بكونه غير متماثل (Skewed)، حيث يتركز جزء كبير من احتماليته عند القيم المنخفضة، ويميل ذيله إلى اليمين. ومع ذلك، فإن شكل هذا التوزيع يتغير بشكل جوهري تبعًا لقيمة درجات الحرية (df). عندما تكون درجات الحرية صغيرة (مثل df=1 أو df=2)، يكون التوزيع شديد الانحراف نحو اليمين. ولكن، كلما زادت درجات الحرية، يبدأ التوزيع في التحول ليصبح أكثر تناظراً، ويقترب شكله تدريجياً من شكل التوزيع الطبيعي. هذا التقارب هو نتيجة مباشرة لنظرية الحد المركزي (Central Limit Theorem) المطبقة على مجموع المربعات.

يلعب توزيع مربع كاي دوراً حاسماً في تقدير فترات الثقة للتباين في مجتمع طبيعي، وفي اختبارات الفرضيات المتعلقة بالتباين. كما أنه أساسي في التحليل الإحصائي المتقدم، مثل تحليل التباين (ANOVA) وفي نماذج الانحدار، حيث يتم استخدام توزيع مربع كاي لتقييم جودة مطابقة النموذج العام للبيانات. إن فهم العلاقة بين درجات الحرية وشكل التوزيع أمر حيوي لتفسير نتائج اختبار مربع كاي بشكل صحيح، حيث أن القيمة الحرجة التي يتم مقارنة χ² المحسوبة بها تعتمد كليًا على شكل التوزيع المناظر لدرجات الحرية المحددة.

4. اختبار مربع كاي لجودة المطابقة (Goodness of Fit Test)

يهدف اختبار مربع كاي لجودة المطابقة إلى تحديد ما إذا كان التوزيع التكراري المشاهَد لمتغير فئوي واحد يختلف اختلافًا جوهريًا عن التوزيع النظري المتوقع. بمعنى آخر، يتم استخدام هذا الاختبار لتقييم ما إذا كانت العينة التي تم جمعها تبدو وكأنها جاءت من مجتمع يتبع توزيعًا احتماليًا افتراضيًا محددًا (سواء كان توزيعًا موحدًا أو توزيعًا مستندًا إلى نظرية سابقة). تبدأ عملية الاختبار بصياغة الفرضية الصفرية التي تنص على عدم وجود فرق بين التوزيع المشاهَد والتوزيع المتوقع، مقابل الفرضية البديلة التي تفترض وجود اختلاف جوهري.

على سبيل المثال، يمكن استخدام هذا الاختبار في دراسة وراثية لتحديد ما إذا كانت نسب ظهور الصفات في الأجيال الجديدة تتوافق مع النسب المتوقعة وفقًا لقوانين مندل (Mendel’s Laws). في هذه الحالة، ستكون التكرارات المتوقعة مستمدة من النظرية المندلية، بينما تكون التكرارات المشاهَدة هي النتائج الفعلية للتجارب. يتمثل التحدي الرئيسي في هذا الاختبار في تحديد التكرارات المتوقعة بشكل دقيق، والتي يجب أن تكون متسقة مع الفرضية الصفرية المحددة مسبقًا.

لإجراء الاختبار، يجب أن تكون البيانات في شكل تكرارات خام (Raw Frequencies)، وليس نسب مئوية أو بيانات مستمرة. كما يجب أن يلتزم الاختبار ببعض الافتراضات الأساسية، أهمها أن الملاحظات يجب أن تكون مستقلة، وأن التكرارات المتوقعة في كل فئة يجب أن تكون كبيرة بما فيه الكفاية لضمان تقريب توزيع العينة بشكل مناسب لتوزيع مربع كاي النظري (يشترط عادةً أن يكون التكرار المتوقع في كل فئة أكبر من 5، أو أن لا يقل عن 80% من الفئات عن هذا الحد). إذا كانت القيمة المحسوبة لمربع كاي تتجاوز القيمة الحرجة (أو إذا كانت القيمة الاحتمالية P-value أقل من مستوى الدلالة α)، يتم رفض الفرضية الصفرية، مما يشير إلى أن البيانات لا تتطابق جيدًا مع التوزيع النظري المفترض.

5. اختبار مربع كاي للاستقلالية (Test of Independence)

يعد اختبار مربع كاي للاستقلالية التطبيق الأكثر شيوعًا لمفهوم χ²، ويهدف إلى تقييم ما إذا كان هناك ارتباط (أو اعتماد) إحصائي بين متغيرين فئويين. يتم تنظيم البيانات لهذا الاختبار في ما يسمى بجدول التوافق (Contingency Table)، حيث تمثل الصفوف مستويات أحد المتغيرات، وتمثل الأعمدة مستويات المتغير الآخر، وتحتوي الخلايا على التكرارات المشاهَدة المشتركة (Joint Frequencies). الفرضية الصفرية هنا تنص على أن المتغيرين مستقلان تمامًا عن بعضهما البعض، أي أن معرفة فئة متغير واحد لا تعطي أي معلومات إضافية حول فئة المتغير الآخر.

على سبيل المثال، يمكن استخدام هذا الاختبار لتحديد ما إذا كانت هناك علاقة بين “الجنس” (ذكر أو أنثى) وبين “التفضيل السياسي” (حزب أ، حزب ب، محايد). يتم حساب التكرارات المتوقعة (E) لكل خلية في الجدول بناءً على افتراض الاستقلالية المطلق. يتم الحصول على التكرار المتوقع لخلية معينة بضرب المجموع الهامشي للصف (Row Total) في المجموع الهامشي للعمود (Column Total) والقسمة على الإجمالي الكلي للملاحظات (Grand Total). إن مقارنة التكرارات المشاهَدة بالتكرارات المتوقعة تتيح لنا قياس مدى انحراف العلاقة الفعلية عن حالة الاستقلالية التامة.

إذا كانت قيمة χ² المحسوبة عالية وكانت القيمة الاحتمالية الناتجة عنها صغيرة (عادةً P < 0.05)، يتم رفض الفرضية الصفرية، ويستنتج الباحثون وجود علاقة دالة إحصائيًا بين المتغيرين، مما يعني أنهما ليسا مستقلين. ومع ذلك، من المهم التأكيد على أن اختبار مربع كاي يحدد فقط وجود علاقة، ولا يقيس قوتها (Strength) أو اتجاهها، ولا يشير إلى وجود علاقة سببية (Causation). لقياس قوة العلاقة، غالبًا ما يتم استخدام مقاييس إضافية مثل معامل فاي (Phi Coefficient) أو معامل V لكرامر (Cramér’s V) بعد إثبات دلالة اختبار مربع كاي.

6. الخصائص الرياضية الرئيسية

الإيجابية وعدم السالبية: إن قيمة مربع كاي (χ²) تكون دائمًا موجبة أو صفرًا. لا يمكن أن تكون سالبة لأنها تعتمد على مجموع مربعات الفروق. القيمة الصفرية تحدث فقط عندما يتطابق التكرار المشاهَد تمامًا مع التكرار المتوقع.
الاعتماد على درجات الحرية: توزيع مربع كاي ليس توزيعًا واحدًا، بل هو عائلة من التوزيعات التي يحدد شكلها بالكامل معلمة واحدة فقط هي درجات الحرية (df). كلما زادت درجات الحرية، زاد متوسط التوزيع (الذي يساوي df)، وزاد تباينه (الذي يساوي 2df)، وأصبح التوزيع أكثر تناظراً.
الجمعية (Additivity): إذا كان لدينا متغيران عشوائيان مستقلان، X₁ يتبع توزيع مربع كاي بـ df₁، و X₂ يتبع توزيع مربع كاي بـ df₂، فإن مجموعهما (X₁ + X₂) يتبع توزيع مربع كاي بـ (df₁ + df₂). هذه الخاصية مهمة في تحليل التباين (ANOVA) وفي النماذج الخطية العامة.
التقارب مع التوزيع الطبيعي: عندما تكون درجات الحرية (df) كبيرة (عادةً أكبر من 30)، يقترب توزيع مربع كاي بشكل جيد من التوزيع الطبيعي. يمكن في هذه الحالة استخدام التقريب الطبيعي لتبسيط الحسابات الإحصائية، خاصة في العصور التي سبقت توفر القدرة الحاسوبية الحديثة.

7. تطبيقاته الإحصائية والعلمية

تتجاوز تطبيقات اختبار مربع كاي مجرد تقييم الاستقلالية وجودة المطابقة، ليصبح أداة متعددة الاستخدامات في مجموعة واسعة من التخصصات العلمية. في مجال علم الأوبئة والصحة العامة، يُستخدم χ² بشكل متكرر لتقييم الارتباط بين عوامل الخطر (مثل التدخين أو التعرض لمادة معينة) ونتائج المرض (مثل الإصابة أو عدم الإصابة). تساعد هذه الاختبارات في تحديد ما إذا كانت هناك علاقة دالة إحصائيًا تتطلب مزيدًا من التحقيق.

في العلوم الاجتماعية والسياسية، يستخدم اختبار مربع كاي لتحليل البيانات المستمدة من الاستطلاعات والدراسات المسحية. على سبيل المثال، يمكن استخدامه لتحديد ما إذا كانت هناك فروق ذات دلالة إحصائية في آراء الناخبين (متغير فئوي) بناءً على الفئة العمرية أو المستوى التعليمي (متغيرات فئوية أخرى). كما أنه أساسي في تقييم مدى مطابقة توزيع العينات المأخوذة لخصائص المجتمع الكلي.

علاوة على ذلك، في مجال الإحصاء المتقدم ونمذجة البيانات، يشكل توزيع مربع كاي عنصراً أساسياً في اختبارات النماذج الهيكلية (Structural Equation Modeling) وفي اختبارات نسب الاحتمالات (Likelihood Ratio Tests)، والتي تستخدم لتقييم مدى تحسن نموذج إحصائي معقد عند إضافة معلمات إضافية. كما أنه يستخدم في استدلالات التباين في النماذج الخطية العامة (Generalized Linear Models)، مما يؤكد أهميته كأداة لا غنى عنها في التحليل الإحصائي الاستدلالي على مختلف المستويات.

8. القيود والانتقادات

على الرغم من أهميته، فإن اختبار مربع كاي ليس خاليًا من القيود وينبغي استخدامه بحذر. أحد أهم القيود هو افتراضه بأن الملاحظات مستقلة عن بعضها البعض. إذا كانت البيانات عبارة عن قياسات متكررة على نفس الأفراد (بيانات مقترنة)، فإن اختبار مربع كاي التقليدي يكون غير مناسب، ويجب اللجوء إلى بدائل مثل اختبار ماكنيمار (McNemar’s Test). كما أن اختبار مربع كاي حساس لحجم العينة؛ ففي العينات الكبيرة جدًا، يمكن أن يصبح أي انحراف بسيط وغير ذي أهمية عملية دالاً إحصائيًا، مما قد يؤدي إلى استنتاجات مضللة حول الدلالة العملية للنتائج.

القيد الآخر الجوهري يتعلق بافتراض التكرارات المتوقعة الدنيا. إذا كانت التكرارات المتوقعة في أي خلية من جدول التوافق صغيرة جدًا (عادة أقل من 5)، فإن التوزيع الفعلي لإحصائية الاختبار قد ينحرف بشكل كبير عن توزيع مربع كاي النظري، مما يؤدي إلى عدم دقة في تحديد القيمة الاحتمالية. في مثل هذه الحالات، يجب على الباحثين استخدام طرق تصحيحية، مثل تصحيح ييتس للاستمرارية (Yates’s Correction for Continuity) عند درجات حرية واحدة، أو دمج الفئات ذات التكرارات المنخفضة، أو استخدام اختبار فيشر الدقيق (Fisher’s Exact Test)، خاصة في جداول 2×2.

أخيرًا، يجب التذكير بأن اختبار مربع كاي يخبرنا فقط ما إذا كانت هناك علاقة أم لا (في اختبار الاستقلالية)، ولكنه لا يحدد قوة هذه العلاقة أو طبيعتها الاتجاهية. كما أنه اختبار غير اتجاهي (Non-directional)، مما يعني أنه لا يختبر ما إذا كانت مجموعة معينة لديها تكرار أعلى أو أقل من المتوقع، بل يختبر ببساطة وجود أي اختلاف إجمالي. لذلك، يتطلب التحليل الكامل للبيانات الفئوية استخدام مقاييس إضافية لفهم الأهمية العملية والاتجاهية للنتائج المكتشفة بواسطة χ².