اختبار مربع كاي: بوابتك لفهم دلالات البيانات النفسية

مدرس الدكتور محمد لوتي

المحتويات:

اختبار خي تربيع (Chi-Square Test)

Primary Disciplinary Field(s): الإحصاء، تحليل البيانات، البحث العلمي، العلوم الاجتماعية، البيولوجيا.

1. التعريف الأساسي

يُعد اختبار خي تربيع (Chi-Square Test) أداة إحصائية غير معلمية (Non-parametric) بالغة الأهمية، تُستخدم بشكل أساسي في تحليل البيانات الفئوية (Categorical Data). وظيفته الجوهرية تتمثل في تقييم ما إذا كانت هناك علاقة ارتباط ذات دلالة إحصائية بين متغيرين فئويين في جدول توافقي (Contingency Table)، أو لتحديد ما إذا كانت التوزيعات المرصودة (Observed Frequencies) لمجموعة واحدة من البيانات تختلف اختلافاً جوهرياً عن التوزيعات المتوقعة (Expected Frequencies) بناءً على فرضية صفرية محددة. إنه يعتمد على توزيع احتمالي خاص يُعرف باسم توزيع خي تربيع، وهو توزيع غير متماثل ولكنه يقترب من التوزيع الطبيعي كلما زادت درجات الحرية.

الفرضية الصفرية (Null Hypothesis) في سياق اختبار خي تربيع غالباً ما تفترض عدم وجود علاقة بين المتغيرات أو أن البيانات تتوافق مع التوزيع المتوقع. يتم حساب قيمة إحصائية للاختبار، والتي تمثل مجموع الفروقات المربعة بين التكرارات المرصودة والمتوقعة، مقسومة على التكرارات المتوقعة نفسها. كلما كانت قيمة خي تربيع المحسوبة أكبر، زاد الدليل ضد الفرضية الصفرية، مما يشير إلى وجود تباين كبير لا يمكن تفسيره بالصدفة وحدها. وعليه، فإن هذا الاختبار لا يقيس قوة العلاقة، بل يقيس احتمالية أن تكون العلاقة الملاحظة حقيقية وليست ناتجة عن تقلبات عشوائية في العينة، مما يجعله عنصراً أساسياً في الإحصاء الاستدلالي.

2. أصل الكلمة والتطور التاريخي

تعود الجذور الرسمية لاختبار خي تربيع إلى عالم الإحصاء البريطاني الشهير كارل بيرسون (Karl Pearson)، الذي نشره لأول مرة في عام 1900 في ورقته المؤثرة “حول معيار رفض الفرضيات المختلفة” (On the Criterion that a Given System of Deviations from the Probable in the Case of a Correlated System of Variables is such that it can be Reasonably Supposed to have Arisen from Random Sampling). قبل عمل بيرسون، كانت هناك محاولات أولية لاستخدام مقاييس مماثلة، لكن بيرسون هو الذي قام بتطوير الأساس الرياضي الدقيق للتوزيع الاحتمالي لـ خي تربيع، مما سمح بتحديد مدى جودة الملاءمة (Goodness of Fit) بين البيانات النظرية والعملية بطريقة منهجية وقابلة للتكرار.

قبل كارل بيرسون، كانت معظم التحليلات الإحصائية تعتمد بشكل كبير على البيانات الكمية والتوزيع الطبيعي (التوزيع الغاوسي). أدى إدخال اختبار خي تربيع إلى ثورة في مجال الإحصاء التطبيقي، حيث وفر لأول مرة طريقة موثوقة للتعامل مع البيانات الفئوية التي لا تتبع التوزيع الطبيعي أو التي لا تستوفي افتراضات الاختبارات المعلمية. وقد أتاح هذا التقدم للباحثين في مجالات متنوعة مثل علم الوراثة (حيث استخدمه العلماء الأوائل مثل مندل في تحليل نتائجهم)، والعلوم الاجتماعية، إجراء استنتاجات إحصائية صارمة حول التوزيعات والارتباطات التي كانت في السابق تُعتبر ذاتية أو وصفية فقط. وهكذا، رسخ بيرسون مكانة خي تربيع كحجر زاوية في الإحصاء الاستدلالي الحديث، مما أثر بشكل عميق على منهجيات البحث في القرن العشرين وما بعده.

3. الأساس الرياضي والصيغة

يعتمد اختبار خي تربيع على مقارنة التكرارات المرصودة (Oᵢ) في العينة الفعلية مع التكرارات المتوقعة (Eᵢ) في حالة صحة الفرضية الصفرية. القيمة المحسوبة للاختبار، والمشار إليها بـ χ²، هي مقياس لتراكم التباين النسبي بين هذه التكرارات عبر جميع الفئات الممكنة في الجدول التوافقي. رياضياً، يتم تعريف اختبار خي تربيع (بيرسون) بالصيغة الأساسية التالية:

$$chi^2 = sum_{i=1}^{n} frac{(O_i – E_i)^2}{E_i}$$

حيث تمثل Oᵢ التكرار المرصود في الفئة i، و Eᵢ تمثل التكرار المتوقع في الفئة i. القاسم (Eᵢ) يضمن أن يتم وزن الفروقات بشكل صحيح، حيث أن الفروقات الكبيرة في الفئات ذات التكرار المتوقع المنخفض تكون لها أهمية إحصائية أكبر. يتم تربيع الفرق (Oᵢ – Eᵢ)² لضمان أن تكون جميع المساهمات في القيمة الإجمالية لـ χ² موجبة، وأن تكون الفروقات الكبيرة ممثلة بشكل أكبر في النتيجة النهائية. العامل الحاسم في تفسير هذه القيمة هو مفهوم درجات الحرية (Degrees of Freedom)، والتي تحدد الشكل الدقيق لتوزيع خي تربيع الذي يجب استخدامه للحصول على القيمة الاحتمالية (p-value).

4. أنواع اختبارات خي تربيع

يمكن تصنيف استخدام اختبار خي تربيع لبيرسون إلى سياقين رئيسيين، على الرغم من أن كلاهما يستخدم نفس المبدأ الرياضي القائم على مقارنة التكرارات المرصودة بالمتوقعة. التمييز بينهما ضروري لتحديد الفرضية الصفرية الصحيحة وطريقة حساب درجات الحرية.

اختبار جودة الملاءمة (Goodness of Fit Test):
الهدف من هذا الاختبار هو التحقق مما إذا كانت مجموعة واحدة من البيانات الفئوية المأخوذة من عينة تتبع توزيعاً مفترضاً أو نظرياً معيناً. الفرضية الصفرية هنا هي أن التوزيع المرصود لا يختلف بشكل كبير عن التوزيع المفترض (مثل التوزيع المتساوي، أو التوزيع المستمد من نظرية وراثية). يتم حساب التكرارات المتوقعة بناءً على التوزيع النظري وحجم العينة الكلي. يُستخدم هذا الاختبار بشكل شائع في علم الوراثة، حيث يتم اختبار ما إذا كانت نسب الأنماط الظاهرية تتوافق مع التنبؤات المندلية، أو في مجالات الجودة لتحديد ما إذا كانت العيوب تتوزع بالتساوي عبر فترات زمنية مختلفة.
اختبار الاستقلال (Test of Independence):
يُعد هذا النوع هو الأكثر استخداماً، ويُطبق عندما يكون لدى الباحث متغيران فئويان ويرغب في تحديد ما إذا كانا مستقلين إحصائياً عن بعضهما البعض ضمن نفس المجموعة السكانية. يتم تنظيم البيانات في جدول توافقي (Contingency Table) ثنائي الأبعاد. الفرضية الصفرية هي أن المتغيرين مستقلان، مما يعني عدم وجود علاقة ارتباط بينهما. إذا رفضنا الفرضية الصفرية (أي كانت قيمة χ² كبيرة)، فإننا نستنتج أن هناك تبعية بين المتغيرين، مثل وجود علاقة بين الجنس وتفضيل نوع معين من المنتجات، مما يوفر أساساً للتنبؤ والاستدلال.

5. الافتراضات والمتطلبات الأساسية

لضمان دقة نتائج اختبار خي تربيع، يجب على الباحثين تلبية عدة افتراضات منهجية وإحصائية. يعد انتهاك هذه الافتراضات سبباً شائعاً لسوء تفسير النتائج أو فقدان القوة الإحصائية للاختبار.

أولاً، يجب أن تكون البيانات في شكل تكرارات خام، وليس نسباً مئوية أو بيانات مستمرة، كما يجب أن تكون الملاحظات مستقلة بشكل مطلق عن بعضها البعض. هذا يعني أن كل إجابة أو ملاحظة يجب أن تأتي من فرد مختلف، ولا يجب أن تؤثر استجابة فرد على استجابة فرد آخر. ثانياً، يجب أن تكون العينة كبيرة بما يكفي لضمان أن توزيع خي تربيع هو تقريب جيد لتوزيع العينة. هذا يقودنا إلى افتراض التكرارات المتوقعة.

الافتراض الحاسم الثالث هو أن التكرارات المتوقعة (Eᵢ) يجب أن تكون كافية. تنص القاعدة الإرشادية لـ كوشران (Cochran’s Rule) على أنه يجب ألا يقل التكرار المتوقع في أي خلية عن 1، ويجب ألا تقل التكرارات المتوقعة في أكثر من 20% من الخلايا عن 5. عندما يتم انتهاك هذا الشرط، كما يحدث في جداول 2×2 ذات العينات الصغيرة، يصبح توزيع خي تربيع غير دقيق، ويجب اللجوء إلى بدائل مثل اختبار فيشر الدقيق (Fisher’s Exact Test) أو دمج الفئات إذا كان ذلك منطقياً من الناحية النظرية.

6. التطبيقات العملية والتحليل

يجد اختبار خي تربيع مكانة بارزة في مجالات البحث التي تعتمد على المسح والاستبيانات وتحليل التوزيعات، حيث تشكل البيانات الفئوية غالبية المخرجات.

في علم الأوبئة والصحة العامة، يُستخدم الاختبار لتقييم مدى ترابط التعرض لعامل خطر معين بالنتائج الصحية. على سبيل المثال، يمكن تحليل ما إذا كان هناك ارتباط ذو دلالة إحصائية بين استخدام أجهزة تنقية المياه وانخفاض معدلات الإصابة بمرض معين في منطقة جغرافية محددة. أما في التسويق وتحليل الأعمال، فيُستخدم لتقييم فعالية الحملات الإعلانية من خلال تحليل ما إذا كانت معدلات التحويل (Conversion Rates) مستقلة عن نوع الإعلان (مثل إعلان الفيديو مقابل إعلان النص) أو المنصة المستخدمة.

في العلوم الاجتماعية وعلم النفس، يسمح اختبار خي تربيع للباحثين بفحص الارتباطات بين الخصائص الشخصية والسلوكيات الاجتماعية. على سبيل المثال، قد يتم استخدامه لتحديد ما إذا كان هناك ارتباط بين الانتماء السياسي المعلن واستخدام نوع معين من المصادر الإخبارية. هذه التطبيقات المتنوعة تؤكد على مرونة الاختبار في التعامل مع مجموعة واسعة من الأسئلة البحثية التي تتطلب تحليلاً للعلاقات بين المتغيرات غير الكمية.

7. تفسير النتائج والدلالة الإحصائية

الخطوة النهائية في تطبيق اختبار خي تربيع هي تفسير القيمة المحسوبة χ² لاتخاذ قرار بشأن الفرضية الصفرية. يتم هذا التفسير من خلال تحديد القيمة الاحتمالية (p-value). القيمة الاحتمالية تمثل احتمال الحصول على قيمة χ² المحسوبة (أو قيمة أكثر تطرفاً منها) إذا كانت الفرضية الصفرية صحيحة بالفعل.

إذا كانت القيمة الاحتمالية (p-value) أقل من مستوى الدلالة (α)، والذي غالباً ما يتم تحديده عند 0.05، فإن الباحث يرفض الفرضية الصفرية. رفض الفرضية الصفرية يعني أن التباين المرصود بين التكرارات ليس نتيجة للصدفة، بل هو نتيجة لوجود علاقة حقيقية ذات دلالة إحصائية بين المتغيرات. وفي حالة اختبار الاستقلال، يعني هذا أن المتغيرين ليسا مستقلين.

ومع ذلك، من الضروري التمييز بين الدلالة الإحصائية والدلالة العملية. قد يؤدي حجم العينة الكبير جداً إلى دلالة إحصائية لعلاقة ضعيفة للغاية (ضعيفة عملياً). لذا، يجب على الباحثين دائماً إكمال التحليل باستخدام مقاييس حجم التأثير (Effect Size) المرتبطة بـ خي تربيع، مثل معامل فاي (Phi) للجداول 2×2 أو معامل V لـ كريمر (Cramer’s V) للجداول الأكبر، لتقييم القوة الفعلية للارتباط المكتشف.

8. النقاشات والانتقادات والبدائل

على الرغم من انتشار اختبار خي تربيع، فإنه يواجه انتقادات تتعلق بحدود تطبيقه وتفسير نتائجه. أحد أبرز القيود هو أنه حساس للغاية لحجم العينة، حيث يميل إلى إظهار دلالة إحصائية حتى للعلاقات الهامشية عندما تكون العينة كبيرة جداً، مما يربك الباحثين بين الارتباط الإحصائي والارتباط العملي.

بالإضافة إلى ذلك، فإن خي تربيع هو اختبار شامل (Omnibus Test)، مما يعني أنه يحدد فقط ما إذا كان هناك تباين عام في الجدول التوافقي، ولكنه لا يحدد بدقة أي الخلايا هي المسؤولة عن هذا التباين. عند رفض الفرضية الصفرية في جدول كبير (أكبر من 2×2)، يجب إجراء تحليلات لاحقة (Post-Hoc Analysis)، مثل تحليل البواقي المعيارية المعدلة، لتحديد مصادر التباين المحددة.

من الناحية المنهجية، يقتصر خي تربيع على قياس الارتباط ولا يمكنه إثبات السببية. كما أن انتهاك افتراض التكرارات المتوقعة الصغيرة (Eᵢ < 5) يتطلب استخدام اختبارات بديلة، مثل اختبار فيشر الدقيق، أو تصحيحات رياضية مثل تصحيح ييتس للاستمرارية (Yates's correction)، خاصة في الجداول 2×2. هذه القيود تدفع الباحثين إلى اختيار الاختبارات المعلمية (إذا كانت الافتراضات مستوفاة) أو نماذج لوغاريتمية خطية أكثر تعقيداً في حالة البحث عن تفاعلات بين متغيرات متعددة.