تجانس التغاير – homogeneity of covariance

تجانس مصفوفة التغاير (Homogeneity of Covariance)

المجال (المجالات) التخصصية الأساسية: الإحصاء متعدد المتغيرات، التصميم التجريبي، النمذجة الإحصائية المتقدمة

1. التعريف الجوهري

يشكل افتراض تجانس مصفوفة التغاير (Homogeneity of Covariance Matrices) أحد الركائز الإحصائية الأساسية التي تقوم عليها العديد من اختبارات التحليل متعدد المتغيرات. يُعرف هذا الافتراض بأنه شرط يقضي بأن تكون مصفوفات التغاير للمتغيرات التابعة متساوية عبر جميع المجموعات أو مستويات العامل المستقل المدروسة ضمن التحليل الإحصائي. بعبارة أخرى، يفترض تجانس مصفوفة التغاير أن العلاقة المتبادلة بين أي زوج من المتغيرات التابعة، وكذلك تباين كل متغير على حدة، تبقى متطابقة إحصائياً بغض النظر عن المجموعة التي ينتمي إليها الفرد أو الوحدة الملاحظة. هذا الافتراض ليس مجرد مسألة شكلية، بل هو شرط ضروري لضمان أن تكون الإحصاءات الاختبارية المستخدمة (مثل إحصاءات ويلكس لامدا أو تريس بيل) موزعة وفق التوزيعات النظرية المتوقعة، وبالتالي ضمان صحة استدلالاتنا حول الفروق بين متوسطات المجموعات.

يتجاوز تجانس مصفوفة التغاير مفهوم تجانس التباين أحادي المتغير (Homogeneity of Variance)، والذي يقتصر على مقارنة تباين متغير واحد فقط عبر المجموعات. ففي سياق الإحصاء متعدد المتغيرات، نحن لا نتعامل مع تباين واحد فحسب، بل مع مصفوفة كاملة تحتوي على التباينات على القطر الرئيسي وعلى التغايرات بين أزواج المتغيرات خارج القطر الرئيسي. لكي يتحقق الافتراض، يجب أن تكون جميع العناصر المقابلة في هذه المصفوفات متساوية بين المجموعات. إذا رمزنا لمصفوفة التغاير للمجموعة "ج" بالرمز Σج، فإن افتراض التجانس يتطلب أن تكون Σ1 = Σ2 = … = Σk، حيث k هو عدد المجموعات قيد الدراسة. إن عدم تحقق هذا الشرط، والمعروف باسم عدم تجانس مصفوفة التغاير أو التغايرية المغايرة (Heteroscedasticity)، يؤدي إلى انحرافات خطيرة في مستويات الدلالة الإحصائية المحتسبة، مما قد يزيد من احتمال ارتكاب الخطأ من النوع الأول (رفض فرضية العدم وهي صحيحة) أو الخطأ من النوع الثاني (قبول فرضية العدم وهي خاطئة).

إن أهمية هذا الافتراض تتجلى بشكل خاص في التحليل الإحصائي متعدد المتغيرات للتباين (MANOVA) وتحليل التمييز (Discriminant Analysis) وتحليل الانحدار متعدد المتغيرات. في هذه السياقات، تكون المقارنات بين المجموعات معقدة بسبب التداخل بين المتغيرات التابعة. عندما تكون مصفوفات التغاير متجانسة، يمكننا التأكد من أن الفروق الملحوظة في متوسطات المتجهات (Mean Vectors) تعود بالفعل إلى تأثير العامل المستقل، وليس إلى اختلافات في بنية العلاقات الداخلية بين المتغيرات داخل كل مجموعة. لذلك، يعد التحقق من هذا الافتراض خطوة أولى وحاسمة قبل تفسير نتائج الاختبارات متعددة المتغيرات الرئيسية.

2. العلاقة بتجانس التباين وتعميمه

يُعد تجانس مصفوفة التغاير تعميمًا مباشرًا ومنطقيًا لافتراض تجانس التباين (Homogeneity of Variance)، المعروف أيضًا باسم تجانس الانحدار (Homoscedasticity) في سياق الانحدار أحادي المتغير. في التحليل الإحصائي أحادي المتغير (مثل اختبار T أو تحليل التباين ANOVA)، نفترض أن التباين حول المتوسطات متساوٍ لجميع المجموعات. هذا الافتراض يسمح لنا باستخدام تقدير مجمع (Pooled Estimate) للتباين عند حساب الخطأ المعياري للاختبار، مما يزيد من قوة الاختبار الإحصائية.

عند الانتقال إلى الإطار متعدد المتغيرات، حيث يتم قياس أكثر من متغير تابع في وقت واحد، فإننا لا نهتم فقط بتباين كل متغير بشكل فردي، بل ببنية التغاير الكلية التي تربط هذه المتغيرات معًا. يتطلب تجانس مصفوفة التغاير أن تكون ليس فقط تباينات كل متغير متساوية عبر المجموعات، ولكن أيضًا أن تكون جميع التغايرات المتبادلة بين المتغيرات التابعة متساوية. على سبيل المثال، إذا كنا نقيس "القلق" و"الإنجاز" في مجموعتين، فإن التجانس يتطلب ما يلي: (أ) تباين القلق في المجموعة الأولى = تباين القلق في المجموعة الثانية، (ب) تباين الإنجاز في المجموعة الأولى = تباين الإنجاز في المجموعة الثانية، و (ج) التغاير بين القلق والإنجاز في المجموعة الأولى = التغاير بين القلق والإنجاز في المجموعة الثانية.

إن فشل افتراض التجانس في الإطار متعدد المتغيرات يعني أن بنية البيانات (Pattern of Dispersion) تختلف جوهريًا بين المجموعات. هذا الاختلاف في البنية يمكن أن يشوه نتائج اختبارات الفرضيات. فإذا كانت إحدى المجموعات لديها تباينات وتغايرات أكبر بكثير من مجموعة أخرى، فإن الاختبارات التي تفترض التساوي (مثل MANOVA التقليدية) ستميل إلى إعطاء نتائج مضللة. في الواقع، إذا كان تجانس التباين أحادي المتغير هو شرط ضروري، فإن تجانس مصفوفة التغاير هو الشرط الكافي للإجراءات متعددة المتغيرات، حيث يشمل تجانس جميع مكونات مصفوفة التشتت.

3. إجراءات الاختبار: اختبار M لبوكس

لتقييم مدى تحقيق افتراض تجانس مصفوفة التغاير، يتم استخدام اختبارات إحصائية محددة، وأشهرها وأكثرها شيوعاً هو اختبار M لبوكس (Box’s M Test). هذا الاختبار هو امتداد طبيعي لاختبار ليفين (Levene’s Test) أو اختبار بارتليت (Bartlett’s Test) المستخدمين في حالة المتغير الواحد. يقوم اختبار M لبوكس بتقييم فرضية العدم (H0) التي تنص على أن جميع مصفوفات التغاير السكانية متساوية (Σ1 = Σ2 = … = Σk) مقابل الفرضية البديلة (H1) التي تنص على أن مصفوفة تغاير واحدة على الأقل تختلف عن الأخريات.

يعتمد اختبار M لبوكس على حساب مقياس M، الذي يمثل دالة لوغاريتمية لنسبة محددات مصفوفات التغاير لكل مجموعة على حدة إلى محدد مصفوفة التغاير المجمعة (Pooled Covariance Matrix). رياضياً، يعتمد الاختبار على مقياس يشبه اختبار نسبة الاحتمالية المعممة. يتم بعد ذلك تحويل قيمة M المحسوبة إلى قيمة إحصائية تقريبية تتبع توزيع مربع كاي (Chi-Square Distribution) أو توزيع فيشر (F-Distribution) للحكم على رفض أو قبول فرضية العدم. تتأثر دقة هذا التحويل بعدد المجموعات وعدد المتغيرات التابعة وحجم العينات.

من المهم الإشارة إلى أن اختبار M لبوكس حساس للغاية للانحراف عن افتراض التوزيع الطبيعي متعدد المتغيرات (Multivariate Normality). هذا يعني أنه إذا كانت البيانات لا تتبع توزيعًا طبيعيًا متعدد المتغيرات (وهو افتراض آخر ضروري لـ MANOVA)، فإن اختبار M قد يشير بشكل خاطئ إلى عدم التجانس (الرفض الكاذب لـ H0)، خاصة عندما تكون أحجام العينات كبيرة. نتيجة لهذه الحساسية، يوصي الإحصائيون بالتعامل مع نتائج اختبار M بحذر، خاصة إذا كانت العينات كبيرة؛ ففي حالة العينات الكبيرة، قد يكون الاختبار دالاً إحصائياً حتى لو كانت الانحرافات عن التجانس بسيطة وغير مؤثرة عملياً على استنتاجات MANOVA. القاعدة العامة المقبولة هي أنه إذا كان حجم العينات متساوياً عبر المجموعات، فإن MANOVA تكون قوية نسبياً ضد انتهاك التجانس، حتى لو كان اختبار M دالاً.

4. الصياغة الرياضية والمنطق الإحصائي

يمكن التعبير عن الافتراض رياضياً بتعريف مصفوفة التغاير السكانية Σj لكل مجموعة j. تكون فرضية العدم لاختبار التجانس كما يلي:

H0: Σ1 = Σ2 = … = Σk

بينما تنص الفرضية البديلة على:

H1: على الأقل مصفوفتان من مصفوفات التغاير غير متساويتين.

المنطق الإحصائي وراء هذا الافتراض ينبع من الحاجة إلى استخدام مصفوفة تشتت مجمعة (Pooled Scatter Matrix) لتقدير الخطأ المشترك عبر جميع المجموعات. في MANOVA، يتم مقارنة التباين بين المجموعات (Between-Groups Variability) بالتباين داخل المجموعات (Within-Groups Variability). لتقدير التباين داخل المجموعات، يتم تجميع (Pooling) مصفوفات التغاير المقدرة لكل مجموعة على حدة. إذا كانت مصفوفات التغاير السكانية متساوية فعلاً، فإن استخدام التقدير المجمع يوفر أفضل وأقوى تقدير للخطأ.

إذا تم رفض H0، فهذا يعني أن التباين داخل المجموعات ليس موحداً؛ وبالتالي، فإن مصفوفة التغاير المجمعة لا تمثل بشكل صحيح التشتت في كل مجموعة على حدة. هذا يؤدي إلى أن إحصاءات الاختبار (مثل إحصاءات MANOVA) ستتأثر بالاختلافات في شكل التشتت بدلاً من مجرد الاختلافات في متوسطات المتجهات، مما يشوه الاختبار الإحصائي. إن صحة الاستدلال الإحصائي تعتمد اعتماداً كبيراً على أن تكون الاختلافات في مصفوفات التغاير بين المجموعات صغيرة بما يكفي لتجاهلها.

5. الآثار المترتبة على انتهاك الافتراض

يؤدي انتهاك افتراض تجانس مصفوفة التغاير إلى عواقب وخيمة على دقة النتائج الإحصائية، خاصة فيما يتعلق بضبط معدل الخطأ من النوع الأول. تتأثر قوة الاختبار الإحصائية ومستوى الدلالة المحسوب بشدة عندما تكون أحجام العينات غير متساوية (Unbalanced Designs) بالتزامن مع عدم التجانس.

عندما تكون أحجام العينات متساوية (التصميم المتوازن): حتى لو كان هناك عدم تجانس معتدل، فإن MANOVA تظل قوية (Robust) نسبياً، مما يعني أن مستوى الدلالة الفعلي لا يختلف كثيراً عن مستوى الدلالة الاسمي (مثل 0.05). وفي هذه الحالة، قد يتم تجاهل دلالة اختبار M لبوكس.

عندما تكون أحجام العينات غير متساوية (التصميم غير المتوازن): تظهر المشاكل بوضوح.

  1. إذا كانت المجموعة ذات حجم العينة الأكبر لديها مصفوفة التغاير الأصغر، فإن MANOVA تميل إلى أن تكون متحفظة (Conservative)، مما يؤدي إلى انخفاض في القوة الإحصائية (زيادة في الخطأ من النوع الثاني).
  2. إذا كانت المجموعة ذات حجم العينة الأصغر لديها مصفوفة التغاير الأكبر، فإن MANOVA تميل إلى أن تكون متهورة (Liberal)، مما يؤدي إلى زيادة كبيرة في معدل الخطأ من النوع الأول (رفض H0 عندما تكون صحيحة). وهذه الحالة هي الأكثر خطورة وتتطلب تدخلات علاجية فورية.

إضافة إلى ذلك، يؤثر عدم تجانس مصفوفات التغاير على إجراءات المتابعة (Post-Hoc Procedures) التي يتم تطبيقها بعد MANOVA، مثل تحليل التباين أحادي المتغير لكل متغير تابع على حدة. هذه الإجراءات المتبعة قد تفقد دقتها، مما يجعل الاستدلالات التفصيلية حول أي متغير تابع مسؤول عن الدلالة الكلية أمراً مشكوكاً فيه. بالتالي، فإن الحفاظ على التجانس يعتبر شرطاً لضمان صلاحية الاختبارات اللاحقة.

6. التدابير العلاجية والبدائل الإحصائية

عندما يتم رفض فرضية تجانس مصفوفة التغاير (خاصة في التصاميم غير المتوازنة)، يجب على الباحث اتخاذ تدابير علاجية للتخفيف من تأثير هذا الانتهاك على النتائج.

أولاً، تحويل البيانات: يمكن محاولة استخدام التحويلات الرياضية المناسبة (مثل اللوغاريتم أو الجذر التربيعي) للمتغيرات التابعة. في بعض الأحيان، يمكن للتحويل أن يحسن من التوزيع الطبيعي متعدد المتغيرات، والذي بدوره قد يؤدي إلى تحسين تجانس مصفوفة التغاير. ومع ذلك، يجب توخي الحذر عند تفسير النتائج بعد التحويل، حيث أن التأثيرات تصبح على مقياس التحويل وليس على المقياس الأصلي للمتغيرات.

ثانياً، استخدام اختبارات MANOVA البديلة: بدلاً من الاعتماد على إحصاءات الاختبار القياسية (مثل ويلكس لامدا)، يمكن استخدام إحصاءات اختبارية أكثر قوة ضد انتهاك التجانس. في حالة انتهاك التجانس، يوصي بعض الإحصائيين باستخدام إحصاءات تريس بيل (Pillai’s Trace) بدلاً من ويلكس لامدا، خاصة عندما تكون أحجام العينات صغيرة، لأن تريس بيل يعتبر الأكثر قوة (Robust) ضد انتهاك افتراض التجانس.

ثالثاً، استخدام أساليب إحصائية روبستية (Robust): يمكن اللجوء إلى النمذجة الإحصائية المتقدمة التي لا تفترض التجانس، مثل استخدام تحليل الانحدار متعدد المتغيرات مع تقديرات الأخطاء المعيارية القوية (Robust Standard Errors) التي لا تتطلب افتراض التجانس. كما يمكن استخدام تحليل التباين متعدد المتغيرات غير البارامتري (Non-parametric Multivariate Analysis)، على الرغم من أن هذا المجال لا يزال أقل تطوراً من نظيره البارامتري. إذا كان عدم التجانس شديداً، فإن أفضل حل قد يكون استخدام تحليل MANOVA منفصل لكل مجموعة، وهو ما يعقد المقارنة المباشرة ولكنه يتجنب افتراض تجميع مصفوفات التغاير.

7. التطبيقات الرئيسية في الإحصاء متعدد المتغيرات

يعد افتراض تجانس مصفوفة التغاير حاسماً في عدد من التقنيات الإحصائية المتقدمة التي تتطلب مقارنات بين المجموعات بناءً على مجموعة من المتغيرات التابعة:

  • تحليل التباين متعدد المتغيرات (MANOVA): هذا هو التطبيق الأكثر شيوعاً. تفترض MANOVA أن مصفوفات التغاير متساوية للسماح بحساب إحصاءات اختبار موحدة وموثوقة لتقييم ما إذا كانت متوسطات المتجهات تختلف بين المجموعات.
  • تحليل التمييز (Discriminant Analysis): يستخدم هذا التحليل لتصنيف الأفراد إلى مجموعات بناءً على مجموعة من المتغيرات التنبؤية. يفترض تحليل التمييز الخطي (Linear Discriminant Analysis) تجانس مصفوفات التغاير بين المجموعات. إذا تم انتهاك التجانس، يجب استخدام تحليل التمييز التربيعي (Quadratic Discriminant Analysis) بدلاً منه، والذي يسمح لمصفوفات التغاير بأن تكون مختلفة.
  • تصاميم القياسات المتكررة (Repeated Measures Designs): في هذه التصاميم، يكون الافتراض المكافئ لتجانس مصفوفة التغاير هو افتراض الكروية (Sphericity) أو التجانس المركب (Compound Symmetry) عندما يكون هناك عامل واحد داخل الأفراد. وفي حالة وجود عدة عوامل داخل الأفراد، يصبح الافتراض أكثر تعقيداً ويتعلق ببنية مصفوفة التغاير. يتطلب الفشل في تحقيق هذه الشروط تطبيق تصحيحات مثل تصحيح جرينهاوس-جايسر (Greenhouse-Geisser) أو هويفيلدت-فيلدت (Huynh-Feldt).

قراءات إضافية