اختبار بارتليت: مفتاحك الذهبي لضمان دقة النتائج النفسية

مدرس الدكتور محمد لوتي

المحتويات:

اختبار بارتلت لتساوي التباين

Primary Disciplinary Field(s): الإحصاء الرياضي، الإحصاء التطبيقي (التحليل البارامتري)

1. التعريف الجوهري والفرضيات

اختبار بارتلت (Bartlett test) هو إجراء إحصائي بارامتري يستخدم لتحديد ما إذا كانت تباينات مجموعتين أو أكثر من العينات العشوائية متساوية بشكل أساسي. يُعرف هذا الشرط في الإحصاء باسم تجانس التباين (Homoscedasticity). يعد هذا الاختبار ذا أهمية قصوى كفحص تمهيدي لعدد من الاختبارات الإحصائية الرئيسية الأخرى، وعلى رأسها تحليل التباين (ANOVA)، الذي يفترض أن التباين داخل كل مجموعة يتم اختباره متماثل. تم تطوير هذا الاختبار من قبل الإحصائي البريطاني موريس ستيفنسون بارتلت في ثلاثينيات القرن العشرين.

تتمثل الفرضية الصفرية (H0) لاختبار بارتلت في أن جميع تباينات المجموعات السكانية التي أُخذت منها العينات متساوية. بمعنى آخر، إذا كان لدينا k من المجموعات، فإن H0 تنص على أن σ²₁ = σ²₂ = … = σ²k. في المقابل، تنص الفرضية البديلة (Ha) على أن تباين مجموعة سكانية واحدة على الأقل يختلف عن الآخرين. يتطلب الاختبار افتراضًا صارمًا بأن البيانات في كل مجموعة يتم سحبها من توزيع طبيعي، وهو ما يشكل نقطة ضعف رئيسية للاختبار مقارنة ببعض البدائل الأحدث.

تكمن الفكرة المحورية للاختبار في مقارنة المتوسط الهندسي للتباينات الخاصة بالعينات الفردية بالتباين المجمع (الموزون) لكافة العينات معًا. إذا كانت التباينات متساوية بالفعل، يجب أن تكون قيمة إحصائية الاختبار الناتجة صغيرة، مما يدعم الفرضية الصفرية. أما إذا كانت هناك اختلافات كبيرة، فستكون الإحصائية كبيرة، مما يؤدي إلى رفض الفرضية الصفرية والتوصل إلى أن التباينات غير متجانسة.

2. الأساس النظري للتباين المتجانس

يُعد شرط تجانس التباين أحد الركائز الأساسية التي تقوم عليها النماذج الإحصائية البارامترية القوية، وخاصة تلك التي تعتمد على التوزيع الطبيعي ومربع مجموع الانحرافات، مثل تحليل التباين (ANOVA) واختبارات t للمجموعات المستقلة. عند استيفاء هذا الشرط، يمكن الوثوق بأن الأخطاء العشوائية في النموذج تتوزع بشكل متساوٍ عبر نطاق المتغيرات، مما يضمن أن مستويات الأهمية المحسوبة تكون دقيقة وموثوقة.

في سياق تحليل التباين (ANOVA)، يتم تصميم الاختبار لتقييم ما إذا كانت هناك اختلافات ذات دلالة إحصائية بين متوسطات مجموعات مختلفة. إن أساس هذا التحليل هو فصل التباين الكلي إلى تباين “بين المجموعات” وتباين “داخل المجموعات”. إذا كان التباين داخل المجموعات غير متجانس (Heteroscedasticity)، فإن هذا يشير إلى أن قدرة المجموعات على التنبؤ بالتباين داخلها تختلف اختلافًا كبيرًا، وبالتالي فإن إحصائية F المستخدمة في ANOVA تصبح غير موثوقة، وقد تؤدي إلى استنتاجات خاطئة حول الفروق بين المتوسطات.

عندما يتم انتهاك افتراض تجانس التباين، خاصة في حالة الأحجام غير المتساوية للعينات، يزداد خطر ارتكاب الخطأ من النوع الأول (رفض H0 وهي صحيحة) أو الخطأ من النوع الثاني (الفشل في رفض H0 وهي خاطئة). يتيح اختبار بارتلت للباحثين فرصة التحقق من هذا الافتراض مسبقًا، مما يمكنهم من اتخاذ قرار مستنير بشأن ما إذا كان يجب عليهم المضي قدمًا في الاختبارات البارامترية القياسية أو التحول إلى إجراءات أكثر قوة أو غير بارامترية، أو تطبيق تصحيحات مثل تصحيح ويلش (Welch’s correction) في حالة ANOVA.

3. الصيغة الرياضية للاختبار

يعتمد اختبار بارتلت على إحصائية اختبار (B) التي يتم بناؤها باستخدام التباينات الخاصة بكل مجموعة والتباين المجمع الموزون. يتم تصميم الإحصائية بحيث تتبع تقريبًا توزيع Chi-squared (كاى تربيع) بدرجات حرية تساوي عدد المجموعات مطروحًا منه واحد (k-1).

تُحسب إحصائية بارتلت باستخدام العلاقة التالية: B = C * (-2 ln(L))، حيث L هي نسبة الإمكان (Likelihood Ratio)، ويتم تبسيط هذه الصيغة عادةً في التطبيق العملي. يتمثل الجزء الأساسي في حساب تباين العينة المجمع الموزون (S²p)، والذي يمثل أفضل تقدير مشترك للتباين المشترك إذا كانت الفرضية الصفرية صحيحة. ثم يتم حساب إحصائية الاختبار B التي تعتمد على الفرق بين التباين المجمع والمتوسط الهندسي للتباينات الفردية، ويتم ضبطها بعامل تصحيح (C) لتحسين تقريبها لتوزيع Chi-squared.

رياضياً، يتم تعريف إحصائية الاختبار B (أو X²_Bartlett) على النحو التالي: B = (N – k) ln(S²p) – Σ (ni – 1) ln(S²i)، حيث N هو الحجم الكلي للعينات، k هو عدد المجموعات، S²p هو التباين المجمع، و S²i هو تباين العينة للمجموعة i، و ni هو حجم العينة للمجموعة i. يتم بعد ذلك قسمة هذه القيمة على عامل تصحيح C الذي يضمن دقة التقريب لتوزيع كاى تربيع، خاصةً عندما تكون أحجام العينات صغيرة أو غير متساوية. هذا التركيب المعقد هو ما يمنح اختبار بارتلت قوته الإحصائية العالية في اكتشاف الفروق في التباينات عندما تكون الافتراضات مستوفاة.

4. إجراءات التطبيق العملي

يتضمن تطبيق اختبار بارتلت عمليًا عدة خطوات منهجية تبدأ بجمع البيانات وتنتهي باتخاذ قرار إحصائي. أولاً، يجب على الباحث تحديد مستوى الأهمية (α)، والذي عادةً ما يكون 0.05. بعد ذلك، يتم حساب التباين لكل مجموعة من المجموعات قيد الدراسة (S²i) وحجم العينة لكل مجموعة (ni).

ثانياً، يتم حساب التباين المجمع الموزون (S²p)، والذي يمثل المتوسط المرجح للتباينات الفردية، باستخدام درجات الحرية لكل مجموعة كأوزان. بعد ذلك، يتم حساب إحصائية الاختبار B وعامل التصحيح C كما هو موضح في الصيغ الرياضية. يتم استخدام هذه الإحصائية النهائية للمقارنة.

ثالثاً، يتم مقارنة القيمة المحسوبة لإحصائية B بالقيمة الحرجة لتوزيع كاى تربيع بدرجات حرية k-1 وعلى مستوى الأهمية α. إذا كانت قيمة B المحسوبة أكبر من القيمة الحرجة، أو إذا كانت قيمة p المرتبطة بها أقل من α، يتم رفض الفرضية الصفرية. هذا الرفض يعني أن هناك دليلاً إحصائياً قوياً على أن التباينات غير متساوية، ويجب على الباحث توخي الحذر عند تفسير نتائج الاختبارات البارامترية اللاحقة.

5. التطور التاريخي والمنشأ

يعود أصل اختبار بارتلت إلى عمل موريس ستيفنسون بارتلت (Maurice Stevenson Bartlett) في عام 1937. كان بارتلت أحد رواد الإحصاء في منتصف القرن العشرين، وقد طور هذا الإجراء كتحسين لاختبارات سابقة لتباين الإمكانية، خاصة اختبار M لبوكس (Box’s M test)، ولكنه ركز على تطبيق أكثر بساطة عندما تكون البيانات موزعة بشكل طبيعي.

جاء تطوير اختبار بارتلت في سياق الحاجة المتزايدة إلى أدوات إحصائية تمهيدية موثوقة للتحقق من افتراضات النماذج البارامترية التي كانت تكتسب شعبية كبيرة في ذلك الوقت، ولا سيما في الزراعة والبيولوجيا، حيث كان تحليل التباين (ANOVA) أداة أساسية. لقد كان هدف بارتلت هو توفير اختبار يتمتع بقوة إحصائية عالية (أي القدرة على اكتشاف الفروق الحقيقية في التباينات) تحت افتراض التوزيع الطبيعي المثالي.

لقد استمد بارتلت الأساس النظري لاختباره من نظرية اختبار نسبة الإمكان (Likelihood-ratio test)، وهي طريقة عامة لبناء اختبارات الفرضيات الإحصائية. قام بتعديل إحصائية نسبة الإمكان بحيث تتبع توزيع كاى تربيع التقريبي، مما جعلها قابلة للتطبيق العملي على نطاق واسع في الإحصاء التطبيقي. وقد كان هذا التعديل، المتمثل في عامل التصحيح، هو المساهمة الرئيسية التي عززت دقة الاختبار، خاصة في العينات الصغيرة.

6. الأهمية والاستخدامات الإحصائية

تكمن الأهمية الرئيسية لاختبار بارتلت في كونه مقياسًا قويًا وحساسًا لانتهاك افتراض تجانس التباين. عند استخدام هذا الاختبار في بيئة تتوفر فيها البيانات طبيعية التوزيع، فإنه يوفر أعلى قوة مقارنة بالعديد من الاختبارات الأخرى المتاحة، مثل اختبار ليفين (Levene’s test)، مما يعني أنه أقل عرضة للخطأ من النوع الثاني (الفشل في اكتشاف التباين غير المتجانس عندما يكون موجودًا بالفعل).

يُستخدم اختبار بارتلت بشكل روتيني في مراحل تحليل البيانات التمهيدية في مجالات متنوعة مثل البحث العلمي التجريبي، وعلم النفس، والطب، والهندسة. على سبيل المثال، قبل إجراء تجربة تتضمن مقارنة تأثير ثلاثة علاجات دوائية (باستخدام ANOVA)، يتم استخدام اختبار بارتلت للتأكد من أن تباين استجابة المرضى في كل مجموعة علاجية متماثل. إذا فشل الاختبار، يجب على الباحث إما تحويل البيانات أو استخدام اختبارات بديلة.

بالإضافة إلى وظيفته كاختبار تمهيدي، يساهم اختبار بارتلت في فهم بنية البيانات. إذا أظهر الاختبار تباينًا غير متجانس، فإنه يشير إلى أن المتغير المستقل يؤثر ليس فقط على متوسطات المجموعات، بل يؤثر أيضًا على انتشار البيانات وتشتتها. هذه المعلومات قد تكون ذات قيمة نظرية بحد ذاتها، حيث تدل على أن تأثير المعالجة ليس متسقًا عبر جميع الأفراد في العينة.

7. الانتقادات والقيود

على الرغم من القوة الإحصائية العالية لاختبار بارتلت، إلا أنه يعاني من قيود كبيرة جعلت الإحصائيين يفضلون استخدام بدائل أكثر قوة في التطبيقات العملية الحديثة. يتمثل القيد الأبرز في حساسية الاختبار الشديدة لانتهاك افتراض التوزيع الطبيعي (Normality assumption).

إذا كانت البيانات منحرفة قليلاً أو بها ذيول سميكة (أي لا تتوافق تمامًا مع التوزيع الطبيعي)، فإن اختبار بارتلت يميل إلى رفض الفرضية الصفرية لتساوي التباينات بشكل متكرر أكثر من اللازم. بعبارة أخرى، يرتفع معدل الخطأ من النوع الأول بشكل كبير عندما لا تكون البيانات موزعة بشكل طبيعي. هذا يعني أن الاختبار قد يشير خطأً إلى وجود تباين غير متجانس، في حين أن الاختلافات الملحوظة في الإحصائية هي في الواقع نتاج لعدم الطبيعية بدلاً من عدم التجانس في التباين نفسه.

لهذا السبب، يوصي الإحصائيون غالبًا باستخدام اختبارات بديلة تكون أكثر قوة (Robust) ضد انتهاكات الطبيعية. من أبرز هذه البدائل: اختبار ليفين (Levene’s test) واختبار براون-فورسايث (Brown–Forsythe test). تعتمد هذه البدائل على الإحصائيات التي تكون أقل تأثراً بالقيم المتطرفة أو انحراف التوزيع عن الطبيعية، مما يجعلها الخيار المفضل في معظم مجموعات البيانات الواقعية التي نادراً ما تكون موزعة بشكل مثالي.

قراءات إضافية

Bartlett, M. S. (1937). Properties of Sufficiency and Statistical Tests. Proceedings of the Royal Society of London. Series A, Mathematical and Physical Sciences, 160(901), 268–282.
Bartlett’s test (Wikipedia).
Snedecor, G. W., & Cochran, W. G. (1989). Statistical Methods (8th ed.). Iowa State University Press.