إحصائي تقليدي – frequentist

مدرس الدكتور محمد لوتي

المحتويات:

الإحصاء التكراري (Frequentist Statistics)

المجال (المجالات) التخصصية الأساسية: الإحصاء الرياضي، نظرية الاحتمالات، المنهجية العلمية

1. التعريف الأساسي

يشير مصطلح التكرارية أو المنهج التكراري إلى مدرسة فكرية ومنهجية رئيسية في الإحصاء ونظرية الاحتمالات، حيث تُفسر الاحتمالية على أنها الحد الذي يقترب منه التكرار النسبي لحدث معين في سلسلة طويلة ومستمرة من التجارب العشوائية المتطابقة والمستقلة. في هذا الإطار، لا يُنظر إلى الاحتمال على أنه درجة من الاعتقاد الشخصي أو المعرفة (كما في الاحتمالية البايزية)، بل كخاصية موضوعية متأصلة في الظاهرة قيد الدراسة، والتي يمكن ملاحظتها وقياسها من خلال التكرارات التجريبية. هذا التفسير يلزم الباحث بالنظر إلى البيانات التي تم جمعها كعينة واحدة من مجموعة افتراضية لا نهائية من العينات الممكنة التي كان يمكن سحبها، مما يوجه طرق الاستدلال الإحصائي نحو تقييم مدى جودة الأداء المنهجي لهذه الإجراءات على المدى الطويل.

إن جوهر الفلسفة التكرارية يكمن في التعامل مع المعلمات (Parameters) السكانية على أنها قيم ثابتة، ولكنها غير معلومة. على سبيل النقيض، يتم التعامل مع التقديرات الإحصائية المستخلصة من العينة (مثل المتوسط العيني أو الانحراف المعياري) على أنها متغيرات عشوائية، لأن قيمتها تتغير اعتماداً على العينة المحددة التي تم سحبها. هذه النظرة تختلف جذريًا عن المناهج الأخرى، وتؤثر بشكل مباشر على كيفية بناء أدوات الاستدلال الرئيسية مثل اختبار الفرضيات وفترات الثقة. فمثلاً، عندما يقوم الإحصائي التكراري بإنشاء فترة ثقة بنسبة 95%، فإنه لا يدعي أن هناك احتمال 95% بأن المعلمة تقع ضمن هذه الفترة المحددة، بل يفسرها على أن 95% من فترات الثقة التي يتم إنشاؤها باستخدام هذه الطريقة ستنجح في احتواء القيمة الحقيقية الثابتة للمعلمة إذا تم تكرار التجربة لعدد لا نهائي من المرات.

يهدف المنهج التكراري إلى توفير أدوات موضوعية لاتخاذ القرارات الإحصائية التي تتحكم في معدلات الخطأ على المدى الطويل. تعتمد هذه الأدوات بشكل كبير على توزيع العينات (Sampling Distribution)، وهو التوزيع الاحتمالي لإحصائية معينة (مثل المتوسط) إذا تم تكرار عملية أخذ العينات مرات لا حصر لها. تتيح هذه الرؤية للباحثين تقييم ما إذا كانت النتائج المرصودة في العينة غير محتملة الحدوث في ظل افتراض معين (الفرضية الصفرية)، وبالتالي اتخاذ قرار برفض هذا الافتراض أو الفشل في رفضه. هذا التركيز الصارم على التكرار طويل الأجل والرقابة الموضوعية على الأخطاء هو ما جعل الإحصاء التكراري يشكل العمود الفقري للإحصاء التطبيقي في العلوم الطبيعية والاجتماعية طوال القرن العشرين وحتى يومنا هذا.

2. أصل الكلمة والتطور التاريخي

تعود الجذور الفلسفية لتفسير الاحتمالية على أساس التكرار إلى القرن التاسع عشر، حيث حاول فلاسفة وعلماء مثل جون فين (John Venn) في كتابه “منطق الصدفة” (The Logic of Chance) وتوماس سيمبسون سبينس (Thomas Simpson Spens) ربط الاحتمال بشكل مباشر بالتجربة الحسية والتكرارات الملاحظة. كان الهدف الأساسي هو إبعاد مفهوم الاحتمال عن التفسيرات الذاتية (التي كانت سائدة في أعمال بيير سيمون لابلاس وغيره) وجعله مفهومًا موضوعيًا يمكن التحقق منه تجريبيًا. ومع ذلك، لم يتم صياغة الأساس الرياضي الصارم للمدرسة التكرارية إلا في أوائل القرن العشرين من قبل ريتشارد فون ميسيس (Richard von Mises)، الذي قدم تعريفًا رسميًا للاحتمال بناءً على “المتسلسلات العشوائية” (Collectives)، وهي تسلسلات لا نهائية من الأحداث تحقق شروط عشوائية محددة.

شهدت الفترة ما بين العقدين الثاني والرابع من القرن العشرين التطور الحاسم للاستدلال الإحصائي التكراري الحديث. كان لعمل السير رونالد فيشر (Ronald Fisher) تأثير هائل في تطوير اختبارات الأهمية الإحصائية ومفهوم القيمة الاحتمالية (P-value) ومنهجية تقدير الاحتمال الأقصى (Maximum Likelihood Estimation – MLE). قدم فيشر الأدوات التي سمحت للعلماء بتحويل البيانات التجريبية إلى استنتاجات موضوعية قابلة للقياس، مما أدى إلى اعتماد منهجه على نطاق واسع في مجال الزراعة والبيولوجيا والطب. وعلى الرغم من أن فيشر كان رائداً في هذه المدرسة، إلا أن منهجه كان يركز على اختبار الفرضيات الصفرية دون الحاجة إلى تحديد فرضية بديلة صريحة.

تلى عمل فيشر التطور المنهجي الذي قام به جيرزي نيمان (Jerzy Neyman) وإيغون بيرسون (Egon Pearson)، اللذان قاما بدمج اختبارات الأهمية مع فكرة اتخاذ القرار الإحصائي الرسمي. أسس نيمان وبيرسون إطار اختبار الفرضيات الحالي الذي يتطلب تحديد فرضية بديلة (H1) وتحديد معدلات الخطأ من النوع الأول (ألفا) والنوع الثاني (بيتا) بشكل مسبق، مما يتيح التحكم في قوة الاختبار الإحصائي. وقد أدى هذا التوليف بين أعمال فيشر ونيمان-بيرسون إلى إنشاء المنهجية التكرارية القياسية التي لا تزال تهيمن على التدريس والممارسة الإحصائية في معظم التخصصات الأكاديمية والتطبيقية حول العالم.

3. المبادئ الأساسية للاحتمالية التكرارية

يستند المنهج التكراري على مجموعة من المبادئ الصارمة المتعلقة بكيفية تعريف الاحتمال واستخدامه في الاستدلال. أول هذه المبادئ هو الافتراض التكراري طويل الأجل، الذي ينص على أن الاحتمال لا يصف نتيجة تجربة فردية، بل يصف نسبة وقوع الحدث في حالة تكرار التجربة بشكل لا نهائي تحت نفس الظروف. وهذا يعني أن الإحصاء التكراري لا يمكنه أن يخبرنا عن احتمالية وقوع حدث لمرة واحدة (كاحتمال فوز فريق رياضي معين في مباراة الغد)، بل يخبرنا فقط عن الأداء المتوقع للإجراءات الإحصائية على مجموعة كبيرة من التجارب المتشابهة.

المبدأ الثاني هو الموضوعية والثبات. في المنهج التكراري، تعتبر المعلمات (مثل متوسط الدخل الحقيقي لسكان دولة ما) قيماً ثابتة وموضوعية ومحددة سلفاً في الطبيعة، حتى لو كانت غير معروفة لنا. وبالتالي، فإن مهمة الإحصائي هي تطوير أدوات (مثل المقدرات أو الاختبارات) تتمتع بخصائص جيدة في ظل تكرار عملية أخذ العينات. هذه الخصائص تشمل الاتساق (Consistency)، حيث تقترب التقديرات من القيمة الحقيقية للمَعْلَمة مع زيادة حجم العينة، والفعالية (Efficiency)، حيث تنتج المقدرات أقل تباين ممكن.

المبدأ الثالث هو التركيز على توزيع العينات (Sampling Distribution). جميع الاستدلالات التكرارية تعتمد على فكرة أن الإحصائية التي يتم حسابها من العينة (مثل المتوسط العيني) هي مجرد نقطة واحدة في توزيع أوسع بكثير من النتائج الممكنة إذا كنا قد سحبنا جميع العينات الممكنة بنفس الحجم. يتيح لنا هذا التوزيع حساب القيمة الاحتمالية (P-value)، والتي تحدد مدى ندرة النتيجة المرصودة في العينة إذا كانت الفرضية الصفرية صحيحة. هذا المفهوم يضمن أن الاستنتاجات الإحصائية مبنية على أساس رياضي يحدد التباين المتوقع الناجم عن العشوائية في عملية أخذ العينات.

4. المفاهيم الرئيسية في الاستدلال التكراري

يعتمد الاستدلال التكراري على مفهومين أساسيين للاستنتاج: اختبار الفرضيات الإحصائية (Hypothesis Testing) وتقدير الفترة (Interval Estimation). في اختبار الفرضيات، يتم صياغة فرضيتين متنافستين: الفرضية الصفرية (H0)، التي تمثل عادةً حالة عدم وجود تأثير أو عدم وجود فرق، والفرضية البديلة (H1). يتم استخدام البيانات لتحديد ما إذا كانت هناك أدلة كافية لرفض H0. وتُعد القيمة الاحتمالية (P-value) هي الأداة الأكثر شهرة في هذا الإطار، حيث تمثل احتمال الحصول على بيانات مساوية أو أكثر تطرفاً من البيانات المرصودة، بافتراض أن الفرضية الصفرية صحيحة.

أما المفهوم الثاني، فهو فترة الثقة (Confidence Interval)، وهي نطاق من القيم يُتوقع أن يحتوي على القيمة الحقيقية للمَعْلَمة السكانية غير المعروفة. كما ذُكر سابقاً، فإن تفسير فترة الثقة التكرارية يعتمد على الأداء طويل الأجل للإجراء. على سبيل المثال، إذا تم حساب فترة ثقة بنسبة 99%، فإن الإحصائي التكراري يضمن أن هذا الإجراء، إذا تم تكراره 100 مرة، سيؤدي إلى احتواء 99 فترة منها للقيمة الحقيقية للمعلمة. فترة الثقة توفر معلومات حول دقة التقدير أكثر من مجرد نقطة تقدير واحدة (Point Estimate)، وتعتبر مكملة لاختبار الفرضيات.

إضافة إلى ذلك، يلعب مفهوم التحكم في الأخطاء دوراً محورياً في الإحصاء التكراري. يتم تحديد نوعين من الأخطاء: خطأ النوع الأول (Type I Error)، وهو رفض الفرضية الصفرية وهي صحيحة (معدله يرمز له بـ ألفا، وعادة ما يُحدد عند 0.05)، وخطأ النوع الثاني (Type II Error)، وهو الفشل في رفض الفرضية الصفرية وهي خاطئة (معدله يرمز له بـ بيتا). يهدف الإحصائيون التكراريون إلى تصميم اختبارات تضمن أن معدل خطأ النوع الأول لا يتجاوز عتبة معينة (مستوى الأهمية)، مع محاولة زيادة قوة الاختبار (Power)، وهي احتمال رفض H0 عندما تكون خاطئة (معدلها يساوي 1 – بيتا).

5. المنهجيات والأدوات التكرارية

يُعد تقدير الاحتمال الأقصى (Maximum Likelihood Estimation – MLE) أحد أهم الأدوات التكرارية المستخدمة في تقدير المعلمات. تقوم هذه المنهجية باختيار قيم المعلمات التي تجعل احتمال رؤية البيانات المرصودة (أو كثافتها الاحتمالية) هو الأكبر. أي أنها تبحث عن المعلمات التي “تفسر” البيانات الحالية بأفضل شكل ممكن. يتمتع مقدر الاحتمال الأقصى بخصائص إحصائية مرغوبة للغاية في الإطار التكراري، خاصةً في العينات الكبيرة، حيث يُعرف بأنه متسق (Consistent) وفعال (Efficient) ويتبع تقريباً توزيعاً طبيعياً.

تشمل الأدوات التكرارية الأخرى مجموعة واسعة من الاختبارات البارامترية وغير البارامترية. الاختبارات البارامترية، مثل اختبارات t، تحليل التباين (ANOVA)، و تحليل الانحدار الخطي (Linear Regression)، هي أدوات تكرارية أساسية تعتمد على افتراضات معينة حول توزيع البيانات (غالباً التوزيع الطبيعي). هذه الأدوات مصممة لتقييم العلاقات بين المتغيرات أو مقارنة متوسطات المجموعات مع التحكم في معدلات الخطأ المحددة مسبقاً (مستوى ألفا). نجاح هذه النماذج في تلبية متطلبات المنهج العلمي التجريبي ساهم في انتشارها كمعيار ذهبي للتحليل الكمي.

كما يعتمد الإحصاء التكراري بشكل كبير على النظرية المقاربة (Asymptotic Theory)، وهي فروع رياضية تصف سلوك الإحصائيات عندما يقترب حجم العينة من اللانهاية. نظرًا لأن التعريف التكراري للاحتمال يتطلب سلسلة لا نهائية من التجارب، فإن العديد من الخصائص المرغوبة للمقدرات (مثل الكفاءة والتوزيع الطبيعي) لا تكون صحيحة إلا تقريبًا في العينات المحدودة، وتصبح دقيقة فقط عندما تكون العينة كبيرة جداً. لذلك، فإن الثقة في الاستدلالات التكرارية غالبًا ما تكون مرتبطة بشكل مباشر بحجم العينة المتاحة، مما يشكل تحديًا في سياقات البحث التي تفتقر إلى البيانات الضخمة.

6. التباين الفلسفي مع الإحصاء البايزي

يختلف المنهج التكراري اختلافاً جوهرياً عن الإحصاء البايزي في تفسير الاحتمال. بالنسبة للتكراريين، الاحتمال هو تكرار نسبي موضوعي، في حين أن البايزيين يرون الاحتمال على أنه درجة من الاعتقاد الشخصي أو المعرفة (Epistemic Probability) التي يمكن تحديثها باستخدام البيانات الجديدة وفقاً لقاعدة بايز. هذا التباين ينتج عنه اختلافات عميقة في كيفية إجراء الاستدلال الإحصائي.

أحد أهم نقاط التباين هي طريقة التعامل مع المعلمات السكانية. يرى التكراريون أن المعلمة ثابتة وغير عشوائية (وبالتالي، لا يمكن الحديث عن “احتمال” أن تكون المعلمة في نطاق معين)، بينما يرى البايزيون أن المعلمة هي متغير عشوائي يمكن تخصيص توزيع احتمالي له (يُعرف بالتوزيع القبلي أو السابق) يعكس المعرفة المتاحة قبل جمع البيانات. بعد جمع البيانات، يتم دمج التوزيع القبلي مع البيانات المرصودة لإنتاج التوزيع البعدي (Posterior Distribution)، الذي يلخص جميع الاستنتاجات حول المعلمة.

يظهر التباين أيضًا في صياغة النتائج. يقدم الإحصاء التكراري فترات الثقة والقيم الاحتمالية التي تجيب على السؤال: “ما مدى احتمالية ملاحظة هذه البيانات (أو بيانات أكثر تطرفاً) إذا كانت الفرضية الصفرية صحيحة؟”. في المقابل، يقدم الإحصاء البايزي فترات المصداقية (Credible Intervals) والتوزيعات البعدية التي تجيب على السؤال الأكثر بداهة للباحث: “بالنظر إلى البيانات، ما هو مدى الاحتمال بأن المعلمة الحقيقية تقع في هذا النطاق؟”. هذا الاختلاف في التفسير يجعل الاستنتاجات البايزية أكثر سهولة في الفهم المباشر للإجابة على الأسئلة البحثية.

7. الأهمية والتأثير

لقد شكل الإحصاء التكراري النظام المهيمن في العلوم التجريبية منذ ثلاثينيات القرن العشرين، ولا تزال أدواته تشكل أساس المنهجية العلمية في مجالات مثل الطب الحيوي، وعلم النفس، والاقتصاد، والفيزياء. وقد أتاحت المنهجية التكرارية وضع معايير موضوعية وموحدة لتقييم الأدلة، مما ساعد في فصل الاكتشافات العلمية القائمة على أدلة قوية عن تلك القائمة على المصادفة العشوائية. إن إطار عمل نيمان-بيرسون، الذي يركز على التحكم في معدلات الخطأ، كان أساسياً لضمان سلامة التجارب السريرية والتصنيع عالي الجودة حيث يكون التحكم في المخاطر أمراً بالغ الأهمية.

إن إرث الإحصاء التكراري يتمثل في توفيره لـ إجراءات إحصائية موثوقة. حتى لو لم يكن التفسير التكراري للاحتمال هو الأكثر بديهية، فإن الأدوات التي يوفرها (مثل الانحدار الخطي واختبارات t) هي أدوات قوية ومستقرة رياضياً وذات خصائص معروفة جيدًا. وقد أدى هذا الاستقرار الرياضي والمنهجي إلى ترسيخ الثقة في النتائج الإحصائية المنشورة في المجلات العلمية، مما سمح بتراكم المعرفة بشكل منهجي يعتمد على أدلة قابلة للاختبار والتحقق.

علاوة على ذلك، فإن معظم البرامج الإحصائية القياسية (مثل SPSS وR وSAS) تعتمد على خوارزميات وطرق تقدير متجذرة في الإطار التكراري، مما يجعله اللغة المشتركة بين الأكاديميين والممارسين الإحصائيين حول العالم. وعلى الرغم من التحديات الأخيرة والمنافسة من المناهج البايزية، يظل الإحصاء التكراري حجر الزاوية الذي يتم من خلاله تدريس أساسيات الاستدلال الإحصائي في الجامعات والمؤسسات البحثية.

8. النقاشات والانتقادات

على الرغم من هيمنته التاريخية، يواجه الإحصاء التكراري انتقادات كبيرة، أبرزها ما يتعلق بسوء تفسير القيمة الاحتمالية (P-value). يميل العديد من الباحثين إلى تفسير P-value خطأً على أنها احتمال خطأ الفرضية الصفرية، بدلاً من تفسيرها الصحيح كاحتمال للبيانات في ظل الفرضية الصفرية. وقد ساهم هذا الخطأ المفاهيمي في ظهور ما يعرف بـ “أزمة التكرار” (Replication Crisis)، حيث يتم نشر العديد من النتائج ذات الدلالة الإحصائية (P < 0.05) والتي لا يمكن إعادة إنتاجها في دراسات لاحقة.

انتقاد آخر رئيسي هو أن الإحصاء التكراري لا يسمح بدمج المعرفة السابقة أو المعلومات الخارجية (Prior Information) في التحليل بشكل صريح، مما يؤدي في بعض الأحيان إلى تجاهل أدلة قوية سابقة أو إلى نتائج غير منطقية في سياقات العينات الصغيرة. كما يُنتقد المنهج التكراري لاعتماده على “النية” أو “قواعد التوقف” (Stopping Rules)؛ فنتائج اختبار تكراري يمكن أن تتغير إذا قرر الباحث التوقف عن جمع البيانات مبكراً أو متأخراً، وهو ما يتعارض مع “مبدأ الاحتمال” (Likelihood Principle) الذي يدعم فكرة أن الاستدلال يجب أن يعتمد فقط على البيانات التي تم جمعها، وليس على البيانات التي كان من الممكن جمعها.

أخيراً، يواجه التفسير التكراري صعوبات فلسفية عند التعامل مع الأحداث الفريدة أو غير القابلة للتكرار (مثل احتمالية وقوع حرب نووية أو احتمالية نجاح مهمة فضائية لمرة واحدة). بما أن الاحتمال في الإطار التكراري لا يُعرف إلا من خلال التكرار اللانهائي، فإنه يفشل في تقديم مقياس عملي للاحتمالية لتلك الأحداث التي بطبيعتها لا يمكن تكرارها، وهي نقطة قوة رئيسية للمنهج البايزي الذي يمكنه تخصيص احتمال لكل حدث بناءً على درجة المعرفة المتاحة.