فترة المصداقية: دليلك لفهم اليقين في البحث النفسي

مدرس الدكتور محمد لوتي

المحتويات:

فترة المصداقية (Credible Interval)

المجال (المجالات) التخصصية الأساسية: الإحصاء البايزي (Bayesian Statistics)، نظرية الاحتمالات

1. التعريف الأساسي

تُعد فترة المصداقية (Credible Interval) مفهومًا إحصائيًا محوريًا ضمن إطار الإحصاء البايزي، وهي تمثل نطاقًا من القيم التي يُحتمل أن يقع فيها المعيار غير المعروف (المعلمة) باحتمالية محددة، بناءً على البيانات المرصودة. خلافًا للنظير التكراري لها، وهو فترة الثقة، فإن فترة المصداقية تصنع بيانًا مباشرًا حول المعلمة نفسها، حيث يتم تفسيرها على أنها تحتوي على المعيار الحقيقي باحتمالية قدرها (1 – α)، حيث تمثل α مستوى الأهمية المحدد (غالبًا 0.05، مما ينتج فترة مصداقية بنسبة 95%). هذا التفسير المباشر يمنحها جاذبية كبيرة في سياقات اتخاذ القرار التي تتطلب قياسًا واضحًا لعدم اليقين.

تُشتق هذه الفترة مباشرة من التوزيع البعدي (Posterior Distribution) للمعلمة. التوزيع البعدي هو نتيجة دمج المعلومات المسبقة لدينا حول المعلمة (التوزيع القبلي) مع المعلومات المستخلصة من البيانات المرصودة (دالة الإمكان) باستخدام مُبرهنة بايز. بالتالي، فإن فترة المصداقية هي ببساطة المنطقة التي تحتل نسبة معينة من كتلة الاحتمال الكلية للتوزيع البعدي. على سبيل المثال، فترة المصداقية 90% هي النطاق الذي يحيط بـ 90% من الاحتمالات البعدية، مما يترك 10% موزعة خارج هذا النطاق.

إن القوة الأساسية لفترة المصداقية تكمن في أنها تجسد حالة المعرفة أو الاعتقاد حول قيمة المعلمة بعد أخذ جميع الأدلة في الاعتبار. بالنسبة للإحصائي البايزي، فإن المعلمة غير معروفة ولكنها ثابتة، ويتم التعبير عن عدم اليقين حولها من خلال التوزيع البعدي. عندما نقول إن فترة المصداقية 95% لمعيار معين هي [L, U]، فإننا نعني أن الاحتمال البعدي بأن تكون قيمة المعيار الحقيقية بين L و U هو 0.95. وهذا يمثل فرقًا جوهريًا عن التفسير المعقد وغير المباشر لفترة الثقة التكرارية.

2. الأصل والتطور التاريخي

يرتبط ظهور مفهوم فترة المصداقية ارتباطًا وثيقًا بالتطور المستمر وتزايد القبول للإحصاء البايزي كمنهجية تحليلية رئيسية. على الرغم من أن جذور الإحصاء البايزي تعود إلى أعمال توماس بايز في القرن الثامن عشر، إلا أن فترة المصداقية كأداة قياسية لم تكتسب شهرة إلا في النصف الثاني من القرن العشرين، مع تزايد الاهتمام بالمنهجيات البايزية كبديل للمنهجيات التكرارية السائدة التي طورها إحصائيون مثل رونالد فيشر وجيرزي نيمان.

في الإحصاء التكراري، كان التركيز ينصب على تطوير أدوات تقييم تحدد السلوك طويل الأجل للعينات المتكررة (مثل فترات الثقة). ومع ذلك، شعر الإحصائيون البايزيون بالحاجة إلى مقياس يعكس بشكل مباشر عدم اليقين حول المعلمة، وليس حول الإجراء الإحصائي. ظهر مصطلح “فترة المصداقية” لتلبية هذه الحاجة وللتأكيد على التمييز الفلسفي بينها وبين “فترة الثقة”. وقد أتاح هذا المفهوم للمحللين التعبير عن النتائج في شكل أكثر سهولة وقربًا من التفكير البشري الطبيعي حول الاحتمال.

كان التقدم التكنولوجي، لا سيما ظهور أساليب الحوسبة المكثفة مثل سلسلة ماركوف مونتي كارلو (MCMC) في أواخر الثمانينات والتسعينات، حاسمًا في ترسيخ فترة المصداقية. قبل هذه الأساليب، كان حساب التوزيع البعدي معقدًا جدًا بالنسبة لمعظم النماذج الواقعية. سمحت MCMC بأخذ عينات من التوزيعات البعدية المعقدة، مما جعل حساب فترات المصداقية عمليًا وقياسيًا، وبالتالي عزز من استخدامها في مجالات واسعة من العلوم والهندسة.

3. العلاقة بالإحصاء البايزي

تُعد فترة المصداقية نتاجًا مباشرًا للمنطق البايزي. يرتكز الإحصاء البايزي على فكرة أن كل ما نعرفه عن المعلمة يجب أن يتم التعبير عنه كتوزيع احتمالي. تبدأ العملية بتوزيع قبلي (Prior Distribution)، يمثل المعتقدات أو المعرفة المتاحة قبل ملاحظة البيانات. عندما يتم جمع البيانات (D)، يتم تحديث هذا الاعتقاد باستخدام دالة الإمكان (Likelihood Function) عبر مبرهنة بايز، مما ينتج التوزيع البعدي (P(θ|D)).

الصيغة الأساسية التي تحكم هذه العملية هي:

التوزيع البعدي ∝ التوزيع القبلي × دالة الإمكان.

التوزيع البعدي هو التوزيع الاحتمالي الكامل للمعلمة (θ) بعد مراعاة البيانات. لفترة المصداقية، يتم تحديد نطاق (فاصل) ضمن هذا التوزيع البعدي بحيث يغطي النسبة المطلوبة من الاحتمال الكلي (على سبيل المثال، 95% أو 99%). هذا يضمن أن فترة المصداقية تعكس بشكل كامل عدم اليقين المتبقي حول المعلمة، مع الأخذ في الاعتبار كلاً من المعلومات المسبقة والبيانات الجديدة.

أحد أهم جوانب العلاقة بين فترة المصداقية والإحصاء البايزي هو أن الإطار البايزي يسمح بإدماج المعلومات السابقة بطريقة رسمية. إذا كانت لدينا معرفة قوية مسبقة، فإن التوزيع القبلي يكون ضيقًا، مما يؤدي إلى فترة مصداقية أضيق (وأكثر دقة)، حتى لو كانت البيانات المرصودة قليلة. على النقيض من ذلك، إذا كان التوزيع القبلي “غير إخباري” (Non-informative)، فإن فترة المصداقية تعتمد بشكل كبير على البيانات، وفي هذه الحالة قد تتطابق عدديًا مع فترة الثقة في بعض النماذج البسيطة (مثل التوزيع الطبيعي).

4. الخصائص الرئيسية والتفسير

تتميز فترات المصداقية بعدة خصائص تجعلها أداة قيمة للتواصل العلمي واتخاذ القرار. أولاً، <strong<التفسير المباشر: كما ذكرنا، فإن التفسير هو أن هناك احتمالًا قدره X% بأن تكون قيمة المعلمة الحقيقية تقع ضمن هذا النطاق، وهو تفسير بديهي لا يحتاج إلى افتراضات حول تكرار التجربة، مما يسهل فهمه من قبل غير المتخصصين.

ثانيًا، هناك أنواع مختلفة من فترات المصداقية، وأكثرها شيوعًا:

فترة الذيل المتساوي (Equal-Tailed Interval – ETI): يتم تحديدها بإيجاد القيم التي تترك نسبة متساوية من الاحتمال (α/2) في كل من الذيل الأيسر والذيل الأيمن للتوزيع البعدي. على سبيل المثال، فترة المصداقية 95% تترك 2.5% في كل ذيل. هذه هي الطريقة الأكثر شيوعًا للحساب، خاصة أنها تتطابق مع المئينيات (Quantiles) للتوزيع البعدي.
فترة أعلى كثافة بعدية (Highest Density Interval – HDI): تُعرف أيضًا باسم فترة أعلى كثافة احتمالية (Highest Posterior Density – HPD). هذه الفترة هي أضيق فترة ممكنة تحتوي على الاحتمال المحدد (مثل 95%). يتميز HDI بأن جميع النقاط داخل الفترة لها كثافة احتمال بعدي أكبر من أي نقطة خارج الفترة. غالبًا ما يفضل HDI لأنه يحدد النطاق الأكثر احتمالًا والأكثر تركيزًا، خاصة إذا كان التوزيع البعدي غير متماثل.

ثالثًا، <strong<الاستجابة للشكل البعدي: على عكس فترات الثقة التي تفترض غالبًا تماثل التوزيع أو تعتمد على التوزيع الطبيعي، تتكيف فترة المصداقية بشكل طبيعي مع أي شكل من أشكال التوزيع البعدي، سواء كان متماثلًا، ملتوياً، أو متعدد القمم (Multimodal). إذا كان التوزيع البعدي ملتوياً، فإن فترة المصداقية ستكون غير متماثلة حول المتوسط البعدي، مما يعكس بدقة عدم اليقين الحقيقي.

5. المقارنة مع فترات الثقة

يُمثل التمييز بين فترة المصداقية (Bayesian CrI) وفترة الثقة (Frequentist CI) أحد أهم النقاط الفلسفية والمنهجية في الإحصاء الحديث. على الرغم من أن الفترتين قد تتطابقان عدديًا في حالات معينة (مثل المعايير المتوسطة في النماذج الخطية باستخدام توزع قبلي غير إخباري)، إلا أن تفسيرهما مختلف تمامًا ويعكس اختلافًا أساسيًا في تعريف الاحتمال.

بالنسبة <strong<لفترة الثقة، يُنظر إلى المعيار الحقيقي (المعلمة) على أنه قيمة ثابتة غير معروفة، بينما يُنظر إلى الفاصل الزمني (فترة الثقة) على أنه متغير عشوائي يعتمد على البيانات التي تم جمعها. التفسير الصحيح هو: إذا كررنا عملية جمع البيانات وحساب الفاصل الزمني عددًا لا نهائيًا من المرات، فإن نسبة X% من الفواصل الزمنية المُنشأة ستحتوي على القيمة الحقيقية للمعلمة. فترة الثقة لا تخبرنا شيئًا عن احتمالية وجود المعلمة داخل الفاصل الزمني <strong<المحسوب حاليًا.

أما <strong<فترة المصداقية، فإنها تنظر إلى المعيار (المعلمة) على أنه كمية عشوائية يتم التعبير عن عدم اليقين حولها بواسطة توزيع احتمالي (التوزيع البعدي). التفسير هو: هناك احتمال بنسبة X% أن المعلمة الحقيقية تقع ضمن هذا الفاصل <strong<المحسوب حاليًا. هذا الفرق هو ما يمنح فترة المصداقية قدرتها على الإجابة على السؤال الذي غالبًا ما يطرحه العلماء وصناع القرار: “ما هو احتمال أن تكون المعلمة في هذا النطاق المحدد؟”.

6. طرق الحساب

يعتمد حساب فترة المصداقية بشكل كبير على شكل التوزيع البعدي. هناك ثلاث طرق رئيسية لتقدير هذه الفترات:

الحساب التحليلي: إذا كان بالإمكان الحصول على التوزيع البعدي في شكل تحليلي مغلق (مما يحدث عادة عند استخدام التوزيعات القبلية المترافقة)، يمكن حساب حدود الفترة مباشرة باستخدام دالة التوزيع التراكمي العكسي (Inverse CDF) للتوزيع البعدي. هذا هو الأسلوب الأسرع والأكثر دقة ولكنه محدود بالنماذج البسيطة.
طرق سلسلة ماركوف مونتي كارلو (MCMC): بالنسبة لمعظم النماذج البايزية الواقعية والمعقدة، يكون التوزيع البعدي معقدًا جدًا بحيث لا يمكن حسابه تحليليًا. في هذه الحالة، تُستخدم خوارزميات MCMC (مثل خوارزمية متروبوليس-هاستينغز أو أخذ عينات جيبس) لإنشاء عينات كبيرة من قيم المعلمة التي تتبع التوزيع البعدي. بمجرد الحصول على هذه العينات، يتم تقدير فترة المصداقية ببساطة عن طريق إيجاد المئينيات (Quantiles) المناسبة لهذه العينات. على سبيل المثال، فترة المصداقية 95% ETI يتم تحديدها بواسطة المئيني 2.5% والمئيني 97.5% من العينات البعدية.
التقريب العددي: في بعض الأحيان، يمكن تقريب التوزيع البعدي بتوزيع بسيط (مثل التوزيع الطبيعي) حول القيمة القصوى البعدية. يمكن بعد ذلك استخدام خصائص التوزيع المُقَرَّب لحساب الفترة. ومع ذلك، غالبًا ما يتم تجنب هذا الأسلوب في التحليل البايزي الحديث لأنه قد يفشل في التقاط عدم التماثل الحقيقي أو خصائص التوزيع المعقدة.

7. الأهمية والتطبيقات

تُعد فترات المصداقية أداة ذات أهمية قصوى في العديد من المجالات، حيث توفر وسيلة قوية وشفافة لتقديم نتائج التحليل الإحصائي، خاصة في السيناريوهات التي يكون فيها التفسير الواضح لعدم اليقين أمرًا حاسمًا.

في <strong<الطب الحيوي والأبحاث السريرية، تُستخدم فترات المصداقية لتقدير مدى فعالية عقار جديد أو خطورة إجراء طبي. عندما يتم تقديم فترة مصداقية 95% لمتوسط تأثير العلاج، يمكن للأطباء وصناع القرار تقييم النطاق المحتمل للتأثيرات المجهولة بثقة مباشرة، مما يسهل اتخاذ قرارات مستنيرة بشأن سلامة المرضى. كما أنها تستخدم بشكل مكثف في <strong لتقدير معدلات الانتشار والتكاثر للأمراض.

في <strong<التعلم الآلي والذكاء الاصطناعي، وخاصة في النماذج البايزية للشبكات العصبية، تُستخدم فترات المصداقية لتقدير عدم اليقين المرتبط بتنبؤات النموذج. هذا أمر بالغ الأهمية في التطبيقات الحرجة، مثل القيادة الذاتية أو التنبؤات المالية، حيث لا يكفي تقديم تنبؤ نقطي، بل يجب تقديم مقياس موثوق لمدى ثقة النموذج في هذا التنبؤ. إنها تتيح للمهندسين التمييز بين التنبؤات التي تكون فيها البيانات واضحة (فترة مصداقية ضيقة) والتنبؤات التي تنطوي على شك كبير (فترة مصداقية واسعة).

8. الجدل والانتقادات

على الرغم من المزايا التفسيرية والمنهجية لفترات المصداقية، إلا أنها ليست خالية من الانتقادات، والتي تنبع بشكل أساسي من الجدل الأوسع حول الإحصاء البايزي نفسه.

تأثير التوزيع القبلي (Prior Subjectivity): يمثل الاختيار الذاتي أو التعسفي <strong الانتقاد الأبرز. إذا كانت البيانات قليلة (حجم عينة صغير)، يمكن أن يؤثر التوزيع القبلي المختار بشكل كبير على التوزيع البعدي، وبالتالي على شكل وموقع فترة المصداقية. يجادل النقاد بأن هذا يفسح المجال للتحيز، حيث يمكن للمحلل أن يختار عمدًا توزيعًا قبليًا يؤدي إلى فترة مصداقية تدعم الفرضية المفضلة لديه.
التعقيد الحسابي: كما ذُكر سابقًا، يتطلب حساب فترة المصداقية في النماذج المعقدة استخدام تقنيات MCMC، وهي عملية <strong وتستغرق وقتًا طويلاً. بالإضافة إلى ذلك، يتطلب ضمان تقارب سلاسل ماركوف إلى التوزيع البعدي الصحيح خبرة ودقة إحصائية عالية، مما يجعل تنفيذها أصعب من الطرق التكرارية البسيطة.
مقارنة النتائج: في بعض الأوساط العلمية التي لا تزال تهيمن عليها المنهجيات التكرارية، قد يكون من الصعب مقارنة فترات المصداقية البايزية مع فترات الثقة المألوفة، مما يتطلب جهدًا تعليميًا إضافيًا لضمان فهم المجتمع العلمي لمعنى النتائج.