تقدير الدالة – estimating function

مدرس الدكتور محمد لوتي

المحتويات:

دالة التقدير (Estimating Function)

المجالات التأديبية الأساسية: الإحصاء الرياضي، نظرية التقدير، الإحصاء شبه المعلمي

1. التعريف الأساسي

تمثل دالة التقدير مفهومًا محوريًا في الإحصاء الرياضي الحديث، وتوفر إطارًا موحدًا ومرنًا لتطوير المقدرات الإحصائية، خاصة في سياق النماذج شبه المعلمية (Semi-parametric models) حيث لا يتم تحديد التوزيع الاحتمالي الكامل للبيانات. تُعرَّف دالة التقدير، ويرمز إليها عادةً بالرمز $g(theta, X)$، على أنها دالة للبيانات المرصودة $X$ ومعلمة الاهتمام غير المعروفة $theta$. الشرط الأساسي الذي يجب أن تحققه هذه الدالة هو أن يكون توقعها الرياضي صفرًا عندما يتم تقييمها عند القيمة الحقيقية للمعلمة، أي $E[g(theta_0, X)] = 0$.

إن الهدف من استخدام دالة التقدير هو اشتقاق مقدر للمعلمة $theta$. يتم تحقيق ذلك عن طريق حل معادلة التقدير، وهي $g(hat{theta}, X) = 0$، حيث $hat{theta}$ هو المقدر الناتج. هذه المعادلة هي في الأساس تعميم لطريقة العزوم (Method of Moments) وطريقة الإمكان الأعظم (Maximum Likelihood Estimation – MLE). في جوهرها، تفرض دالة التقدير شرطًا على المقدر؛ يجب أن يجعل المقدر الناتج، $hat{theta}$، التوقع التجريبي (المحسوب من العينة) للدالة مساويًا للصفر، محاكيًا بذلك الشرط النظري بأن التوقع الحقيقي صفر عند القيمة الحقيقية $theta_0$. هذا الإطار يسهل بناء مقدرات ذات خصائص أسيمتوتية (تقاربية) مرغوبة مثل الاتساق والتقارب الطبيعي، حتى في ظل غياب معرفة تفصيلية بالتوزيع الكامن للبيانات.

في سياق المتجهات المعلمية المتعددة، تكون دالة التقدير عبارة عن متجه من الدوال، يساوي بُعده بُعد متجه المعلمات $theta$. يتم حل نظام المعادلات الناتج للحصول على المقدرات المتعددة. إن القوة الرياضية لدوال التقدير تكمن في قدرتها على توفير مقدرات متسقة وفعالة (من الناحية التقاربية) دون الحاجة إلى افتراضات توزيعية صارمة، مما يجعلها أداة لا غنى عنها في الإحصاء التطبيقي، لا سيما عند التعامل مع البيانات المترابطة أو غير المستقلة.

2. أصل الكلمة والتطور التاريخي

على الرغم من أن مبادئ استخدام المعادلات التي يكون توقعها صفراً كانت موجودة ضمن طريقتي الإمكان الأعظم والعزوم منذ فترة طويلة، إلا أن الإطار النظري الموحد لدوال التقدير قد تم تطويره بشكل أساسي في النصف الثاني من القرن العشرين. كان الرائد في هذا المجال هو الإحصائي الهندي ف. ب. غودامبي (V. P. Godambe)، الذي قدم في عمله الرائد عام 1960 مفهوم دالة التقدير كتعميم شامل لطريقة الإمكان الأعظم. أدرك غودامبي أن دالة الإمكان الأعظم (Score Function)، وهي مشتق لوغاريتم دالة الإمكان، تحقق شرط التوقع الصفري وهي، في الواقع، حالة خاصة من دالة التقدير.

جاء الدافع وراء تطوير هذا الإطار من الحاجة إلى إيجاد طرق تقدير فعالة عندما تكون الافتراضات التوزيعية الكاملة (كما هو مطلوب في MLE) غير قابلة للتحقق أو غير مرغوب فيها. لقد سمح إطار دوال التقدير للإحصائيين بالتركيز فقط على العلاقة بين المعلمات والبيانات التي يمكن التعبير عنها في التوقع، متجاهلين الجوانب الأخرى من التوزيع التي قد تكون معقدة أو غير معروفة. هذا التحول سمح بتطوير الإحصاء شبه المعلمي، الذي يوازن بين مرونة الإحصاء غير المعلمي وكفاءة الإحصاء المعلمي.

في الثمانينيات، اكتسبت دوال التقدير أهمية بالغة بفضل عمل ليانغ وزيغر (Liang and Zeger) الذين قدموا المعادلات المعممة للتقدير (Generalized Estimating Equations – GEE) في عام 1986. تعتبر GEE تطبيقًا مباشرًا وقويًا لإطار دوال التقدير، وهي مصممة للتعامل مع تحليل البيانات الطولية (Longitudinal Data) والبيانات المجمعة التي تحتوي على ارتباطات داخلية غير محددة. كان هذا العمل حاسمًا في ترسيخ دوال التقدير كأداة أساسية في الإحصاء الحيوي والاجتماعي، حيث نادرًا ما تكون افتراضات الاستقلال والتوزيع الكامل قابلة للتطبيق.

3. الخصائص الرئيسية

يتم تقييم جودة دالة التقدير، وبالتالي المقدر الناتج عنها، بناءً على خصائصها التقاربية (Asymptotic properties). هذه الخصائص هي التي تمنح إطار دوال التقدير قوته النظرية والعملية. الخاصيتان الأساسيتان هما الاتساق والتقارب الطبيعي.

أولاً، يجب أن يكون المقدر الناتج عن دالة التقدير متسقاً (Consistent). يعني الاتساق أن المقدر $hat{theta}$ يتقارب احتماليًا نحو القيمة الحقيقية $theta_0$ كلما زاد حجم العينة إلى ما لا نهاية. يتحقق هذا عادةً إذا كانت دالة التقدير مستمرة في $theta$، وكان لها توقع صفري عند $theta_0$ فقط، وكانت مستوفية لبعض شروط الانتظام (Regularity Conditions) لضمان وجود وحل المعادلة $g(hat{theta}, X) = 0$.

ثانياً، يتمتع المقدر بخاصية التقارب الطبيعي التقاربي (Asymptotic Normality). وهذا يعني أن توزيع المقدر $hat{theta}$، بعد إعادة قياسه بشكل مناسب (عادةً بضرب الانحراف المعياري في جذر حجم العينة $n$), يتقارب نحو التوزيع الطبيعي القياسي كلما زاد حجم العينة. هذه الخاصية حاسمة لبناء فترات الثقة وإجراء اختبارات الفرضيات حول المعلمات. يمكن التعبير عن التباين التقاربي (Asymptotic Variance) للمقدر الناتج باستخدام مصفوفة معلومات غودامبي-هايد (Godambe-Heyde Information Matrix)، التي تعتمد على مصفوفة التغاير لدالة التقدير ومشتقها المتوقع بالنسبة للمعلمة.

ثالثاً، الخاصية الأهم التي تميز دوال التقدير هي الأمثلية (Optimality). في إطار دوال التقدير، لا يكون هناك بالضرورة دالة تقدير واحدة فقط تحقق شرط التوقع الصفري. تنشأ مسألة اختيار أفضل دالة تقدير من بين فئة معينة من الدوال الممكنة. يتم تعريف دالة التقدير المثلى (Optimal Estimating Function) بأنها تلك التي تنتج مقدراً يتمتع بأدنى تباين تقاربي ممكن. أثبت غودامبي وزملاؤه أن دالة التقدير المثلى في أي فئة من دوال التقدير هي تلك التي تكون متناسبة مع دالة الإمكان الأعظم (Score Function) إذا كانت الأخيرة متاحة، أو تلك التي تزيد من كمية معلومات غودامبي (Godambe Information) التي يمكن استخلاصها من البيانات.

4. الأهمية والتأثير

أحدث إطار دوال التقدير ثورة في الإحصاء التطبيقي، لا سيما في المجالات التي تتعامل مع البيانات المعقدة حيث تكون الافتراضات التوزيعية القوية غير واقعية أو غير مبررة. تكمن الأهمية الرئيسية لهذا المنهج في قدرته على توفير مقدرات قوية (Robust) ضد سوء تحديد التوزيع الأساسي. على سبيل المثال، في تحليل الانحدار، يمكن لدوال التقدير أن تسمح بتقدير معاملات الانحدار بشكل متسق حتى لو كان التباين أو شكل التوزيع للخطأ غير محدد بدقة، طالما أن دالة التوقع (المتوسط الشرطي) محددة بشكل صحيح.

أحد أبرز تطبيقات دوال التقدير هو في مجال معادلات التقدير المعممة (GEE). تُستخدم GEE على نطاق واسع في الإحصاء الحيوي والوبائي لتحليل البيانات الطولية أو المجمعة التي تتميز بالارتباطات داخل المجموعات (Intra-cluster Correlations). تسمح GEE بتقدير معلمات النموذج بشكل متسق وفعال دون الحاجة إلى تحديد الهيكل الدقيق لمصفوفة التغاير. بدلاً من ذلك، يتم استخدام دالة تقدير تعتمد على مصفوفة تغاير “عملية” (Working Covariance Matrix)، مما يسهل الحساب ويحافظ على اتساق المقدرات حتى لو كانت هذه المصفوفة العملية غير صحيحة.

بالإضافة إلى GEE، تُستخدم دوال التقدير في تطوير مقدرات العزوم المعممة (Generalized Method of Moments – GMM)، وهي تقنية اقتصادية قياسية، وفي تطوير مقدرات الانحدار القوية (Robust Regression Estimators). إن التأثير الجوهري لدوال التقدير هو أنها حولت نظرية التقدير من التركيز الحصري على النماذج المعلمية الكاملة إلى نهج أكثر مرونة يركز على العزوم أو العلاقات بين البيانات والمعلمات، مما وسع نطاق التحليل الإحصائي ليشمل مجموعات بيانات أكثر تعقيداً وواقعية.

5. أنواع دوال التقدير والعلاقة بالمقدرات الكلاسيكية

يمكن النظر إلى العديد من طرق التقدير الإحصائية الكلاسيكية على أنها حالات خاصة من إطار دالة التقدير، مما يوضح شمولية هذا المفهوم. هناك نوعان رئيسيان يمكن تصنيفهما ضمن هذا الإطار:

أولاً: دالة الإمكان الأعظم (Score Function). إذا كان التوزيع الاحتمالي للبيانات $f(X|theta)$ معروفًا بالكامل، فإن دالة الإمكان الأعظم، $S(theta, X) = partial log f(X|theta) / partial theta$، هي دالة تقدير. الشرط الأساسي لـ MLE، وهو $E[S(theta_0, X)] = 0$، يضمن أن المقدر الناتج (مقدر الإمكان الأعظم) هو حل لمعادلة تقدير. هذه الدالة هي دالة التقدير المثلى في حالة النماذج المعلمية بالكامل، حيث أنها تحقق الحد الأدنى لتباين كرامر-راو (Cramér–Rao Bound).

ثانياً: دالة العزوم (Moment Function). في طريقة العزوم الكلاسيكية، يتم مساواة العزوم السكانية (المعتمدة على $theta$) بالعزوم العينية (المحسوبة من $X$). إذا كانت لدينا معادلة اللحظة $E[m(X)] = k(theta)$، فإن دالة التقدير المقابلة هي $g(theta, X) = m(X) – k(theta)$. يتم حل $g(hat{theta}, X) = 0$ للحصول على المقدر. على الرغم من بساطتها، فإن دوال العزوم غالبًا ما تكون أقل كفاءة من دالة الإمكان الأعظم، لكنها تتميز بالمرونة العالية وعدم الحاجة لافتراضات توزيعية قوية.

ثالثاً: دوال التقدير المعممة والمُعَدَّلة. تشمل هذه الفئة دوال تقدير مصممة خصيصًا لزيادة الكفاءة أو القوة في سياقات محددة. على سبيل المثال، في الإحصاء القوي، يتم تعديل دالة الإمكان الأعظم لتقليل تأثير القيم الشاذة (Outliers) عن طريق تطبيق دالة تخفيف (Clipping function) عليها، مما ينتج دوال تقدير ذات تأثير محدود (Bounded Influence Estimating Functions). بالإضافة إلى ذلك، في النماذج شبه المعلمية، يتم إنشاء دوال تقدير لا تعتمد على المعلمات المزعجة (Nuisance Parameters) غير المرغوب فيها، مما يسمح بالتركيز على معلمة الاهتمام فقط.

6. الجدالات والانتقادات

على الرغم من المرونة والقوة التي يوفرها إطار دوال التقدير، فإنه ليس خاليًا من الجدالات والنقاط التي تستدعي الحذر عند التطبيق. أحد الانتقادات الرئيسية هو أن دوال التقدير، باستثناء دالة الإمكان الأعظم في حالة النماذج المعلمية الكاملة، غالبًا ما تكون أقل كفاءة مقارنة بالمقدرات التي تستخدم التوزيع الكامل للبيانات. إذا كان التوزيع الحقيقي معروفًا، فإن MLE هو المقدر الأفضل تقاربيًا، واستخدام أي دالة تقدير أخرى (مثل دالة العزوم) يؤدي إلى فقدان المعلومات وبالتالي زيادة في التباين التقاربي.

نقد آخر يتعلق بمسألة اختيار دالة التقدير. عندما تكون هناك عدة دوال تقدير محتملة تحقق شرط التوقع الصفري، يصبح تحديد الدالة “المثلى” تحديًا نظريًا وعمليًا. في حين أن النظرية توفر معيار الأمثلية (تعظيم معلومات غودامبي)، فإن تطبيق هذا المعيار يتطلب غالبًا معرفة التغاير الكامن، والذي قد يكون غير معروف. في الممارسة العملية، قد يختار الباحثون دالة تقدير بناءً على البساطة الحسابية بدلاً من الكفاءة النظرية المثلى.

علاوة على ذلك، في تطبيق GEE تحديداً، يعتمد تقدير التباين القياسي (Standard Error) للمقدر على مصفوفة “الموثوقية” أو “التباين القوي” (Robust Variance Estimator). هذا التقدير للتباين، على الرغم من قوته ضد سوء تحديد هيكل الارتباط، قد يكون متحيزًا بشكل كبير (Biased) في العينات الصغيرة. لذلك، يظل تحديد ما إذا كانت دالة التقدير المختارة توفر توازنًا مناسبًا بين القوة والكفاءة والتحيز في العينات المحدودة مسألة مستمرة في النقاش الإحصائي.

7. مصفوفة معلومات غودامبي (Godambe Information)

مصفوفة معلومات غودامبي، التي ابتكرها غودامبي وهايد (Godambe and Heyde)، هي المقياس الأساسي للكفاءة في إطار دوال التقدير. إنها تلعب دورًا مماثلًا لدور مصفوفة معلومات فيشر (Fisher Information) في نظرية الإمكان الأعظم، لكنها تنطبق على فئة أوسع من دوال التقدير. تُعرَّف كفاءة دالة التقدير $g$ بناءً على مصفوفة معلومات غودامبي $I_g$ كالتالي:
$$I_g(theta) = [E(partial g / partial theta)]^T [Cov(g)]^{-1} [E(partial g / partial partial theta)]$$
حيث يمثل $E(partial g / partial theta)$ المشتق المتوقع للدالة بالنسبة للمعلمة، و $Cov(g)$ هي مصفوفة التغاير لدالة التقدير نفسها.

الهدف من اختيار دالة التقدير المثلى هو تعظيم مصفوفة معلومات غودامبي. تُظهر النظرية أن التباين التقاربي للمقدر $hat{theta}$ يتم تحديده بالمعكوس لمصفوفة معلومات غودامبي، $Var(hat{theta}) approx I_g(theta)^{-1}$. وهذا يعني أن الدالة التي تزيد من $I_g$ هي الدالة التي تقلل من تباين المقدر، وبالتالي تزيد من كفاءته. عندما يتم استخدام دالة الإمكان الأعظم (Score Function) كدالة تقدير، تتطابق مصفوفة معلومات غودامبي مع مصفوفة معلومات فيشر، مما يؤكد أن MLE هو المقدر الأكثر كفاءة في ظل الافتراضات التوزيعية الكاملة.

إن مفهوم معلومات غودامبي هو التجسيد الرياضي لـ “كمية المعلومات” التي تحملها دالة تقدير معينة حول المعلمة، مما يسمح بمقارنة موضوعية بين دوال تقدير مختلفة تنتمي إلى نفس الفئة. هذا الإطار الرياضي هو ما يمنح نظرية دوال التقدير قدرتها على توفير أساس متين للتقدير شبه المعلمي.