تقدير – estimation

مدرس الدكتور محمد لوتي

المحتويات:

التقدير (Estimation)

المجالات الانضباطية الأساسية: الإحصاء، الرياضيات التطبيقية، الاقتصاد القياسي، معالجة الإشارات.

1. التعريف الجوهري

يُعدّ التقدير (Estimation) أحد الركائز الأساسية في مجالات الإحصاء والرياضيات التطبيقية، ويُمثل عملية استنتاج قيمة تقريبية أو مجموعة من القيم المحتملة لمعامل غير معلوم (Parameter) خاص بمجتمع إحصائي أو نموذج رياضي، وذلك بالاعتماد على بيانات محدودة ومُشاهدات مأخوذة من عينة. هذه العملية لا تهدف إلى الوصول إلى القيمة الحقيقية بالضبط، والتي غالبًا ما تكون مستحيلة التحقق في سياقات العالم الحقيقي، بل تسعى إلى تقديم أفضل تخمين ممكن بناءً على الأدلة المتاحة، مع تحديد درجة عدم اليقين المصاحبة لهذا التخمين. إن جوهر التقدير يكمن في استخدام الاستدلال الإحصائي لسد الفجوة المعرفية بين البيانات الجزئية (العينة) والمعلومات الكلية (المجتمع).

يمكن تعريف التقدير على أنه الإجراء المنهجي الذي يُستخدم لاستنتاج خصائص المجتمع الإحصائي (مثل المتوسط الحسابي، التباين، أو معامل الانحدار) من خلال تحليل بيانات عينة إحصائية ممثلة. في السياق الرياضي، إذا كان لدينا نموذج احتمالي يعتمد على مجموعة من المعاملات غير المعروفة، فإن التقدير هو عملية تحديد دالة (تُسمى المُقدِّر) تأخذ قيم العينة المدخلة وتنتج قيمة تُعتبر تخمينًا لهذه المعاملات. ويجب التفريق بين مفهومي المُقدِّر (Estimator)، وهو الدالة أو القاعدة الإحصائية المستخدمة، والقيمة المُقدَّرة (Estimate)، وهي النتيجة العددية المحددة التي تنتج عن تطبيق هذه الدالة على مجموعة بيانات معينة.

الهدف الأساسي من أي عملية تقدير هو إنتاج مُقدِّرات تتمتع بصفات مرغوبة، مثل أن تكون قريبة قدر الإمكان من القيمة الحقيقية للمعامل المجهول، وأن تكون موثوقة ومستقرة عبر العينات المختلفة. يتطلب ذلك فهمًا عميقًا للتوزيع البيانات الأساسي (Probabilistic Distribution) والطريقة التي تم بها جمع العينة. في كثير من الأحيان، يتضمن التقدير التعامل مع اللايقين والخطأ العشوائي، حيث لا يمكن لأي تقدير مستمد من عينة أن يكون مثاليًا. لذا، فإن الإحصائيين لا يكتفون بتقديم القيمة المقدرة فحسب، بل يضيفون إليها مقاييس للخطأ، مثل الخطأ المعياري (Standard Error) أو فترات الثقة (Confidence Intervals)، لتقديم صورة كاملة عن مدى دقة التقدير.

2. المجالات الانضباطية الأساسية والتطبيقات

يُعتبر التقدير قلب الإحصاء الاستدلالي، حيث يُستخدم لتحويل البيانات المُشاهدة إلى معرفة قابلة للتطبيق على مجتمعات أوسع. وتتركز استخداماته الأساسية في المجالات التي تتعامل مع النماذج الاحتمالية والبيانات غير المؤكدة. في البيولوجيا والإحصاء الحيوي، يُستخدم لتقدير البقاء على قيد الحياة (Survival Analysis) أو تقدير معاملات الجينات الوراثية. أما في الهندسة، وبالأخص في مجالات معالجة الإشارات ونظرية التحكم، فإن التقدير أمر حيوي لتحديد حالة النظام (State Estimation)، كما في استخدام مرشح كالمان (Kalman Filter) لتقدير موقع مركبة متحركة بناءً على قياسات ضوضائية.

تظهر أهمية التقدير بشكل خاص في علم الاقتصاد القياسي (Econometrics)، حيث تُستخدم تقنيات الانحدار (Regression Techniques) لتقدير العلاقة بين المتغيرات الاقتصادية، مثل تقدير مرونة الطلب أو تأثير السياسات النقدية. في هذه الحالة، لا يتم تقدير معامل مفرد، بل يتم تقدير مجموعة كاملة من المعاملات التي تحدد شكل النموذج الاقتصادي. ويعتمد نجاح التنبؤات الاقتصادية بشكل كبير على جودة ودقة المُقدِّرات المستخدمة في تحليل السلاسل الزمنية (Time Series Analysis) والنماذج الهيكلية.

علاوة على ذلك، يلعب التقدير دورًا مركزيًا في مجالات تعلم الآلة (Machine Learning)، خاصة في نماذج الانحدار والتصنيف البارامترية. إن عملية “تدريب” النموذج هي في جوهرها عملية تقدير للمعاملات (الأوزان والانحيازات) التي تقلل من دالة الخسارة (Loss Function) إلى الحد الأدنى، مما يضمن أن النموذج يقدم أفضل توقع ممكن للبيانات غير المرئية. وبالتالي، فإن فهم مبادئ التقدير الإحصائي يظل أساسيًا لفهم كيفية عمل الخوارزميات المتقدمة في الذكاء الاصطناعي.

3. التطور التاريخي والمفاهيم الرياضية المبكرة

تعود الجذور الفكرية للتقدير إلى القرنين الثامن عشر والتاسع عشر، عندما بدأ العلماء في التعامل مع الأخطاء في القياسات الفلكية والجيوديسية. كان الهدف المبكر هو إيجاد طريقة منهجية للجمع بين العديد من الملاحظات التي تحتوي على أخطاء عشوائية للوصول إلى أفضل قيمة حقيقية. ويُعتبر كارل فريدريش غاوس (Carl Friedrich Gauss) وأدريان-ماري ليجندر (Adrien-Marie Legendre) شخصيتين محوريتين في هذا التطور، حيث قاما بوضع وتطوير طريقة المربعات الدنيا (Least Squares Method) في أوائل القرن التاسع عشر. تهدف هذه الطريقة إلى إيجاد المعاملات التي تقلل مجموع مربعات الفروق بين القيم المُشاهدة والقيم المُتوقعة من النموذج، وهي تُعدّ أول مُقدِّر مُعترف به على نطاق واسع ويمتلك خصائص رياضية قوية.

في مطلع القرن العشرين، شهد مجال التقدير تحولًا جذريًا بفضل أعمال رونالد فيشر (Ronald Fisher)، الذي يُعتبر مؤسس الإحصاء الحديث. قدم فيشر مفاهيم حاسمة مثل الكفاءة (Efficiency) والإنحياز (Bias) والكفاية (Sufficiency)، مما وضع أساسًا نظريًا صارمًا لتقييم جودة المُقدِّرات. أهم مساهماته كانت تطوير طريقة أقصى الإمكان (Maximum Likelihood Estimation – MLE) في عشرينات القرن الماضي. أظهر فيشر أن مُقدِّر أقصى الإمكان يتمتع بخصائص تقاربية مثالية، حيث يقترب من أن يكون المُقدِّر الأكثر كفاءة (الأقل تباينًا) عندما يكون حجم العينة كبيرًا.

بالتوازي مع التطورات “الفيشرية” التي ركزت على الإحصاء التكراري (Frequentist Statistics)، ظهرت المدرسة البيزية (Bayesian). يختلف التقدير البيزي عن التقدير التكراري في طريقة معاملة المعامل المجهول؛ فبينما يعتبره التكراري قيمة ثابتة غير معروفة، يعتبره البيزي متغيرًا عشوائيًا له توزيع احتمالي مسبق (Prior Distribution). يتم دمج هذا التوزيع المسبق مع البيانات المُشاهدة لإنتاج توزيع احتمالي لاحق (Posterior Distribution)، الذي يلخص كل المعرفة المتاحة عن المعامل. هذه الازدواجية بين المنهجين التكراري والبيزي تشكل العمود الفقري لنظرية التقدير الحديثة.

4. الخصائص الرئيسية للمُقدِّرات

لتقييم مدى جودة أي مُقدِّر إحصائي، يتم الاعتماد على مجموعة من الخصائص المعيارية التي تُحدد مدى قربه من المعامل الحقيقي وكفاءته في استخدام المعلومات المتاحة. من أهم هذه الخصائص هي الإنحياز (Bias)، والذي يُعرف بأنه الفرق المتوقع بين القيمة المُقدَّرة والقيمة الحقيقية للمعامل. المُقدِّر المثالي هو المُقدِّر غير المنحاز (Unbiased Estimator)، أي أن متوسط قيم التقدير عبر عدد لا نهائي من العينات يساوي القيمة الحقيقية. ومع ذلك، قد يُفضل في بعض الأحيان استخدام مُقدِّر منحاز قليلًا إذا كان تباينه (Variance) أقل بكثير، مما يؤدي إلى تقليل متوسط خطأ المربعات (Mean Squared Error – MSE).

الخاصية الثانية الحاسمة هي التباين (Variance)، والذي يقيس مدى تشتت القيم المُقدَّرة حول متوسطها. فالمُقدِّر ذو التباين المنخفض يُعدّ أكثر دقة واستقرارًا؛ بعبارة أخرى، إذا كررنا عملية سحب العينات والتقدير عدة مرات، فإن القيم الناتجة ستكون متقاربة جدًا من بعضها البعض. يسعى الإحصائيون دائمًا إلى إيجاد مُقدِّر غير منحاز وذو تباين أدنى، وهو ما يُعرف بـالمُقدِّر غير المنحاز ذي التباين الأدنى (UMVUE)، والذي يمثل المعيار الذهبي للجودة في الإحصاء التكراري. وتُحدد نظرية كرامر-راو (Cramer-Rao Bound) الحد الأدنى النظري الممكن لهذا التباين.

أما الخاصية الثالثة، الاتساق (Consistency)، فهي خاصية تقاربية تتعلق بسلوك المُقدِّر عندما يزداد حجم العينة إلى ما لا نهاية. يُعتبر المُقدِّر متسقًا إذا كانت القيمة المُقدَّرة تقترب من القيمة الحقيقية للمعامل بزيادة حجم العينة. هذه الخاصية مهمة بشكل خاص في سياق البيانات الضخمة (Big Data)، حيث تضمن أن المُقدِّر سيصبح دقيقًا بشكل متزايد مع توفر المزيد من المعلومات. وأخيرًا، الكفاية (Sufficiency) تشير إلى ما إذا كان المُقدِّر يستخدم كل المعلومات ذات الصلة بالمعامل والمتاحة في العينة؛ فالمُقدِّر الكافي يلتقط كل المعلومات التي يمكن استخلاصها من البيانات حول المعامل المجهول.

5. أنواع التقدير

يُنقسم التقدير الإحصائي تقليديًا إلى نوعين رئيسيين، يخدم كل منهما غرضًا مختلفًا في تقديم صورة عن المعامل المجهول. النوع الأول هو التقدير النقطي (Point Estimation)، حيث يتمثل الهدف في إنتاج قيمة عددية واحدة ومفردة تُستخدم كتخمين “أفضل” للمعامل. مثال على ذلك هو استخدام متوسط العينة الحسابي كتقدير نقطي للمتوسط الحقيقي للمجتمع. على الرغم من بساطته وسهولة تفسيره، فإن التقدير النقطي لا يقدم أي معلومات مباشرة عن مدى دقة هذا التخمين أو درجة عدم اليقين المحيطة به، مما يجعله غير كافٍ في سياقات اتخاذ القرارات الحرجة.

النوع الثاني والأكثر شمولاً هو التقدير بفترة (Interval Estimation)، والذي يوفر مجموعة من القيم المحتملة التي من المتوقع أن تحتوي على القيمة الحقيقية للمعامل المجهول بدرجة معينة من اليقين. يُعبّر عن هذا النوع عادةً باستخدام فترات الثقة (Confidence Intervals) في الإحصاء التكراري أو الفترات المعقولة (Credible Intervals) في الإحصاء البيزي. تحدد فترة الثقة مستوى الثقة (مثل 95%)، مما يعني أنه إذا تكررت عملية سحب العينات وحساب الفترة عدة مرات، فإن نسبة مئوية محددة من تلك الفترات ستحتوي على القيمة الحقيقية للمعامل.

يُعتبر التقدير بفترة أكثر إفادة عمليًا لأنه يدمج مفاهيم عدم اليقين والتباين مباشرة في النتيجة النهائية. على سبيل المثال، قد يكون تقدير متوسط الدخل في مدينة ما 50,000 دولار (تقدير نقطي)، ولكن فترة الثقة 95% قد تكون [48,000 دولار، 52,000 دولار]. هذه الفترة تخبرنا أننا واثقون بنسبة 95% بأن المتوسط الحقيقي يقع ضمن هذا النطاق، مما يوفر نطاقًا معقولًا للتغيرات ويساعد على تجنب المبالغة في دقة التقدير النقطي. إن العلاقة بين التقدير النقطي والتقدير بفترة هي علاقة تكاملية، حيث غالبًا ما يمثل التقدير النقطي مركز الفترة.

6. طرق التقدير الشائعة

توجد عدة طرق رياضية رئيسية لبناء المُقدِّرات، وتختلف هذه الطرق في الافتراضات التي تعتمد عليها وفي الخصائص الإحصائية للمُقدِّرات الناتجة. أحد أهم هذه الطرق هي طريقة أقصى الإمكان (Maximum Likelihood Estimation – MLE). تعتمد هذه الطريقة على مبدأ اختيار قيم المعاملات التي تجعل احتمال مشاهدة البيانات المتاحة (دالة الإمكان) هو الأكبر. يُعتبر مُقدِّر أقصى الإمكان شائعًا للغاية لأنه يتمتع بخصائص تقاربية مثالية، مثل الاتساق، والتقارب إلى التوزيع الطبيعي، والكفاءة التقاربية (حيث يحقق الحد الأدنى لتباين كرامر-راو عندما تكون العينة كبيرة). يتطلب تطبيق هذه الطريقة معرفة دقيقة بالشكل الرياضي للتوزيع الاحتمالي الأساسي للبيانات.

هناك أيضًا طريقة العزوم (Method of Moments – MOM)، وهي طريقة أقدم وأبسط من MLE. تقوم هذه الطريقة على مبدأ مساواة العزوم النظرية للمجتمع (المعبر عنها بدلالة المعاملات المجهولة) بالعزوم التجريبية المقدرة من العينة. على الرغم من سهولة تطبيقها وعدم تطلبها افتراضات صارمة حول توزيع البيانات مقارنة بـ MLE، إلا أن مُقدِّرات العزوم قد تكون أقل كفاءة إحصائيًا، خاصة في العينات الصغيرة. ومع ذلك، لا تزال تُستخدم كخطوة أولى للحصول على تقديرات أولية أو عندما يكون حساب مُقدِّر أقصى الإمكان معقدًا رياضيًا.

أما بالنسبة للإحصاء البيزي، فإن الطريقة الأساسية هي التقدير البيزي (Bayesian Estimation). بدلاً من البحث عن قيمة واحدة للمعامل، يهدف التقدير البيزي إلى حساب التوزيع الاحتمالي اللاحق (Posterior Distribution) للمعاملات، والذي يجمع بين المعرفة المسبقة (Prior) والمعلومات المستمدة من البيانات (Likelihood). غالبًا ما تُستخدم مقاييس مثل متوسط التوزيع اللاحق أو وسيطه كنقاط تقدير بيزي. في التطبيقات الحديثة التي تتضمن نماذج معقدة، غالبًا ما يتطلب حساب التوزيع اللاحق استخدام تقنيات حاسوبية مكثفة مثل سلاسل ماركوف مونت كارلو (MCMC)، مما مكن من تطبيق هذا المنهج على نطاق واسع في العقود الأخيرة.

7. الأهمية والتأثير في العلوم الحديثة

تكمن أهمية التقدير في كونه الجسر الذي يربط النظرية الاحتمالية بالواقع المُشاهد. فبدون أدوات تقدير قوية، تظل النماذج الرياضية مجرد تركيبات نظرية دون القدرة على اختبارها أو تطبيقها على الظواهر الحقيقية. وقد أدى التطور في نظرية التقدير إلى تحسين كبير في قدرة الباحثين على استخلاص استنتاجات موثوقة من البيانات المعقدة والمحدودة. ففي مجالات مثل علم الأوبئة، يعتمد التخطيط للسياسات الصحية العامة بشكل كامل على تقديرات دقيقة لمعدلات العدوى والوفيات ونسبة السكان المعرضين للخطر.

في عصر البيانات الضخمة (Big Data) والذكاء الاصطناعي، اكتسبت نظرية التقدير أهمية متجددة. ففي حين أن خوارزميات تعلم الآلة تستخدم أحيانًا طرقًا غير بارامترية، إلا أن معظم النماذج البارامترية (مثل الشبكات العصبية) تعتمد في جوهرها على تقدير آلاف أو ملايين المعاملات (الأوزان) من خلال طرق تحسين تعادل تقنيات التقدير (مثل الانحدار التدرجي العشوائي). إن القدرة على تقدير المعاملات بكفاءة وبتكلفة حاسوبية معقولة هي ما يجعل أنظمة الذكاء الاصطناعي الحديثة قابلة للتطبيق.

ويؤثر التقدير أيضًا بشكل عميق على مجال التمويل وإدارة المخاطر. فتقدير تقلبات الأسهم (Volatility) وتحديد أسعار الخيارات (Option Pricing) يعتمد على نماذج تقدير متطورة (مثل نماذج ARCH/GARCH) التي تستخدم بيانات السلاسل الزمنية لتقدير المعاملات التي تحكم سلوك السوق. إن أي خطأ في التقدير في هذا السياق يمكن أن يؤدي إلى خسائر مالية فادحة، مما يشدد على الحاجة المستمرة للبحث عن مُقدِّرات أكثر قوة وملاءمة للبيانات ذات الذيل الثقيل (Heavy-tailed data) والخصائص غير الثابتة (Non-stationary properties).

8. المناقشات والانتقادات

على الرغم من أهمية التقدير، فإنه ليس بمنأى عن الجدل والانتقادات، خاصة فيما يتعلق بالمنهجيات المتبعة. النقاش الأقدم والأكثر حدة يدور حول المقارنة بين التقدير التكراري والتقدير البيزي. ينتقد التكراريون المنهج البيزي لإدخاله عنصر الذاتية (Subjectivity) من خلال التوزيع المسبق (Prior)، مشيرين إلى أن اختيار التوزيع المسبق يمكن أن يؤثر بشكل كبير على النتيجة النهائية للتقدير، خاصة عند توفر بيانات محدودة. في المقابل، ينتقد البيزيون التكراريين لعدم قدرتهم على دمج المعرفة السابقة المتاحة في النموذج، واعتمادهم المفرط على مفهوم العينة العشوائية المتكررة، وهو مفهوم يصعب تطبيقه في العديد من السيناريوهات الواقعية الفريدة.

هناك نقد آخر يتعلق بـ افتراضات النموذج (Model Assumptions). تتطلب العديد من طرق التقدير القوية، مثل MLE، افتراضات صارمة حول توزيع البيانات (مثل الافتراض بأن البيانات تتبع التوزيع الطبيعي). إذا تم انتهاك هذه الافتراضات، فإن المُقدِّرات الناتجة قد تكون منحازة أو غير كفؤة، وقد تكون فترات الثقة المحسوبة غير صالحة. وقد أدى ذلك إلى تطوير مُقدِّرات أكثر قوة (Robust Estimators) تكون أقل حساسية للقيم المتطرفة (Outliers) أو للانحرافات عن الافتراضات التوزيعية القياسية، مثل طريقة الانحدار القوي (Robust Regression).

كما يُثار الجدل حول مفهوم “أفضلية” المُقدِّر. فبينما يتم البحث عن المُقدِّرات ذات التباين الأدنى غير المنحاز (UMVUE)، قد يكون هذا الهدف غير ممكن التحقيق دائمًا. في بعض الأحيان، يمكن التضحية بالإنحياز قليلاً (باستخدام مُقدِّر منحاز) مقابل الحصول على تقليل كبير في التباين، مما يؤدي إلى مُقدِّر ذي متوسط خطأ مربعات (MSE) أفضل. هذا المقايضة بين الانحياز والتباين (Bias-Variance Tradeoff) هي مفهوم مركزي في الإحصاء وتعلم الآلة، وهي تؤكد على أن اختيار المُقدِّر الأمثل يعتمد بشكل كبير على السياق المحدد وعلى الأهداف النهائية للتحليل.