المحتويات:
R المربّع المعدّل
Primary Disciplinary Field(s): الإحصاء، الاقتصاد القياسي، تعلّم الآلة، علم البيانات.
1. تعريف جوهري
يُعدّ R المربّع المعدّل (Adjusted R-squared) إحصائية حاسمة في مجال تحليل الانحدار، وهو يمثل امتدادًا وتعديلًا لمقياس R المربّع التقليدي (Coefficient of Determination or R-squared). بينما يقيس R المربّع النسبة المئوية للتغير في المتغير التابع التي تفسرها المتغيرات المستقلة في النموذج، فإنه يعاني من قصور جوهري يتمثل في ميله إلى الزيادة بشكل مصطنع عند إضافة أي متغير مستقل جديد إلى النموذج، حتى لو كان هذا المتغير غير ذي صلة أو لا يضيف قيمة تفسيرية حقيقية.
ولمعالجة هذا القصور، تم تطوير R المربّع المعدّل ليقدم تقييمًا أكثر دقة لقوة النموذج التفسيرية، خاصة عند مقارنة نماذج انحدار متعددة تحتوي على أعداد مختلفة من المتغيرات المستقلة. يقوم هذا المقياس بتعديل R المربّع الأصلي عن طريق الأخذ في الاعتبار عدد المتغيرات المستقلة في النموذج وحجم العينة. إنه يفرض “عقوبة” على إضافة متغيرات مستقلة لا تساهم بشكل كبير في تحسين قدرة النموذج على تفسير التباين في المتغير التابع، مما يجعله أداة أفضل لاختيار النموذج الأكثر كفاءة والأكثر بساطة.
بشكل أساسي، يوفر R المربّع المعدّل تقديرًا أكثر تحفظًا وواقعية لمدى جودة ملاءمة النموذج للبيانات. إذا أضفت متغيرًا مستقلًا جديدًا إلى النموذج ولم يؤدِ هذا المتغير إلى تحسن كافٍ في قدرة النموذج على التفسير (مقارنةً بالخسارة في درجات الحرية)، فإن قيمة R المربّع المعدّل ستنخفض. هذا يجعله مؤشرًا لا يقدر فقط على مدى تفسير النموذج للتغير، بل أيضًا على كفاءة هذا التفسير من حيث عدد المتغيرات المستخدمة، مما يساعد الباحثين على تجنب الإفراط في الملاءمة (Overfitting) ويشجع على بناء نماذج أكثر اقتصادًا وذات معنى إحصائي.
2. التطور التاريخي والاشتقاق
يعود مفهوم قياس جودة الملاءمة في الانحدار الخطي إلى أوائل القرن العشرين، حيث أسس كارل بيرسون (Karl Pearson) لمفهوم معامل الارتباط. تطور هذا المفهوم لاحقًا إلى معامل التحديد (R المربّع)، والذي أصبح مقياسًا شائعًا لنسبة التباين في المتغير التابع التي تفسرها المتغيرات المستقلة في نموذج الانحدار. ومع ذلك، عندما بدأت النماذج الإحصائية تتجه نحو استخدام متغيرات مستقلة متعددة (الانحدار المتعدد)، ظهرت مشكلة جوهرية في R المربّع.
تمثلت هذه المشكلة في أن قيمة R المربّع لا يمكن أن تنخفض أبدًا عند إضافة متغير مستقل جديد إلى النموذج، حتى لو كان هذا المتغير لا يملك أي قوة تفسيرية حقيقية. في الواقع، من المضمون أن تزداد قيمة R المربّع (أو على الأقل تبقى كما هي) مع كل متغير مضاف، بغض النظر عن مدى فائدته. هذا السلوك يضلل الباحثين ويدفعهم نحو بناء نماذج معقدة بشكل غير ضروري، مما يزيد من خطر الإفراط في الملاءمة (Overfitting) حيث يصبح النموذج ملائمًا لضوضاء البيانات بدلاً من العلاقات الحقيقية.
لمعالجة هذه المشكلة، تم تطوير R المربّع المعدّل لتقديم تقدير أكثر واقعية لقدرة النموذج على التفسير. يعتمد هذا التعديل على فكرة درجات الحرية (Degrees of Freedom). فكلما زاد عدد المتغيرات المستقلة (k) في النموذج، كلما قلّت درجات الحرية المتاحة لتقدير الأخطاء، مما يؤدي إلى “عقوبة” ضمنية. الصيغة الرياضية لـ R المربّع المعدّل تُدرج هذه العقوبة بشكل صريح، مما يضمن أن قيمة المقياس لا تزداد إلا إذا كان المتغير المضاف يساهم بشكل كبير في تقليل مجموع مربعات البواقي (Sum of Squared Residuals) بما يبرر الخسارة في درجات الحرية. هذا التطور كان حاسمًا في توجيه الباحثين نحو بناء نماذج انحدار أكثر دقة واقتصادًا وأكثر قابلية للتعميم.
3. الخصائص الرئيسية والصيغة
يمتلك R المربّع المعدّل عدة خصائص تميزه عن R المربّع التقليدي وتجعله أداة أكثر فعالية في تقييم نماذج الانحدار المتعدد. إحدى أهم هذه الخصائص هي قدرته على الانخفاض عند إضافة متغيرات مستقلة غير مفيدة للنموذج. على عكس R المربّع الذي يزداد أو يظل ثابتًا دائمًا، فإن R المربّع المعدّل يمكن أن ينخفض إذا لم تكن المساهمة التفسيرية للمتغير الجديد كافية لتعويض العقوبة المفروضة على استخدام درجات حرية إضافية. هذا يجعله مقياسًا أكثر موثوقية لمقارنة النماذج ذات الأعداد المختلفة من المتغيرات.
صيغة R المربّع المعدّل هي كالتالي:
(R_{adj}^2 = 1 – (1 – R^2) frac{n-1}{n-k-1})
حيث:
- (R_{adj}^2) هو R المربّع المعدّل.
- (R^2) هو R المربّع التقليدي.
- (n) هو عدد الملاحظات (حجم العينة).
- (k) هو عدد المتغيرات المستقلة في النموذج (لا يشمل الثابت).
يمكن تفسير هذه الصيغة بأنها تأخذ مجموع مربعات الأخطاء (SSE) ومجموع مربعات الكلي (SST) وتعدلهما باستخدام درجات الحرية. فـ ((1 – R^2)) يمثل نسبة التباين غير المفسر في المتغير التابع. ثم يتم ضرب هذه النسبة في معامل تعديل (frac{n-1}{n-k-1}). يمثل (n-1) درجات الحرية الكلية، بينما يمثل (n-k-1) درجات الحرية المتبقية (الأخطاء) في النموذج. كلما زاد (k) (عدد المتغيرات)، كلما كبر الكسر (frac{n-1}{n-k-1})، وبالتالي زادت العقوبة المفروضة على R المربّع الأصلي. هذه العقوبة تضمن أن قيمة R المربّع المعدّل لا ترتفع إلا إذا كان المتغير الجديد يساهم بفعالية في تقليل الخطأ المتبقي بشكل يفوق تكلفة تعقيد النموذج. يمكن أن تكون قيمة R المربّع المعدّل سالبة، وهو ما يشير إلى أن النموذج أضعف من مجرد استخدام متوسط المتغير التابع للتنبؤ.
4. الأهمية والتأثير
تكمن الأهمية الجوهرية لـ R المربّع المعدّل في قدرته على توجيه عملية اختيار النموذج وتحسين جودته، خاصة في سياق الانحدار المتعدد. فبينما يعطي R المربّع التقليدي انطباعًا مضللًا بأن إضافة المزيد من المتغيرات دائمًا ما يحسن النموذج، يقدم R المربّع المعدّل رؤية أكثر واقعية. إنه يساعد الباحثين والمحللين على تجنب خطر الإفراط في الملاءمة، وهي حالة يصبح فيها النموذج معقدًا للغاية ويتناسب مع ضوضاء البيانات بدلاً من التقاط العلاقات الأساسية الحقيقية.
من خلال مكافأة النماذج التي تفسر نسبة عالية من التباين باستخدام أقل عدد ممكن من المتغيرات المستقلة الهادفة، يشجع R المربّع المعدّل على بناء نماذج أكثر بساطة وأكثر قابلية للتعميم. هذه البساطة ليست مجرد تفضيل جمالي، بل هي ضرورية لضمان أن النموذج يلتقط العلاقات السببية أو الارتباطية الحقيقية في البيانات، بدلاً من مجرد حفظ الأنماط الخاصة بالعينة المعطاة. النموذج البسيط والقوي يكون أكثر سهولة في التفسير والفهم، وأكثر فائدة في اتخاذ القرارات والتنبؤ.
يُستخدم R المربّع المعدّل على نطاق واسع في مجالات متعددة مثل الاقتصاد القياسي، وعلم البيانات، والعلوم الاجتماعية، والبحوث الطبية. إنه يوفر معيارًا موحدًا لمقارنة فعالية النماذج المتنافسة التي قد تختلف في هيكلها. فعندما يكون الهدف هو فهم المتغيرات التي تؤثر على ظاهرة معينة وتحديد أفضل مجموعة من هذه المتغيرات، يصبح R المربّع المعدّل أداة لا غنى عنها لتقييم مدى جودة الملاءمة الحقيقية للنموذج ولضمان أن النتائج المستخلصة من التحليل تكون قوية وذات مغزى.
5. النقاشات والانتقادات
على الرغم من فائدته الواضحة في تقييم النماذج وتجنب الإفراط في الملاءمة، فإن R المربّع المعدّل ليس مقياسًا مثاليًا ويواجه عددًا من الانتقادات والنقاشات في الأوساط الإحصائية. أحد الانتقادات الرئيسية هو أنه، مثل R المربّع التقليدي، لا يشير إلى السببية بين المتغيرات. فارتفاع قيمة R المربّع المعدّل لا يعني بالضرورة أن المتغيرات المستقلة تسبب التغير في المتغير التابع؛ بل يشير فقط إلى وجود علاقة ارتباطية قوية. قد يكون هناك متغيرات محيرة أو عوامل كامنة غير مدرجة في النموذج تؤثر على كل من المتغيرات المستقلة والتابعة، مما يؤدي إلى علاقة ارتباطية زائفة.
نقد آخر يتعلق بحقيقة أن R المربّع المعدّل لا يقيم دقة التنبؤ للنموذج بشكل مباشر. فنموذج ذو R مربّع معدّل عالٍ قد لا يكون بالضرورة الأفضل في التنبؤ بالقيم الجديدة خارج العينة التي تم تدريبه عليها. في بعض الحالات، قد يكون النموذج الذي يظهر R مربّعًا معدّلًا أقل، ولكنه أكثر استقرارًا وقابلية للتعميم، أفضل للتنبؤ. كما أنه لا يقدم أي معلومات حول ما إذا كانت افتراضات الانحدار الخطي (مثل الخطية، تجانس التباين، استقلالية البواقي، التوزيع الطبيعي للبواقي) قد تم الوفاء بها. هذه الافتراضات حاسمة لصحة النموذج، ولا يمكن لـ R المربّع المعدّل وحده أن يضمنها.
بالإضافة إلى ذلك، يمكن أن تكون قيم R المربّع المعدّل سالبة، وهو ما يمكن أن يكون مربكًا للمحللين غير المتمرسين. تشير القيمة السالبة إلى أن النموذج لا يفسر أيًا من التباين في المتغير التابع، وأنه في الواقع أسوأ من مجرد استخدام متوسط المتغير التابع كأفضل تخمين. على الرغم من أن هذا صحيح من الناحية الإحصائية، إلا أنه قد يكون صعب الفهم من الناحية البديهية. وأخيرًا، في حين أنه يساعد في اختيار النموذج، إلا أنه لا يزال مقياسًا وصفيًا إلى حد كبير، ويفضل العديد من الإحصائيين استخدام معايير أخرى لاختيار النموذج، مثل معيار أكايكي للمعلومات (AIC) أو معيار بايزي للمعلومات (BIC)، والتي توفر أساسًا نظريًا أقوى لمقارنة النماذج وتوازن بشكل أكثر صرامة بين جودة الملاءمة وتعقيد النموذج.
6. الفرق بين R المربّع وR المربّع المعدّل
لتوضيح أهمية R المربّع المعدّل، من الضروري فهم الفروقات الجوهرية بينه وبين R المربّع التقليدي. كلاهما يقيسان مدى جودة ملاءمة نموذج الانحدار للبيانات، أي النسبة المئوية للتباين في المتغير التابع التي تفسرها المتغيرات المستقلة. ومع ذلك، فإن سلوكهما وتفسيرهما يختلفان بشكل كبير عند التعامل مع نماذج الانحدار المتعددة.
R المربّع (Coefficient of Determination) هو مقياس مباشر لنسبة التباين المفسر. تتراوح قيمته بين 0 و1 (أو 0% و100%)، حيث تشير القيم الأعلى إلى أن النموذج يفسر جزءًا أكبر من التباين. المشكلة الأساسية في R المربّع هي أنه يزداد حتمًا (أو يبقى كما هو) مع إضافة كل متغير مستقل جديد إلى النموذج، بغض النظر عما إذا كان هذا المتغير يضيف قيمة تفسيرية حقيقية أم لا. هذا يعني أن نموذجًا يحتوي على عدد كبير من المتغيرات، حتى لو كانت معظمها غير ذات صلة، يمكن أن يظهر قيمة R مربّع عالية، مما يعطي انطباعًا زائفًا بجودة الملاءمة.
في المقابل، R المربّع المعدّل (Adjusted R-squared) يأخذ في الاعتبار عدد المتغيرات المستقلة في النموذج ويفرض “عقوبة” على إضافة المتغيرات التي لا تساهم بشكل كافٍ في تحسين قوة التفسير. هذا يعني أن قيمة R المربّع المعدّل يمكن أن تنخفض إذا كان المتغير الجديد لا يضيف معلومات مفيدة كافية لتبرير تعقيد النموذج. وبالتالي، فإن R المربّع المعدّل هو مقياس أكثر واقعية لجودة الملاءمة، لأنه يحاول تقدير قدرة النموذج على تفسير التباين في المتغير التابع في المجتمع بشكل عام، وليس فقط في العينة المدروسة. إنه يعاقب على إضافة متغيرات مستقلة عديمة الفائدة، ويشجع على بناء نماذج أكثر اقتصادًا وذات معنى إحصائي. يُفضل استخدام R المربّع المعدّل عند مقارنة نماذج انحدار مختلفة تحتوي على أعداد مختلفة من المتغيرات المستقلة، بينما قد يكون R المربّع التقليدي كافيًا عند مقارنة نماذج بنفس عدد المتغيرات أو عند وجود متغير مستقل واحد فقط.
7. متى نستخدم R المربّع المعدّل؟
يُعدّ R المربّع المعدّل أداة لا غنى عنها في مواقف معينة ضمن تحليل الانحدار، حيث تتجلى فائدته بشكل أكبر مقارنة بـ R المربّع التقليدي. الاستخدام الأساسي له يكون عند الحاجة إلى مقارنة نماذج انحدار متعددة تحتوي على أعداد مختلفة من المتغيرات المستقلة. في هذه الحالة، لا يمكن الاعتماد على R المربّع التقليدي وحده، لأنه سيشير دائمًا إلى أن النموذج الأكثر تعقيدًا (الذي يحتوي على متغيرات أكثر) هو الأفضل، حتى لو كانت هذه المتغيرات لا تساهم بفعالية. R المربّع المعدّل، بعقوبته على التعقيد غير المبرر، يوفر معيارًا أكثر عدالة للمقارنة، مما يساعد في اختيار النموذج الأكثر كفاءة.
كما يُستخدم R المربّع المعدّل بشكل واسع في مرحلة بناء النموذج واستكشاف المتغيرات. عندما يكون الباحث يعمل على تحديد أفضل مجموعة من المتغيرات المستقلة التي يجب تضمينها في النموذج، يمكن أن يكون R المربّع المعدّل بمثابة مؤشر لإزالة المتغيرات التي لا تضيف قيمة تفسيرية كافية. إذا أدت إزالة متغير إلى زيادة قيمة R المربّع المعدّل، فهذا يعني أن المتغير كان يضر بالنموذج أكثر مما ينفعه، وأن النموذج الأبسط أفضل. هذا يساعد في بناء نموذج أكثر أناقة وأسهل في التفسير.
علاوة على ذلك، يُنصح باستخدام R المربّع المعدّل عندما يكون الهدف هو تطوير نموذج تفسيري، حيث يكون التركيز على فهم العلاقات بين المتغيرات وتحديد المتغيرات التي تساهم بشكل كبير في تفسير التباين في المتغير التابع. في هذه الحالات، لا يكفي مجرد تحقيق أفضل ملاءمة للبيانات، بل يجب التأكد من أن هذه الملاءمة تأتي من متغيرات ذات معنى إحصائي ولا تزيد من تعقيد النموذج دون مبرر. على الرغم من ذلك، يجب دائمًا استخدام R المربّع المعدّل بالاقتران مع مقاييس إحصائية أخرى، مثل قيم P للمتغيرات الفردية، واختبار F العام للنموذج، وفحص البواقي، لتقديم تقييم شامل لمدى صحة وقوة النموذج.
8. القيود والتفسيرات الخاطئة الشائعة
على الرغم من مزاياه، يمتلك R المربّع المعدّل عدة قيود ويمكن أن يكون عرضة لسوء التفسير إذا لم يُفهم في سياقه الصحيح. من أهم هذه القيود أنه ليس مقياسًا للسببية. فارتفاع قيمته لا يعني أن المتغيرات المستقلة تسبب التغير في المتغير التابع. إنه يشير فقط إلى وجود علاقة ارتباطية قوية، وقد تكون هذه العلاقة نتيجة لعوامل خارجية أو متغيرات محيرة غير مدرجة في النموذج. يجب على الباحثين دائمًا توخي الحذر وتجنب استنتاج السببية بناءً على هذا المقياس وحده.
قيد آخر هو أن R المربّع المعدّل ليس مقياسًا لدقة التنبؤ. في حين أنه يقيم جودة ملاءمة النموذج للبيانات المتاحة، إلا أنه لا يضمن أن النموذج سيقوم بتنبؤات دقيقة لبيانات جديدة أو خارج العينة. قد يكون النموذج ذو R مربّع معدّل عالٍ عرضة للإفراط في الملاءمة، مما يجعله ضعيفًا في التعميم على البيانات غير المرئية. لتقييم دقة التنبؤ، تُفضل تقنيات مثل التحقق المتقاطع (Cross-validation).
بالإضافة إلى ذلك، فإن R المربّع المعدّل لا يكشف عن التحيز في النموذج، مثل التحيز الناتج عن المتغيرات المحذوفة (Omitted Variable Bias). كما أنه لا يقدم معلومات حول ما إذا كان النموذج قد استوفى الافتراضات الأساسية للانحدار الخطي، مثل خطية العلاقة، تجانس تباين البواقي (Homoscedasticity)، وتوزيع البواقي الطبيعي. يمكن أن يكون نموذج ذو R مربّع معدّل عالٍ لكنه ينتهك هذه الافتراضات، مما يجعل استنتاجاته غير موثوقة. وأخيرًا، يجب تجنب الاستخدام الأعمى لـ R المربّع المعدّل كمعيار وحيد لاختيار النموذج. الاعتماد المفرط عليه دون النظر إلى الجوهر النظري، والتحقق من الافتراضات، وفحص دلالة المتغيرات الفردية، يمكن أن يؤدي إلى بناء نماذج غير صحيحة أو مضللة.
9. أمثلة تطبيقية
يجد R المربّع المعدّل تطبيقات واسعة النطاق في العديد من المجالات الأكاديمية والعملية، حيث يساعد الباحثين والمحللين على تقييم جودة النماذج الإحصائية التي يبنونها. في مجال الاقتصاد والاقتصاد القياسي، يُستخدم R المربّع المعدّل بشكل متكرر عند تحليل العوامل المؤثرة على المتغيرات الاقتصادية الكلية مثل الناتج المحلي الإجمالي، معدلات التضخم، أو أسعار الفائدة. على سبيل المثال، قد يحاول اقتصاديون بناء نموذج لتفسير نمو الناتج المحلي الإجمالي باستخدام متغيرات مثل الاستثمار، الإنفاق الحكومي، معدلات البطالة، ومؤشرات الابتكار. سيتم استخدام R المربّع المعدّل لمقارنة النماذج المختلفة التي تحتوي على مجموعات فرعية من هذه المتغيرات، لاختيار النموذج الذي يفسر النمو الاقتصادي بأكبر قدر من الدقة والفعالية دون تضمين متغيرات غير ضرورية.
في العلوم الاجتماعية وعلم النفس، يمكن استخدام R المربّع المعدّل لفهم العوامل التي تؤثر على السلوك البشري أو الظواهر الاجتماعية. على سبيل المثال، قد يدرس باحثون في علم الاجتماع تأثير متغيرات مثل التعليم، الدخل، الحالة الاجتماعية، والوصول إلى الرعاية الصحية على مستوى الرضا عن الحياة. سيمكنهم R المربّع المعدّل من تحديد أي من هذه المتغيرات تقدم التفسير الأقوى للتباين في الرضا عن الحياة دون تعقيد النموذج بشكل غير مبرر. هذا يساعد في صياغة نظريات أكثر دقة وتوجيه التدخلات الاجتماعية بشكل فعال.
أما في مجال الطب وعلم الأوبئة، يمكن استخدام R المربّع المعدّل لتحليل العوامل الخطرة المرتبطة بنتائج صحية معينة، مثل انتشار مرض ما أو فعالية علاج. على سبيل المثال، قد يتم بناء نموذج للتنبؤ بانتشار مرض السكري باستخدام متغيرات مثل العمر، الوزن، التاريخ العائلي، ومستوى النشاط البدني. يساعد R المربّع المعدّل في تقييم أفضل مجموعة من هذه العوامل التي تفسر التباين في احتمالية الإصابة بالمرض، مما يدعم جهود الوقاية والعلاج. في كل هذه الأمثلة، يخدم R المربّع المعدّل كأداة حيوية لضمان أن النماذج الإحصائية ليست فقط جيدة الملاءمة للبيانات، بل أيضًا متينة وذات مغزى عملي.
10. البدائل والمقاييس الأخرى لجودة الملاءمة
بينما يُعدّ R المربّع المعدّل أداة قيمة في تقييم نماذج الانحدار، إلا أنه ليس المقياس الوحيد لجودة الملاءمة أو لاختيار النموذج، وغالبًا ما يُستخدم بالاقتران مع بدائل أخرى أو يُفضل استخدام تلك البدائل في سياقات معينة. من أبرز هذه البدائل معيار أكايكي للمعلومات (AIC) ومعيار بايزي للمعلومات (BIC). كلاهما يعملان على مبدأ موازنة جودة الملاءمة (الممثلة بالاحتمالية القصوى للنموذج) مع تعقيد النموذج (عدد المعلمات). تعاقب هذه المعايير النماذج الأكثر تعقيدًا، ولكن BIC يفرض عقوبة أقوى على التعقيد، خاصة مع زيادة حجم العينة، مما يجعله يميل نحو اختيار نماذج أبسط مقارنة بـ AIC.
مقياس آخر هو Mallow’s Cp، والذي يُستخدم عادة في اختيار المتغيرات الفرعية في الانحدار المتعدد. إنه يقيم الانحياز والتباين في نموذج الانحدار، ويهدف إلى العثور على نموذج فرعي يقلل من خطأ التنبؤ الكلي. قيمة Cp القريبة من عدد المتغيرات في النموذج الفرعي (بما في ذلك الثابت) تشير إلى أن النموذج الفرعي جيد بقدر النموذج الكامل الذي يحتوي على جميع المتغيرات.
بالإضافة إلى هذه المقاييس القائمة على المعلومات، هناك تقنيات أكثر قوة لتقييم أداء النموذج التنبؤي، مثل التحقق المتقاطع (Cross-validation). في التحقق المتقاطع، يتم تقسيم البيانات إلى مجموعات فرعية للتدريب والاختبار، ويتم تدريب النموذج على مجموعة فرعية واحدة ثم اختباره على أخرى. هذا يوفر تقديرًا أكثر واقعية لمدى قدرة النموذج على التعميم على بيانات جديدة، وهو أمر بالغ الأهمية في تطبيقات تعلّم الآلة وعلم البيانات حيث يكون الهدف الأساسي هو التنبؤ. بينما يركز R المربّع المعدّل على جودة الملاءمة الداخلية للنموذج، تركز هذه البدائل على جوانب مختلفة من أداء النموذج، مثل دقة التنبؤ أو اختيار النموذج الأمثل وفقًا لمبادئ نظرية المعلومات، مما يوفر رؤية أكثر شمولية لجودة النموذج.
Further Reading
- معامل التحديد – ويكيبيديا
- الانحدار الخطي المتعدد – ويكيبيديا
- درجات الحرية – ويكيبيديا
- الإفراط في الملاءمة – ويكيبيديا
- اختيار النموذج – ويكيبيديا
- معيار أكايكي للمعلومات – ويكيبيديا
- معيار بايزي للمعلومات – ويكيبيديا
- تعلّم الآلة – ويكيبيديا
- الاقتصاد القياسي – ويكيبيديا
- علم الأوبئة – ويكيبيديا
- Mallows’s Cp – Wikipedia (English)
- Cross-validation (statistics) – Wikipedia (English)