توزيع جاما – gamma distribution

توزيع جاما

Primary Disciplinary Field(s): الإحصاء الرياضي، نظرية الاحتمالات، الإحصاء التطبيقي

1. التعريف الأساسي

يمثل توزيع جاما (Gamma Distribution) أحد أهم التوزيعات الاحتمالية المستمرة في نظرية الاحتمالات والإحصاء التطبيقي، وهو يستخدم بشكل أساسي لنمذجة المتغيرات العشوائية الموجبة ذات القيم المستمرة التي تمثل فترات الانتظار أو الأزمنة بين الأحداث. يتميز هذا التوزيع بمرونته العالية، مما يسمح له باتخاذ أشكال متعددة بناءً على قيم معلماته، ويجعله أداة قوية في مجالات مثل نظرية التعويل (Reliability Theory)، ونظرية الطوابير، والنمذجة المالية.

يتم تعريف توزيع جاما من خلال دالة كثافة الاحتمال (PDF) الخاصة به، والتي تعتمد على معلمتين أساسيتين: معلمة الشكل (Shape Parameter)، التي يرمز لها عادةً بالرمز $alpha$ (ألفا) أو $k$، ومعلمة المقياس (Scale Parameter)، التي يرمز لها بالرمز $theta$ (ثيتا) أو معكوسها، معلمة المعدل (Rate Parameter)، التي يرمز لها بالرمز $beta$ (بيتا) أو $lambda$. إذا كانت $X$ متغيراً عشوائياً يتبع توزيع جاما بالمعلمتين $alpha$ و $theta$، فإن دالة كثافة الاحتمال $f(x)$ تُعطى بالصيغة الرياضية التالية:

$f(x; alpha, theta) = frac{x^{alpha – 1} e^{-x / theta}}{Gamma(alpha) theta^{alpha}}$، حيث $x > 0$.

في هذه المعادلة، تشير $Gamma(alpha)$ إلى دالة جاما الرياضية، وهي امتداد لدالة العاملي (Factorial Function) للأعداد الحقيقية والمركبة. إن الدور الأساسي لدالة جاما في هذه الصيغة هو ضمان أن يكون التكامل الكلي لدالة كثافة الاحتمال يساوي 1، وهو شرط أساسي لأي دالة كثافة احتمال صالحة. وتجدر الإشارة إلى أن معلمة الشكل $alpha$ تتحكم في شكل منحنى التوزيع، بينما تتحكم معلمة المقياس $theta$ في انتشار التوزيع على المحور الأفقي.

2. التأثيل والتطور التاريخي

على الرغم من أن التوزيع يحمل اسم دالة جاما، إلا أن جذوره التاريخية مرتبطة بتطورات سابقة في نظرية الاحتمالات. يمكن تتبع الأساس النظري لتوزيع جاما إلى أعمال رياضيين بارزين، لا سيما في سياق دراسة توزيعات زمن الانتظار. في الواقع، يعتبر توزيع جاما تعميماً لتوزيعات أخرى معروفة مثل التوزيع الأُسي (Exponential Distribution) وتوزيع إيرلانغ (Erlang Distribution)، اللذين كانا يستخدمان لنمذجة فترات الانتظار في العمليات العشوائية.

التطور الأبرز حدث عندما أدرك العلماء أن دمج معلمة شكل إضافية (ألفا) يسمح بنمذجة مجموعة أوسع بكثير من الظواهر التي لا يمكن للتوزيع الأُسي وحده أن يمثلها بدقة. التوزيع الأُسي، الذي يمثل حالة خاصة من توزيع جاما عندما تكون $alpha = 1$، يتسم بخاصية “انعدام الذاكرة”، وهي خاصية لا تنطبق على العديد من سيناريوهات الانتظار في العالم الحقيقي (مثل وقت تعطل الآلات أو فترات حياة الكائنات). إدخال معلمة الشكل $alpha$ جعل توزيع جاما قادراً على نمذجة التوزيعات ذات الالتواء الموجب المختلف، بدءاً من المنحنيات المتناقصة بشكل حاد (عندما $alpha < 1$) وصولاً إلى المنحنيات الشبيهة بالتوزيع الطبيعي (عندما تكون $alpha$ كبيرة).

يُنسب الفضل في تطوير وتوحيد استخدام دالة جاما في الإحصاء إلى أعمال رياضيين مثل كارل بيرسون (Karl Pearson) في أواخر القرن التاسع عشر وأوائل القرن العشرين، في سياق عائلته الواسعة من التوزيعات التي تستخدم في نمذجة البيانات غير المتماثلة. لقد عززت هذه الأعمال مكانة توزيع جاما كأداة إحصائية أساسية، خاصة في مجالات تتطلب نمذجة النتائج الإيجابية التي لا تتبع بالضرورة التوزيع الطبيعي، مثل كميات الأمطار، أو مطالبات التأمين، أو أزمنة المعالجة.

3. الخصائص الرياضية الرئيسية

تتسم الخصائص الرياضية لتوزيع جاما بالبساطة النسبية عند التعبير عنها بدلالة المعلمتين $alpha$ (الشكل) و $theta$ (المقياس). هذه الخصائص ضرورية لإجراء الاستدلال الإحصائي، وتحديد موثوقية النماذج القائمة على هذا التوزيع.

القيمة المتوقعة والتباين: إن القيمة المتوقعة (المتوسط) لتوزيع جاما، والتي تمثل القيمة المركزية التي يتوقع أن يتجمع حولها التوزيع، تُحسب ببساطة كحاصل ضرب معلمتي الشكل والمقياس. وبالمثل، يُحسب التباين، الذي يقيس مدى انتشار التوزيع، كحاصل ضرب معلمة الشكل ومربع معلمة المقياس. هذه العلاقات المباشرة تجعل العمليات الحسابية والتقديرية للتوزيع سهلة نسبياً مقارنة بالتوزيعات المعقدة الأخرى.

  1. المتوسط (القيمة المتوقعة): $E[X] = alpha theta$
  2. التباين: $Var[X] = alpha theta^2$

بالإضافة إلى ذلك، يعتبر دالة توليد العزوم (Moment Generating Function, MGF) أداة قوية في تحليل توزيع جاما، حيث تسمح بتوليد جميع عزوم التوزيع (مثل المتوسط والتباين) وتلعب دوراً حاسماً في إثبات الخصائص التجميعية للتوزيع. دالة توليد العزوم لتوزيع جاما تُعطى بالصيغة: $M_X(t) = (1 – theta t)^{-alpha}$، حيث $t < 1/theta$. إن هذه الصيغة المدمجة تؤكد الطبيعة الأُسية الأساسية التي يقوم عليها التوزيع. كما أن التوزيع يتميز دائماً بالالتواء الموجب، مما يعني أن ذيله الأيمن أطول من ذيله الأيسر، وهي خاصية طبيعية للمتغيرات العشوائية التي تمثل الأزمنة أو الكميات الموجبة.

4. الأشكال والارتباطات

توزيع جاما ليس مجرد توزيع واحد، بل هو عائلة من التوزيعات التي تشمل العديد من الحالات الخاصة الشهيرة والمستخدمة على نطاق واسع في الإحصاء ونظرية الاحتمالات. هذه الارتباطات تؤكد مرونة التوزيع وتعميميته.

التوزيع الأُسي: عندما يتم تعيين معلمة الشكل $alpha = 1$، يتحول توزيع جاما مباشرة إلى التوزيع الأُسي. يستخدم التوزيع الأُسي بشكل أساسي لنمذجة الزمن بين حدثين متتاليين في عملية بواسون (Poisson process)، حيث تكون الأحداث نادرة ومستقلة. في هذه الحالة، تصبح معلمة المقياس $theta$ مرتبطة ارتباطاً مباشراً بمتوسط زمن الانتظار.

توزيع إيرلانغ: توزيع إيرلانغ هو حالة خاصة لتوزيع جاما عندما تكون معلمة الشكل $alpha$ عدداً صحيحاً موجباً ($k in {1, 2, 3, …}$). تم تطوير هذا التوزيع في الأصل من قبل المهندس الدنماركي إيه. كيه. إيرلانغ (A. K. Erlang) لنمذجة أزمنة الانتظار في أنظمة الاتصالات الهاتفية ونظرية الطوابير. يمثل توزيع إيرلانغ مجموع $k$ من المتغيرات العشوائية المستقلة التي تتبع التوزيع الأُسي (أي مجموع $k$ من فترات الانتظار المتتالية). هذه الخاصية التجميعية تجعله مفيداً للغاية في نمذجة العمليات متعددة المراحل.

توزيع كاي تربيع (Chi-squared Distribution): يعتبر توزيع كاي تربيع (أو مربع كاي) أيضاً حالة خاصة مهمة لتوزيع جاما. إذا كان المتغير العشوائي يتبع توزيع جاما بمعلمة شكل $alpha = nu/2$ ومعلمة مقياس $theta = 2$ (حيث $nu$ هي درجات الحرية)، فإنه يتبع توزيع كاي تربيع بدرجات حرية $nu$. هذا التوزيع حيوي في الإحصاء الاستدلالي، خاصة في اختبارات الفروض المتعلقة بالتباينات واختبارات حسن المطابقة، مما يربط توزيع جاما بشكل مباشر بالتحليل الإحصائي متعدد المتغيرات.

5. الأهمية والتطبيقات الإحصائية

تكمن الأهمية الكبرى لتوزيع جاما في قدرته على نمذجة ظواهر متعددة في العلوم الطبيعية والاجتماعية التي لا يمكن وصفها بدقة بواسطة التوزيع الطبيعي أو الأُسي. يعتبر توزيع جاما خياراً أولياً لنمذجة أي كمية موجبة مستمرة تظهر التواءً موجباً في توزيعها.

في مجال علم الأوبئة، يُستخدم توزيع جاما لنمذجة الفترات الزمنية بين التعرض لمرض وظهور الأعراض (فترة الحضانة)، حيث غالباً ما تكون هذه الفترات غير متماثلة. وفي الهندسة والفيزياء، يتم استخدامه في نمذجة أوقات الفشل (Life Testing) للمكونات الميكانيكية والإلكترونية، وهو جزء أساسي من تحليل البقاء (Survival Analysis)، حيث يوفر مرونة أكبر من التوزيع الأُسي في تمثيل مراحل “الاهتراء” أو “الشيخوخة” للمنتجات.

في مجال التمويل والاقتصاد، يُستخدم توزيع جاما لنمذجة تدفقات السيولة، ومطالبات التأمين، والتحليل الاقتصادي للتقلبات. نظراً لأن المطالبات المالية والضرر عادة ما تكون قيماً موجبة وتميل إلى أن تكون متطرفة (ذيل سميك)، فإن مرونة معلمة الشكل $alpha$ تسمح بتكييف النموذج مع بيانات العالم الحقيقي بشكل فعال. كما أنه يستخدم في نمذجة أخطاء القياس الإيجابية في بعض التحليلات البيئية والكيميائية.

6. التقدير والاستدلال

للاستفادة من توزيع جاما في التطبيقات العملية، يجب تقدير معلمتي الشكل $alpha$ والمقياس $theta$ من بيانات العينة المتاحة. هناك طرق متعددة لتقدير هذه المعلمات، أبرزها طريقة العزوم وطريقة الإمكان الأقصى.

طريقة الإمكان الأقصى (Maximum Likelihood Estimation – MLE): تعتبر هذه الطريقة هي الأكثر شيوعاً وفعالية، حيث تسعى إلى إيجاد قيم المعلمات التي تزيد من احتمال مشاهدة البيانات المرصودة. يتطلب تقدير معلمتي جاما باستخدام MLE عادةً حل نظام من المعادلات غير الخطية، ويتطلب ذلك استخدام خوارزميات عددية، خصوصاً لتقدير معلمة الشكل $alpha$. على الرغم من التعقيد الحسابي، فإن مقدرات MLE تتميز بخصائص إحصائية مرغوبة مثل الاتساق والكفاءة التقاربية.

طريقة العزوم (Method of Moments – MOM): هذه الطريقة هي الأبسط من الناحية الحسابية، وتتضمن مساواة عزوم العينة (مثل متوسط العينة وتباينها) بالعزوم النظرية للتوزيع (التي تمثلها $alpha theta$ و $alpha theta^2$). يمكن حل المعادلات الناتجة مباشرة للحصول على مقدرات $alpha$ و $theta$. على الرغم من سهولة تطبيقها، إلا أن مقدرات العزوم قد تكون أقل كفاءة من مقدرات الإمكان الأقصى، خاصة في حالة العينات الصغيرة.

7. الجدل والانتقادات

على الرغم من قوة ومرونة توزيع جاما، فإنه يواجه بعض القيود والتحديات التي يجب على الباحثين أخذها في الاعتبار عند استخدامه للنمذجة.

أولاً، يكمن التحدي الرئيسي في تقدير المعلمات، لا سيما معلمة الشكل $alpha$. كما ذُكر سابقاً، فإن مقدرات الإمكان الأقصى لـ $alpha$ ليست لها صيغة مغلقة، وتتطلب حلولاً عددية متكررة. هذا التعقيد الحسابي قد يزيد من زمن المعالجة ويجعل عملية النمذجة أقل وضوحاً مقارنة بالتوزيعات الأخرى التي يمكن تقدير معلماتها بشكل مباشر.

ثانياً، يفترض توزيع جاما أن المتغير العشوائي يبدأ دائماً عند الصفر، أي أن القيم السالبة مستحيلة. في حين أن هذا الافتراض مثالي لنمذجة الأزمنة والأوزان والكميات الموجبة، فإنه يجعله غير مناسب للظواهر التي قد تكون قيمها سالبة أو التي تتطلب نقطة بداية غير صفرية. كما أن التوزيع لا يمتلك ذيولاً سميكة جداً بالقدر الذي قد تتطلبه بعض البيانات المالية المتطرفة (مثل خسائر الكوارث)، مما قد يدفع الباحثين إلى استخدام توزيعات بديلة مثل توزيع باريتو أو توزيع ويبل في تلك السياقات.

قراءات إضافية