عشيري – decile

العشير (Decile)

المجالات التخصصية الأساسية: الإحصاء الوصفي، الرياضيات التطبيقية، الاقتصاد القياسي، علم الاجتماع.

1. التعريف الجوهري

يمثل مفهوم العشير (Decile) أحد أهم المقاييس الإحصائية الموضعية المستخدمة على نطاق واسع في تحليل توزيع البيانات. يُعرف العشير بأنه إحدى النقاط التسع التي تقسم مجموعة بيانات مرتبة (تصاعدياً أو تنازلياً) إلى عشرة أجزاء متساوية، حيث يحتوي كل جزء من هذه الأجزاء على 10% من إجمالي عدد المشاهدات أو القيم. هذه النقاط التسع، التي يُرمز إليها عادةً بالرموز من D1 إلى D9، تساعد بشكل فعال في فهم الهيكل الداخلي لتوزيع البيانات وتحديد مدى تمركزها أو تشتتها. إن الدور الأساسي للعشيرات يتمثل في توفير نظرة سريعة وواضحة على كيفية توزيع القيم عبر السلسلة الإحصائية، مما يجعله أداة لا غنى عنها في مجالات تتطلب تحليلاً دقيقاً لمستويات التفاوت والتباين.

على خلاف مقاييس النزعة المركزية التقليدية مثل المتوسط الحسابي، تركز العشيرات على تحديد الموضع النسبي لقيمة معينة ضمن التوزيع الكلي. فمثلاً، يشير العشير الأول (D1) إلى القيمة التي تقع عندها 10% من البيانات، بينما يشير العشير التاسع (D9) إلى القيمة التي تقع تحتها 90% من البيانات. هذا التركيز على تقسيم التوزيع إلى شرائح متساوية يبرز أهمية العشيرات كوسيلة فعالة في التعامل مع البيانات التي قد تكون منحرفة أو تحتوي على قيم متطرفة، حيث تكون أقل تأثراً بالقيم الشاذة مقارنةً بالمتوسط الحسابي. وبالتالي، توفر العشيرات صورة أكثر واقعية عن التوزيع الحقيقي للظاهرة قيد الدراسة، سواء كانت مستويات دخل، أو درجات اختبارات، أو مقاييس جودة.

من الجدير بالذكر أن العشير الخامس (D5) يتمتع بخصوصية بالغة، إذ يتطابق تماماً مع مفهوم الوسيط (Median) في الإحصاء، وكذلك مع المئينة الخمسين (P50). هذه النقطة المركزية تقسم البيانات إلى نصفين متساويين، 50% فوقها و 50% تحتها. هذا التوافق بين مقاييس الموضع المختلفة يؤكد الطبيعة المنهجية الموحدة التي تتبعها الإحصاءات الموضعية (Quantiles)، حيث يمكن التعبير عن أي عشير بدلالة المئينات (Percentiles). هذه المرونة في التعبير والاستخدام تجعل العشيرات أداة أساسية ليس فقط في الوصف الإحصائي البسيط، ولكن أيضاً في التحليلات المتقدمة التي تتناول التوزيعات الاحتمالية واختبارات الفرضيات.

2. الاشتقاق اللغوي والتطور التاريخي

يعود أصل مصطلح “Decile” إلى الكلمة اللاتينية “decimus”، والتي تعني “العاشر” أو “جزء من عشرة”، مما يعكس بوضوح وظيفته الأساسية في تقسيم مجموعة البيانات إلى عشرة أجزاء. تاريخياً، تطورت الحاجة إلى مقاييس موضعية أكثر تفصيلاً – بما في ذلك العشيرات – مع نمو الدراسات الاقتصادية والاجتماعية في القرنين التاسع عشر والعشرين، خاصةً تلك المعنية بقياس التفاوت الاجتماعي والاقتصادي. ففي المراحل المبكرة للإحصاء، كانت مقاييس النزعة المركزية ومقاييس التشتت البسيطة هي السائدة، لكنها لم تكن كافية لتقديم صورة دقيقة عن كيفية توزيع الثروة أو الدخل داخل المجتمع.

برزت أهمية العشيرات كأداة تحليلية قوية في سياق محاولات الاقتصاديين وعلماء الاجتماع لفهم الفجوات بين الشرائح العليا والدنيا في المجتمع. على سبيل المثال، أصبح استخدام العشيرات أمراً محورياً في تقارير منظمة التعاون الاقتصادي والتنمية (OECD) والأمم المتحدة، حيث يتم تحليل توزيع الدخل القومي بتقسيم السكان إلى عشرة شرائح متساوية. هذا التطور المنهجي سمح بظهور مؤشرات أكثر تعبيراً، مثل “نسبة D9/D1” التي تقيس مدى التفاوت بين أعلى 10% وأدنى 10% من السكان، وهو مؤشر ذو أهمية قصوى في صياغة السياسات العامة الهادفة للحد من اللامساواة.

على الرغم من أن المفاهيم المرتبطة بالتقسيم الموضعي للبيانات كانت موجودة ضمن الإحصاء الرياضي منذ فترة طويلة، إلا أن التبني الواسع والمنهجي للعشيرات في التحليل التطبيقي تزامن مع الحاجة المتزايدة إلى أدوات تسمح بالمقارنات الدولية والإقليمية. إن التطورات التكنولوجية في معالجة البيانات الضخمة عززت أيضاً من استخدام العشيرات، حيث أصبحت هذه المقاييس سهلة الحساب حتى مع مجموعات البيانات الهائلة، مما يضمن استمراريتها كأداة تحليلية أساسية في عصر البيانات الضخمة (Big Data) والنمذجة الإحصائية المتقدمة.

3. الخصائص الرئيسية

تتميز العشيرات بعدة خصائص منهجية تجعلها فريدة ومفيدة في التحليل الإحصائي. أولاً، إنها مقاييس ترتيبية، بمعنى أن حسابها يعتمد بالضرورة على ترتيب البيانات تصاعدياً أو تنازلياً. هذا الترتيب هو الخطوة الأولى والأكثر أهمية، ويضمن أن تكون القيمة المحسوبة تعكس الموضع النسبي بدقة. ثانياً، تتميز العشيرات بخاصية التقسيم المتساوي، حيث يمثل كل فاصل عشيري (من Dk إلى Dk+1) 10% بالضبط من إجمالي المشاهدات، مما يسهل تفسير التوزيعات.

الخاصية الثالثة والرئيسية هي العلاقة الوثيقة بين العشيرات والمقاييس الموضعية الأخرى. كما ذكرنا سابقاً، يتطابق العشير الخامس (D5) مع الوسيط، لكن العلاقة تمتد لتشمل المئينات (Percentiles). فكل عشير هو مئينة مضاعفة للعشرة: D1 هي P10، D2 هي P20، وصولاً إلى D9 التي هي P90. هذه العلاقة البنيوية تسمح للمحللين بالتحول بين المقاييس حسب مستوى التفصيل المطلوب، حيث توفر المئينات تفصيلاً دقيقاً بنسبة 1%، بينما توفر العشيرات تلخيصاً عملياً بنسبة 10%.

علاوة على ذلك، تتميز العشيرات بأنها أقل حساسية للقيم المتطرفة (Outliers) مقارنة بالمتوسط الحسابي. فعلى الرغم من أن القيم المتطرفة قد تؤثر على تحديد موقع العشير، إلا أن تأثيرها يكون محدوداً جداً مقارنة بتأثيرها على المتوسط. هذه المرونة تجعل العشيرات خياراً مفضلاً عند التعامل مع البيانات الاقتصادية أو الاجتماعية التي غالباً ما تكون توزيعاتها منحرفة (Skewed)، حيث يمكن لعدد قليل من القيم الكبيرة جداً (مثل الدخول المرتفعة للغاية) أن تشوه المتوسط بشكل كبير، بينما يظل موقع العشير، وخاصة الوسيط (D5)، مقياساً مستقراً للنزعة المركزية.

4. منهجية الحساب وطرق التوزيع

يتطلب حساب العشيرات اتباع خطوات منهجية صارمة لضمان الدقة في تحديد نقاط الفصل. تبدأ العملية بـ ترتيب البيانات في تسلسل تصاعدي أو تنازلي. بعد الترتيب، يتم تحديد موقع العشير المطلوب (Dk، حيث k تتراوح من 1 إلى 9) باستخدام صيغة الموقع. في حالة البيانات غير المجمعة (البيانات الخام)، يمكن استخدام الصيغة التالية لتحديد موقع العشير k: $L_k = (n + 1) times (k/10)$، حيث $n$ هو إجمالي عدد المشاهدات.

تنشأ التعقيدات المنهجية عندما يكون موقع العشير المحسوب قيمة غير صحيحة، مما يعني أن العشير يقع بين قيمتين ملاحظتين. في هذه الحالة، يجب تطبيق طريقة الاستيفاء (Interpolation) لتقدير القيمة الدقيقة للعشير. الاستيفاء هو عملية رياضية تُستخدم لتقدير قيمة تقع بين نقطتين معلومتين، وهو أمر ضروري للحصول على مقياس دقيق للعشير بدلاً من الاكتفاء بأقرب قيمة ملاحظة. كما أن هناك اختلافات طفيفة في طرق الحساب بين البرامج الإحصائية المختلفة (مثل R و Excel و SPSS)، والتي قد تستخدم تعريفات مختلفة قليلاً لصيغة الموقع، خاصة عند التعامل مع مجموعات البيانات الصغيرة، مما قد يؤدي إلى تباينات هامشية في القيم المحسوبة.

أما في حالة البيانات المجمعة (الموزعة في فئات تكرارية)، فإن الحساب يتطلب استخدام صيغة مختلفة تعتمد على التكرار التراكمي. يتم أولاً تحديد الفئة التي يقع فيها العشير بناءً على التكرار التراكمي الذي يتجاوز الموقع النظري للعشير ($L_k$). بعد تحديد الفئة العشيرية، يتم تطبيق الصيغة الخاصة بالاستيفاء الخطي، والتي تتضمن الحد الأدنى للفئة، وطول الفئة، والتكرار التراكمي السابق، وتكرار الفئة نفسها. هذا التمييز بين حساب العشيرات للبيانات الخام والمجمعة يبرز الحاجة إلى فهم عميق لطبيعة البيانات المتاحة قبل الشروع في التحليل، ويؤكد على أن منهجية الحساب هي جزء لا يتجزأ من دقة النتائج الإحصائية.

5. العلاقة بالمئينات والربيعيات

تندرج العشيرات ضمن عائلة أوسع من مقاييس الموضع تعرف باسم الكميات (Quantiles)، والتي تشمل الربيعيات (Quartiles) والمئينات (Percentiles). إن فهم العلاقة الهيكلية بين هذه المقاييس أمر بالغ الأهمية للمحلل الإحصائي، حيث إنها جميعها تعمل على تقسيم التوزيع إلى شرائح متساوية، لكنها تختلف في عدد الأجزاء الناتجة. فبينما تقسم العشيرات البيانات إلى عشرة أجزاء، تقسم الربيعيات البيانات إلى أربعة أجزاء (25% لكل جزء)، وتقسم المئينات البيانات إلى مائة جزء (1% لكل جزء).

إن الربط المباشر بين العشيرات والمئينات هو الأكثر وضوحاً؛ إذ يمكن اعتبار العشيرات مجموعة فرعية من المئينات. فالعشير الأول (D1) هو المئينة العاشرة (P10)، والعشير الثاني (D2) هو المئينة العشرون (P20)، وهكذا. هذا التكافؤ يتيح استخدام العشيرات كشكل مبسط وموجز لتمثيل التوزيع عندما لا تكون هناك حاجة إلى التفصيل الدقيق الذي توفره المئينات. وفي المقابل، يمكن استخدام المئينات لتقدير العشيرات إذا كانت البيانات متاحة فقط في شكل مئينيات، مما يعزز مرونة الأدوات الإحصائية المتاحة.

أما العلاقة بالربيعيات، فهي علاقة تداخلية جزئية. يتطابق العشير الخامس (D5) مع الربيع الثالث (Q2)، وكلاهما يمثل الوسيط. ومع ذلك، فإن الربيع الأول (Q1) يساوي المئينة الخامسة والعشرين (P25)، بينما الربيع الثالث (Q3) يساوي المئينة الخامسة والسبعين (P75). نظراً لأن العشيرات لا تتضمن نقاط الفصل 25% و 75% بشكل مباشر (بل تتضمن 10% و 20% و… 90%)، فإن المحللين غالباً ما يستخدمون الربيعيات لقياس المدى الربيعي (Interquartile Range – IQR)، وهو مقياس تشتت يعتمد على Q3 – Q1، بينما تستخدم العشيرات بشكل أساسي لقياس التفاوت في الأطراف (مثل نسبة D9/D1). هذا التمايز في الاستخدام يعكس التخصص الوظيفي لكل مجموعة من مقاييس الكميات.

6. تطبيقات في التحليل الاقتصادي والاجتماعي

تعد العشيرات أداة محورية في علم الاقتصاد، وخاصة في دراسة توزيع الدخل والثروة. عند تحليل بيانات الدخل القومي، يتم تقسيم السكان إلى عشرة عشيرات دخل متساوية الحجم. يتيح هذا التقسيم للمحللين الاقتصاديين مراقبة ديناميكيات التفاوت بدقة، وتحديد الشرائح الأكثر فقراً (العشيرات الدنيا) والشرائح الأكثر ثراءً (العشيرات العليا). إن مؤشرات مثل حصة الدخل التي يمتلكها العشير الأعلى (D10) مقارنة بحصة العشير الأدنى (D1) توفر مقاييس كمية ملموسة لظاهرة اللامساواة، وتعتبر أساساً لصياغة سياسات الضرائب وإعادة التوزيع.

بالإضافة إلى الاقتصاد، تلعب العشيرات دوراً هاماً في مجالات التعليم والصحة. ففي تحليل الأداء التعليمي، يمكن ترتيب نتائج الطلاب إلى عشيرات، مما يساعد المؤسسات التعليمية على تحديد الطلاب الذين يحتاجون إلى دعم إضافي (الذين يقعون في العشيرات الدنيا) وتحديد مستويات التفوق الأكاديمي (العشيرات العليا). وفي مجال الصحة، تُستخدم العشيرات لتقييم توزيع مؤشرات مثل مؤشر كتلة الجسم (BMI) أو مستويات الكوليسترول في عينة سكانية، مما يساعد في تحديد المجموعات المعرضة لخطر صحي أكبر واتخاذ التدابير الوقائية المناسبة.

كما تمتد تطبيقات العشيرات إلى التمويل وإدارة المخاطر. في التحليل المالي، قد يتم استخدام العشيرات لتقسيم الشركات أو الأصول المالية بناءً على مقاييس الأداء أو المخاطر. فمثلاً، يمكن ترتيب الأسهم حسب عائداتها السنوية وتقسيمها إلى عشيرات، مما يسمح للمستثمرين بفحص خصائص الأسهم التي تقع في أعلى 10% أداءً أو أدنى 10% أداءً. هذا النوع من التحليل الموضعي يسمح باتخاذ قرارات استثمارية أكثر استنارة، خاصة في سياق اختبار استراتيجيات الاستثمار التي تستهدف أطراف التوزيع (Tail Risk Analysis).

7. الأهمية والأثر

تكمن الأهمية الجوهرية لاستخدام العشيرات في قدرتها على تبسيط وتحليل التوزيعات المعقدة للبيانات الكبيرة. إنها توفر أداة تفسيرية قوية تمكن الجمهور غير المتخصص، وكذلك صانعي السياسات، من استيعاب مدى التباين والتفاوت في ظاهرة ما دون الحاجة إلى التعمق في التفاصيل الإحصائية المعقدة. فعندما يقال إن “أعلى عشير يمتلك 40% من الثروة”، تكون الرسالة أكثر تأثيراً ووضوحاً من مجرد ذكر المتوسط أو الانحراف المعياري.

علاوة على ذلك، تُحدث العشيرات أثراً كبيراً في التحليل المقارن. فهي تسمح بمقارنات عادلة بين مجموعات أو دول مختلفة، بغض النظر عن حجم السكان أو الاختلافات المطلقة في مقاييسهم. فبدلاً من مقارنة متوسطات الدخل التي تتأثر بأسعار العملات ومستويات المعيشة المختلفة، يمكن للمحللين مقارنة توزيع الدخل؛ على سبيل المثال، مقارنة النسبة المئوية للدخل الذي يمتلكه العشير الأدنى في دولة ما بنظيره في دولة أخرى. هذا التوحيد في مقاييس التوزيع يعزز من جودة الأبحاث الدولية ويساعد على تحديد أفضل الممارسات في مكافحة الفقر وعدم المساواة.

في سياق الإحصاء التطبيقي، تُعتبر العشيرات أساساً لإنشاء مقاييس الدرجات المعيارية (Standardized Scores) وتصنيف الأفراد. على سبيل المثال، في الاختبارات الموحدة (مثل اختبارات القبول الجامعي)، غالباً ما يتم تحويل الدرجات الخام إلى رتب عشيرية أو مئينية لتحديد أداء الطالب مقارنة بزملائه. هذا التحويل ليس مجرد عملية رياضية، بل هو اعتراف بأن القيمة النسبية (الموضع ضمن التوزيع) قد تكون أكثر أهمية من القيمة المطلقة في سياقات التقييم والمقارنة.

8. الجدليات والانتقادات

على الرغم من الاستخدام الواسع والفوائد المتعددة للعشيرات، إلا أن هناك بعض الجدليات والانتقادات المنهجية الموجهة نحو استخدامها. أحد الانتقادات الرئيسية يتعلق بفقدان البيانات الدقيقة. فعندما يتم تجميع آلاف أو ملايين البيانات في عشرة صناديق واسعة (العشيرات)، فإن التباين والاختلافات الدقيقة داخل كل عشير يتم تجاهلها. فجميع الأفراد الذين يقع دخلهم ضمن العشير الخامس، على سبيل المثال، يتم معاملتهم إحصائياً على قدم المساواة، بالرغم من أن أحدهم قد يكون قريباً جداً من العشير الرابع والآخر قريباً من العشير السادس. هذا التجاهل للتفاصيل الداخلية يُعرف باسم “مشكلة تجميع البيانات” (Binning Problem).

انتقاد آخر يتعلق بـ الاعتماد المفرط على الترتيب. العشيرات هي مقاييس ترتيبية بحتة؛ فهي تخبرنا عن موقع القيمة، لكنها لا تخبرنا عن المسافة المطلقة بين القيم. قد تكون المسافة بين D1 و D2 مختلفة تماماً عن المسافة بين D8 و D9. هذا يعني أن العشيرات لا تعطي صورة كاملة عن تشتت البيانات أو شكل التوزيع. على سبيل المثال، قد يشير العشير الأدنى في توزيعين مختلفين إلى نفس النسبة المئوية من الدخل، لكن في أحد التوزيعين تكون الفجوة بين D1 و D2 صغيرة جداً، بينما تكون واسعة جداً في التوزيع الآخر، وهذا الفارق الجوهري في التشتت لا يظهر بوضوح عند الاكتفاء بقراءة نقاط العشيرات التسع فقط.

بالإضافة إلى ذلك، تثير منهجيات الحساب المختلفة للعشيرات، خاصة طرق الاستيفاء المستخدمة في البرامج الإحصائية، بعض الجدل، لا سيما عند التعامل مع مجموعات البيانات الصغيرة حيث يمكن أن تؤدي الاختلافات الطفيفة في الصيغة الرياضية إلى نتائج مختلفة بشكل ملحوظ. لذلك، يُنصح المحللون دائماً بدمج العشيرات مع مقاييس إحصائية أخرى، مثل معامل جيني (Gini Coefficient) أو الانحراف المعياري، لتقديم تحليل إحصائي شامل ومتكامل يتجاوز القيود الملازمة لأي مقياس موضعي فردي.

9. قراءات إضافية