اختبار ألفا للجيش: كيف صاغ علم النفس مستقبل التجنيد؟

اختبار ألفا للجيش

التاريخ: 1917–1918
الموقع: الولايات المتحدة الأمريكية (معسكرات التجنيد العسكرية)

1. الملخص العام

يمثل اختبار ألفا للجيش (Army Alpha Test) أحد أبرز الأحداث وأكثرها تأثيراً في تاريخ علم النفس التطبيقي وعلم القياس النفسي، حيث تم تطويره وتنفيذه على نطاق واسع في الولايات المتحدة خلال فترة الحرب العالمية الأولى. كان الهدف الأساسي من هذا الاختبار هو تصنيف وتوزيع ما يقرب من مليوني مجند جديد بكفاءة وفعالية داخل صفوف الجيش الأمريكي، وذلك لتحديد قدراتهم الذهنية، ومهاراتهم اللغوية، وملاءمتهم للمناصب القيادية أو التخصصات التقنية المعقدة. ولأول مرة في التاريخ، تم تطبيق أداة تقييم موحدة على هذا العدد الهائل من الأفراد، مما نقل علم النفس من مجال أكاديمي نظري إلى أداة عملية وإدارية حاسمة في اتخاذ القرارات الوطنية.

شكل اختبار ألفا للجيش، إلى جانب شقيقه غير اللفظي اختبار بيتا للجيش (Army Beta Test)، إنجازاً لوجستياً وعلمياً ضخماً قاده فريق من كبار علماء النفس الأمريكيين، وعلى رأسهم روبرت يركيس (Robert Yerkes)، الذي ترأس لجنة اختبارات الجيش التابعة لجمعية علم النفس الأمريكية (APA). وقد أتاح هذا الاختبار تطبيق مبادئ القياس النفسي التي وضعها رواد مثل ألفريد بينيه وجيمس ماكين كاتيل، ليس فقط على المستوى الفردي، ولكن على مستوى السكان بالكامل. وقد صُمم اختبار ألفا ليكون اختباراً كتابياً موجهاً للمجندين القادرين على القراءة والكتابة باللغة الإنجليزية، بينما خُصص اختبار بيتا للمجندين الأميين أو الذين لا يجيدون اللغة الإنجليزية، لضمان تغطية شاملة لجميع شرائح القوة المجندة.

على الرغم من الأهداف النبيلة المعلنة والمتمثلة في تحقيق الكفاءة والعدالة في التوزيع العسكري، فإن النتائج التي تمخضت عن اختبار ألفا كان لها تأثيرات اجتماعية وسياسية عميقة ومثيرة للجدل. فقد استُخدمت هذه النتائج، التي أشارت إلى اختلافات كبيرة في متوسطات الذكاء بين المجموعات العرقية والجنسيات المهاجرة المختلفة، من قبل دعاة حركة تحسين النسل (Eugenics) لتبرير السياسات التقييدية للهجرة في عشرينيات القرن الماضي. وبعيداً عن الجدل الاجتماعي، أثبت هذا المشروع إمكانية تطبيق الاختبارات النفسية على نطاق واسع في البيئات التنظيمية والصناعية، مما مهد الطريق لظهور تخصصات فرعية جديدة في علم النفس، مثل علم النفس الصناعي والتنظيمي، وأرسى الأساس لجميع اختبارات الكفاءة والقبول التي تلت ذلك في التعليم والقطاع الخاص.

2. الخلفية التاريخية والأسباب الدافعة

اندلعت الحرب العالمية الأولى عام 1914، ومع دخول الولايات المتحدة الصراع في عام 1917، واجه الجيش تحدياً إدارياً ولوجستياً غير مسبوق: الحاجة إلى تجنيد وتدريب وتوزيع ملايين الأفراد بسرعة فائقة. كان النظام التقليدي لتقييم المجندين يعتمد على المقابلات الشخصية العشوائية والتقييمات الذاتية، وهي أساليب كانت بطيئة وغير موحدة، وتفتقر إلى الموثوقية اللازمة لتحديد الأفراد الأكفاء للمهام التي تتطلب تفكيراً معقداً أو قدرات قيادية. كانت هناك حاجة ماسة إلى آلية منهجية وموضوعية تضمن وضع “الرجل المناسب في المكان المناسب” لزيادة الفعالية القتالية والإدارية للجيش.

في هذا السياق، تطوع علماء النفس الأمريكيون، بقيادة روبرت يركيس (أستاذ في جامعة هارفارد ورئيس APA آنذاك)، لتقديم خبراتهم لمواجهة هذا التحدي. كان يركيس يؤمن إيماناً راسخاً بأن علم النفس، وتحديداً أدوات القياس النفسي التي كانت في طور النضوج، يمكن أن يقدم حلاً فعالاً لتصنيف المجندين على أساس القدرة العقلية. لقد رأى علماء النفس في الحرب فرصة ذهبية لإثبات القيمة العملية والمجتمعية لتخصصهم، والانتقال به من المعامل الأكاديمية إلى ميدان التطبيق العملي واسع النطاق. تم تشكيل لجنة خاصة في مايو 1917 لجمع وتطوير اختبارات الذكاء المناسبة للاستخدام العسكري.

تأثرت جهود التطوير بشكل كبير بالعمل الرائد الذي قام به ألفريد بينيه في فرنسا، والذي طور أول اختبار عملي للذكاء لقياس القدرات العقلية للأطفال. ومع ذلك، كان التحدي يكمن في تكييف هذه الاختبارات الفردية لتصبح اختبارات جماعية يمكن إجراؤها على مئات الأفراد في وقت واحد، في بيئات معسكرات التدريب الصاخبة. كانت هذه القفزة من الاختبار الفردي إلى الاختبار الجماعي هي الابتكار المنهجي الأهم الذي قدمه فريق يركيس، مما جعل اختبار ألفا حلاً قابلاً للتطبيق في سياق لوجستيات الحرب واسعة النطاق. كان الدافع الأكاديمي إذاً متمثلاً في إثبات صلاحية علم القياس النفسي على المستوى الوطني، بينما كان الدافع العسكري متمثلاً في تحقيق الكفاءة التشغيلية المثلى.

3. تصميم الاختبار ومكوناته

صُمم اختبار ألفا للجيش ليكون اختباراً جماعياً يستغرق حوالي 50 دقيقة للإكمال، ويتكون من ثمانية اختبارات فرعية مصممة لقياس جوانب مختلفة من القدرة العقلية التي يُفترض أنها ضرورية للنجاح في المهام العسكرية المعقدة. وكان التركيز الأساسي على القدرة على فهم التعليمات المكتوبة، والتعامل مع المعلومات اللفظية والعددية بسرعة ودقة. وقد تميز الاختبار بكونه موحداً (Standardized)، مما يعني أن يتم تطبيقه وتصحيحه بنفس الطريقة الصارمة في جميع المعسكرات لضمان قابلية المقارنة بين نتائج المجندين.

احتوى الاختبار على مجموعة متنوعة من المهام التي لم تكن تهدف بالضرورة إلى قياس المعرفة الأكاديمية المكتسبة، بل القدرة الفطرية على التفكير وحل المشكلات. ومع ذلك، كان الاعتماد الكبير على اللغة الإنجليزية المكتوبة والقراءة السريعة يعني بالضرورة أن المجندين ذوي الخلفيات التعليمية الضعيفة أو غير الناطقين بالإنجليزية كانوا سيعانون حتماً، وهو ما أدى لاحقاً إلى انتقادات واسعة حول التحيز الثقافي (Cultural Bias). وللتخفيف من هذه المشكلة، تم تطوير اختبار بيتا غير اللفظي، الذي اعتمد على الرسوم البيانية والأشكال الهندسية لتصنيف الأفراد الذين لا يستطيعون اجتياز اختبار ألفا.

تتألف الأجزاء الثمانية لاختبار ألفا من مزيج من المهام المتنوعة التي تغطي مجالات التفكير اللفظي، والمنطقي، والعددي. وكانت درجات الاختبار تُستخدم لتحديد تصنيف المجند، حيث تعكس الدرجة الأعلى قدرة عقلية أعلى وتوصية بوضعه في مناصب تتطلب تدريباً متخصصاً أو قيادة. كانت هذه المكونات مصممة لقياس ما أسماه يركيس “الذكاء الفطري” (Innate Intelligence)، وإن كان التطبيق العملي قد كشف عن أن الاختبار يقيس إلى حد كبير القدرة على التكيف مع البيئة الثقافية والتعليمية الأمريكية السائدة.

4. المكونات الرئيسية للاختبار

لتوضيح طبيعة اختبار ألفا، يمكن تفصيل المهام الثمانية التي يتكون منها الاختبار:

  • الاختبار 1: اتباع التعليمات (Instructions): يتطلب من المجندين قراءة التعليمات المكتوبة بسرعة وتنفيذها بدقة، مثل وضع علامة أو دائرة حول كلمة معينة. هذا يقيس القدرة على فهم الإرشادات المكتوبة.
  • الاختبار 2: الحسابات الحسابية (Arithmetical Problems): مجموعة من المسائل الرياضية الأساسية التي تتطلب مهارات حسابية بسيطة وتفكيراً منطقياً لحلها.
  • الاختبار 3: الحكم العملي (Practical Judgment): أسئلة متعددة الخيارات تختبر الحس السليم والقدرة على اتخاذ قرارات منطقية في سيناريوهات يومية أو عسكرية.
  • الاختبار 4: المرادفات والمضادات (Synonyms and Antonyms): يتطلب تحديد ما إذا كانت أزواج الكلمات المحددة لها نفس المعنى أو معاني متعارضة، وهو مقياس مباشر للمفردات والقدرة اللغوية.
  • الاختبار 5: ترتيب الجمل (Sentence Arrangement): يتطلب إعادة ترتيب مجموعة من الكلمات المبعثرة لتكوين جملة ذات معنى، مما يقيس الفهم النحوي والمنطقي.
  • الاختبار 6: استكمال المتسلسلات الرقمية (Number Series Completion): يتطلب تحديد الرقم التالي في متسلسلة رقمية معينة، وهو مقياس للتفكير الاستدلالي والمنطقي.
  • الاختبار 7: القياس (Analogies): يتطلب إكمال علاقة مشابهة بين زوجين من الكلمات (على سبيل المثال: اليد: الذراع :: القدم: ؟)، وهو مقياس أساسي للتفكير المجرد.
  • الاختبار 8: المعلومات العامة (Information): أسئلة حول الحقائق العامة والتاريخ والجغرافيا والثقافة الأمريكية، مما يقيس المعرفة المكتسبة.

5. التنفيذ والنتائج الأولية

تم تطبيق اختبار ألفا للجيش بشكل مكثف بين عامي 1917 و 1918، حيث تم اختبار ما يزيد عن 1.7 مليون جندي أمريكي. كان التنفيذ يمثل عملية إدارية ضخمة، حيث كان يتم تدريب مئات الفاحصين على مستوى البلاد لضمان التزامهم الصارم بالبروتوكولات الموحدة للاختبار. كانت النتائج تُسجل وتُصنف على مقياس من A إلى E، حيث تمثل A أعلى مستوى من القدرة العقلية وE أدناها. وكان من المقرر أن يتم وضع الأفراد ذوي الدرجات المنخفضة (D و E) في وحدات تتطلب عملاً يدوياً بسيطاً، بينما يوصى بوضع الأفراد ذوي الدرجات العالية (A و B) في مدارس الضباط أو في أدوار فنية متقدمة (مثل المشغلين اللاسلكيين أو الميكانيكيين).

أظهرت النتائج الإحصائية، التي تم جمعها وتحليلها لاحقاً بواسطة يركيس وفريقه، أن متوسط العمر العقلي للمجند الأمريكي كان حوالي 13 سنة (بناءً على مقياس بينيه المعدل)، وهو ما أثار قلقاً كبيراً في الأوساط الأكاديمية والسياسية حول المستوى العام للذكاء في البلاد. الأهم من ذلك، كشفت البيانات عن اختلافات واضحة بين المجموعات العرقية والمهاجرة. على سبيل المثال، كان متوسط درجات المجندين البيض أعلى بشكل عام من متوسط درجات المجندين السود، وكانت درجات المهاجرين القادمين من شمال وغرب أوروبا أعلى من درجات المهاجرين القادمين من جنوب وشرق أوروبا (مثل الإيطاليين والبولنديين).

على الرغم من أن فريق يركيس أشار إلى أن هذه الاختلافات قد تكون ناتجة عن عوامل بيئية مثل التعليم ومستوى التعرض للغة الإنجليزية، إلا أن النتائج تم تفسيرها بسرعة من قبل آخرين، لا سيما دعاة تحسين النسل، كدليل على التفاوت الوراثي في الذكاء بين الأعراق والجنسيات. وقد تم استخدام هذه الإحصائيات المضللة لاحقاً في النقاشات الوطنية حول سياسات الهجرة، حيث تم تبرير سن قوانين تقييدية (مثل قانون حصص الهجرة لعام 1924) على أساس الحاجة إلى حماية “الذكاء العرقي” للولايات المتحدة.

6. التأثير على علم النفس التطبيقي والإرث

كان الأثر الفوري لاختبار ألفا هائلاً على تخصص علم النفس. فقد أثبتت التجربة العسكرية أن علم النفس ليس مجرد تخصص نظري، بل يمكن أن يكون له دور حيوي وفعال في الإدارة واتخاذ القرار على المستوى المؤسسي. هذا الإنجاز عزز بشكل كبير من مكانة جمعية علم النفس الأمريكية (APA) ومنح علماء النفس الشرعية اللازمة للتدخل في مجالات لم تكن متاحة لهم من قبل، مثل القطاع الصناعي والتعليمي.

أدى النجاح اللوجستي لاختبار ألفا إلى تحول جذري في أساليب التوظيف والقبول في الولايات المتحدة. فبعد الحرب، تم تكييف نماذج اختبارات الذكاء الجماعية واستخدامها في:

  • التعليم: تطوير اختبارات القبول الموحدة للمدارس والجامعات (مثل اختبارات SAT التي ظهرت لاحقاً).
  • القطاع الصناعي: استخدام اختبارات الكفاءة والذكاء لتصنيف العمال وتعيينهم في وظائف محددة، مما ساهم في تأسيس علم النفس الصناعي والتنظيمي (Industrial and Organizational Psychology).
  • التنمية المهنية: إنشاء أدوات تقييم مهني لتوجيه الأفراد نحو المسارات المهنية التي تتناسب مع قدراتهم العقلية المفترضة.

يمثل اختبار ألفا نقطة تحول حاسمة في تحول علم النفس إلى مهنة تطبيقية. لقد أظهر كيف يمكن للاختبارات الموضوعية، على الرغم من عيوبها، أن توفر طريقة سريعة وفعالة لتقييم المهارات على نطاق واسع، مما أدى إلى اعتماد أدوات القياس النفسي كجزء أساسي من البنية التحتية الإدارية الحديثة في الحكومات والشركات. وقد أرسى الاختبار أيضاً الأساس النظري والعملي لتطوير جميع اختبارات الذكاء الجماعية اللاحقة، على الرغم من أن المنهجيات اللاحقة أصبحت أكثر تعقيداً وأكثر وعياً بضرورة تقليل التحيز الثقافي واللغوي.

7. الانتقادات والجدل

منذ ظهوره وحتى يومنا هذا، كان اختبار ألفا للجيش عرضة لانتقادات حادة تتعلق بالتحيز المنهجي والتفسير الخاطئ للنتائج.

كان الانتقاد الأبرز يتعلق بمسألة التحيز الثقافي واللغوي. على الرغم من أن الاختبار كان يهدف إلى قياس “الذكاء الفطري”، فإن اعتماده الكثيف على اللغة الإنجليزية والمفاهيم الثقافية الأمريكية يعني أنه كان في الواقع يقيس إلى حد كبير مستوى التعليم والاندماج الثقافي. فالمجند المهاجر الذي لم يتعرض للتعليم الأمريكي أو لم يتقن اللغة الإنجليزية كان من المرجح أن يحصل على درجة منخفضة، ليس بسبب ضعف قدراته العقلية، ولكن بسبب حاجز اللغة والمعرفة الثقافية. وقد أشار الناقدون، مثل عالم النفس والتر ليبمان، إلى أن الاختبار لم يكن يقيس الذكاء النقي، بل يقيس “التعرض للفرص” و”الخلفية الاجتماعية”.

ثانياً، كانت هناك انتقادات حادة حول الاستخدام المفرط والسياسي للنتائج. فبدلاً من استخدام النتائج كأداة تصنيف داخل الجيش (وهو الهدف الأصلي)، تم استخدامها خارج السياق العسكري لتبرير الأيديولوجيات الاجتماعية المثيرة للجدل، لا سيما حركة تحسين النسل. كان تفسير يركيس وآخرين بأن الاختلافات في الدرجات بين المجموعات العرقية تعكس تفاوتاً وراثياً في الذكاء هو مثال صارخ على إساءة استخدام البيانات العلمية لدعم الأجندات السياسية التقييدية، مما أدى إلى عواقب وخيمة على سياسات الهجرة والتكامل الاجتماعي في العقود التي تلت الحرب.

ثالثاً، شكك البعض في صلاحية الاختبار وموثوقيته. ففي ظل الظروف الفوضوية لمعسكرات التجنيد، لم يكن التطبيق موحداً دائماً، كما أن تدريب الفاحصين كان غير كافٍ في بعض الأحيان. وقد أدت هذه العيوب الإجرائية إلى نتائج غير دقيقة في بعض الأحيان، مما قوض من القيمة التنبؤية للاختبار. وعلى الرغم من أن يركيس حاول لاحقاً التنصل من التفسيرات الوراثية المتطرفة لنتائجه، فإن الضرر الناتج عن الربط بين درجات الاختبار والقدرة العرقية كان قد وقع بالفعل، مما ترك إرثاً معقداً من الجدل حول العلاقة بين القياس النفسي والقضايا الاجتماعية الحساسة.

المصادر والمراجع الإضافية