جداول التعزيز المتزامنة – concurrent schedules of reinforcement

جداول التعزيز المتزامنة

المجالات التأديبية الأساسية: تحليل السلوك التجريبي، علم النفس المعرفي والسلوكي

1. التعريف الجوهري

تُمثل جداول التعزيز المتزامنة (Concurrent Schedules of Reinforcement) نموذجاً تجريبياً محورياً ضمن إطار الإشراط الإجرائي، وهي تُعرّف بترتيب يسمح للكائن الحي (سواء كان حيواناً أو إنساناً) بالاختيار بحرية بين اثنين أو أكثر من جداول التعزيز التي تعمل بشكل مستقل وفي آن واحد. بعبارة أخرى، يُقدم هذا الإعداد خياراً سلوكياً مباشراً؛ حيث يمكن للمستجيب تخصيص جهده بين بدائل متعددة، كل بديل منها مرتبط بجدول تعزيز محدد. الهدف الأساسي من دراسة الجداول المتزامنة هو فهم وتفسير السلوك الاختياري وتخصيص الاستجابة. هذه الجداول ضرورية لنمذجة الظواهر المعقدة في البيئات الطبيعية، حيث نادراً ما يواجه الفرد خياراً واحداً، بل يواجه مجموعة من الخيارات المتنافسة على الموارد والوقت.

تتميز البيئة التجريبية لجدول التعزيز المتزامن بوجود مفتاحي استجابة (أو رافعتين) على الأقل، يكون لكل منهما جدول تعزيز خاص به (مثل جدول تعزيز متغير الفترة VI أو جدول تعزيز متغير النسبة VR). يتم تسجيل كيفية “توزيع” الكائن الحي لاستجاباته بين هذين المفتاحين. إن دراسة هذا التوزيع لا تتعلق فقط بمعدل الاستجابة الإجمالي، بل تتعلق بنسبة الاستجابات الموجهة نحو البديل الأول مقارنة بالبديل الثاني. إن الاكتشافات المستخلصة من هذه النماذج التجريبية كانت حاسمة في تطوير فهمنا للعمليات المعرفية والسلوكية التي تحكم عملية اتخاذ القرار واختيار الموارد.

2. التطور التاريخي والمفاهيمي

تأصلت دراسة جداول التعزيز المتزامنة في أعمال بي. إف. سكينر (B.F. Skinner) حول الإشراط الإجرائي في منتصف القرن العشرين. ومع ذلك، ركزت الأبحاث الأولية لسكينر في المقام الأول على الاستجابات التي يتم إجراؤها في ظل جداول تعزيز مفردة. كان الانتقال إلى دراسة “الاختيار” كمتغير سلوكي مستهدف هو نقطة التحول، حيث أدرك الباحثون أن السلوك في العالم الحقيقي هو سلسلة مستمرة من الاختيارات بين البدائل المتاحة.

كانت المساهمة الأكثر أهمية في هذا المجال هي صياغة قانون المطابقة (The Matching Law) من قبل ريتشارد جيه. هيرنشتاين (R.J. Herrnstein) في عام 1961. قبل هيرنشتاين، كان فهم كيفية توزيع الاستجابات في ظل الجداول المتزامنة مجرد ملاحظات وصفية. قدم قانون المطابقة إطاراً رياضياً دقيقاً ربط النسبة النسبية للاستجابات المخصصة لجدول معين بالنسبة النسبية للتعزيز المستخلص من ذلك الجدول. هذا التحول من الوصف إلى التنبؤ الكمي رفع من مكانة جداول التعزيز المتزامنة كأداة قوية في علم النفس التجريبي.

في البداية، كانت الدراسات تستخدم جداول تعزيز بسيطة ومتزامنة، غالباً ما تكون جداول فترة متغيرة (VI) على كلا البديلين (VI-VI)، لأن هذه الجداول تميل إلى إنتاج معدلات استجابة مستقرة وغير متكتلة، مما يسهل قياس توزيع السلوك. تطور المجال لاحقاً ليشمل جداول متزامنة معقدة، مثل تلك التي تجمع بين جداول النسبة والفترة، أو تلك التي تدمج تكاليف الاستجابة أو فترات تأخير التعزيز، بهدف اختبار حدود قانون المطابقة وتعميمه على ظروف بيئية أكثر واقعية.

3. المكونات الأساسية للإعداد التجريبي

يتطلب الإعداد التجريبي لجدول التعزيز المتزامن ترتيباً دقيقاً لضمان قياس الاختيار النقي بدلاً من مجرد التبديل العشوائي. يجب أن تتوفر ثلاثة شروط أساسية: أولاً، توفر بديلين للاستجابة أو أكثر (مثل رافعتين أو مفتاحي ضوء). ثانياً، يجب أن يعمل كل بديل وفقاً لجدول تعزيز خاص به ومستقل عن الآخر. ثالثاً، يجب أن يكون الكائن الحي قادراً على التبديل بين البدائل دون تكلفة كبيرة أو عقوبة زمنية (أو مع تكلفة محسوبة بدقة).

لضمان أن يكون الاختيار مدروساً وليس مجرد تفاعل عشوائي، غالباً ما يتم استخدام جداول الفترة المتغيرة (VI) المتزامنة. يوفر جدول VI التعزيز بعد فترة زمنية عشوائية، مما يجعل معدل الاستجابة العالي غير ضروري للحصول على التعزيز. إذا كان الجدولان هما VI 30 ثانية و VI 60 ثانية، فإن البديل الأول يوفر ضعف معدل التعزيز للبديل الثاني. في ظل هذه الظروف، يُتوقع من الكائن الحي أن يخصص تقريباً ثلثي استجاباته للبديل الأول وثلثها للبديل الثاني، بما يتوافق مع قانون المطابقة.

غالباً ما يتم دمج مفهوم “عقوبة التبديل” (Changeover Delay – COD) في الإعداد التجريبي. عقوبة التبديل هي فترة زمنية قصيرة (عادة 1.5 إلى 3 ثوانٍ) تلي تبديل الكائن الحي من بديل إلى آخر، وخلال هذه الفترة لا يتم تقديم أي تعزيز، حتى لو كان مستحقاً. هذا الإجراء يهدف إلى منع الاستجابات المتتالية السريعة على كلا البديلين، والتي قد تشوه قياس معدل الاختيار الحقيقي، مما يضمن أن السلوك الملاحظ يمثل تخصيصاً حقيقياً للجهد.

4. قانون المطابقة (The Matching Law)

يُعد قانون المطابقة، الذي اقترحه هيرنشتاين، حجر الزاوية في فهم السلوك في ظل الجداول المتزامنة. ينص القانون في شكله الأساسي على أن النسبة النسبية للاستجابة على بديل معين (B₁) تتطابق مع النسبة النسبية للتعزيز المستلم من ذلك البديل (R₁).

الصيغة الرياضية الأساسية لقانون المطابقة هي:

  • B₁ / (B₁ + B₂) ≈ R₁ / (R₁ + R₂)

حيث تمثل B₁ و B₂ معدلات الاستجابة على البديلين 1 و 2، وتمثل R₁ و R₂ معدلات التعزيز المستلمة من البديلين 1 و 2. هذا القانون يقدم تنبؤاً قوياً: إذا كان البديل A يوفر 75% من إجمالي التعزيز المتاح في البيئة، فمن المتوقع أن يخصص الكائن الحي 75% من إجمالي استجاباته للبديل A. يُظهر هذا المبدأ أن الكائن الحي لا يعمل ببساطة على تعظيم معدل التعزيز المطلق، بل يعمل على توزيع سلوكه بطريقة تتناسب مع التوفر النسبي للمكافآت.

لقد وُجد أن قانون المطابقة ينطبق بدقة مذهلة على أنواع مختلفة، بما في ذلك الحمام والفئران والبشر، وفي سياقات سلوكية متنوعة تتجاوز النماذج البسيطة (مثل اختيار الأنشطة الاجتماعية، أو تخصيص وقت الدراسة بين المواد). وقد أدى هذا التعميم إلى اعتبار قانون المطابقة من أكثر المبادئ التجريبية موثوقية في علم النفس السلوكي، مما يوفر إطاراً موحداً لتحليل السلوك الاختياري.

5. الانحرافات والتعميمات في قانون المطابقة

على الرغم من دقة قانون المطابقة، لاحظ الباحثون وجود انحرافات منهجية عن التنبؤ المثالي، مما أدى إلى تطوير صيغة معممة للقانون. تشمل هذه الانحرافات بشكل رئيسي ظاهرتين: التحيز (Bias) والنقص في المطابقة (Undermatching) أو الإفراط في المطابقة (Overmatching).

يحدث التحيز عندما يخصص الكائن الحي نسبة أكبر من استجاباته لبديل معين مما يتطلبه معدل التعزيز النسبي، حتى عندما يكون التعزيز متساوياً. يمكن أن ينتج التحيز عن تفضيل فطري لآلية الاستجابة (مثل تفضيل مفتاح على آخر)، أو عن عوامل بيئية غير محسوبة (مثل سهولة الوصول إلى مفتاح معين). يشير التحيز إلى أن عوامل أخرى غير معدلات التعزيز المطلقة تؤثر على الاختيار.

أما النقص في المطابقة فهو الانحراف الأكثر شيوعاً، ويحدث عندما تكون نسبة الاستجابات أقل حدة من نسبة التعزيز. على سبيل المثال، إذا كان البديل A يوفر 80% من التعزيز، قد يخصص الكائن الحي 70% فقط من استجاباته له. ويُعتقد أن النقص في المطابقة ينتج غالباً عن تكلفة التبديل المنخفضة جداً أو عدم وجود عقوبة تبديل كافية، مما يسمح للكائن الحي بالانتقال بسهولة بين البدائل دون خسارة كبيرة، وبالتالي تقليل الحاجة إلى التركيز الشديد على البديل الأفضل.

لمعالجة هذه الانحرافات، تم تعميم قانون المطابقة ليشمل بارامترات التمييز والتحيز:

B₁ / B₂ = b * (R₁ / R₂) ^ s

حيث يمثل ‘b’ بارامتر التحيز، ويمثل ‘s’ بارامتر الحساسية أو التمييز (Sensitivity). عندما تكون s=1، تكون المطابقة مثالية. عندما تكون s<1، يحدث نقص في المطابقة (أي أن الكائن الحي غير حساس تماماً للاختلافات في معدل التعزيز). هذا الشكل المعمم يوفر قدرة تنبؤية فائقة ويسمح للباحثين بتحديد العوامل السلوكية والبيئية التي تعدل العلاقة الأساسية بين الاستجابة والتعزيز.

6. التطبيقات العملية وأهمية المفهوم

لا تقتصر أهمية جداول التعزيز المتزامنة وقانون المطابقة على المختبر، بل تمتد لتفسير مجموعة واسعة من السلوكيات البشرية والحيوانية في الحياة اليومية. إن الحياة اليومية هي في الأساس جدول تعزيز متزامن ضخم، حيث نختار باستمرار بين العمل أو الترفيه، أو بين المهام العاجلة والأقل إلحاحاً، أو بين مصادر الطعام المختلفة.

في مجال الاقتصاد السلوكي، يُستخدم نموذج الجداول المتزامنة لفهم عمليات اتخاذ القرار في الاستهلاك وتخصيص الموارد. لقد أظهرت الأبحاث أن البشر، عند اتخاذ قرارات مالية أو زمنية، يميلون إلى “مطابقة” سلوكهم مع العائد المتوقع، على الرغم من أن هذا السلوك قد لا يكون دائماً مثالياً بالمعنى الاقتصادي التقليدي (أي تعظيم المنفعة).

علاوة على ذلك، تُستخدم هذه الجداول في فهم الاضطرابات السلوكية والإدمان. يمكن النظر إلى تعاطي المخدرات أو المقامرة على أنه اختيار بين بديلين: التعزيز الفوري والقوي الناجم عن السلوك الإدماني (حتى لو كان معدل تعزيزه متغيراً ومحدوداً) مقابل التعزيز المؤجل والأضعف نسبياً الناجم عن الأنشطة الصحية (مثل العمل أو العلاقات الاجتماعية). إن فهم كيفية تحيز الأفراد نحو البدائل ذات العائد الفوري يساعد في تصميم التدخلات العلاجية الفعالة التي تهدف إلى زيادة معدل التعزيز النسبي للبدائل الصحية.

7. الانتقادات والقيود المنهجية

على الرغم من النجاح التجريبي لقانون المطابقة، واجه المفهوم بعض الانتقادات والقيود. أحد الانتقادات الرئيسية يتعلق بالتركيز الشديد على جداول الفترة المتغيرة (VI). يجادل النقاد بأن استخدام جداول VI-VI يميل إلى إخفاء تعقيدات السلوك التي قد تظهر تحت جداول النسبة المتغيرة (VR). عندما يتم وضع جداول VR متزامنة، غالباً ما يختار الكائن الحي الانخراط بالكامل في الجدول الذي يقدم أعلى نسبة تعزيز (أي يقوم بعملية “التحسين” أو “التعظيم” بدلاً من المطابقة)، مما يشير إلى أن المطابقة هي ظاهرة خاصة بظروف جداول الفترة.

قيد آخر يتعلق بـ قياس الاستجابة. يفترض قانون المطابقة أن الاستجابات يتم تخصيصها بناءً على التعزيز المستلم. ومع ذلك، يجادل بعض الباحثين بأن الكائن الحي قد يستجيب بناءً على “القيمة” المدركة للبديل، والتي قد تتأثر بمتغيرات أخرى غير معدل التعزيز، مثل حجم التعزيز، أو جودته، أو التأخير في الحصول عليه. إن القانون المعمم يحاول دمج بعض هذه العوامل، لكنه لا يزال يعتمد بشكل كبير على بيانات معدل الاستجابة كمؤشر أساسي للاختيار.

أخيراً، هناك جدل مستمر حول ما إذا كان قانون المطابقة يمثل مبدأ أساسياً للسلوك أم أنه مجرد نتيجة ثانوية لعمليات سلوكية أكثر جوهرية، مثل التبديل بين البدائل لتعظيم التعزيز في فترات زمنية قصيرة (نظرية التبادل المحلي). بغض النظر عن هذا الجدل، يظل نموذج جداول التعزيز المتزامنة وقانون المطابقة الإطار الأكثر تأثيراً ونجاحاً في التنبؤ بالسلوك الاختياري وتحليله في علم النفس السلوكي.

Further Reading