خوارزميات البحث: كيف تختار المسار الأذكى نحو هدفك؟

مدرس الدكتور محمد لوتي

المحتويات:

البحث الأفضل أولاً (Best-First Search)

Primary Disciplinary Field(s): الذكاء الاصطناعي، علوم الحاسوب، الخوارزميات (Artificial Intelligence, Computer Science, Algorithms)

1. التعريف الجوهري والمبادئ الأساسية

يمثل البحث الأفضل أولاً، أو ما يُعرف اختصاراً بـ BFS، تصنيفاً عاماً لخوارزميات البحث الموجهة والمستنيرة التي تُستخدم في مجالات الذكاء الاصطناعي وعلوم الحاسوب لحل مشكلات البحث في الرسوم البيانية (Graphs) أو فضاءات الحالة (State Spaces). خلافاً لطرق البحث غير المستنيرة مثل البحث في العمق أولاً (DFS) أو البحث في الاتساع أولاً (BFS)، التي تعتمد على ترتيب صارم لاستكشاف العقد دون النظر إلى الهدف، يستخدم البحث الأفضل أولاً دالة تقييم إرشادية (Heuristic Evaluation Function) لتقدير مدى قرب العقدة من الهدف النهائي. هذا التقدير يسمح للخوارزمية باتخاذ قرارات “ذكية” حول العقدة الأكثر واعدة للاستكشاف في الخطوة التالية، مما يسرّع بشكل كبير عملية العثور على المسار أو الحل.

تكمن الفلسفة الأساسية للبحث الأفضل أولاً في مبدأ البخل (Greed) الموجه بالمعرفة المسبقة. بدلاً من استكشاف جميع الجيران بشكل عشوائي أو منهجي بحت، تقوم الخوارزمية دائماً بتوسيع العقدة التي تبدو “الأفضل” وفقاً لدالة الإرشاد المحددة. إذا كانت دالة الإرشاد مصممة بشكل جيد، فإنها توجه البحث مباشرة نحو الهدف، مما يقلل من عدد العقد التي يجب فحصها ويحسن من كفاءة زمن التشغيل بشكل ملحوظ مقارنة بالبحث غير المستنير. ومع ذلك، فإن الاعتماد الكلي على هذه الدالة يعني أن جودة الحل وكفاءة الخوارزمية تعتمدان بشكل مباشر على مدى دقة هذه الدالة الإرشادية في تقدير التكاليف المتبقية.

من الناحية التنفيذية، يتميز البحث الأفضل أولاً بالاحتفاظ بهيكلين بيانات رئيسيين أثناء عملية البحث: قائمة مفتوحة (Open List أو Frontier) وقائمة مغلقة (Closed List). القائمة المفتوحة هي قائمة انتظار ذات أولوية (Priority Queue) تحتوي على العقد التي تم اكتشافها ولكن لم يتم توسيعها بعد، ويتم ترتيب هذه العقد بناءً على قيمة دالة التقييم الإرشادية الخاصة بها. أما القائمة المغلقة، فتضم العقد التي تم توسيعها بالفعل لمنع تكرار الحلقات أو إعادة زيارة العقد غير الضرورية. يتم اختيار العقدة ذات الأولوية القصوى (الأفضل) من القائمة المفتوحة في كل تكرار، ويتم نقلها إلى القائمة المغلقة، ثم يتم إضافة جيرانها إلى القائمة المفتوحة، مع تحديث أولوياتهم.

2. التطور التاريخي والسياق

ظهر مفهوم البحث الأفضل أولاً كاستجابة مباشرة لقيود خوارزميات البحث الأولى في مجال الذكاء الاصطناعي خلال الخمسينيات والستينيات من القرن الماضي. في تلك الفترة، كانت خوارزميات البحث غير المستنير (مثل BFS وDFS) تُستخدم لحل مشكلات بسيطة، لكنها كانت تعاني من مشكلة الانفجار التوافقي (Combinatorial Explosion) عند تطبيقها على فضاءات حالة كبيرة، مما يجعلها غير عملية. أدرك الباحثون أن دمج المعرفة الخاصة بالمشكلة ضمن عملية البحث (المعروفة باسم البحث المستنير) أمر ضروري لتحقيق الكفاءة.

يُعد البحث الأفضل أولاً المظلة التي تندرج تحتها العديد من الخوارزميات المستنيرة البارزة. ففي عام 1968، قدم الباحثون بيتر هارت، نيلز نيلسون، وبرترام رافائيل خوارزمية A* (A-star)، التي تعتبر أشهر وأقوى تطبيق للبحث الأفضل أولاً. لم يكن البحث الأفضل أولاً مجرد خوارزمية واحدة، بل كان إطار عمل يسمح للخوارزمية باختيار أفضل مسار بناءً على معلومات إرشادية. هذا التطور مثل نقطة تحول، حيث انتقل البحث في الذكاء الاصطناعي من محاولة تصفح كل مسار محتمل إلى محاولة التخمين الذكي للمسار الأكثر احتمالاً للنجاح.

قبل ظهور A*، كان هناك تطوير لخوارزميات أبسط مثل البحث النهم الأفضل أولاً (Greedy Best-First Search)، الذي كان يركز فقط على تقدير تكلفة المسافة المتبقية إلى الهدف. ومع ذلك، أثبتت خوارزمية A* تفوقها من خلال دمج عنصرين في دالة التقييم: التكلفة الفعلية للمسار الذي تم اجتيازه حتى العقدة الحالية ($g(n)$)، بالإضافة إلى التقدير الإرشادي للتكلفة المتبقية للوصول إلى الهدف ($h(n)$). هذا المزيج ضمن إيجاد المسار الأمثل، بشرط أن تكون الدالة الإرشادية متسقة ومقبولة، مما رسخ البحث الأفضل أولاً كمحور أساسي لخوارزميات التخطيط وحل المشكلات في الذكاء الاصطناعي.

3. آلية العمل والخوارزمية

تتبع خوارزمية البحث الأفضل أولاً مجموعة محددة من الخطوات لضمان اختيار العقدة الأكثر واعدة في كل مرحلة. يبدأ البحث بتحديد عقدة البداية وإضافتها إلى القائمة المفتوحة، حيث يتم تعيين قيمتها الإرشادية. طالما أن القائمة المفتوحة ليست فارغة وعقدة الهدف لم يتم العثور عليها، تستمر الخوارزمية في التكرار من خلال اختيار العقدة ذات الأولوية الأعلى (أي أقل قيمة تقديرية للتكلفة) من القائمة المفتوحة.

بمجرد اختيار العقدة الحالية (التي تم اعتبارها “الأفضل”)، يتم إزالتها من القائمة المفتوحة وإضافتها إلى القائمة المغلقة. ثم تقوم الخوارزمية بفحص جميع جيران هذه العقدة. لكل جار، يتم تقييم ما إذا كان قد تم اكتشافه بالفعل أو معالجته. إذا كان الجار جديداً، يتم حساب دالة التقييم الإرشادية الخاصة به، ويتم تخزينه مع مؤشر إلى العقدة الأصلية (لإعادة بناء المسار لاحقاً)، ثم يتم إضافته إلى القائمة المفتوحة. إذا كان الجار قد تم اكتشافه بالفعل ولكنه موجود في القائمة المفتوحة، قد تتطلب الخوارزمية تحديث مساره إذا تم اكتشاف مسار جديد وأفضل (أي أقل تكلفة) للوصول إليه.

تعتمد كفاءة هذه الآلية بشكل حاسم على كيفية إدارة القائمة المفتوحة. نظراً لأن القائمة المفتوحة يجب أن تسمح بالاسترجاع السريع للعقدة ذات الأولوية القصوى، يتم تنفيذها عادةً باستخدام هيكل بيانات مكدس أولويات (Priority Heap) أو شجرة ثنائية (Binary Tree). يضمن هذا الهيكل أن عملية استخراج “الأفضل” تستغرق وقتاً لوغاريتمياً ($O(log n)$)، مما يحافظ على كفاءة الخوارزمية حتى عند التعامل مع عدد كبير من العقد. وتستمر العملية حتى يتم إزالة عقدة الهدف من القائمة المفتوحة (وهذا يعني أنه تم العثور على المسار).

4. وظيفة التقييم (دالة الإرشاد)

تُعد وظيفة التقييم الإرشادية ($f(n)$) هي القلب النابض لخوارزمية البحث الأفضل أولاً، فهي التي تمنحها صفتها “المستنيرة”. بشكل عام، يتم تعريف هذه الدالة لتقدير تكلفة المسار من عقدة البداية إلى عقدة الهدف عبر العقدة الحالية $n$. في الشكل العام للبحث الأفضل أولاً، يمكن أن تتخذ دالة التقييم أشكالاً متعددة بناءً على استراتيجية البحث المطلوبة.

في حالة البحث النهم الأفضل أولاً (Greedy Best-First Search)، تكون دالة التقييم مبسطة جداً، حيث $f(n) = h(n)$. هنا، $h(n)$ هي الدالة الإرشادية التي تقدر تكلفة المسافة المتبقية من العقدة $n$ إلى الهدف. الهدف من هذا النهج هو تقليل التكلفة المقدرة المتبقية في كل خطوة، مما يؤدي إلى بحث سريع جداً ولكنه لا يضمن العثور على المسار الأمثل أو حتى إيجاد حل على الإطلاق في بعض الحالات المعقدة (أي أنه غير كامل وغير أمثل).

أما في حالة خوارزمية A*، التي تعتبر المعيار الذهبي للبحث الأفضل أولاً، فإن دالة التقييم تكون $f(n) = g(n) + h(n)$. حيث يمثل $g(n)$ التكلفة الفعلية (المعروفة) للمسار من عقدة البداية إلى العقدة الحالية $n$. ويمثل $h(n)$ التكلفة المقدرة (الإرشادية) من $n$ إلى الهدف. هذا الجمع بين التكلفة الفعلية والمقدرة يضمن أن الخوارزمية لا تكتفي بالنظر إلى مدى قربها من الهدف فحسب، بل تأخذ في الاعتبار أيضاً مدى تكلفة الوصول إلى النقطة الحالية، مما يؤدي إلى إيجاد المسار الأقصر والأمثل، بشرط أن تكون دالة $h(n)$ مقبولة (Admissible).

5. الأنواع الرئيسية والمتغيرات

البحث الأفضل أولاً ليس خوارزمية واحدة، بل هو عائلة من الخوارزميات، تختلف بشكل أساسي في دالة التقييم المستخدمة لترتيب العقد في القائمة المفتوحة. الأنواع الأكثر شيوعاً هي:

البحث النهم الأفضل أولاً (Greedy Best-First Search): هذا المتغير هو الأكثر بساطة، حيث يعطي الأولوية القصوى للعقدة التي لديها أقل تقدير إرشادي للتكلفة المتبقية للوصول إلى الهدف ($h(n)$). يتميز بالسرعة الفائقة في العثور على حل، لأنه يتبع المسار الذي يبدو أفضل في اللحظة الحالية دون النظر إلى التكلفة الإجمالية التي تم تحملها حتى الآن. ومع ذلك، يمكن أن يؤدي هذا النهج إلى الوقوع في مسارات فرعية غير مثالية أو حتى مسارات مسدودة، مما يفقده خاصيتي الكمال والأمثلية.
خوارزمية A* (A-star Search): كما ذكرنا سابقاً، تعتبر A* هي التطبيق الأمثل والأكثر استخداماً للبحث الأفضل أولاً. تستخدم دالة التقييم $f(n) = g(n) + h(n)$. إذا كانت دالة الإرشاد $h(n)$ مقبولة (أي لا تبالغ أبداً في تقدير التكلفة الفعلية المتبقية)، فإن خوارزمية A* تضمن إيجاد المسار الأمثل (الأقل تكلفة). كما أنها تضمن الكمال (إيجاد الحل إذا كان موجوداً) في الرسوم البيانية المحدودة.
البحث الأفضل أولاً المكرر (Iterative Deepening A* – IDA*): تم تطوير هذا المتغير لمعالجة مشكلة الاستهلاك الهائل للذاكرة الذي تعاني منه خوارزمية A* القياسية. تتجنب IDA* تخزين القائمة المفتوحة والمغلقة بالكامل، وبدلاً من ذلك، تقوم بتكرار عمليات البحث في العمق أولاً (DFS)، مع تحديد حد للتكلفة الإجمالية $f(n)$ التي يمكن الوصول إليها. تبدأ بحد منخفض وتزيده تدريجياً. هذا النهج يضحي ببعض السرعة مقابل كفاءة الذاكرة.

6. خصائص الأداء والتحليل

يتم تحليل أداء خوارزميات البحث الأفضل أولاً بناءً على ثلاثة مقاييس رئيسية: الكمال (Completeness)، الأمثلية (Optimality)، والتعقيد الزمني والمكاني (Time and Space Complexity).

بالنسبة للكمال، فإن البحث الأفضل أولاً بشكل عام (بما في ذلك A*) يعتبر كاملاً إذا كان فضاء الحالة محدوداً. في حالة A*، يضمن الكمال حتى في الرسوم البيانية ذات التكاليف غير السلبية. ومع ذلك، فإن البحث النهم الأفضل أولاً ليس كاملاً؛ لأنه قد يقع في حلقات لا نهائية أو يختار مساراً رخيصاً محلياً ولكنه لا يؤدي إلى الهدف. أما الأمثلية، فهي مضمونة فقط في خوارزمية A*، شريطة أن تكون دالة الإرشاد مقبولة. هذا يعني أن A* ستجد أقصر مسار ممكن للتكلفة. أما Greedy BFS، فغالباً ما يجد حلاً، لكنه نادراً ما يكون الحل الأمثل.

فيما يتعلق بالتعقيد الزمني والمكاني، فإن البحث الأفضل أولاً، وخاصة A*، يواجه تحديات كبيرة. في أسوأ الأحوال، يكون التعقيد الزمني والمكاني لـ A* أسّياً (Exponential) بالنسبة لعمق الحل، ويُرمز إليه بـ $O(b^d)$، حيث $b$ هو عامل التفرع و $d$ هو عمق الحل. هذا يرجع إلى أن A*، لضمان الأمثلية، قد تحتاج إلى الاحتفاظ بقائمة مفتوحة ضخمة جداً في الذاكرة لتخزين جميع العقد التي تم اكتشافها. هذا الاستهلاك الذاكري هو أكبر قيود تواجه A* في حل مشكلات فضاء الحالة الكبيرة جداً.

7. التطبيقات العملية

نظراً لكفاءة البحث الأفضل أولاً في توجيه البحث نحو الهدف، فقد أصبح أداة لا غنى عنها في العديد من تطبيقات الذكاء الاصطناعي وعلوم الحاسوب:

إيجاد المسار (Pathfinding): هذا هو التطبيق الأكثر شهرة. تُستخدم خوارزمية A* على نطاق واسع في ألعاب الفيديو (خاصة ألعاب الاستراتيجية والمحاكاة) والروبوتات لتحديد أقصر وأفضل مسار بين نقطتين مع تجنب العقبات. تعتبر A* هي الخوارزمية القياسية لتوجيه الوحدات في البيئات المعقدة.
التخطيط والجدولة (Planning and Scheduling): في الذكاء الاصطناعي، تُستخدم متغيرات البحث الأفضل أولاً لحل مشكلات التخطيط، حيث يجب على النظام تحديد تسلسل الإجراءات المطلوبة للانتقال من حالة البداية إلى حالة الهدف (مثل تخطيط مهام الروبوت).
حل الألغاز (Puzzle Solving): تُعد الألغاز الكلاسيكية مثل “لغز الثماني” (8-Puzzle) أو “لغز الخمسة عشر” حقول اختبار مثالية لخوارزميات البحث الأفضل أولاً، حيث يمكن تصميم دوال إرشادية دقيقة جداً لتقليل فضاء البحث.
التحليل الشبكي والبيولوجيا الحاسوبية: تُستخدم تقنيات البحث الأفضل أولاً في تحليل الشبكات المعقدة، مثل شبكات النقل أو الشبكات الاجتماعية، ولديها تطبيقات أيضاً في مجال البيولوجيا الحاسوبية لتحليل تسلسل الحمض النووي (DNA) أو هياكل البروتين.

8. الانتقادات والتحديات

على الرغم من قوة وفعالية البحث الأفضل أولاً، خاصة في شكل A*، إلا أنه يواجه عدداً من التحديات والانتقادات التي تحد من استخدامه في بعض البيئات:

أولاً، المشكلة الأكثر حدة هي التعقيد المكاني (Space Complexity). تتطلب خوارزمية A* تخزين جميع العقد التي تم توسيعها في الذاكرة (القائمة المغلقة) وجميع العقد المرشحة في القائمة المفتوحة لضمان الأمثلية. في فضاءات الحالة الكبيرة جداً، يمكن أن تستهلك الذاكرة المتاحة بسرعة كبيرة، مما يجعل الخوارزمية غير قابلة للتطبيق. وقد أدت هذه المشكلة إلى تطوير متغيرات تهدف إلى تقليل استهلاك الذاكرة مثل IDA* و RBFS (Recursive Best-First Search).

ثانياً، يعتمد البحث الأفضل أولاً بشكل جذري على جودة الدالة الإرشادية. إذا كانت الدالة الإرشادية ضعيفة (غير مقبولة أو غير متسقة)، فقد يؤدي البحث إلى استكشاف عدد كبير جداً من العقد غير الضرورية، مما يقلل من كفاءته، أو قد يفشل A* في إيجاد المسار الأمثل. في المقابل، إذا كانت الدالة الإرشادية قوية جداً (قريبة من التكلفة الفعلية)، فإنها توجه البحث بكفاءة عالية، ولكن تصميم دالة إرشادية قوية ومقبولة قد يكون تحدياً كبيراً في المشكلات المعقدة.

ثالثاً، في الشكل النهم (Greedy BFS)، هناك خطر عدم الأمثلية. هذا النوع من البحث يركز على الكسب القصير الأجل، متجاهلاً التكاليف التراكمية، مما قد يؤدي إلى العثور على حلول سريعة ولكنها بعيدة عن أن تكون الأفضل. علاوة على ذلك، في الرسوم البيانية التي تحتوي على الكثير من التكاليف المتقاربة، قد يستغرق البحث وقتاً طويلاً في معالجة العقد المتقاربة في القائمة المفتوحة، مما يقلل من ميزة السرعة المتوقعة.