كيف يعيد الذكاء الاصطناعي للبحث الآلي تعريف تجارب الذكاء الاصطناعي في البرمجة ويثير نقاشًا حول الأنظمة ذاتية التحسن...

في الأسابيع الأخيرة، حولت تجربة فيروسية من أندريه كارباتي البحث التلقائي في الذكاء الاصطناعي من فكرة نادرة إلى نقطة حديث مركزية في مجتمع أبحاث الذكاء الاصطناعي.

أصول مفهوم البحث التلقائي لكارباتي

في أوائل هذا الشهر، شارك أندريه كارباتي، الباحث البارز في الذكاء الاصطناعي وأحد الموظفين المؤسسين لـ OpenAI، تجربة مثيرة على منصة X. ثم تولى قيادة الذكاء الاصطناعي في تسلا ويعمل الآن بشكل مستقل مع إدارة Eureka Labs، وهو مشروع يبني نوعًا جديدًا من المدارس لعصر الذكاء الاصطناعي.

يملك كارباتي، الذي يتابعونه 1.9 مليون شخص على X، تأثيرًا كبيرًا بحيث تنتشر أي تعليقاته حول الذكاء الاصطناعي بسرعة. ومع ذلك، برز منشوره الأخير لأنه عرض نظامًا عمليًا بناه للبحث الآلي، أطلق عليه اسم “البحث التلقائي”. سرعان ما استحوذ هذا المفهوم على خيال الممارسين والنظريين على حد سواء.

في التجربة، استخدم كارباتي وكيل برمجي للذكاء الاصطناعي لإجراء سلسلة من الاختبارات بهدف تحسين تدريب نموذج لغة صغير. على مدى يومين متواصلين، نفذ الوكيل 700 تجربة، مستكشفًا بشكل منهجي تكوينات التدريب لإيجاد إعدادات أفضل.

خلال تلك التجارب، اكتشف الوكيل 20 تحسينًا زادت من كفاءة التدريب. علاوة على ذلك، عندما طبق كارباتي نفس التعديلات العشرين على نموذج لغة أكبر، رغم أنه لا يزال صغيرًا نسبيًا، سجل زيادة بنسبة 11% في سرعة التدريب. وأكدت هذه المكاسب الملموسة على الإمكانات العملية لنهجه.

من عرض تجريبي في المختبر إلى نموذج بحثي محتمل جديد

وصف كارباتي الإطار بأنه محرك بحث عام لتحسين الشفرات والنماذج. وأكد بشكل حاسم أن وكيل البحث التلقائي لم يكن يضبط نفسه، بل كان يعدل كود التدريب والمعلمات الأولية للشبكة العصبية لنموذج ذكاء اصطناعي أصغر. وتلك الفروق مهمة لمناقشات السلامة، حتى لو كانت لها تداعيات عميقة على سير العمل البحثي.

جادل بأن مثل هذه الأدوات يمكن أن تعيد تشكيل كيفية إجراء المختبرات الرائدة لأبحاث الذكاء الاصطناعي. “جميع المختبرات الرائدة في نماذج اللغة الكبيرة ستفعل ذلك. إنها المعركة النهائية”، كتب كارباتي على X. ومع ذلك، أقر بأن توسيع الفكرة من مشروع بايثون يتكون من 630 سطرًا إلى قاعدة كود لنموذج رائد أكبر، والذي يكون أكبر بمقادير هائلة، يضيف تعقيدًا كبيرًا.

لا يزال كارباتي يرى أن التحدي هو مشكلة هندسية أكثر منه حاجزًا مفاهيميًا. في رأيه، ستقوم المختبرات بتشغيل مجموعة من الوكلاء، وتسمح لهم بالتعاون لضبط نماذج أصغر، ثم ترويج الأفكار الأكثر وعدًا تدريجيًا إلى نطاقات أكبر. وأشار إلى أن البشر، يمكنهم “اختياريًا” المساهمة على الحواف، من خلال التوجيه والتقييم بدلاً من برمجة كل تعديل يدويًا.

حاليًا، يركز تنفيذه على وكيل واحد يحسن بشكل تكراري قاعدة الكود على مسار واحد. لكن، في المستقبل، يتوقع أن يستكشف عدة وكلاء ذكاء اصطناعي فرضيات وتجارب مختلفة بشكل متزامن. وكتب أن الخطوة التالية للبحث التلقائي هي أن يصبح بيئة غير متزامنة، وتعاونية بشكل هائل، موجهة لمحاكاة مجتمع بحثي بدلاً من طالب دكتوراه واحد.

رد فعل الصناعة واختبار Shopify

انتقلت التجربة بسرعة من النظرية إلى التطبيق عندما قرر توبياس لوتكه، المؤسس المشارك والمدير التنفيذي لشركة Shopify، تجربة الإعداد على بيانات الشركة. وأبلغ على X أنه استخدم النظام لتحسين نموذج ذكاء اصطناعي داخلي، موضحًا أن الوكيل قام بتحسين كل من الجودة والسرعة. جعل ذلك المفهوم ملموسًا للتطبيقات المؤسساتية.

وفقًا لوتكه، بعد أن ترك العملية تعمل طوال الليل، أجرى الوكيل 37 تجربة وحقق زيادة في الأداء بنسبة 19%. ومع ذلك، لم ينشر التفاصيل التقنية الكاملة، لكن النتيجة كانت مثيرة بما يكفي لتعزيز المزيد من الحماس والتكهنات حول التأثير التجاري.

لاحقًا، علّق كارباتي بأن أي مقياس يمكن تقييمه بشكل فعال يمكن استهدافه بواسطة مجموعة من الوكلاء. وأشار أيضًا إلى أنه إذا كان للمقياس بديل أرخص، مثل تدريب شبكة أصغر بدلاً من كبيرة، يمكن دمجه أيضًا. وحثّ التقنيين على التفكير فيما إذا كانت مشكلات تحسينهم تقع ضمن هذه الفئة.

روابط الحلم والخوف من الذكاء الاصطناعي ذاتي التحسين

ما جذب انتباه الجمهور حقًا هو مدى قرب هذا من فكرة الذكاء الاصطناعي القادر على تحسين نفسه بشكل مستمر، والتي طالما نوقشت في الخيال العلمي. غالبًا ما تصور الخيال العلمي أنظمة تعيد كتابة كودها الخاص، بينما يطمح بعض الباحثين المعاصرين إلى مثل هذه القدرات، ويخشاها آخرون. إن مفهوم التحسين الذاتي التكراري له صدى خاص في دوائر سلامة الذكاء الاصطناعي.

في تلك المناقشات، القلق الرئيسي هو أن الذكاء الاصطناعي قد يواصل تحسين بنيته وبيانات تدريبه في حلقة مفرغة. على مدى العديد من الدورات، قد يؤدي ذلك إلى ما يسميه بعض الباحثين في السلامة “انطلاقًا صعبًا” أو “انفجار الذكاء”. في مثل هذا السيناريو، قد يتجاوز الذكاء الاصطناعي بسرعة القدرات الإدراكية للبشر، مما يصعب أو يستحيل الحفاظ على السيطرة ذات المعنى.

ومع ذلك، فإن إعداد كارباتي لا يقترب من تلك الصورة المثالية أو المقلقة. فالوكيل الذي استخدمه لا يعدل مسار تدريبه الخاص أو يغير مكوناته الداخلية. بدلاً من ذلك، يعيد كتابة كود التدريب وإعدادات الشبكة العصبية لنموذج أبسط مختلف. هذا الفصل يحافظ على النظام الحالي ضمن نمط تحسين أكثر تقليدية، على الرغم من أن الاتجاه واضح.

ومع ذلك، فسّر العديد من المراقبين العمل على أنه معاينة لكيفية تنظيم المختبرات لنظم أكثر استقلالية في المستقبل. علاوة على ذلك، من خلال جعل التجربة التي يقودها الوكيل تبدو سهلة وفعالة، يمكن أن يسرّع المشروع اعتماد هياكل مماثلة، بما في ذلك حلقات تحسين أنظمة الوكيل الأكثر تقدمًا.

حلقة كارباتي وأنماط الوكيل العامة

سلط بعض المحللين الضوء على أن النمط الأساسي وراء المشروع يمكن تجريده وإعادة استخدامه. كتب جاناكيرام MSV، المحلل الرئيسي في Janakiram & Associates، في منصة The New Stack أن كارباتي قد حدد بشكل فعال حلقة قابلة لإعادة الاستخدام. أطلق عليها اسم “حلقة كارباتي”، مقترحًا قالبًا لأنظمة الوكيل الأوسع.

وفقًا لجاناكيرام، تحتوي الحلقة على ثلاثة عناصر أساسية. أولاً، يجب أن يكون لدى الوكيل وصول إلى ملف واحد يمكنه تعديله بحرية. ثانيًا، يحتاج إلى مقياس واحد يمكن اختباره موضوعيًا ليتم تحسينه. ثالثًا، يجب أن يكون هناك حد زمني ثابت لكل تجربة، يقيد مدة تشغيل الوكيل قبل تقديم النتائج.

كما أكد أن التعليمات التي وضعها كارباتي في ملف التكوين الخاص به توفر نموذجًا قويًا لكيفية التواصل مع أي وكيل ذكاء اصطناعي. حددت النصوص الواضحة ما يجب أن يفعله الوكيل، والقيود التي تنطبق، وما لا يجب أن يلمسه، ومعايير التوقف. بالإضافة إلى ذلك، حددت بدقة مدة كل حلقة ومتى يجب أن يتوقف الوكيل ويختصر النتائج.

جادل المعلقون بأن هذا الأسلوب من هندسة التعليمات الدقيقة أصبح مهارة حاسمة. فبينما تزداد قوة النماذج الأساسية، لا يزال التحكم الفعال يعتمد على البشر الذين يكتبون توجيهات واضحة ومنظمة تتماشى مع أهداف وحدود واضحة لوكالة الذكاء الاصطناعي.

البحث التلقائي مقابل طرق AutoML القائمة

لم يتفق الجميع على أن عمل كارباتي يمثل اختراقًا. قال بعض النقاد إنه أعاد اكتشاف مكونات AutoML، وهي مجموعة من التقنيات التي تستخدمها Google وMicrosoft وغيرها من مختبرات الذكاء الاصطناعي منذ سنوات. كما أن أطر AutoML تجري تجارب تكرارية للبحث عن بيانات وهياكل ومعلمات أفضل.

تعتمد أنظمة AutoML التقليدية بشكل كبير على حلقات تحسين آلية واستراتيجيات بحث. تستكشف هياكل النماذج، وتضبط المعلمات، وأحيانًا تختار بيانات التدريب باستخدام تغييرات عشوائية أو خوارزميات تطورية. ومع ذلك، فهي عادة لا تتضمن وكيل ذكاء اصطناعي يمكنه قراءة الأوراق البحثية، وتصميم فرضيات جديدة، وكتابة تغييرات كود عشوائية استجابة لذلك.

ردّ كارباتي على المقارنات التي تقلل من الفرق. أشار إلى طرق مثل البحث عن بنية الشبكة العصبية، التي ظهرت كوسيلة لأتمتة تصميم النموذج. في رأيه، كانت الأشكال السابقة من هذه التقنية ضعيفة مقارنة بوكيل يمكنه التفكير في الكود، والتعلم من التجارب السابقة، واسترجاع المعلومات من الإنترنت.

وصف البحث عن بنية الشبكة العصبية التاريخي بأنه “نسخة ضعيفة جدًا من هذا، لدرجة أنها في فئة خاصة بها من عديم الفائدة تمامًا”. وأكد أيضًا أن نظامه يستخدم نموذج لغة كبير لكتابة كود عشوائي، وتفسير نتائج التجارب السابقة، وتكييف الاستراتيجيات على الفور، مما يجعله أكثر مرونة بكثير من خطوط أنابيب AutoML التقليدية للبحث عن بنية الشبكة العصبية.

نظرة مستقبلية على تجمعات الوكلاء والتأثير الأوسع

مع تزايد الاهتمام، يستكشف بعض الباحثين كيف يمكن توسيع أفكار تجربة البحث التلقائي لكارباتي إلى تجمعات كاملة من الوكلاء. الرؤية هي شبكة من الوكلاء المتخصصين يقسمون المهام، ويتحققون من النتائج، ويقترحون أساليب جديدة، بينما يحدد البشر الأهداف العليا والضوابط. يمكن أن يغير ذلك سير العمل في الأبحاث الأكاديمية والصناعية للذكاء الاصطناعي.

ومع ذلك، فإن توسيع تجمعات الوكلاء يثير أسئلة مفتوحة حول السلامة، والموثوقية، والحوكمة. يحذر المراقبون القلقون من مخاطر التحسين الذاتي التكراري من أنه مع زيادة استقلالية وتأثير هذه الأنظمة على البنية التحتية الحيوية، سيكون من الضروري وجود رقابة دقيقة. سيكون من الضروري الحفاظ على مقاييس تقييم قوية ومراجعة بشرية في كل خطوة ترقية.

حتى الآن، يظل مشروع كارباتي توضيحًا محدودًا لكيفية إجراء نماذج اللغة لتجارب البحث التلقائي على قواعد كود متواضعة. ومع ذلك، فإن رد الفعل من شخصيات مثل لوتكه والمحللين عبر الصناعة يوحي بأن النمط الأساسي قد ينتشر بسرعة، مما يطمس الخط الفاصل بين الباحثين البشريين والجماعات الوكيلة الذاتية.

باختصار، يُظهر عمل كارباتي في البحث التلقائي أن وكيلًا واحدًا مُعدًا جيدًا يمكنه اكتشاف مكاسب أداء قابلة للقياس في أيام، وليس شهور. وعلاوة على ذلك، مع دفع المختبرات لهذه التقنيات نحو نماذج أكبر وتجمعات متعددة من الوكلاء، قد يفتحون قدرات جديدة قوية، مع تصعيد النقاشات القديمة حول الاستقلالية، والسيطرة، والمستقبل المحتمل لأبحاث الذكاء الاصطناعي.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
إضافة تعليق
إضافة تعليق
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.48Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.48Kعدد الحائزين:0
    0.00%
  • القيمة السوقية:$2.48Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.48Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.48Kعدد الحائزين:1
    0.00%
  • تثبيت