عندما تصبح المتصفحات ساحة المعركة التالية للذكاء الاصطناعي، من سيُستبعد؟

يكمن مستقبل الذكاء الاصطناعي في الوكلاء الذين يمكنهم التنقل في صفحات الويب بشكل مستقل. تستثمر شركات التكنولوجيا في تطوير وكلاء المتصفح لأتمتة مهام الويب وزيادة الإنتاجية. تستكشف هذه المقالة حالات الاستخدام والتحديات الحالية والفرص التي تقدمها سيناريوهات Web3 الأصلية. كتب هذا المقال ماريو تشاو وفيغو ، @IOSG ، وتم تجميعه وتجميعه ومساهمة به BlockBeats. OpenAI Sam Altman: أنا مهتم بالحصول على Google Chrome!) أكبر معركة متصفح في الأسواق المشاركة) (تمت إضافة الخلفية: تقدم Perplexity 34.5 مليار دولار للاستحواذ على متصفح Chrome ، وأتباع محرك بحث الذكاء الاصطناعي يقاتلون عمالقة) على مدار ال 12 شهرا الماضية ، تغيرت العلاقة بين متصفحات الويب والأتمتة بشكل كبير. تتدافع جميع شركات التكنولوجيا الكبرى تقريبا لبناء (browser agent) وكيل المتصفح الخاص بها. اعتبارا من نهاية عام 2024 ، أصبح هذا الاتجاه أكثر وضوحا: أطلقت OpenAI وضع العامل في يناير ، وأصدرت Anthropic "استخدام الكمبيوتر" لنموذج كلود ، وأطلقت Google DeepMind Project Mariner ، وأعلنت Opera عن متصفح الوكيل Neon ، وأطلقت Perplexity الذكاء الاصطناعي متصفح Comet. الإشارة واضحة: يكمن مستقبل الذكاء الاصطناعي في الوكلاء الذين يمكنهم التنقل في صفحات الويب بشكل مستقل. لا يقتصر هذا الاتجاه على إضافة روبوتات محادثة أكثر ذكاء إلى المتصفحات فحسب ، بل إنه تحول أساسي في الطريقة التي تتفاعل بها الآلات مع البيئة الرقمية. وكلاء المتصفح هم أنظمة الذكاء الاصطناعي التي "ترى" صفحات الويب وتتخذ إجراءات: النقر على الروابط ، وملء النماذج ، وتمرير الصفحات ، وإدخال النص: تماما مثل المستخدمين البشريين. يعد هذا النموذج بإطلاق العنان لإنتاجية هائلة وقيمة اقتصادية من خلال أتمتة المهام التي لا تزال يدوية أو معقدة للغاية بالنسبة للبرمجة النصية التقليدية. ▲ عرض GIF التوضيحي: عامل متصفح الذكاء الاصطناعي قيد التشغيل: اتبع التعليمات ، وانتقل إلى صفحة مجموعة البيانات المستهدفة ، والتقط لقطات شاشة تلقائيا واستخرج البيانات المطلوبة. من سيفوز في حرب متصفح الذكاء الاصطناعي؟ تقوم جميع شركات التكنولوجيا الكبيرة تقريبا ( وكذلك بعض الشركات الناشئة ) بتطوير وكلاء الذكاء الاصطناعي المتصفح الخاص بهم. فيما يلي بعض المشاريع الأكثر تمثيلا: OpenAI - وضع الوكيل ( وضع وكيل OpenAI المعروف سابقا باسم Operator ، تم إطلاقه في يناير 2025 ) وكيل الذكاء الاصطناعي له متصفحه الخاص. يمكن للمشغلين التعامل مع مجموعة متنوعة من المهام المتكررة عبر الإنترنت: ملء نماذج الويب ، وطلب البقالة ، وجدولة الاجتماعات: كل ذلك من خلال واجهة ويب قياسية شائعة الاستخدام من قبل البشر. ▲ الذكاء الاصطناعي الوكلاء جدولة الاجتماعات مثل المساعدين المحترفين: تحقق من التقويمات ، وابحث عن الفترات الزمنية المتاحة ، وإنشاء الأحداث ، وإرسال التأكيدات ، وإنشاء مستندات .ics لك. Anthropic - "استخدام الكمبيوتر" لكلود في نهاية عام 2024 ، قدمت Anthropic ميزة جديدة "استخدام الكمبيوتر ( )Use الكمبيوتر" لكلود 3.5 ، مما يمنحها القدرة على تشغيل أجهزة الكمبيوتر والمتصفحات مثل الإنسان. يمكن لكلود النظر إلى الشاشة وتحريك المؤشر والنقر فوق الأزرار وإدخال النص. هذه هي أول أداة وكيل كبيرة من نوعها تدخل الإصدار التجريبي العام ، مما يسمح للمطورين بالسماح لكلود بالتنقل في مواقع الويب والتطبيقات تلقائيا. يضعها Anthropic كميزة تجريبية بهدف أساسي يتمثل في أتمتة مهام سير العمل متعددة الخطوات على صفحات الويب. الحيرة - ( شركة Comet الذكاء الاصطناعي الناشئة Perplexity التي تشتهر بمحرك الأسئلة والأجوبة ) أطلقت متصفح Comet في منتصف عام 2025 كبديل يعمل بالطاقة الذكاء الاصطناعي لمتصفح Chrome. في جوهره ، يعد Comet محرك بحث الذكاء الاصطناعي محادثة مدمجا في شريط URL (omnibox) يوفر أسئلة وأجوبة فورية وملخصات بدلا من روابط البحث التقليدية. بالإضافة إلى ذلك ، يحتوي Comet على مساعد Comet المدمج ، وهو وكيل مقيم في الشريط الجانبي يقوم بأتمتة المهام الروتينية عبر المواقع. على سبيل المثال، يمكنه تلخيص الرسائل التي تفتحها، أو جدولة اجتماع، أو إدارة ترقيم صفحات المتصفح، أو استعراض معلومات الويب والزحف إليها نيابة عنك. للسماح للوكلاء بأن يكونوا على دراية بمحتوى الويب الحالي من خلال واجهة الشريط الجانبي ، يهدف Comet إلى مزج التصفح بسلاسة مع مساعدي الذكاء الاصطناعي. سيناريوهات تطبيق العالم الحقيقي لوكلاء المتصفح في المقالة السابقة ، استعرضنا كيف ( شركات التكنولوجيا الكبرى مثل )OpenAI و Anthropec و Perplexity وما إلى ذلك (browser بروكسيات المتصفح من خلال أشكال منتجات مختلفة agents) وظيفة الحقن. لفهم قيمتها بشكل أكثر حدسية ، يمكننا إلقاء نظرة فاحصة على كيفية تطبيق هذه القدرات على الحياة اليومية وسير عمل الشركة في سيناريوهات العالم الحقيقي. أتمتة الويب اليومية # التجارة الإلكترونية والتسوق الشخصي سيناريو عملي للغاية هو تفويض مهام التسوق والحجز إلى وكيل. يمكن للوكلاء ملء عربة التسوق عبر الإنترنت تلقائيا وتقديم الطلبات بناء على قوائم ثابتة ، أو يمكنهم العثور على أقل الأسعار عبر العديد من تجار التجزئة وإكمال عملية الدفع نيابة عنك. بالنسبة للسفر ، يمكنك أن تطلب من الذكاء الاصطناعي أداء مهام مثل: "احجز لي رحلة إلى طوكيو الشهر المقبل ( أجرة أقل من 800 دولار ) واحجز فندقا به خدمة الواي فاي المجانية". يتولى الوكيل العملية برمتها: البحث عن الرحلات الجوية ، ومقارنة الخيارات ، وملء معلومات الركاب ، واستكمال حجوزات الفنادق ، كل ذلك من خلال مواقع شركات الطيران والفنادق. يتجاوز هذا المستوى من الأتمتة روبوتات السفر الحالية: إنه لا يوصي فحسب ، بل ينفذ عمليات الشراء مباشرة. # تحسين كفاءة المكاتب الوكلاء قادرون على أتمتة العديد من الإجراءات التجارية المتكررة التي يقوم بها الأشخاص في متصفحاتهم. على سبيل المثال ، قم بتنظيم رسائل البريد الإلكتروني واستخراج قوائم المهام ، أو تحقق من وجود فجوات في تقويمات متعددة وجدولة الاجتماعات تلقائيا. يمكن لمساعد المذنب في Perplexity بالفعل تلخيص محتويات صندوق الوارد الخاص بك أو إضافة جدول أعمال لك من خلال واجهة الويب. يمكن للوكلاء أيضا تسجيل الدخول إلى أداة SaaS لإنشاء تقارير منتظمة أو تحديث جداول البيانات أو إرسال النماذج بمجرد تفويضها من قبلك. تخيل وكيل موارد بشرية يمكنه تسجيل الدخول تلقائيا إلى لوحات الوظائف المختلفة لنشر الوظائف. أو وكيل مبيعات يمكنه تحديث ملف تعريف العميل المتوقع لنظام CRM. كانت هذه المهام العادية ستستهلك الكثير من وقت الموظف ، ولكن يمكن ل الذكاء الاصطناعي القيام بذلك عن طريق أتمتة نماذج الويب وإجراءات الصفحة. بالإضافة إلى مهمة واحدة، يمكن للوكلاء توصيل مهام سير العمل الكاملة عبر أنظمة شبكة متعددة. يجب تنفيذ كل هذه الخطوات في واجهات ويب مختلفة ، وهي قوة وكيل المتصفح. يمكن للوكلاء تسجيل الدخول إلى لوحات المعلومات المختلفة لاستكشاف الأخطاء وإصلاحها وحتى تنسيق العمليات مثل إعداد موظفين جدد ( إنشاء ) حساب على مواقع SaaS متعددة. بشكل أساسي ، يمكن إجراء أي عملية متعددة الخطوات تتطلب حاليا النقر فوق مواقع متعددة بواسطة وكيل. تحديات وقيود اليوم على الرغم من الإمكانات ، لا تزال وكلاء المتصفح اليوم بعيدين عن الكمال. تكشف التطبيقات الحالية عن بعض التحديات التقنية والبنية التحتية طويلة الأمد: عدم تطابق الهندسة المعمارية الحديثة ...

AGENT-4.24%
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • تثبيت