عصر متصفح الذكاء الاصطناعي: الفرص والتحديات في الحرب الثالثة للمتصفحات
تدور حرب المتصفحات الثالثة بهدوء. منذ تسعينيات القرن الماضي مع Netscape و IE من مايكروسوفت، إلى Firefox المستند إلى الفكر المفتوح و Chrome من Google، كانت المنافسة بين المتصفحات تجسيدًا مركزياً لسلطة التحكم في المنصات وتغير الأنماط التكنولوجية. تمكن Chrome بفضل سرعة التحديث والتفاعل البيئي من احتلال موقع الهيمنة، بينما شكلت Google من خلال هيكل "الأوليغارشي" بين البحث والمتصفح حلقة مغلقة لنقطة دخول المعلومات.
لكن اليوم، هذا النمط بدأ يتزعزع. ظهور نماذج اللغة الكبيرة (LLM) جعل المزيد والمزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بدون نقر"، مما أدى إلى انخفاض سلوك النقر التقليدي على الويب. في الوقت نفسه، الشائعات حول احتمال استبدال Apple لمحرك البحث الافتراضي في Safari تهدد أساس أرباح Alphabet، وقد بدأ السوق يظهر قلقه تجاه "الأصالة في البحث".
تواجه المتصفحات أيضًا إعادة تشكيل دورها. لم تعد مجرد أدوات لعرض صفحات الويب، بل أصبحت حاويات تجمع بين قدرات متعددة مثل إدخال البيانات، سلوك المستخدم، والخصوصية والهوية. على الرغم من قوة وكيل الذكاء الاصطناعي، إلا أنه لإجراء تفاعلات صفحة معقدة، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر الويب، لا يزال يتعين الاعتماد على حدود الثقة ووظائف الصناديق الرملية للمتصفح. المتصفح يتحول من واجهة بشرية إلى منصة استدعاء أنظمة للوكيل.
ما يمكن أن يكسر هيكل سوق المتصفحات الحالي بحق ليس "كروم" أفضل، بل هي بنية تفاعلية جديدة: ليست مجرد عرض للمعلومات، بل استدعاء للمهام. يجب أن تصمم المتصفحات المستقبلية لوكلاء الذكاء الاصطناعي - ليس فقط للقراءة، ولكن أيضًا للكتابة والتنفيذ. مشاريع مثل Browser Use تحاول تحويل هيكل الصفحة إلى دلالات، وتحويل الواجهة المرئية إلى نصوص هيكلية يمكن لوكلاء الذكاء الاصطناعي استدعاؤها، مما يحقق خريطة من الصفحة إلى التعليمات ويقلل بشكل كبير من تكاليف التفاعل.
لقد بدأت المشاريع الرائدة في السوق تجربة المياه: قامت Perplexity ببناء متصفح أصلي يسمى Comet، يستخدم الذكاء الاصطناعي بدلاً من نتائج البحث التقليدية؛ أما Brave فقد دمجت حماية الخصوصية مع الاستدلال المحلي، معززة بذلك وظائف البحث والحجب باستخدام LLM؛ بينما تستهدف مشاريع مثل Donut وCrypto الأصلية المدخلات الجديدة لتفاعل الذكاء الاصطناعي مع الأصول على السلسلة. تتمثل الخصائص المشتركة لهذه المشاريع في: محاولة إعادة هيكلة إدخال المتصفح، بدلاً من تحسين طبقة الإخراج.
بالنسبة لرواد الأعمال، تكمن الفرص في العلاقة الثلاثية بين الإدخال، الهيكل والوكيل. يعد المتصفح كواجهة لاستدعاء العالم بواسطة الوكلاء في المستقبل، مما يعني أن من يستطيع تقديم "كتل القدرات" القابلة للتنظيم، والقابلة للاستدعاء، والموثوقة، يمكنه أن يصبح جزءًا من الجيل الجديد من المنصات. من تحسين محركات البحث إلى تحسين محركات الوكلاء (، ومن حركة مرور الصفحات إلى استدعاء سلسلة المهام، يتم إعادة تشكيل أشكال المنتجات وأفكار التصميم. تحدث الحرب الثالثة للمتصفحات في "الإدخال" وليس في "العرض"؛ لم يعد من يحقق الفوز هو من يجذب انتباه المستخدمين، بل من يكسب ثقة الوكيل، ويحصل على مدخلات الاستدعاء.
تاريخ تطور المتصفحات
في أوائل التسعينيات، عندما لم يكن الإنترنت قد أصبح جزءًا من الحياة اليومية، ظهرت Netscape Navigator كأنها سفينة تفتح قارة جديدة، حيث فتحت أبواب العالم الرقمي لملايين المستخدمين. لم يكن هذا المتصفح هو الأول، لكنه كان الأول حقًا الذي وصل إلى الجمهور وشكل تجربة الإنترنت. في ذلك الوقت، كان بإمكان الناس لأول مرة تصفح صفحات الويب بسهولة من خلال واجهة رسومية، وكأن العالم بأسره أصبح فجأة في متناول اليد.
ومع ذلك، فإن التألق غالبًا ما يكون قصير الأجل. أدركت مايكروسوفت بسرعة أهمية المتصفح، وقررت فرض دمج Internet Explorer في نظام التشغيل Windows، ليصبح المتصفح الافتراضي. تعتبر هذه الاستراتيجية "سلاحا قاتلا للمنصة"، حيث دمرت مباشرة الهيمنة السوقية لـ Netscape. لم يختر العديد من المستخدمين IE طواعية، بل قبلوه بسبب أنه الافتراضي للنظام. بفضل قدرة توزيع Windows، أصبح IE بسرعة زعيم الصناعة، بينما دخلت Netscape في مسار الانحدار.
في خضم الأزمة، اختار مهندسو نتسكيب طريقًا جريئًا ومثاليًا - حيث قاموا بفتح شفرة مصدر المتصفح، داعين مجتمع المصدر المفتوح. بدا أن هذا القرار هو "تنازل مقدوني" في عالم التكنولوجيا، مما يرمز إلى نهاية حقبة قديمة وصعود قوى جديدة. أصبحت هذه الشفرة لاحقًا أساس مشروع متصفح موزيلا، الذي سمي في البداية فينيكس)، مما يعني طائر الفينيق من الرماد(، لكنه غير اسمه عدة مرات بسبب مشكلات العلامات التجارية، وانتهى به المطاف ليصبح فايرفوكس.
فايرفوكس ليس مجرد نسخة بسيطة من نيتسكيب، بل حقق العديد من الانجازات في تجربة المستخدم، وبيئة الإضافات، والأمان، وغيرها. إن ولادته تمثل انتصار الروح المفتوحة، وأيضاً تضخ حياة جديدة في الصناعة بأكملها. وصفه البعض بأنه "الوريث الروحي" لنيتسكيب، مثلما ورثت الإمبراطورية العثمانية بقايا البيزنطيين. على الرغم من أن هذه الاستعارة مبالغ فيها، إلا أنها تحمل معنى عميق.
لكن قبل بضع سنوات من الإصدار الرسمي لـ Firefox، كانت مايكروسوفت قد أصدرت بالفعل ستة إصدارات من IE، وبفضل ميزة الوقت واستراتيجية تجميع النظام، جعلت Firefox في البداية في وضع المطاردة، مما جعل هذه المسابقة غير تنافسية من حيث خط البداية.
في الوقت نفسه، ظهر لاعب مبكر آخر بهدوء. تم إصدار متصفح أوبرا في عام 1994، وهو من النرويج، وكان في البداية مجرد مشروع تجريبي. ولكن منذ الإصدار 7.0 في عام 2003، قدم محرك Presto الذي تم تطويره داخليًا، وقدم دعمًا مبكرًا لتقنيات متقدمة مثل CSS، والتخطيط التكيفي، والتحكم الصوتي، والترميز Unicode. على الرغم من أن عدد المستخدمين محدود، إلا أنه ظل دائمًا في طليعة الصناعة من الناحية التكنولوجية، ليصبح "المفضل لدى المهووسين".
في نفس العام، أصدرت شركة آبل متصفح سفاري. كانت هذه نقطة تحول ذات دلالة. في ذلك الوقت، كانت مايكروسوفت قد استثمرت 150 مليون دولار في آبل التي كانت على وشك الإفلاس، من أجل الحفاظ على واجهة المنافسة وتجنب مراجعة مكافحة الاحتكار. على الرغم من أن محرك البحث الافتراضي لسفاري منذ نشأته هو جوجل، إلا أن هذه العلاقة التاريخية مع مايكروسوفت ترمز إلى العلاقة المعقدة والدقيقة بين عمالقة الإنترنت: التعاون والمنافسة، دائمًا ما يسيران جنبًا إلى جنب.
في عام 2007، تم إطلاق IE7 مع Windows Vista، ولكن ردود الفعل في السوق كانت متوسطة. من ناحية أخرى، تمكنت Firefox، بفضل وتيرة التحديث الأسرع، وآلية التمديد الأكثر ودية، وجاذبيتها الطبيعية للمطورين، من زيادة حصتها في السوق تدريجياً إلى حوالي 20%. بدأت هيمنة IE تتراجع، والاتجاهات تتغير.
تعتبر جوجل طريقة أخرى. على الرغم من أنها بدأت في التفكير في إنشاء متصفح خاص بها منذ عام 2001، إلا أنه استغرق الأمر ست سنوات لإقناع الرئيس التنفيذي إريك شميدت بالموافقة على هذا المشروع. تم إطلاق كروم في عام 2008، وهو مبني على مشروع كروميوم مفتوح المصدر ومحرك ويب كيت المستخدم في سافاري. تم تسميته "متصفح ضخم"، لكنه سرعان ما ارتفع بفضل خبرة جوجل في الإعلانات وبناء العلامات التجارية.
السلاح الرئيسي لـ Chrome ليس الوظائف، بل وتيرة التحديثات المتكررة ) كل ستة أسابيع ( مع تجربة موحدة عبر جميع المنصات. في نوفمبر 2011، تجاوز Chrome Firefox لأول مرة، وبلغت حصته في السوق 27٪؛ بعد ستة أشهر، تجاوز IE مرة أخرى، مكتملًا التحول من منافس إلى متفوق.
في الوقت نفسه، بدأ الإنترنت المحمول في الصين في تشكيل نظامه البيئي الخاص. اشتهر متصفح معين في أوائل العقد الأول من القرن العشرين بسرعة، خاصة في الأسواق الناشئة مثل الهند وإندونيسيا والصين، حيث كسب إعجاب مستخدمي الأجهزة المتدنية بفضل تصميمه الخفيف وخصائص ضغط البيانات لتوفير حركة البيانات. في عام 2015، تجاوزت حصته في السوق العالمية لمتصفحات الهواتف المحمولة 17٪، وبلغت في الهند في مرحلة ما 46٪. لكن هذا الانتصار لم يدم طويلاً. مع تشديد الحكومة الهندية لمراجعة أمان التطبيقات الصينية، اضطر هذا المتصفح إلى الخروج من السوق الرئيسية، وفقد تدريجياً مجده السابق.
مع دخول عقد 2020، تم ترسيخ هيمنة Chrome، حيث استقر حصته في السوق العالمية عند حوالي 65%. ومن الجدير بالذكر أن محرك بحث Google ومتصفح Chrome، على الرغم من كونهما جزءًا من Alphabet، إلا أنهما من منظور السوق يشكلان نظامين هيمنيين مستقلين - الأول يتحكم في حوالي 90% من نقاط الدخول العالمية للبحث، بينما الثاني يسيطر على "النافذة الأولى" التي يدخل من خلالها معظم المستخدمين إلى الإنترنت.
للحفاظ على هذه الهيكلية الثنائية للاحتكار، استثمرت جوجل مبالغ كبيرة. في عام 2022، دفعت شركة ألفابت حوالي 20 مليار دولار لشركة أبل فقط لتبقى جوجل هي محرك البحث الافتراضي في متصفح سافاري. وأشار بعض المحللين إلى أن هذه النفقات تعادل 36% من إيرادات إعلانات البحث التي تحصل عليها جوجل من حركة المرور عبر سافاري. بعبارة أخرى، تدفع جوجل "رسوم حماية" للحفاظ على خندقها.
لكن الاتجاه تغير مرة أخرى. مع ظهور النماذج اللغوية الكبيرة )LLM(, بدأت محركات البحث التقليدية تتعرض للصدمة. في عام 2024, تراجعت حصة Google في سوق البحث من 93% إلى 89%, على الرغم من أنها لا تزال تهيمن, إلا أن الشقوق بدأت تظهر. الأكثر ثورية هو الشائعات حول أن Apple قد تطلق محرك بحث AI خاص بها - إذا تم تغيير محرك البحث الافتراضي في Safari إلى阵营自家, فإن ذلك لن يغير فقط شكل النظام البيئي, بل قد يهز أيضًا عمود أرباح Alphabet. استجاب السوق بسرعة, حيث انخفض سعر سهم Alphabet من 170 دولارًا إلى 140 دولارًا, مما يعكس ليس فقط هلع المستثمرين, ولكن أيضًا عدم الارتياح العميق تجاه مستقبل عصر البحث.
من Navigator إلى Chrome، من المثل العليا مفتوحة المصدر إلى الإعلانات التجارية، من متصفح خفيف إلى مساعد بحث بالذكاء الاصطناعي، كانت معركة المتصفحات دائمًا حربًا حول التكنولوجيا والمنصات والمحتوى والسلطة. ساحة المعركة تتغير باستمرار، لكن الجوهر لم يتغير أبدًا: من يمتلك المدخل، هو من يحدد المستقبل.
الهيكل القديم لمتصفحات الويب الحديثة
عند الحديث عن بنية المتصفح، فإن الهيكل التقليدي الكلاسيكي موضح أدناه:
العميل - مدخل الواجهة الأمامية
استعلام عن الوصول إلى Google Front End الأقرب عبر HTTPS، إكمال فك تشفير TLS، أخذ عينات من QoS والتوجيه الجغرافي. إذا تم اكتشاف حركة مرور غير طبيعية )DDoS، يمكن تقييد هذه الطبقة أو تحديها تلقائيًا.
فهم الاستعلام
يحتاج الواجهة الأمامية إلى فهم معنى الكلمات التي يدخلها المستخدم، وهناك ثلاث خطوات: تصحيح الإملاء العصبي، تصحيح "recpie" إلى "recipe"؛ توسيع المرادفات، توسيع "how to fix bike" إلى "repair bicycle". تحليل النية، تحديد ما إذا كانت الاستعلامات معلوماتية أو توجيهية أو تجارية، وتخصيص طلبات Vertical.
استرجاع المرشحين
تُعرف تقنية الاستعلام المستخدمة من قبل جوجل باسم: الفهرس العكسي. في الفهرس المباشر، يمكننا استخدام معرف للوصول إلى الملفات. ولكن المستخدم لا يمكنه معرفة رقم المحتوى الذي يريده من بين مئات المليارات من الملفات، لذلك تم استخدام الفهرس العكسي التقليدي جدًا، والذي يستند إلى المحتوى للبحث عن الملفات التي تحتوي على الكلمات الرئيسية المقابلة. بعد ذلك، استخدمت جوجل الفهرس المتجه لمعالجة البحث الدلالي، أي للبحث عن محتوى مشابه لمعنى الاستعلام. يقوم بتحويل النصوص والصور والمحتويات الأخرى إلى متجهات عالية الأبعاد (embedding)، ويبحث بناءً على تشابه هذه المتجهات. على سبيل المثال، حتى إذا بحث المستخدم عن "كيفية صنع عجينة البيتزا"، يمكن لمحرك البحث إرجاع نتائج ذات صلة بـ"دليل صنع عجينة البيتزا"، لأنها مشابهة دلاليًا. بعد المرور عبر الفهرس العكسي والفهرس المتجه، سيتم فرز حوالي مئة ألف صفحة ويب.
الترتيب المتعدد المستويات
تقوم الأنظمة عادةً بتصفية صفحات المرشحين التي تتكون من مئات الآلاف إلى حوالي 1000 صفحة، من خلال خصائص خفيفة بعدة آلاف من الأبعاد مثل BM25 و TF-IDF ودرجة جودة الصفحة، مما يشكل مجموعة مرشحة أولية. تُعرف هذه الأنظمة بشكل عام باسم محركات التوصية. تعتمد على مجموعة ضخمة من الميزات الناتجة عن كيانات متعددة، بما في ذلك سلوك المستخدم وخصائص الصفحة ونية الاستعلام وإشارات السياق. على سبيل المثال، تأخذ Google في الاعتبار تاريخ المستخدم وتعليقات سلوك المستخدمين الآخرين ودلالات الصفحة ومعاني الاستعلام، كما تأخذ في الاعتبار عناصر السياق مثل الوقت ( من اليوم وأيام الأسبوع المحددة ) والأحداث الخارجية مثل الأخبار العاجلة.
التعلم العميق لإجراء الترتيب الرئيسي
في مرحلة البحث الأولي، تستخدم Google تقنيات مثل RankBrain و Neural Matching لفهم دلالة الاستعلام، وتصفية النتائج الأولية ذات الصلة من مستندات ضخمة. تم تقديم RankBrain من قبل Google في عام 2015 كنظام تعلم آلي، بهدف فهم معنى استعلامات المستخدمين بشكل أفضل، وخاصة الاستعلامات التي تظهر لأول مرة. يقوم بتحويل الاستعلامات والمستندات إلى تمثيلات متجهية، وحساب التشابه بينها، مما يساعد في العثور على النتائج الأكثر صلة. على سبيل المثال، بالنسبة للاستعلام "كيف أصنع عجينة البيتزا"، حتى لو لم تكن هناك كلمات رئيسية مطابقة تمامًا في المستند، يمكن لـ RankBrain التعرف على المحتوى ذي الصلة بـ "أساس البيتزا" أو "صنع العجينة".
تعتبر Neural Matching تقنية أخرى أطلقتها Google في عام 2018، وتهدف إلى فهم أعمق للعلاقة الدلالية بين الاستعلامات والمستندات. تستخدم هذه التقنية نماذج الشبكات العصبية لالتقاط العلاقات الغامضة بين الكلمات، مما يساعد Google على مطابقة الاستعلامات ومحتوى الويب بشكل أفضل. على سبيل المثال، بالنسبة للاستعلام "لماذا صوت مروحة جهاز الكمبيوتر المحمول الخاص بي مرتفع؟"، يمكن لـ Neural Matching فهم أن المستخدم قد يبحث عن معلومات استكشاف الأخطاء وإصلاحها المتعلقة بالسخونة الزائدة أو تراكم الغبار أو ارتفاع استخدام وحدة المعالجة المركزية، حتى لو لم تظهر هذه الكلمات بشكل مباشر في الاستعلام.
إعادة ترتيب عميقة: تطبيق نموذج BERT
بعد تصفية الوثائق ذات الصلة أولاً، تستخدم Google نموذج BERT( تمثيلات الترميز ثنائية الاتجاه من المحولات) لتحليل هذه الوثائق
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
إعادة تشكيل المتصفح بالذكاء الاصطناعي: الفرص والتحديات في حرب المتصفحات الثالثة
عصر متصفح الذكاء الاصطناعي: الفرص والتحديات في الحرب الثالثة للمتصفحات
تدور حرب المتصفحات الثالثة بهدوء. منذ تسعينيات القرن الماضي مع Netscape و IE من مايكروسوفت، إلى Firefox المستند إلى الفكر المفتوح و Chrome من Google، كانت المنافسة بين المتصفحات تجسيدًا مركزياً لسلطة التحكم في المنصات وتغير الأنماط التكنولوجية. تمكن Chrome بفضل سرعة التحديث والتفاعل البيئي من احتلال موقع الهيمنة، بينما شكلت Google من خلال هيكل "الأوليغارشي" بين البحث والمتصفح حلقة مغلقة لنقطة دخول المعلومات.
لكن اليوم، هذا النمط بدأ يتزعزع. ظهور نماذج اللغة الكبيرة (LLM) جعل المزيد والمزيد من المستخدمين يكملون المهام في صفحة نتائج البحث "بدون نقر"، مما أدى إلى انخفاض سلوك النقر التقليدي على الويب. في الوقت نفسه، الشائعات حول احتمال استبدال Apple لمحرك البحث الافتراضي في Safari تهدد أساس أرباح Alphabet، وقد بدأ السوق يظهر قلقه تجاه "الأصالة في البحث".
تواجه المتصفحات أيضًا إعادة تشكيل دورها. لم تعد مجرد أدوات لعرض صفحات الويب، بل أصبحت حاويات تجمع بين قدرات متعددة مثل إدخال البيانات، سلوك المستخدم، والخصوصية والهوية. على الرغم من قوة وكيل الذكاء الاصطناعي، إلا أنه لإجراء تفاعلات صفحة معقدة، واستدعاء بيانات الهوية المحلية، والتحكم في عناصر الويب، لا يزال يتعين الاعتماد على حدود الثقة ووظائف الصناديق الرملية للمتصفح. المتصفح يتحول من واجهة بشرية إلى منصة استدعاء أنظمة للوكيل.
ما يمكن أن يكسر هيكل سوق المتصفحات الحالي بحق ليس "كروم" أفضل، بل هي بنية تفاعلية جديدة: ليست مجرد عرض للمعلومات، بل استدعاء للمهام. يجب أن تصمم المتصفحات المستقبلية لوكلاء الذكاء الاصطناعي - ليس فقط للقراءة، ولكن أيضًا للكتابة والتنفيذ. مشاريع مثل Browser Use تحاول تحويل هيكل الصفحة إلى دلالات، وتحويل الواجهة المرئية إلى نصوص هيكلية يمكن لوكلاء الذكاء الاصطناعي استدعاؤها، مما يحقق خريطة من الصفحة إلى التعليمات ويقلل بشكل كبير من تكاليف التفاعل.
لقد بدأت المشاريع الرائدة في السوق تجربة المياه: قامت Perplexity ببناء متصفح أصلي يسمى Comet، يستخدم الذكاء الاصطناعي بدلاً من نتائج البحث التقليدية؛ أما Brave فقد دمجت حماية الخصوصية مع الاستدلال المحلي، معززة بذلك وظائف البحث والحجب باستخدام LLM؛ بينما تستهدف مشاريع مثل Donut وCrypto الأصلية المدخلات الجديدة لتفاعل الذكاء الاصطناعي مع الأصول على السلسلة. تتمثل الخصائص المشتركة لهذه المشاريع في: محاولة إعادة هيكلة إدخال المتصفح، بدلاً من تحسين طبقة الإخراج.
بالنسبة لرواد الأعمال، تكمن الفرص في العلاقة الثلاثية بين الإدخال، الهيكل والوكيل. يعد المتصفح كواجهة لاستدعاء العالم بواسطة الوكلاء في المستقبل، مما يعني أن من يستطيع تقديم "كتل القدرات" القابلة للتنظيم، والقابلة للاستدعاء، والموثوقة، يمكنه أن يصبح جزءًا من الجيل الجديد من المنصات. من تحسين محركات البحث إلى تحسين محركات الوكلاء (، ومن حركة مرور الصفحات إلى استدعاء سلسلة المهام، يتم إعادة تشكيل أشكال المنتجات وأفكار التصميم. تحدث الحرب الثالثة للمتصفحات في "الإدخال" وليس في "العرض"؛ لم يعد من يحقق الفوز هو من يجذب انتباه المستخدمين، بل من يكسب ثقة الوكيل، ويحصل على مدخلات الاستدعاء.
تاريخ تطور المتصفحات
في أوائل التسعينيات، عندما لم يكن الإنترنت قد أصبح جزءًا من الحياة اليومية، ظهرت Netscape Navigator كأنها سفينة تفتح قارة جديدة، حيث فتحت أبواب العالم الرقمي لملايين المستخدمين. لم يكن هذا المتصفح هو الأول، لكنه كان الأول حقًا الذي وصل إلى الجمهور وشكل تجربة الإنترنت. في ذلك الوقت، كان بإمكان الناس لأول مرة تصفح صفحات الويب بسهولة من خلال واجهة رسومية، وكأن العالم بأسره أصبح فجأة في متناول اليد.
ومع ذلك، فإن التألق غالبًا ما يكون قصير الأجل. أدركت مايكروسوفت بسرعة أهمية المتصفح، وقررت فرض دمج Internet Explorer في نظام التشغيل Windows، ليصبح المتصفح الافتراضي. تعتبر هذه الاستراتيجية "سلاحا قاتلا للمنصة"، حيث دمرت مباشرة الهيمنة السوقية لـ Netscape. لم يختر العديد من المستخدمين IE طواعية، بل قبلوه بسبب أنه الافتراضي للنظام. بفضل قدرة توزيع Windows، أصبح IE بسرعة زعيم الصناعة، بينما دخلت Netscape في مسار الانحدار.
في خضم الأزمة، اختار مهندسو نتسكيب طريقًا جريئًا ومثاليًا - حيث قاموا بفتح شفرة مصدر المتصفح، داعين مجتمع المصدر المفتوح. بدا أن هذا القرار هو "تنازل مقدوني" في عالم التكنولوجيا، مما يرمز إلى نهاية حقبة قديمة وصعود قوى جديدة. أصبحت هذه الشفرة لاحقًا أساس مشروع متصفح موزيلا، الذي سمي في البداية فينيكس)، مما يعني طائر الفينيق من الرماد(، لكنه غير اسمه عدة مرات بسبب مشكلات العلامات التجارية، وانتهى به المطاف ليصبح فايرفوكس.
فايرفوكس ليس مجرد نسخة بسيطة من نيتسكيب، بل حقق العديد من الانجازات في تجربة المستخدم، وبيئة الإضافات، والأمان، وغيرها. إن ولادته تمثل انتصار الروح المفتوحة، وأيضاً تضخ حياة جديدة في الصناعة بأكملها. وصفه البعض بأنه "الوريث الروحي" لنيتسكيب، مثلما ورثت الإمبراطورية العثمانية بقايا البيزنطيين. على الرغم من أن هذه الاستعارة مبالغ فيها، إلا أنها تحمل معنى عميق.
لكن قبل بضع سنوات من الإصدار الرسمي لـ Firefox، كانت مايكروسوفت قد أصدرت بالفعل ستة إصدارات من IE، وبفضل ميزة الوقت واستراتيجية تجميع النظام، جعلت Firefox في البداية في وضع المطاردة، مما جعل هذه المسابقة غير تنافسية من حيث خط البداية.
في الوقت نفسه، ظهر لاعب مبكر آخر بهدوء. تم إصدار متصفح أوبرا في عام 1994، وهو من النرويج، وكان في البداية مجرد مشروع تجريبي. ولكن منذ الإصدار 7.0 في عام 2003، قدم محرك Presto الذي تم تطويره داخليًا، وقدم دعمًا مبكرًا لتقنيات متقدمة مثل CSS، والتخطيط التكيفي، والتحكم الصوتي، والترميز Unicode. على الرغم من أن عدد المستخدمين محدود، إلا أنه ظل دائمًا في طليعة الصناعة من الناحية التكنولوجية، ليصبح "المفضل لدى المهووسين".
في نفس العام، أصدرت شركة آبل متصفح سفاري. كانت هذه نقطة تحول ذات دلالة. في ذلك الوقت، كانت مايكروسوفت قد استثمرت 150 مليون دولار في آبل التي كانت على وشك الإفلاس، من أجل الحفاظ على واجهة المنافسة وتجنب مراجعة مكافحة الاحتكار. على الرغم من أن محرك البحث الافتراضي لسفاري منذ نشأته هو جوجل، إلا أن هذه العلاقة التاريخية مع مايكروسوفت ترمز إلى العلاقة المعقدة والدقيقة بين عمالقة الإنترنت: التعاون والمنافسة، دائمًا ما يسيران جنبًا إلى جنب.
في عام 2007، تم إطلاق IE7 مع Windows Vista، ولكن ردود الفعل في السوق كانت متوسطة. من ناحية أخرى، تمكنت Firefox، بفضل وتيرة التحديث الأسرع، وآلية التمديد الأكثر ودية، وجاذبيتها الطبيعية للمطورين، من زيادة حصتها في السوق تدريجياً إلى حوالي 20%. بدأت هيمنة IE تتراجع، والاتجاهات تتغير.
تعتبر جوجل طريقة أخرى. على الرغم من أنها بدأت في التفكير في إنشاء متصفح خاص بها منذ عام 2001، إلا أنه استغرق الأمر ست سنوات لإقناع الرئيس التنفيذي إريك شميدت بالموافقة على هذا المشروع. تم إطلاق كروم في عام 2008، وهو مبني على مشروع كروميوم مفتوح المصدر ومحرك ويب كيت المستخدم في سافاري. تم تسميته "متصفح ضخم"، لكنه سرعان ما ارتفع بفضل خبرة جوجل في الإعلانات وبناء العلامات التجارية.
السلاح الرئيسي لـ Chrome ليس الوظائف، بل وتيرة التحديثات المتكررة ) كل ستة أسابيع ( مع تجربة موحدة عبر جميع المنصات. في نوفمبر 2011، تجاوز Chrome Firefox لأول مرة، وبلغت حصته في السوق 27٪؛ بعد ستة أشهر، تجاوز IE مرة أخرى، مكتملًا التحول من منافس إلى متفوق.
في الوقت نفسه، بدأ الإنترنت المحمول في الصين في تشكيل نظامه البيئي الخاص. اشتهر متصفح معين في أوائل العقد الأول من القرن العشرين بسرعة، خاصة في الأسواق الناشئة مثل الهند وإندونيسيا والصين، حيث كسب إعجاب مستخدمي الأجهزة المتدنية بفضل تصميمه الخفيف وخصائص ضغط البيانات لتوفير حركة البيانات. في عام 2015، تجاوزت حصته في السوق العالمية لمتصفحات الهواتف المحمولة 17٪، وبلغت في الهند في مرحلة ما 46٪. لكن هذا الانتصار لم يدم طويلاً. مع تشديد الحكومة الهندية لمراجعة أمان التطبيقات الصينية، اضطر هذا المتصفح إلى الخروج من السوق الرئيسية، وفقد تدريجياً مجده السابق.
مع دخول عقد 2020، تم ترسيخ هيمنة Chrome، حيث استقر حصته في السوق العالمية عند حوالي 65%. ومن الجدير بالذكر أن محرك بحث Google ومتصفح Chrome، على الرغم من كونهما جزءًا من Alphabet، إلا أنهما من منظور السوق يشكلان نظامين هيمنيين مستقلين - الأول يتحكم في حوالي 90% من نقاط الدخول العالمية للبحث، بينما الثاني يسيطر على "النافذة الأولى" التي يدخل من خلالها معظم المستخدمين إلى الإنترنت.
للحفاظ على هذه الهيكلية الثنائية للاحتكار، استثمرت جوجل مبالغ كبيرة. في عام 2022، دفعت شركة ألفابت حوالي 20 مليار دولار لشركة أبل فقط لتبقى جوجل هي محرك البحث الافتراضي في متصفح سافاري. وأشار بعض المحللين إلى أن هذه النفقات تعادل 36% من إيرادات إعلانات البحث التي تحصل عليها جوجل من حركة المرور عبر سافاري. بعبارة أخرى، تدفع جوجل "رسوم حماية" للحفاظ على خندقها.
لكن الاتجاه تغير مرة أخرى. مع ظهور النماذج اللغوية الكبيرة )LLM(, بدأت محركات البحث التقليدية تتعرض للصدمة. في عام 2024, تراجعت حصة Google في سوق البحث من 93% إلى 89%, على الرغم من أنها لا تزال تهيمن, إلا أن الشقوق بدأت تظهر. الأكثر ثورية هو الشائعات حول أن Apple قد تطلق محرك بحث AI خاص بها - إذا تم تغيير محرك البحث الافتراضي في Safari إلى阵营自家, فإن ذلك لن يغير فقط شكل النظام البيئي, بل قد يهز أيضًا عمود أرباح Alphabet. استجاب السوق بسرعة, حيث انخفض سعر سهم Alphabet من 170 دولارًا إلى 140 دولارًا, مما يعكس ليس فقط هلع المستثمرين, ولكن أيضًا عدم الارتياح العميق تجاه مستقبل عصر البحث.
من Navigator إلى Chrome، من المثل العليا مفتوحة المصدر إلى الإعلانات التجارية، من متصفح خفيف إلى مساعد بحث بالذكاء الاصطناعي، كانت معركة المتصفحات دائمًا حربًا حول التكنولوجيا والمنصات والمحتوى والسلطة. ساحة المعركة تتغير باستمرار، لكن الجوهر لم يتغير أبدًا: من يمتلك المدخل، هو من يحدد المستقبل.
الهيكل القديم لمتصفحات الويب الحديثة
عند الحديث عن بنية المتصفح، فإن الهيكل التقليدي الكلاسيكي موضح أدناه:
العميل - مدخل الواجهة الأمامية
استعلام عن الوصول إلى Google Front End الأقرب عبر HTTPS، إكمال فك تشفير TLS، أخذ عينات من QoS والتوجيه الجغرافي. إذا تم اكتشاف حركة مرور غير طبيعية )DDoS، يمكن تقييد هذه الطبقة أو تحديها تلقائيًا.
فهم الاستعلام
يحتاج الواجهة الأمامية إلى فهم معنى الكلمات التي يدخلها المستخدم، وهناك ثلاث خطوات: تصحيح الإملاء العصبي، تصحيح "recpie" إلى "recipe"؛ توسيع المرادفات، توسيع "how to fix bike" إلى "repair bicycle". تحليل النية، تحديد ما إذا كانت الاستعلامات معلوماتية أو توجيهية أو تجارية، وتخصيص طلبات Vertical.
استرجاع المرشحين
تُعرف تقنية الاستعلام المستخدمة من قبل جوجل باسم: الفهرس العكسي. في الفهرس المباشر، يمكننا استخدام معرف للوصول إلى الملفات. ولكن المستخدم لا يمكنه معرفة رقم المحتوى الذي يريده من بين مئات المليارات من الملفات، لذلك تم استخدام الفهرس العكسي التقليدي جدًا، والذي يستند إلى المحتوى للبحث عن الملفات التي تحتوي على الكلمات الرئيسية المقابلة. بعد ذلك، استخدمت جوجل الفهرس المتجه لمعالجة البحث الدلالي، أي للبحث عن محتوى مشابه لمعنى الاستعلام. يقوم بتحويل النصوص والصور والمحتويات الأخرى إلى متجهات عالية الأبعاد (embedding)، ويبحث بناءً على تشابه هذه المتجهات. على سبيل المثال، حتى إذا بحث المستخدم عن "كيفية صنع عجينة البيتزا"، يمكن لمحرك البحث إرجاع نتائج ذات صلة بـ"دليل صنع عجينة البيتزا"، لأنها مشابهة دلاليًا. بعد المرور عبر الفهرس العكسي والفهرس المتجه، سيتم فرز حوالي مئة ألف صفحة ويب.
الترتيب المتعدد المستويات
تقوم الأنظمة عادةً بتصفية صفحات المرشحين التي تتكون من مئات الآلاف إلى حوالي 1000 صفحة، من خلال خصائص خفيفة بعدة آلاف من الأبعاد مثل BM25 و TF-IDF ودرجة جودة الصفحة، مما يشكل مجموعة مرشحة أولية. تُعرف هذه الأنظمة بشكل عام باسم محركات التوصية. تعتمد على مجموعة ضخمة من الميزات الناتجة عن كيانات متعددة، بما في ذلك سلوك المستخدم وخصائص الصفحة ونية الاستعلام وإشارات السياق. على سبيل المثال، تأخذ Google في الاعتبار تاريخ المستخدم وتعليقات سلوك المستخدمين الآخرين ودلالات الصفحة ومعاني الاستعلام، كما تأخذ في الاعتبار عناصر السياق مثل الوقت ( من اليوم وأيام الأسبوع المحددة ) والأحداث الخارجية مثل الأخبار العاجلة.
التعلم العميق لإجراء الترتيب الرئيسي
في مرحلة البحث الأولي، تستخدم Google تقنيات مثل RankBrain و Neural Matching لفهم دلالة الاستعلام، وتصفية النتائج الأولية ذات الصلة من مستندات ضخمة. تم تقديم RankBrain من قبل Google في عام 2015 كنظام تعلم آلي، بهدف فهم معنى استعلامات المستخدمين بشكل أفضل، وخاصة الاستعلامات التي تظهر لأول مرة. يقوم بتحويل الاستعلامات والمستندات إلى تمثيلات متجهية، وحساب التشابه بينها، مما يساعد في العثور على النتائج الأكثر صلة. على سبيل المثال، بالنسبة للاستعلام "كيف أصنع عجينة البيتزا"، حتى لو لم تكن هناك كلمات رئيسية مطابقة تمامًا في المستند، يمكن لـ RankBrain التعرف على المحتوى ذي الصلة بـ "أساس البيتزا" أو "صنع العجينة".
تعتبر Neural Matching تقنية أخرى أطلقتها Google في عام 2018، وتهدف إلى فهم أعمق للعلاقة الدلالية بين الاستعلامات والمستندات. تستخدم هذه التقنية نماذج الشبكات العصبية لالتقاط العلاقات الغامضة بين الكلمات، مما يساعد Google على مطابقة الاستعلامات ومحتوى الويب بشكل أفضل. على سبيل المثال، بالنسبة للاستعلام "لماذا صوت مروحة جهاز الكمبيوتر المحمول الخاص بي مرتفع؟"، يمكن لـ Neural Matching فهم أن المستخدم قد يبحث عن معلومات استكشاف الأخطاء وإصلاحها المتعلقة بالسخونة الزائدة أو تراكم الغبار أو ارتفاع استخدام وحدة المعالجة المركزية، حتى لو لم تظهر هذه الكلمات بشكل مباشر في الاستعلام.
إعادة ترتيب عميقة: تطبيق نموذج BERT
بعد تصفية الوثائق ذات الصلة أولاً، تستخدم Google نموذج BERT( تمثيلات الترميز ثنائية الاتجاه من المحولات) لتحليل هذه الوثائق