الاختراق سيكون في هذين العامين أو الثلاثة القادمة! لي داهاي، الشريك المؤسس في شركة مينغبي، يقول: لقد ظهرت بوادر جيل جديد من تفاعل الإنسان والآلة

robot
إنشاء الملخص قيد التقدم

عندما يبدأ الذكاء الاصطناعي في الانتقال من الشاشات إلى العالم الحقيقي، فإن تفاعل الإنسان والآلة يشهد لحظة تطور رئيسية.

سواء كان الهاتف المحمول، السيارة، أو الروبوتات والأجهزة القابلة للارتداء التي تتسارع في الانتشار، فإن نمط التفاعل الدائري الذي يركز على السؤال والجواب، بدأ يظهر مشكلات مثل الاستجابة البطيئة، والانفصال في الإدراك، وانقطاع السياق. هذه العيوب الوراثية لهذا الأسلوب من التفاعل، أصبحت تشكل عائقًا رئيسيًا أمام دخول الذكاء الاصطناعي إلى العالم الفيزيائي.

في 2 فبراير، قال لي داهاي، الشريك المؤسس والرئيس التنفيذي لشركة 面壁智能، خلال مقابلة مع وسائل الإعلام بما في ذلك صحفي “每日经济新闻”، إن الأفق قد بدأ يظهر في اتجاه تفاعل الإنسان والآلة من الجيل الجديد، لكن القفزة الحقيقية لن تحدث بين عشية وضحاها، بل ستحدث تدريجيًا مع استمرار تحسين قدرات النماذج السحابية والنماذج على الأجهزة الطرفية. خلال هذه العملية، هل يمكن لنموذج متعدد modalities أن يصبح الدماغ المادي المربوط بين الذكاء الرقمي والعالم الفيزيائي، هو السؤال المركزي الذي يركز عليه القطاع.

مصدر الصورة: 面壁智能

ال modalities الكاملة ليست تراكبًا للوظائف، بل تغيير في نمط التفاعل

مع بدء دخول الذكاء الاصطناعي إلى العالم الفيزيائي، وعندما يقود الروبوتات أو الأجهزة القابلة للارتداء، بدأت تظهر عيوب في نمط التفاعل التقليدي بين الإنسان والآلة.

يعتقد لي تشيوان، أستاذ دائم في قسم علوم الحاسوب بجامعة تسينغهوا، والمؤسس المشارك والرئيس العلمي لشركة 面壁智能، أن الإنسان يتفاعل عبر قنوات متعددة بشكل متزامن، حيث يمكن للإنسان أن يستمر في السماع والنظر أثناء حديثه، وهذه العمليات لا تعيق بعضها البعض. لكن على مستوى التفاعل بين الإنسان والآلة، فإن معظم النماذج السابقة كانت تفتقر إلى هذه القدرة، “بمجرد أن تبدأ في الكلام، لا يمكنك أن ترى، وهناك مشاكل من هذا القبيل.”

عيوب هذا النمط من التفاعل، تحد من عمق دخول الذكاء الاصطناعي إلى الذكاء المادي. يرى لي تشيوان أن القدرة على التفاعل بشكل إنساني وطبيعي للغاية، هي خطوة رئيسية لجعل الروبوتات والأجهزة الذكية أكثر شبها بالبشر. “هذه (النموذج متعدد modalities) قد تكون أقرب إلى أن تجعل روبوتاتنا وأجهزتنا الذكية تتفاعل بشكل طبيعي كما يفعل الإنسان.”

وفقًا لهذا الحكم، فإن الذكاء المادي ليس فرعًا مستقلًا، بل هو سيناريو تطبيق يتطلب قدرات تفاعل نماذج أعلى. يؤكد لي تشيوان أن في سيناريوهات مثل الأجهزة الذكية والأجهزة المادية، هناك حاجة لنماذج مماثلة، لكي تتمكن من خدمة الإنسان بشكل أفضل. يعتقد أن التكرار السريع لقدرات الذكاء المادي قد لا يكون بعيدًا جدًا، “إذا حاولنا أن نقدر المدة، فهي ربما تكون بين عامين إلى ثلاثة أعوام.”

على مستوى الصناعة، فإن دمج النماذج على الأجهزة الطرفية مع أجهزة الذكاء الاصطناعي أصبح قضية واقعية ومعقدة.

يعتقد لي داهاي أنه مع دخول الشركات الكبرى إلى السوق، وظهور الكيانات الذكية في الهواتف وغيرها من الأجهزة، فإن الأفق قد بدأ يظهر في شكل تفاعل إنسان-آلة من الجيل الجديد، لكنه لا يعني أن نقطة التحول قد وصلت بعد. يقدر أن هذا الانتقال لن يكون مرة واحدة، “سيستمر الجميع في استكشاف هذا الاتجاه، ويجب أن يصاحبه تحسين مستمر لنماذج السحابة والنماذج على الأجهزة الطرفية.”

حتى في سيناريوهات الهواتف المحمولة التي يتم مناقشتها على نطاق واسع حاليًا، لا تزال التقنية تواجه قيودًا واضحة. يقول لي داهاي إن هاتف Doubao يعتمد على أحد أفضل النماذج في الصناعة، لكنه لم يصل بعد إلى الحالة المثالية من حيث إكمال المهام المعقدة للبشر.

ويحلل لي داهاي بشكل أعمق، من ناحية، أن الحلول السحابية البحتة تواجه مشكلة الخصوصية، ومن ناحية أخرى، فإن استهلاك الموارد على الأجهزة الطرفية، مثل القدرة الحاسوبية، يجعل تطبيق القدرات متعددة modalities على الهواتف يستغرق وقتًا أطول. ويقول بصراحة، كلما زادت modalities، زاد استهلاك الموارد، مما يحدد وتيرة التطور بين الأجهزة المختلفة.

لا تزال التفاعلات الحالية على الهواتف تعتمد بشكل رئيسي على الصوت واللمس، وال modalities محدودة نسبيًا. يوضح لي داهاي أن الاختراق الرئيسي في هاتف Doubao هو تمكين الكيان الذكي من تشغيل الهاتف كما يفعل الإنسان، لإنجاز المهام المعقدة نيابة عن المستخدم، وهو حل لمشكلة الإخراج كما يفعل الإنسان. أما الاتجاه التالي في التطور، فهو في تحول طرق الإدخال.

“حاليًا، يتطلب تزامن سياق الهاتف مع الإنسان عمليات يدوية نشطة على الشاشة. إذا استطاع الهاتف في المستقبل أن يستمع ويشاهد العالم الحقيقي مباشرة، فسيتمكن من التزامن بشكل أفضل مع المالك ومشاركة السياق.” يعتقد لي داهاي أن هذا هو الخطوة الحاسمة نحو جعل الهاتف كيانًا ذكيًا حقيقيًا، لكنه سيواجه تحديات مزدوجة تتعلق بالطاقة وحماية الخصوصية، مما يفرض متطلبات أعلى على تصميم المنتج.

بالمقابل، يعتقد لي داهاي أن السيناريوهات مثل السيارات والروبوتات، نظرًا لمرونة الموارد، تعتبر اتجاهات أكثر وعدًا لنماذج modalities الكاملة. وفي مجال الذكاء المادي، يعتقد أن المشكلة الحالية ليست في الجوهر، بل في الدماغ، وإذا حدث تقدم ثوري في قدرات النماذج، فمن المحتمل أن يشهد الذكاء المادي قفزة مماثلة لـ “ChatGPT”.

الصناعة ستشهد بسرعة انفجار القدرات التخصصية والتفاعلية للنماذج

وفقًا لهذا الرأي، فإن شركة 面壁智能 لا تركز بشكل خاص على منتج أو شكل معين من الأجهزة، بل على قدرتها المستمرة على إنتاج نماذج عالية الجودة.

في مجال الذكاء الاصطناعي، كانت قوانين التوسع (Scaling Law) تعتبر قانونًا ثابتًا، لكن الجدل حول ما إذا كانت ستواجه حائطًا لم يتوقف أبدًا. اقترحت شركة 面壁智能 منظورًا آخر: قانون الكثافة (Densing Law)، وهو أن عمر صلاحية النماذج الكبيرة قصير جدًا، وأن كثافتها تتضاعف تقريبًا كل 100 يوم. هذا يعني أن الأهم ليس في تطوير نموذج ممتاز، بل في امتلاك القدرة على تطوير نماذج ممتازة باستمرار.

تعتبر شركة 面壁智能 نفسها “آلة طباعة النماذج الكبيرة”. يوضح لي داهاي أن هذه الآلة تشير إلى عملية تدريب نماذج ذات كثافة قدرات أعلى بشكل مستمر.

ويضيف لي تشيوان أن منطق قانون الكثافة مشابه لصناعة الرقائق: الاتجاه المستقبلي للنماذج الكبيرة هو أن تكون أصغر حجمًا وأكثر كثافة، مما يقلل من تكلفة النموذج بشكل كبير، ويجعل من الممكن تشغيلها على أجهزة أقرب إلى المستخدم.

يؤكد لي داهاي أن تسويق النماذج على الأجهزة الطرفية هو جزء من التحقق من القدرات ودورة البيانات. الاعتماد فقط على البيع التجاري للنماذج لتحقيق هدف نشرها على مئات المليارات من الأجهزة قد يكون صعبًا، والطريق الأكثر واقعية هو من خلال النظام البيئي والمطورين، لدفع هذه العملية قدمًا معًا.

فيما يخص المنافسة مع الشركات الكبرى، يعتقد لي داهاي أن فرص الشركات الناشئة لم تتلاشى بعد دخول الشركات الكبرى. لا يزال الذكاء الاصطناعي فرصة صناعية، والتحدي أمام الشركات الناشئة هو أن تختار احتلال حصة صغيرة في سوق واسع جدًا، أو أن تسعى للسيطرة على سوق أصغر، “أنا أؤمن أن هناك مساحة كبيرة للجميع ليبدعوا.”

أما بالنسبة للاتجاهات التكنولوجية المستقبلية، فقد اقترح لي تشيوان مسارين رئيسيين: الأول هو تعزيز القدرات الذكية بشكل مستمر؛ والثاني هو استخدام الذكاء بشكل أكثر كفاءة. يعتقد أن خلال سنة أو سنتين، ستشهد الصناعة بسرعة تطور قدرات النماذج، وتفجر قدراتها التفاعلية مع العالم. “هذه (النموذج) ككيان ذكي، يمتلك قدرات تعلم ذاتي أقوى، وهو اتجاه مهم جدًا في التطور خلال السنة أو السنتين القادمتين. وعندما يمتلك القدرة على الاستكشاف والتعلم والنمو بشكل مستقل، فإن الخطوة التالية ستكون في التعاون بين كيانات ذكية متعددة.”

ويقول لي تشيوان إنه خلال خمس إلى عشر سنوات، من المؤكد أن العالم سيدخل في شبكة من الكيانات الذكية المترابطة والمتعاونة بشكل عالٍ، مع ظهور الذكاء الجماعي.

(المصدر: 每日经济新闻)

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$2.44Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.44Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • القيمة السوقية:$2.43Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$0.1عدد الحائزين:1
    0.00%
  • تثبيت