هنا يأتي FastVLM



يضعون MLP لإسقاط الرموز المرئية من FastViTHD إلى عالم LLM.

النتيجة: عدد أقل بكثير من الرموز ( مثل 4× أقل من FastViT، 16× أقل من ViT‑L/14 بدقة 336 بكسل ). أعني، هذا انخفاض كبير في عدد الرموز والتعقيد، بينما
IN4.8%
MLP2.76%
PIXEL1.46%
TOKEN1.2%
شاهد النسخة الأصلية
post-image
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • 5
  • إعادة النشر
  • مشاركة
تعليق
0/400
GasFeeLovervip
· 09-02 14:39
حسناً، لا يوجد ما يُفاخر به.
شاهد النسخة الأصليةرد0
ser_we_are_earlyvip
· 09-02 14:39
يبدو أن FastVLM رائع حقًا
شاهد النسخة الأصليةرد0
BlockchainBardvip
· 09-02 14:38
مذهل! لقد اندهشت من عدد الرموز.
شاهد النسخة الأصليةرد0
WhaleWatchervip
· 09-02 14:27
لقد أضفت شيئًا جديدًا مرة أخرى!
شاهد النسخة الأصليةرد0
DiamondHandsvip
· 09-02 14:23
آه آه، أشعر بالدوار بسبب الرياح...
شاهد النسخة الأصليةرد0
  • تثبيت