نوشته و ویرایش شده توسط مجله ی اسکوار
انویدیا خانواده مدلهای هوش مصنوعی منبعباز و قوی NVLM 1.0 خود را انتشار کرده است که با مدلهای ساختهشده توسط OpenAI و گوگل رقابت میکند. عضو مهم این خانواده از مدلهای زبانی چندوجهی بزرگ با گفتن NVLM-D-72B دارای ۷۲ میلیارد پارامتر است و در ماموریت های بینایی و زبانی کارکرد استثنایی اراعه میکند و درهمینحال قابلیتهای متنی آن نیز افزایش یافته است.
محققان انویدیا در مقاله خود توضیح خواهند داد:
«ما NVLM 1.0 را معارفه میکنیم، خانوادهای از مدلهای زبانی بزرگ چندوجهی که در ماموریت های بینایی به نتایج گسترش یافتهای دست اشکار میکنند و با مدلهای پیشرو (همانند GPT-4o) و مدلهای قابلدسترس دیگر رقابت میکند.»
قابلیتهای مدل هوش مصنوعی تازه انویدیا
مطابق گزارشهای منتشرشده، مدل NVLM-D-72B، انطباقپذیری زیاد خوبی در پردازش ورودیهای بصری و متنی پیچیده نشان داده است. در مقاله انویدیا مثالهایی اراعهشده که توانایی مدل در تفسیر میمها، تجزیهوتحلیل تصاویر و حل مرحلهبهمرحله مسائل ریاضی را مشخص می کند.
علاوهبراین، کارکرد مدل در عرصه ماموریت های متنی نیز بهبود یافته است. درواقع دقت NVLM-D-72B در این عرصه بهطور میانگین در بنچمارکهای کلیدی ۴.۳ امتیاز ارتقا اشکار کرده است.
انویدیا با انتشار کردن عمومی این مدل و وعده انتشار کردن کد آموزشی آن، انگارً تصمیم دارد از روال بستهنگهداشتن سیستمهای هوش مصنوعی پیشرفته فاصله بگیرد. تصمیمی که علتمیبشود محققان و گسترشدهندگان به فناوریهای پیشرفته دسترسی داشته باشند و بههمین ترتیب تحقیقوگسترش در عرصه هوش مصنوعی را تسریع میکند.
علاوهبراین، پروژه NVLM شامل مطرحهای معماری نوآورانهای میبشود، از جمله یک رویکرد ترکیبی که تکنیکهای گوناگون پردازش چندوجهی را ترکیب میکند. این چنین پیشرفتی میتواند جهت تحقیقات آینده را شکل بدهد.
جامعه هوش مصنوعی نیز بهطور کلی عکس العمل مثبتی نسبت به مدل هوش مصنوعی تازه انویدیا داشته است. یکی از محققان هوش مصنوعی در شبکه اجتماعی ایکس میگوید:
«انویدیا بهتازگی یک مدل ۷۲B منتشرکرده که در ریاضی و کدنویسی با لاما ۴۰۵B 3.1 برابری میکند و این چنین قابلیتهای بینایی دارد.»
بااینحال، انتشار کردن عمومی NVLM 1.0 خطرات خاص خود را نیز بههمراه دارد. با در دسترس قرارگرفتن مدلهای هوش مصنوعی قوی، نگرانیهای مربوط به سوءاستفاده از آنها به گمان زیادً افزایش اشکار خواهد کرد.
دسته بندی مطالب