به گزارش آیندگان
مدتی پیش استارتاپ هوش مصنوعی «ایلان ماسک» یعنی xAI نسخه تازه چتبات خود Grok-1.5 را معارفه کرد. اکنون در ادامه رقابت این شرکت با OpenAI، مدل چندوجهی Grok-1.5 Vision یا Grok-1.5V رونمایی شد. این هوش مصنوعی اکنون علاوهبر آنکه میتواند متن را فهمیدن کند، قادر به پردازش نمودار، اسکرینشات و تصاویر گوناگون است.
بر پایه اظهار xAI، نسخه Grok-1.5V میتواند با مدلهای چندوجهی پیشرفته دیگر در قسمتهایی همانند استدلال چند رشتهای، فهمیدن نمودارهای علمی، چارتها و تصاویر رقابت کند. Grok-1.5 ویژن بهزودی برای افراد منتخب و برخی از کاربران جاری این چتبات در دسترس خواهد می بود.
Grok ویژن با قابلیت پردازش دادههای تصویری و چندوجهی
xAI نسخه چندوجهی Grok را در هفت بنچمارک گوناگون با دیگر رقیب ها همانند GPT-4V قیاس کرده است که در برخی از آنها این مدل برتری قابلتوجهی را بهثبت رسانده است. خواندن متن در عکس، فهمیدن مسائل ریاضی، تبدیل فلوچارت به کد پایتون، تشکیل یک داستان از نقاشی و تبدیل جدول به فرمت فایل CSV از قابلیتهای تازه نسخه ویژن Grok است.
xAI مدل چندوجهی خود را با رقیبهایی همانند GPT-4V ،Claude 3Sonnet و جمینای پرو ۱.۵ قیاس کرده است و ادعا میکند که Grok-1.5V در بنچمارک RealWorldQA از رقبای خود بهتر عمل میکند؛ این بنچمارک تازه برای برسی مقدار فهمیدن دنیای واقعی تشکیل شده است.
بنچمارک RealWorldQA با منفعت گیری از بیشتر از ۷۰۰ عکس به همراه سوالوپاسخ برای هر مورد تشکیل شده است. در این تصاویر وسایل نقلیه گوناگون و اشیای دنیای واقعی وجود دارند. xAI این بنچمارک را با مجوز CC یا Creative Commons برای عموم انتشار میکند.

شرکت هوش مصنوعی ایلان ماسک از وقتی که چتبات آن برای اولینبار در سال ۲۰۲۳ رونمایی شد، پیشرفتهای بسیاری داشته است و دائماً نیز تلاش میکند تا با OpenAI و دیگر شرکتهای پیشتاز هوش مصنوعی رقابت کند. اما این چتبات در این زمان چندان بیحاشیه نیز نبوده است. اخیراً محققان دریافتند که چتبات Grok میتواند به کاربران درمورد عمل های مجرمانه اطلاعاتی بدهد.
بااینوجود، xAI بهجستوجو ساختن «هوش جامع مصنوعی سودمند» با قابلیت فهمیدن جهان است. این مقصد مشخص می کند که در ماههای آینده بهروزرسانیهای قابل توجهی برای فهمیدن چندوجهی و قابلیتهای هوش مصنوعی مولد به Grok خواهد آمد.
دسته بندی مطالب
فرهنگ وهنر
منبع