به گزارش آیندگان
شرکت چینی Alibaba از مدل هوش مصنوعی دارای قابلیت استدلال جدیدی با نام Qwen with Questions (یا QwQ) رونمایی کرده است که رقیب تازه مدل o1 از OpenAI به حساب میآید.
مدلی که Alibaba معارفه کرده، شامل ۳۲.۵ میلیارد پارامتر است و میتواند به خواستهایی با حداکثر ۳۲ هزار توکن جواب بدهد. همانند دیگر مدلهای بزرگ دارای قابلیت استدلال (LRM)، هوش مصنوعی QwQ نیز در طول استنتاج خود برای بازدید جوابهایی که میخواهد به کاربر اراعه کند و تصحیح اشتباهات، از چرخههای محاسباتی بیشتری منفعت گیری میکند.
به همین علت برای کارهایی که به استدلال منطقی و برنامهریزی نیاز دارند، همانند ریاضی و کدنویسی مناسبتر است.
کارکرد هوش مصنوعی دلایلگر QwQ در ریاضی و کدنویسی
مطابق آزمایشهای این شرکت، QwQ در بنچمارکهای AIME و MATH که توانایی مدل در حل مسائل ریاضی را برسی میکنند، o1-preview را ناکامی داده است. این چنین در بنچمارک GPQA (برای برسی استدلال علمی) بهتر از o1-mini بوده است اما در عرصه کدنویسی، بنچمارک LiveCodeBench کارکرد بهتر o1 را نشان داده است، هرچند کارکرد QwQ از مدلهای دیگر همانند GPT-4o و Claude 3.5 Sonnet بهتر بوده است.
هوش مصنوعی Alibaba فعلاً بهصورت پیشنمایش اراعه شده. با این شرایط میتوان او گفت نسخهای با کارکرد بهتر در آینده اراعه خواهد شد. این شرکت در بیانیه مربوط به معارفه مدل خود درمورد کارکرد آن میگوید:
«از طریق اکتشافات عمیق و آزمایشهای بیشمار خود، چیزی زیاد محسوس را کشف کردیم: هنگامی وقتی را به اندیشیدن، سوال و تأمل تعلق میدهیم، فهمیدن مدل از ریاضیات و برنامهنویسی همانند گلی در برابر خورشید شکوفا میشود… این فرایند انعکاس دقیق و دروننگری تبدیل پیشرفتهای قابلتوجهی در حل مشکلات پیچیده میشود.»
علیبابا درمورد دادهها یا فرایندی برای آموزش مدل خود منفعت گیری کرده هیچ مقالهای انتشار نکرده اما باتوجهبه این که QwQ مدلی متنباز است (برخلاف o1) «فرایند تفکر» آن نهان نیست و میتوان برای فهمیدن این نوشته که مدل زمان حل مشکلات چطور استدلال میکند، سراغ متن آن رفت.
این چنین این شرکت اشاره کرده QwQ در برخی اوقات با محدودیتهایی همانند ترکیب زبانها یا گیرافتادن در حلقههای استدلال روبه رو میشود. هماکنون از طریق Hugging Face میتوانید نسخه آزمایشی آن را امتحان کنید.
دسته بندی مطالب
فرهنگ وهنر