Gemini 3.1 Pro معرفی شد؛ مدل هوش مصنوعی گوگل با جهش دو برابری در استدلال

مدل هوش مصنوعی Gemini 3.1 Pro معرفی شد؛ هوشمندتر برای پیچیده‌ترین وظایف

شرکت گوگل از جدیدترین مدل هوش مصنوعی خود با نام Gemini 3.1 Pro رونمایی کرد؛ مدلی که به گفته این شرکت برای پیچیده‌ترین وظایف فکری طراحی شده و جهشی عظیم در توانایی‌های استدلال و حل مسئله به همراه دارد. این مدل که هم‌اکنون به صورت پیش‌نمایش در اختیار توسعه‌دهندگان و کاربران قرار گرفته، در بنچمارک معتبر ARC-AGI-2 موفق به کسب امتیاز ۷۷.۱ درصد شده که بیش از دو برابر نسل قبلی است و رقبای قدری مانند GPT-5.2 و Claude Opus 4.6 را پشت سر می‌گذارد .

معرفی Gemini 3.1 Pro؛ جهش در هوشمندی با حفظ قیمت رقابتی

گوگل با معرفی مدل هوش مصنوعی Gemini 3.1 Pro گامی بلند در ارتقای توانایی‌های شناختی این پلتفرم برداشته است. این مدل که نسخه بهبودیافته Gemini 3 Pro محسوب می‌شود، با تمرکز بر استدلال پیشرفته، حل مسائل پیچیده و کدنویسی حرفه‌ای طراحی شده است. نکته قابل توجه اینکه علی‌رغم بهبود چشمگیر عملکرد، قیمت‌گذاری API این مدل نسبت به نسل قبل تغییری نکرده و همچنان با نرخ ۲ دلار به ازای هر میلیون توکن ورودی و ۱۲ دلار برای هر میلیون توکن خروجی (برای پرامپت‌های زیر ۲۰۰ هزار توکن) عرضه می‌شود .

مدل هوش مصنوعی Gemini 3.1 Pro معرفی شد؛ هوشمندتر برای پیچیده‌ترین وظایف
مدل هوش مصنوعی Gemini 3.1 Pro معرفی شد؛ هوشمندتر برای پیچیده‌ترین وظایف

رکوردشکنی Gemini 3.1 Pro در بنچمارک‌های استدلال و دانش علمی

بر اساس آمار منتشرشده توسط گوگل، مدل هوش مصنوعی Gemini 3.1 Pro در ۱۶ بنچمارک معتبر، موفق به کسب ۱۳ رتبه نخست شده است . مهم‌ترین این موفقیت‌ها در بنچمارک ARC-AGI-2 رقم خورده که توانایی استدلال انتزاعی و حل الگوهای جدید را می‌سنجد. امتیاز ۷۷.۱ درصدی این مدل در حالی ثبت شده که نسخه قبلی (Gemini 3 Pro) تنها ۳۱.۱ درصد کسب کرده بود و رقبایی مانند GPT-5.2 با ۵۲.۹ درصد و Claude Opus 4.6 با ۶۸.۸ درصد نیز با اختلاف قابل توجهی عقب‌تر هستند .

در بنچمارک GPQA Diamond که سنجش دانش علمی در سطح دکتری است، Gemini 3.1 Pro با ۹۴.۳ درصد، از GPT-5.2 (۹۲.۴ درصد) و Claude Opus 4.6 (۹۱.۳ درصد) پیشی گرفته است . همچنین در آزمون Humanity’s Last Exam که پیچیده‌ترین سؤالات را شامل می‌شود، این مدل با ۴۴.۴ درصد، گوی سبقت را از رقبا ربوده است .

قابلیت‌های فنی؛ از تفکر سه سطحی تا SVGهای خلاقانه

مدل هوش مصنوعی Gemini 3.1 Pro از قابلیت جدیدی به نام «سه سطح تفکر» (Low/Medium/High) بهره می‌برد که به توسعه‌دهندگان اجازه می‌دهد میزان عمق استدلال را بر اساس نیاز تنظیم کنند . در حالت High، رفتار این مدل به نسخه فشرده‌شده Gemini Deep Think نزدیک می‌شود که هفته پیش برای وظایف علمی و مهندسی معرفی شده بود .

این مدل با حفظ پنجره زمینه ۱ میلیون توکن (معادل تحلیل همزمان چندین کتاب بلند) و افزایش سقف خروجی به ۶۴ هزار توکن، برای پروژه‌های حجیم ایده‌آل است . از نظر فنی، معماری Mixture of Experts (MoE) همچنان هسته اصلی این مدل را تشکیل می‌دهد که تنها بخشی از پارامترها را برای هر وظیفه فعال می‌کند .

در زمینه کدنویسی، Gemini 3.1 Pro در بنچمارک SWE-Bench Verified امتیاز ۸۰.۶ درصد را کسب کرده که با Claude Opus 4.6 برابری می‌کند . همچنین قابلیت تولید SVG‌های پویا و کدنویسی خلاقانه از دیگر ویژگی‌های برجسته این مدل است .

مقایسه با رقبا؛ برتری در استدلال، رقابت نزدیک در کدنویسی

اگرچه مدل هوش مصنوعی Gemini 3.1 Pro در اکثر بنچمارک‌ها پیشتاز است، اما رقابت در برخی حوزه‌ها همچنان نفس‌گیر است. در بنچمارک‌های عامل‌محور (Agentic) مانند APEX-Agents، این مدل با ۶۹.۲ درصد، Claude Opus 4.6 (۵۹ درصد) را پشت سر گذاشته، اما در GDPval-AA که وظایف شغلی را شبیه‌سازی می‌کند، Claude Sonnet 4.6 با ۱۶۳۳ امتیاز، برتری محسوسی نسبت به Gemini (۱۳۱۷ امتیاز) دارد .

در Terminal-Bench 2.0 که کدنویسی پیشرفته را می‌سنجد، GPT-5.3-Codex با ۷۷.۳ درصد از Gemini 3.1 Pro (۶۸.۵ درصد) پیشی گرفته است . همچنین Claude Opus 4.6 در تست‌های انسانی LMArena با اختلاف ۴ امتیازی در صدر باقی مانده است .

کاهش ۳۸ درصدی توهم؛ گامی به سوی قابلیت اعتماد بیشتر

یکی از مهم‌ترین پیشرفت‌های مدل هوش مصنوعی Gemini 3.1 Pro، کاهش چشمگیر نرخ توهم (Hallucination) است. بر اساس بنچمارک AA-Omniscience، امتیاز این مدل از ۱۳ به ۳۰ جهش یافته که نشان‌دهنده کاهش ۳۸ درصدی تمایل به پاسخ‌های نادرست است . این یعنی مدل بهتر از گذشته می‌فهمد چه زمانی پاسخ صحیح را نمی‌داند و از ارائه اطلاعات نادرست خودداری می‌کند.

دسترسی و قیمت‌گذاری Gemini 3.1 Pro

مدل هوش مصنوعی Gemini 3.1 Pro هم‌اکنون از طریق پلتفرم‌های زیر در دسترس است :

  • توسعه‌دهندگان: Gemini API، Google AI Studio، Android Studio و Antigravity IDE
  • سازمان‌ها: Vertex AI و Gemini Enterprise
  • کاربران عادی: اپلیکیشن Gemini و NotebookLM (با اشتراک Pro یا Ultra)

قیمت‌گذاری دقیق API به شرح زیر است :

دسته‌بندیتا ۲۰۰ هزار توکنبیش از ۲۰۰ هزار توکن
ورودی (Input)۲.۰۰ دلار / ۱ میلیون توکن۴.۰۰ دلار / ۱ میلیون توکن
خروجی (Output)۱۲.۰۰ دلار / ۱ میلیون توکن۱۸.۰۰ دلار / ۱ میلیون توکن
کشینگ (Caching)۰.۲۰ دلار / ۱ میلیون توکن۰.۴۰ دلار / ۱ میلیون توکن

جمع‌بندی؛ عصر جدید رقابت با نسخه‌های .1

معرفی مدل هوش مصنوعی Gemini 3.1 Pro با الگوی نسخه‌گذاری جدید (.1 به جای .5) نشان‌دهنده تغییر استراتژی گوگل به سوی به‌روزرسانی‌های سریع‌تر و تدریجی است . این مدل با وجود جهش دو برابری در استدلال و حفظ قیمت قبلی، پیامی روشن به رقبا دارد: رقابت در بازار هوش مصنوعی نه فقط بر سر عملکرد، که بر سر هزینه و دسترسی‌پذیری نیز هست. در حالی که Gemini در استدلال و وظایف عامل‌محور پیشتاز است، رقابت با Claude در دقت و GPT در کدنویسی همچنان ادامه دارد.

اخرین اخبار هوش مصنوعی

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *