شرکت گوگل از جدیدترین مدل هوش مصنوعی خود با نام Gemini 3.1 Pro رونمایی کرد؛ مدلی که به گفته این شرکت برای پیچیدهترین وظایف فکری طراحی شده و جهشی عظیم در تواناییهای استدلال و حل مسئله به همراه دارد. این مدل که هماکنون به صورت پیشنمایش در اختیار توسعهدهندگان و کاربران قرار گرفته، در بنچمارک معتبر ARC-AGI-2 موفق به کسب امتیاز ۷۷.۱ درصد شده که بیش از دو برابر نسل قبلی است و رقبای قدری مانند GPT-5.2 و Claude Opus 4.6 را پشت سر میگذارد .
معرفی Gemini 3.1 Pro؛ جهش در هوشمندی با حفظ قیمت رقابتی
گوگل با معرفی مدل هوش مصنوعی Gemini 3.1 Pro گامی بلند در ارتقای تواناییهای شناختی این پلتفرم برداشته است. این مدل که نسخه بهبودیافته Gemini 3 Pro محسوب میشود، با تمرکز بر استدلال پیشرفته، حل مسائل پیچیده و کدنویسی حرفهای طراحی شده است. نکته قابل توجه اینکه علیرغم بهبود چشمگیر عملکرد، قیمتگذاری API این مدل نسبت به نسل قبل تغییری نکرده و همچنان با نرخ ۲ دلار به ازای هر میلیون توکن ورودی و ۱۲ دلار برای هر میلیون توکن خروجی (برای پرامپتهای زیر ۲۰۰ هزار توکن) عرضه میشود .

رکوردشکنی Gemini 3.1 Pro در بنچمارکهای استدلال و دانش علمی
بر اساس آمار منتشرشده توسط گوگل، مدل هوش مصنوعی Gemini 3.1 Pro در ۱۶ بنچمارک معتبر، موفق به کسب ۱۳ رتبه نخست شده است . مهمترین این موفقیتها در بنچمارک ARC-AGI-2 رقم خورده که توانایی استدلال انتزاعی و حل الگوهای جدید را میسنجد. امتیاز ۷۷.۱ درصدی این مدل در حالی ثبت شده که نسخه قبلی (Gemini 3 Pro) تنها ۳۱.۱ درصد کسب کرده بود و رقبایی مانند GPT-5.2 با ۵۲.۹ درصد و Claude Opus 4.6 با ۶۸.۸ درصد نیز با اختلاف قابل توجهی عقبتر هستند .
در بنچمارک GPQA Diamond که سنجش دانش علمی در سطح دکتری است، Gemini 3.1 Pro با ۹۴.۳ درصد، از GPT-5.2 (۹۲.۴ درصد) و Claude Opus 4.6 (۹۱.۳ درصد) پیشی گرفته است . همچنین در آزمون Humanity’s Last Exam که پیچیدهترین سؤالات را شامل میشود، این مدل با ۴۴.۴ درصد، گوی سبقت را از رقبا ربوده است .
قابلیتهای فنی؛ از تفکر سه سطحی تا SVGهای خلاقانه
مدل هوش مصنوعی Gemini 3.1 Pro از قابلیت جدیدی به نام «سه سطح تفکر» (Low/Medium/High) بهره میبرد که به توسعهدهندگان اجازه میدهد میزان عمق استدلال را بر اساس نیاز تنظیم کنند . در حالت High، رفتار این مدل به نسخه فشردهشده Gemini Deep Think نزدیک میشود که هفته پیش برای وظایف علمی و مهندسی معرفی شده بود .
این مدل با حفظ پنجره زمینه ۱ میلیون توکن (معادل تحلیل همزمان چندین کتاب بلند) و افزایش سقف خروجی به ۶۴ هزار توکن، برای پروژههای حجیم ایدهآل است . از نظر فنی، معماری Mixture of Experts (MoE) همچنان هسته اصلی این مدل را تشکیل میدهد که تنها بخشی از پارامترها را برای هر وظیفه فعال میکند .
در زمینه کدنویسی، Gemini 3.1 Pro در بنچمارک SWE-Bench Verified امتیاز ۸۰.۶ درصد را کسب کرده که با Claude Opus 4.6 برابری میکند . همچنین قابلیت تولید SVGهای پویا و کدنویسی خلاقانه از دیگر ویژگیهای برجسته این مدل است .
مقایسه با رقبا؛ برتری در استدلال، رقابت نزدیک در کدنویسی
اگرچه مدل هوش مصنوعی Gemini 3.1 Pro در اکثر بنچمارکها پیشتاز است، اما رقابت در برخی حوزهها همچنان نفسگیر است. در بنچمارکهای عاملمحور (Agentic) مانند APEX-Agents، این مدل با ۶۹.۲ درصد، Claude Opus 4.6 (۵۹ درصد) را پشت سر گذاشته، اما در GDPval-AA که وظایف شغلی را شبیهسازی میکند، Claude Sonnet 4.6 با ۱۶۳۳ امتیاز، برتری محسوسی نسبت به Gemini (۱۳۱۷ امتیاز) دارد .
در Terminal-Bench 2.0 که کدنویسی پیشرفته را میسنجد، GPT-5.3-Codex با ۷۷.۳ درصد از Gemini 3.1 Pro (۶۸.۵ درصد) پیشی گرفته است . همچنین Claude Opus 4.6 در تستهای انسانی LMArena با اختلاف ۴ امتیازی در صدر باقی مانده است .
کاهش ۳۸ درصدی توهم؛ گامی به سوی قابلیت اعتماد بیشتر
یکی از مهمترین پیشرفتهای مدل هوش مصنوعی Gemini 3.1 Pro، کاهش چشمگیر نرخ توهم (Hallucination) است. بر اساس بنچمارک AA-Omniscience، امتیاز این مدل از ۱۳ به ۳۰ جهش یافته که نشاندهنده کاهش ۳۸ درصدی تمایل به پاسخهای نادرست است . این یعنی مدل بهتر از گذشته میفهمد چه زمانی پاسخ صحیح را نمیداند و از ارائه اطلاعات نادرست خودداری میکند.
دسترسی و قیمتگذاری Gemini 3.1 Pro
مدل هوش مصنوعی Gemini 3.1 Pro هماکنون از طریق پلتفرمهای زیر در دسترس است :
- توسعهدهندگان: Gemini API، Google AI Studio، Android Studio و Antigravity IDE
- سازمانها: Vertex AI و Gemini Enterprise
- کاربران عادی: اپلیکیشن Gemini و NotebookLM (با اشتراک Pro یا Ultra)
قیمتگذاری دقیق API به شرح زیر است :
| دستهبندی | تا ۲۰۰ هزار توکن | بیش از ۲۰۰ هزار توکن |
|---|---|---|
| ورودی (Input) | ۲.۰۰ دلار / ۱ میلیون توکن | ۴.۰۰ دلار / ۱ میلیون توکن |
| خروجی (Output) | ۱۲.۰۰ دلار / ۱ میلیون توکن | ۱۸.۰۰ دلار / ۱ میلیون توکن |
| کشینگ (Caching) | ۰.۲۰ دلار / ۱ میلیون توکن | ۰.۴۰ دلار / ۱ میلیون توکن |
جمعبندی؛ عصر جدید رقابت با نسخههای .1
معرفی مدل هوش مصنوعی Gemini 3.1 Pro با الگوی نسخهگذاری جدید (.1 به جای .5) نشاندهنده تغییر استراتژی گوگل به سوی بهروزرسانیهای سریعتر و تدریجی است . این مدل با وجود جهش دو برابری در استدلال و حفظ قیمت قبلی، پیامی روشن به رقبا دارد: رقابت در بازار هوش مصنوعی نه فقط بر سر عملکرد، که بر سر هزینه و دسترسیپذیری نیز هست. در حالی که Gemini در استدلال و وظایف عاملمحور پیشتاز است، رقابت با Claude در دقت و GPT در کدنویسی همچنان ادامه دارد.
