بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه در هوش مصنوعی «گوگل»

مدل «جمینای ۲.۵ پرو» تنظیمات جدیدی را برای بهبود استدلال، ویژگی‌های صوتی و پشتیبانی چندزبانه دریافت کرد.

به گزارش خبرآنی، گوگل در کنفرانس «Google I/O 2025» از به‌روزرسانی‌های جدیدی برای مجموعه مدل‌های «جمینای ۲.۵»(Gemini 2.5) خود رونمایی کرد که شامل استدلال قوی‌تر، خروجی صدای بومی، ارتقاء امنیت و قابلیت‌های بهبودیافته برای توسعه‌دهندگان است. گوگل در اعلام به‌روزرسانی‌های جدید گفت: ما در ماه مارس «جمینای ۲.۵ پرو»(Gemini 2.5 Pro) را معرفی کردیم که هوشمندترین مدل ما تا به امروز است و امروز، قابلیت‌های جدیدی را به ۲.۵ پرو و «۲.۵ فلش»(2.5 Flash) اضافه می‌کنیم.

به نقل از تایمز آو ایندیا، مدل ارتقاءیافته جمینای ۲.۵ پرو اکنون در صدر نمودارهای عملکرد از جمله «WebDev Arena» برای کدنویسی و «LMArena» برای آزمایش ترجیحات انسانی قرار دارد. همچنین، این مدل دارای یک پنجره زمینه با یک میلیون توکن است که به آن امکان می‌دهد تا ورودی‌های طولانی‌تر و وظایف درک ویدئو را مدیریت کند.

گوگل اعلام کرد: به لطف «LearnLM» - نسخه‌ای از جمینای که با متخصصان آموزشی توسعه داده شده - این مدل اکنون در وظایف مرتبط با یادگیری نیز پیشرو است. مربیان و متخصصان، جمینای ۲.۵ پرو را در طیف متنوعی از سناریوها نسبت به سایر مدل‌ها ترجیح دادند.

صدای بومی، گفت‌وگوی احساسی و پشتیبانی چندزبانه

گوگل خروجی صدای بومی را نیز برای داشتن یک تجربه طبیعی‌تر با هوش مصنوعی معرفی کرد. جمینای اکنون می‌تواند با تُن‌ها، لهجه‌ها و سبک‌های گوناگون صحبت کند. برای مثال، هنگام تعریف کردن یک داستان می‌تواند صدای دراماتیک داشته باشد. موارد دیگر بهبود صوتی به شرح زیر هستند:

۱. احساسات کاربر را تشخیص می‌دهد و بر اساس آنها پاسخ می‌دهد (گفتگوی عاطفی).

۲. نویز پس‌زمینه را نادیده می‌گیرد (صدای فعال).

۳. وظایف صوتی پیچیده‌تر را انجام می‌دهد (تفکر در API زنده).

سیستم تبدیل متن به گفتار اکنون از چندین گوینده و بیش از ۲۴ زبان پشتیبانی می‌کند و می‌تواند هنگام گفت‌وگو بین زبان‌ها جابه‌جا شود. این ویژگی‌ها از طریق رابط برنامه‌نویسی جمینای در دسترس خواهند بود.

تفکر عمیق برای کارهای پیچیده

گوگل اعلام کرد که در حال آزمایش یک حالت استدلال پیشرفته به نام «تفکر عمیق» است که به جمینای کمک می‌کند تا پیش از پاسخ دادن، چندین پاسخ را در نظر بگیرد. این حالت برای چالش‌های دشواری مانند ریاضیات پیشرفته و برنامه‌نویسی طراحی شده است.

سخنگوی این شرکت گفت: ما در حال آغاز کردن آزمایش یک حالت استدلال بهبودیافته به نام «دیپ ثینک»(Deep Think) هستیم. ما زمان بیشتری را به ارزیابی‌های ایمنی پیشرفته‌تر و دریافت نظرات بیشتر از متخصصان ایمنی اختصاص می‌دهیم.

دیپ ثینک در حال حاضر در معیارهایی مانند «2025 USAMO» برای ریاضی، «LiveCodeBench» برای کدنویسی و «MMMU» برای استدلال چندوجهی پیشرو است.

افزایش سرعت و کارآیی جمینای ۲.۵ فلش

این شرکت اعلام کرد جمینای ۲.۵ فلش که نسخه سبک‌تر مدل است، اکنون از ۲۰ تا ۳۰ درصد توکن کمتر استفاده می‌کند و در عین حال، استدلال، کدنویسی و وظایف چندوجهی را بهبود می‌بخشد. این نسخه اکنون در اپلیکیشن جمینای و پلتفرم‌های «ای‌آی استودیو»(AI Studio) و «ورتکس ای‌آی»(Vertex AI) در دسترس است.

انتظار می‌رود نسخه عمومی مدل به‌روزرسانی‌شده در اوایل ژوئن عرضه شود و نسخه ۲.۵ پرو نیز اندکی پس از آن از راه برسد.

انتهای پیام

منبع : ایسنا

آخرین خبر ها

پربیننده ترین ها

دوستان ما

گزارش تخلف

همه خبرهای سایت از منابع معتبر تهیه و منتشر می‌شود. در صورت وجود هرگونه مشکل از طریق صفحه گزارش تخلف اطلاع دهید.