به گزارش پایگاه خبری خبرآنی به نقل از دانشگاه صنعتی امیرکبیر، دکتر سعیده ممتازی عضو هیات علمی دانشکده مهندسی کامپیوتر دانشگاه و سرپرست آزمایشگاه پردازش زبان طبیعی گفت: در یک نمونه همکاری موفق میان صنعت و دانشگاه، متخصصان مرکز تحقیقات هوش مصنوعی پارت و آزمایشگاه پردازش زبان طبیعی دانشگاه صنعتی امیرکبیر جامعترین و قدرتمندترین سیستم ارزیابی مدلهای زبانی فارسی (Open Persian LLM Leaderboard) را توسعه دادند.
وی افزود: با توسعه این سیستم قدرتمند ارزیابی مدلهای زبانی فارسی، زیستبوم هوش مصنوعی کشور از این پس به سنجهای دقیق و یکپارچه برای ارزیابی LLM های فارسی مجهز خواهند شد.
ممتازی با اشاره به ویژگیهای این سیستم ارزیابی مدلهای زبانی فارسی، اظهار کرد: این سیستم ارزیابی شامل بیش از ۴۰ هزار نمونه است که بخشی از آنها از چندین بنچمارک معتبر جهانی به فارسی برگردانده شده و بخشی دیگر در داخل کشور از پایه تهیه و برچسبزنی شدهاند.
این عضو هیات علمی دانشکده مهندسی کامپیوتر دانشگاه صنعتی امیرکبیر خاطر نشان کرد: دادگان ارزیابی برای این سیستم در حال افزایش و بهروزرسانی است تا ضریب دقت در ارزیابیها بهبود یابد.
به گفته وی مدل ارائه شده در این پروژه، در کنار برترین بنچمارکهای جهانی قرار میگیرد، ضمن اینکه بخشی از دادگان این سیستم ارزیابی (بنچمارک) هم اکنون به صورت متن باز در دسترس عموم قرار گرفته است.
متخصصان برای ارزیابی مدل زبانی خود و دیگران میتوانند به این آدرس مراجعه کنند.