به گزارش پایگاه خبری خبرآنی به نقل از پژوهشگاه ارتباطات و فناوری اطلاعات، همگام با طراحی و توسعه سامانه ذکاوت (ذائقهسنجی کاربران و تحلیل ترافیک)، سکوی پردازش زبان فارسی عامیانه توسعه داده شده و در این سامانه مورد بهره برداری قرار گرفت.
از آنجایی که متنهای منتشرشده در پیامرسان/ شبکههای اجتماعی به صورت عامیانه بوده و پردازش زبان فارسی یکی از ارکان پایهای تحلیل محتوای متنی محسوب میشود، لذا بر اساس دانش موجود در پژوهشگاه ICT، سکوی پردازش زبان فارسی عامیانه (محاورهای) توسط پروژه « طراحی و ایجاد بستر تحلیل ترافیک و ذائقه سنجی کاربران فضای مجازی» توسعه داده شد و طی پروژه توسعه ذکاوت در فاز اول عملیاتی شده است.
لیلا ربیعی مجری این پروژه و مدیر گروه توسعه سرویس و مدیریت منابع هوش مصنوعی پژوهشگاه ICT گفت: این سکو شامل ابزارهای تشخیص موجودیتهای نامدار (NER)، نرمالساز فارسی(Normalizer)، برچسبزن ادات سخن(POSTagger) و چانکر (chunker) است که به صورت API قابلیت ارائه خدمات را خواهد داشت. پیکرهای شامل ۵۰۰ هزار توکن فارسی از متون عامیانه شبکههای اجتماعی جهت توسعه ابزارهای برچسبزن ادات سخن و چانکر، توسط تیم زبانشناسی برچسبگذاری شده است.
پژوهشگاه ارتباطات و فناوری اطلاعات در آزمایشگاههای مرکز توسعه و نوآوری هوش مصنوعی جهت ارائه خدمت به دانشجویان و محققان این حوزه اعلام آمادگی میکند.