ارائه روشی مبتنی بر یادگیری عمیق و واژه نامه حسی برای تحلیل احساسات متون فارسی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه فناوری اطلاعات، دانشکده مهندسی برق و کامپیوتر، دانشگاه سیستان و بلوچستان

2 گروه مهندسی کامپیوتر- دانشکده مهندسی برق و کامپیوترـ دانشگاه سیستان و بلوچستان ـ زاهدان ـ ایران ـ

چکیده

تحلیل احساسات یکی از شاخه‌های مهم پردازش زبان طبیعی است که هدف آن طبقه‌بندی متون بر اساس احساس و نگرش نویسنده متن است. در زبان فارسی، متون نوشته شده در شبکه‌های اجتماعی غالباً کوتاه، بدون ساختار و مملو از عبارات محاوره‌ای و غیررسمی هستند که این ویژگی‌ها باعث می‌شود کارایی الگوریتم‌های تحلیل احساسات به طور چشمگیری کاهش یابد. هدف این مقاله ارائه روشی مبتنی بر یادگیری عمیق و واژه‌نامه حسی برای تحلیل احساسات متون فارسی نوشته شده در شبکه‌های اجتماعی است. به دلیل این که اغلب واژه‌نامه‌‌های حسی موجود در زبان فارسی از لحاظ اندازه کوچک و فاقد عبارات محاوره‌ای و غیررسمی هستند، ابتدا روشی برای گسترش واژه‌نامه‌های حسی موجود با افزودن عبارات محاوره‌ای پرکاربرد در رسانه‌های اجتماعی که به کمک ChatGPT تعیین قطبیت شده‌اند ارائه می‌شود. سپس از ترکیب واژه‌نامه حسی و شبکه عصبی پیچشی دو کاناله برای تعیین قطبیت متون استفاده می‌شود. نتایج ارزیابی‌های انجام گرفته نشان می‌دهد که با گسترش واژه‌نامه‌های حسی موجود با دو روش پیشنهادی، صحت الگوریتم تحلیل احساسات به ترتیب 74/1 و 14/2 درصد افزایش می‌یابد که نشان‌دهنده موفقیت ChatGPT در تعیین قطبیت عبارات محاوره‌ای فارسی است. همچنین، بکارگیری ویژگی‌های مستخرج از واژه‌نامه حسی در یک شبکه عصبی پیچشی دوکاناله منجر به افزایش دقت دو مدل پایه موردبررسی به میزان 6/1 و 2/3 درصد می‌‌شود.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Proposing an approach based on deep learning and sentiment lexicon for Persian sentiment analysis

نویسندگان [English]

  • Samira Noferesti 1
  • Mahshid Miri 2
1 Information Technology Department, Faculty of Electrical and Computer Engineering, University of Sistan and Baluchestan
2 Dept. of Computer Engineering, Faculty of Electrical and Computer Engineering, University of Sistan and Baluchestan
چکیده [English]

Sentiment analysis is one of the important branches of natural language processing, which aims to classify texts with respect to the feelings and attitudes of the author of the text. In Persian, most of the available sentiment lexicons are small in size and lack slang expressions and informal words. These features significantly reduce the performance of sentiment analysis algorithms. This paper aims to present a method based on deep learning and sentiment lexicons for sentiment analysis of Persian texts written on social networks. Since most existing sentiment lexicons in Persian language are small in size and lack slang and informal expressions, first, two methods based on ChatGPT are proposed to expand the existing Persian sentiment lexicons by adding slang expressions that are widely used in social media. Then, the combination of the sentiment lexicon and dual-channel convolutional neural network (DC-CNN) is used to determine the polarity of texts. Experimental results show that by expanding the existing sentiment lexicons with the two proposed methods, the accuracy of the sentiment analysis algorithm increases by 1.74 and 2.14 percent, respectively, which indicates the success of ChatGPT in polarity classification of Persian slang expressions. Also, employing the features extracted from the sentiment lexicon in a DC-CNN leads to an increase in the precision of the two base models by 1.6 and 3.2 percent.

کلیدواژه‌ها [English]

  • Sentiment analysis
  • Polarity classification
  • Deep learning
  • Dual-channel CNN
  • Sentiment lexicon
  • Slang expressions