بکارگیری مدل تحلیل احساسات در سطح حروف مبتنی بر شبکه‌ی عصبی روی نظرات فارسی ثبت شده در شبکه‌های اجتماعی و فروشگاه‌های اینترنتی

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی برق و کامپیوتر، دانشگاه خوارزمی ، تهران، ایران

2 مرکز آموزش عالی فنی و مهندسی بوئین زهرا، گروه مهندسی برق و کامپیوتر، بوئین زهرا، قزوین، ایران

چکیده

امروزه با توجه به تمایل روز افزون مردم برای خرید اجناس از طریق فروشگاه‌های اینترنتی و شبکه‌های مجازی، شاهد افزایش داده‌های بدون ساختار مانند متن در سطح اینترنت هستیم. از این رو، پردازش متون و توسعه‌ی الگوریتم‌های کارآمد جهت استخراج دانش، توجه پژوهشگران حوزه‌ی علوم داده در بسترهای مذکور را به خود جلب کرده است. از رویکردهای پردازش متن می‌توان به موضوع دسته‌بندی جملات به گروه‌های احساسی متفاوت با استفاده از الگوریتم‌ها و روش‌های گوناگون اشاره کرد. در پژوهش حاضر، چارچوبی برای دسته‌بندی نظرات، مبتنی بر احساسات کاربران توسعه داده شده است که از پردازش در سطح حروف بهره می‌برد. از این‌رو در چارچوب پیشنهادی، از معماری تعبیه از مدل‌های زبانی استفاده شده است که لایه‌های چهارگانه‌ی تعبیه (جهت انتقال حروف به فضای برداری)، پیچش یک بُعدی (جهت استخراج بردار ویژگی برای هر واژه)، نگاشت و شبکه‌ی عصبی بازگشتی را شامل می‌شود. در چارچوب پیشنهادی، ابتدا با بکارگیری لایه‌ی تعبیه در سطح حروف، برداری ثابت برای آن‌ها تعیین شده است. سپس، مبتنی بر عملگرهای پیچش یک بعدی که به صورت موازی بکارگیری شده‌اند، ارتباط معنایی و منطقی بین حروف تشکیل‌دهنده‌ی هر واژه بدست آمده و بردار 128 بعدی برای هر لغت، حاصل می‌شود. پس از دستیابی به بردارهای واژگان، با استفاده از دو معماری شبکه‌های عصبی بازگشتی، ارتباط بین واژگان کشف شده و احساس مرتبط با دیدگاه، تعیین می‌شود. نتایج حاصل از بکارگیری مدل پیشنهادی بر روی مجموعه‌ی نظرات مبتنی بر سنجه‌های Accuracy و F-score، به ترتیب 79.87% و 79.9% می‌باشد.

کلیدواژه‌ها


عنوان مقاله [English]

Applying Character-Level Neural Network-Based Sentiment Analysis Model on Persian Comments of the Social Media-Online Store Platforms

نویسندگان [English]

  • Omid Khalaf Beigi 1
  • Seyed Alireza Bashiri Mosavi 2
  • Sina Gharloghi 2
1 Department of Electrical and Computer Engineering, Kharazmi University, Tehran, Iran
2 Department of Electrical and Computer Engineering, Buein Zahra Technical University, Buein Zahra, Qazvin, Iran
چکیده [English]

Nowadays, due to people being more willing to shop online through online stores and social media, we are facing the growth of unstructured data like texts on the internet. Hence, text processing and the development of optimal algorithms for extracting knowledge have drawn scholar’s attention to this field. One of the aspects of the text processing field is classifying texts in the form of classes of various sentiments using different algorithms. We propose a novel framework to classify the comments based on the user’s sentiment performed in the character-level scenario. Hence, the proposed framework is mounted on the architecture of embedding from the language model triggered by the quad-layer, namely embedding, one-dimensional convolution, the map, and the recurrent neural network. In the proposed framework, first, by using the embedding layer at the level of the character, a constant vector is assigned to them. Next, the semantic and logical relation between the characters per word for surviving word-specific 128-dimensional vectors is extracted by exerting the parallel-oriented one-dimensional convolution operators. After obtaining vectors, based on two recurrent neural network architectures, the relationship between the discovered words and the comment-specific sentiment is determined. The obtained results show that the proposed framework has an Accuracy of 79.87% and a F-score of 79.9% for comments class labeling.

کلیدواژه‌ها [English]

  • Natural Language Processing
  • Sentiment Analysis
  • Context Based Model
  • Deep Neural Network
  • Internet Platforms

مقالات آماده انتشار، پذیرفته شده
انتشار آنلاین از تاریخ 18 اردیبهشت 1402
  • تاریخ دریافت: 24 شهریور 1401
  • تاریخ بازنگری: 01 فروردین 1402
  • تاریخ پذیرش: 16 اردیبهشت 1402