تحلیل احساسات رمزارزها با یادگیری انتقالی شات صفر

نوع مقاله : مقاله پژوهشی

نویسندگان

گروه کامپیوتر و نرم‌افزار، دانشکده مهندسی کامپیوتر، دانشگاه یزد، یزد، ایران.

چکیده

تحلیل احساسات جنبه‌محور ‌توئیت‌ها با شبکه‌های عصبی عمیق بسیار مورد توجه است. با این حال، این شبکه‌‌ها برای کارایی مطلوب نیازمند دادگان غنی می‌باشند. بنابراین، در این مطالعه از یادگیری انتقالی عمیق شات صفر و دادگان میان‌دامنه‌ای برای افزایش غنای منابع آموزشی در دامنه هدف استفاده شده است. در این پژوهش، ابتدا توئیت‌های تاثیرگذاران رمزارزها جمع‌آوری شده و سپس، از ترکیب شبکه‌ عصبی عمیق، لایه توجه و شبکه‌ پیش‌آموزش‌دیده دستیل‌برت برای تحلیل احساسات جنبه‌محور استفاده شده است. نقشه حرارتی لایه توجه نشان می‌دهد استفاده از این لایه بعد از مدل‌های عمیق توانسته به برجسته‌سازی کلمات جنبه کمک کند. در یادگیری انتقالی شات صفر، مدل هیچ نمونه‌ای از داده‌های هدف دارای برچسب را در اختیار ندارد و آموزش با دادگان میان دامنه‌ای انجام می‌شود. علاوه بر این، استفاده از دادگان میان‌دامنه‌ای و انتخاب بهینه آنها با از ضریب شباهت پیرسون در شرایط کمبود داده غنی سبب کاهش انتقال منفی شده و همچنین حساسیت مدل را به محتوی زمینه متن کمک می‌کند. همچنین، برای حل مشکل دادگان نامتوازن از رویکرد نمونه‌برداری بیش از حد اقلیت مصنوعی استفاده شده است. یافته‌های تجربی نشان می‌دهد، مدل در مقایسه با پژوهش‌های پیشین، به صورت میانگین دقت و F1 را بر روی مجموعه ‌داده بنچ‌مارک SemEval در حدود 2 درصد افزایش داده و میانگین نرخ ROC-AUC به 86.35 درصد رسیده است. همچنین، در این پژوهش از نرخ یادگیری وفق‌پذیر استفاده شده که سبب همگرایی سریع‌تر مدل می‌شود. انتخاب ابرپارامترهای شبکه نیز‌ با روش گریدی صورت گرفته که موجب وفق‌پذیری بیشتر مدل با دامنه هدف شده است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Sentiment analysis of cryptocurrencies with Zero-shot transfer learning

نویسندگان [English]

  • Kia Jahanbin
  • Mohammad Ali Zare Chahooki
Department of Computer Engineering, Yazd University, Yazd, Iran.
چکیده [English]

Aspect-based sentiment analysis of tweets with deep neural networks is of great interest. However, these networks require rich data for optimal performance. Therefore, this study uses zero-shot deep transfer learning and cross-domain data to increase the richness of educational resources in the target domain. First, we collected the tweets of cryptocurrency influencers and then used the combination of the deep neural network, attention layer, and pre-trained Distillbert for aspect-based sentiment analysis. The heat map of the attention layer shows that using this layer after deep models has helped highlight the aspect words. In zero-shot transfer learning, the model does not have samples of the labelled target data, and training only uses cross-domain data. In addition, using cross-domain data and their optimal selection with Pearson's similarity coefficient in conditions of lack of rich data reduces the negative transfer. It helps the model's sensitivity to the context of the text. Also, the Synthetic Minority Over-sampling Technique has been used to solve the problem of unbalanced data. The experimental findings show that the model has increased the average accuracy and F1 on the SemEval benchmark dataset by about 2%, and the average ROC-AUC rate has reached 86.35% compared to previous research. Also, we used the adaptive learning rate to accelerate the model's convergence and Grid Search to select the network's hyperparameters, making the model more adaptable to the target domain.

کلیدواژه‌ها [English]

  • Cryptocurrency aspect-briented sentiment analysis
  • Zero-shot transfer learning
  • Pre-trained deep neural networks
  • attention layer
  • Grid search
  • Adaptive learning rate