ارزش‌گذاری ارجاعات غیر‌مستقیم در شبکه‌های استنادی با استفاده از تلفیق داده‌ها

نویسندگان

دانشگاه صنعتی سجاد

چکیده

انجام هر فعالیت علمی نیازمند آگاهی از فعالیت‌های مرتبط پیشین است. شبکه‌های استنادی از جمله شبکه‌هایی هستند که هر سند در آن، به‌عنوان حلقه‌ای از یک زنجیره با اسناد قبلی و بعدی خود مقایسه می‌شود و اسنادی که بیشترین تعداد ارجاعات را دریافت کرده‌اند به‌عنوان مؤثرترین اسناد آن حوزه شناخته می‌شوند. تعداد استنادهای دریافتی هر مدرک نشان‌دهنده جایگاه آن در تحقیقات انجام‌شده در آن حوزه است. مقالاتی با تعداد استنادهای دریافتی زیاد، در تحقیقات آن حوزه دارای سهم قابل توجهی هستند. بنابراین ضرورت رتبه‌بندی اسناد با در نظر گرفتن‌ ویژگی‌های مهم آن‌ها و ساختار شبکه‌های استنادی تا حد زیادی احساس می‌شود. یک چالش پیش رو در این بخش، وجود ارجاعات غیرمستقیم و تعیین ویژگی‌های مناسب است که باعث ایجاد پیچیدگی در این رتبه‌بندی می‌شود. در نتیجه، ارائه راهکاری که بتواند تأثیر چنین ارجاعاتی را به شکل مناسبی لحاظ کند، دارای اهمیت است. در این مقاله روشی به‌منظور ارزش‌گذاری بر روی اسناد با استفاده از برخی معیارهای تعریف‌شده در شبکه‌های استنادی ارائه شده است. ترکیب چندین معیار به‌دست‌آمده از این شبکه‌ها موجب حاصل شدن نتایج بهبود‌یافته و دقیق‌تری می‌شود. لذا روش پیشنهادی به کمک ترکیب ویژگی‌ها و تلفیق داده‌ها و با بهره‌گیری از روش عملگر میانگین وزنی مرتب‌شده، امتیاز اسناد را محاسبه نموده و رتبه‌بندی آن‌ها را انجام می‌دهد. رتبه‌بندی طبق معیار رتبه‌ صفحه با به‌کارگیری ویژگی‌های شبکه‌های استنادی انجام شده است و روش تلفیق داده‌ها با روش‌های دیگر مقایسه شده که نتایج حاکی از عملکرد بهتر روش تلفیق داده‌ها دارد. مقایسه خطای رتبه‌بندی در مقایسه با یک روش مرجع با کاهش متوسط خطای حدود دو درصد در کل آزمایش‌ها نیز این نتایج را تأیید می‌کند.

کلیدواژه‌ها


عنوان مقاله [English]

Valuing Indirect Citations in Citation Networks using Data Fusion

نویسندگان [English]

  • Mehdi Salkhordeh Haghighi
  • Fatemeh Sajedi
چکیده [English]

Any scientific activity requires awareness of previous related activities. Citation networks are the networks in which each document is compared as a link of a chain with its previous and next documents, and the documents with the highest number of citations are considered as the most effective ones in a domain. Most of the introduced methods use direct citations for valuing the documents. One of the challenges in ranking documents are indirect citations and determining effective features to compute the ranks. The presented method uses not only direct but also indirect citations for the valuing process. In this research, several measures for analyzing citation networks are introduced. The combination of these measures and using a data fusion method will improve the way by which documents are valued and ranked. In the presented method, an ordered weighted averaging fusion method is used to determine values based on the direct and indirect citations computed by some defined measures. Through some experiments, the presented method has been compared with some other fusion methods, which results indicate the effectiveness of our method.
 

کلیدواژه‌ها [English]

  • Ordered Weighted Averaging operator
  • Citation Networks
  • OWA
  • Data fusion
  • Document ranking
  1. [1] M. newman, “Coauthorship networks and patterns of scientific collaboration,” proceedings of the national academy of sciences, جلد 101, pp. 5200-5205, 2004. [2] M. Nan, G. Jiancheng و Z. Yi, “Bringing PageRank to the citaion Analysis,” information processing and management , جلد 44, pp. 800-810, 2008. [3] p. Paul, V. Kumar, p. Chudhury و s. Nandy, “Temporal analysis of author ranking using citation-collaboration network,” in communication systems and networks, pp. 1-6, 2015. [4] D. Christopher j, B. Pateman و K. Alaster, “A citation network analysis of lithic microwear reaserch,” جلد 7, pp. 54-62, 2018. [5] F. A. Massucci و D. Docampo, “Measuring the academic reputation through citation networks via pagerank,” informetrics, جلد 13, pp. 185-201, 2019. [6] H. Yo-lin, N. James و W. Xi-Zhao, “Owa operator based link perdiction ensemble for social network,” expert systems with applications, جلد 42, شماره 1, pp. 21-50, 2015. [7] M. Marriana و A. Emrouznejad, “The value of indirect ties in citation networks:SNA analysis with OWA operator weights,” Inf science, جلد 115, 2015. [8] D. G. Gonzalez, “Combined social networks and data envelopment analysis for ranking,” European Journal of Operational Research, 2017. [9] K. Murali, D. Rama Koti Reddy و R. Mulaveesala, “Application of image fusion for the IR images in frequency modulated thermal wave imaging for Non Destructive Testing (NDT),” Materials Today: Proceedings, جلد 5, pp. 544-549, 2018. [10] J. M. Merig´o, A. M. Gil-Lafuente, D. Yu و C. Llopis-Albert, “Fuzzy decision making in complex frameworks with generalized aggregation operators,” Applied Soft Computing, 2018. [11] L. Kuncheva, Combining Pattern Classifiers, John Wiley & Sons, 2014. [12] C. N. Taylor و A. N. Bishop, “Homogeneous Functionals and Bayesian Data Fusion with Unknown Correlation,” Information Fusion, 2018. [13] R. Yager, “An ordered weighted Averaging Aggregation operators in multicritria Decision making,” inform sci, جلد 31, pp. 107-139, 1998. [14] A. Emrouznejad و G. Amin, “Improving minimax disparity model to determine the OWA operator weights,” Information science , جلد 180, pp. 1477-1485, 2010. [15] Z. Xu, “An Overview of Methods for Determining OWA Weights,” International Journal of Intelligent Syatems, جلد 20, p. 843–865, 2005. [16] W. Ligeng و L. Sifeng, “A Model to Determine Owa Weights and Its Application in Energy Technology Evaluation,” international journal of inteeligent systems, جلد 30, pp. 798-806, 2015. [17] R. Fuller و P. Majlender, “An analytic approach for obtaining maximal entropy OWA operator weights,” Fuzzy sets and systems , جلد 136, pp. 203-215, 2003. [18] M. Ailem, F. Role و M. Nadif, “Graph Modularity Maximization as an Effective Method for Co-clustering Text Data,” Knowledge-Based Systems, 2016. [19] M. Changat, P. G. Narasimha-Shenoi و G. Seethakuttyamma, “Betweenness in graphs: A short survey on shortest and induced path betweenness,” AKCE International Journal of Graphs and Combinatorics, 2018. [20] M. Salkhordeh Haghighi, A. Vahedian و H. Sadoghi Yazdi, “Creating and measuring diversity in multiple classifier systems using support vector data description,” Applied Soft Computing, جلد 11, شماره 8, pp. 4931-4942, 2011. [21] J. Gehrke, . P. Ginsparg و . J. M. Kleinberg, “High-energy physics citation network,” Stanfortd University, 2003. [درون خطی]. Available: https://snap.stanford.edu/data/cit-HepPh.html. [22] Y. Wang و C. Parkan, “A minimax disparity approach for obtaining OWA operator weights,” Information science , جلد 175, pp. 3356-3363, 2005.