Credit rating of bank customers using a new ensemble method based on support vector machine: a case study of Pasargad bank

Document Type : Original Article

Authors

1 Department of Mathematics, Ayatollah Boroujerdi University, Boroujerd, Iran

2 Deparment of Economics, Ayatollah Boroujerdi University, Boroujerd, Iran

Abstract

In recent years, credit rating and identifying good and bad customers have become critical issues for banks worldwide. The ability to grant facilities to good customers while avoiding bad ones, which leads to a reduction in bank arrears, has been a primary concern for bank managers. Credit rating systems have been developed to address this issue and provide an efficient solution. This paper presents a new ensemble model for credit ranking bank customers based on the support vector machine algorithm. First, the dataset is divided into several subsets using the bootstrap approach, and the support vector machine algorithm is then applied to each subset to form several models. Finally, voting is performed among these models to obtain a final model. In order to show the accuracy of the ensemble model, the data of 2218 Pasargad Bank customers, including 14 explanatory attributes, are evaluated using the proposed method. Based on various criteria, the results obtained on Pasargad Bank data confirm the superiority of the ensemble support vector machine method over conventional methods such as support vector machine and random forest. The type II errors, which is the proportion of bad customers who are wrongly predicted to be good ones in the proposed ensemble method with the linear core, is 17% less than the conventional support vector machine method and 15% less than the random forest method.

Keywords


[1] ابوالحسنی م. ج.، صمدی س. و واعظ‌برزانی م.، «تعیین اثرات کوتاه‌مدت و بلندمدت متغیرهای کلان اقتصادی و بانکی بر حجم مطالبات معوق بانک‌های پذیرفته شده در بورس اوراق بهادار تهران (1396-1386)»، مطالعات اقتصادی کاربردی ایران، جلد 10، شماره 37، ص. 201-233، 1400.
[2] بزرگ‌اصل م. و صمدی م. ت.، «رابطه بین ریسک نقدینگی و ریسک اعتباری و تاثیر آن بر ناپایداری مالی در صنعت بانکداری ایران»، فصلنامه پژوهش‌های پولی-بانکی، جلد 10، شماره 33، ص. 509-531، 1396.
[3] فلاح‌شمس م. و مهدوی‌راد ح.، «طراحی مدل اعتبارسنجی و پیش‌بینی ریسک اعتباری مشتریان تسهیلات لیزینگ (مورد مطالعه: شرکت لیزینگ ایران خودرو)»، پژوهش‌نامه اقتصادی (رویکرد اسلامی-ایرانی)، جلد 12، شماره 44، ص. 213-234، 1391.
[4] عیسی‌زاده س. و عریانی ب.، «رتبه‌بندی مشتریان حقوقی بانک‌ها بر حسب ریسک اعتباری به روش تحلیل پوششی داده‌ها: مطالعه موردی شعب بانک کشاورزی»، فصلنامه پژوهش‌ها و سیاست‌های اقتصادی، شماره 55، ص. 86-59، 1389.
[5] کشاورزحداد غ.‌‌ و آیتی گازار ح.، «مقایسه کارکرد مدل لاجیت و روش درخت‌های طبقه‌بندی و رگرسیونی در فرآیند اعتبارسنجی متقاضیان حقیقی برای استفاده از تسهیلات بانکی»، پژوهش‌های رشد و توسعه پایدار (پژوهش‌های اقتصادی)، شماره 4، ص. 71-97، 1386.
[6] مهرآرا م.، موسایی م.، تصوری م.‌‌ و‌‌ حسن‌زاده ا.، «رتبه‌‌بندی اعتباری مشتریان حقوقی بانک پارسیان»، فصل‌نامه مدل‌سازی اقتصادی، جلد 3، شماره 9، ص. 150-121، 1388.
[7] Thomas L. C., "A survey of credit and behavioral scoring: Forecasting financial risks of lending to customers", International Journal of Forecasting, 16(2): 149-172, 2000.
[8] Kim Y. S. and Sohn S. Y., "Managing loan customers using misclassification patterns of credit scoring model", Expert Systems with Applications, 26(4): 567-573, 2004.
[9] پورزمانی ز. و کلانتری ح.، «مقایسه‌ی قدرت پیش‌بینی بحران مالی توسط تکنیک‌های مختلف هوش مصنوعی»، پژوهش‌های حسابداری مالی و حسابرسی، شماره 17، ص. 64-33، 1392.
[10] Shin K. S. and Lee Y. J., "A Genetic Application in Bankruptcy Prediction Modelling", Expert Systems with Applications, 23(3): 321-328, 2002.
[11] Reichert K.  A., Cho C. C., and Wagner M. G., "An examination of the conceptual issues involved in developing credit-scoring models", Journal of Business and Economic Statistics, 1(2): 101-114, 1983.
[12] Huang C. l., Chen M. C., and Wang, C., "Credit scoring with a data mining approach based on support vector machines", Expert Systems with Applications, 33(4): 847-856, 2007.
[13] طلوعی‌اشلقی ع.، نیکومرام ه. و مقدوری‌شربیانی ف.، «طبقه‌بندی متقاضیان تسهیلات اعتباری بانک‌ها با استفاده از تکنیک ماشین بردار پشتیبان»، مجله پژوهش های مدیریت، شماره 84، 1389.
[14] محمدیان‌حاجی‌کرد ا.، اصغرزاده‌زعفرانی م. و امام‌دوست م.، «بررسی ریسک اعتباری مشتریان حقوقی با استفاده از مدل ماشین بردار پشتیبان و مدل هیبریدی الگوریتم ژنتیک- مطالعه موردی‌ بانک تجارت»، مهندسی مالی و اوراق بهادار، جلد 7، شماره 27، ص. 17-32، 1395.
[15] Tang L., Cai F., and Ouyang Y., "Applying a nonparametric random forest algorithm to assess the credit risk of the energy industry in China", Technological Forecasting and Social Change, 144: 563-572, 2019.
[16] آرخی ص. و ادیب‌نژاد م.، «ارزیابی کارایی الگوریتم‌های ماشین بردار پشتیبان جهت طبقه‌بندی کاربری اراضی با استفاده از داده‌های ماهواره‌ای ETM+ لندست (مطالعه موردی: حوزه سد ایلام)»، تحقیقات مرتع و بیابان ایران، جلد 18، شماره 3، ص. 420-440، 1390.
[17] نوازی س. و رسول‌زادگان ع.، «ارائه یک روش جدید دو مرحله‌ای جهت تخمین هوشمند سن افراد»، مجله محاسبات نرم، جلد 2، شماره 2، ص. 52-61، 1392.
[18] وثیقی‌ذاکر ا. و جلیلی س.، «پیش‌بینی ژن‏‌های بیماری با استفاده از دسته‌بند تک‌کلاسی ماشین بردار پشتیبان»، مجله محاسبات نرم، جلد 4، شماره 1، ص. 74-83، 1394.
[19] ویسی ه.، قایدشرف ح. و ابراهیمی م.، « بهبود کارایی الگوریتم‌های یادگیری ماشین در تشخیص بیماری‌های قلبی با بهینه‌سازی داده‌ها و ویژگی‌ها»، مجله محاسبات نرم، جلد 8، شماره 1، ص. 70-85، 1398.
[20] خسروی ا.، عبدالمالکی ه. و فیاضی م.، « پیش‌بینی وضعیت تحصیلی متقاضیان پذیرش‌شده دانشگاه، مبتنی بر داده‌های آموزشی و پذیرشی با استفاده از تکنیک‌های داده کاوی»، مجله محاسبات نرم، جلد 9، شماره 2، ص. 94-113، 1399.
[21] Bao W., Lianju N., and Yue K., “Integration of unsupervised and supervised machine learning algorithms for credit risk assessment”, Expert Systems with Applications, 128: 301-315, 2019.