انطباق دامنه ماشین بردار پشتیبان دوقلو با ربع کره تطبیقی وزن‌دار: روشی بدون نیاز به داده منبع و مقاوم در برابر نویز

نوع مقاله : مقاله پژوهشی

نویسندگان

1 گروه مهندسی کامپیوتر- دانشکده فنی و مهندسی ـ دانشگاه تربت حیدریه

2 دانشگاه سجاد

چکیده

مشکل طبقه‌بندی داده‌های با برچسب کم را می‌توان با استفاده از دانش کسب شده از دامنه دیگر و انطباق آن با دامنه هدف برطرف کرد. با این حال، بیشتر این روش‌ها در محیط‌های دارای نویز، پایداری و مقاومت خود را از دست می‌دهند. این مقاله با هدف
مدلسازی ابهام در مسائل طبقه‌بندی دودوئی و غیرقابل تمایز بودن داده‌ها در فرآیند انطباق دامنه ارائه شده است. در مدل دوقلوی پیشنهادی برای هر کدام از داده‌های منبع و هدف دو طبقه‌بندی‌کننده ماشین بردار پشتیبان ربع کره درنظر گرفته شده و دو ربع کره به گونه‌ای آموزش می‌بینند که به‌جای حل یک مسأله برنامه‌ریزی درجه دوم (QPP)، دو معادله خطی حل شوند. در نتیجه، پیچیدگی زمانی مدل کاهش یابد. همچنین با استفاده از نظریه مجموعه‌های فازی راف در وزن‌دهی، نمونه‌های با اطمینان بالا در انطباق دامنه و طبقه‌بندی تاثیر بیشتری خواهند داشت ضمن آن‌که کلاس‌های اقلیت که معمولاً در داده‌ها کمتر حضور دارند، در فرآیند ساخت مدل نادیده گرفته نشوند. از نقاط قوت مدل پیشنهادی این است که پس از ساخت و آموزش طبقه‌بندی‌کننده‌های دامنه منبع، دسترسی به داده‌های منبع دیگر لازم نیست و تنها وجود پارامترهای ربع کره‌های دامنه منبع کفایت می‌کند. کارایی مدل پیشنهادی در مقایسه با روش‌های رقیب، در پانزده وظیفه برگرفته شده از دو مجموعه‌داده معیار ارزیابی شده است. نتایج آزمایش‌ها نشان می‌دهد که مدل پیشنهادی از نظر دقت طبقه‌بندی و زمان محاسباتی عملکرد برتری دارد. علاوه بر این، تحلیل نویز نشان می‌دهد که مدل پیشنهادی از پایداری بالایی در برابر نویز برخوردار است.

کلیدواژه‌ها

موضوعات


عنوان مقاله [English]

Adaptive Weighted Twin Quarter-Sphere SVM: A Source-Free and Robust to Noise Domain Adaptation Method

نویسندگان [English]

  • Mona Moradi 1
  • Javad Hamidzadeh 2
1 Department of Computer Engineering, University of Torbat Heydarieh, Torbat Heydarieh
2 Faculty of computer engineering and information technology, Sadjad University,
چکیده [English]

The challenge of data classification by insufficient labeled data can be solved by domain adaptation techniques and leveraging external knowledge. However, most of these techniques lose robustness in noisy environments where the labels and features become corrupted. Aiming to model the indiscernibility and vagueness in domain adaptation, the present paper introduces a twin model for domain adaptation that combines the quarter-sphere support vector machine data description (QS-SVM) with a new fuzzy rough set-based weighting approach. The proposed model learns two small hyperspheres per domain regarding binary classification by solving two linear equations rather than one Quadratic Programming Problem (QPP), unlike standard QS-SVM. Consequently, the time complexity is reduced by this strategy. The Benefit of the fuzzy rough set is that only the high-confidence samples influence the adaptation and classification results of the hyperspheres. The strength of the proposed model is that after constructing and training the source domain classifiers, accessibility to the source domain data is not required, and the existence of only the source domain hyperspheres is sufficient. Also, the proposed fuzzy rough set-based sample weighting method ensures that the minority classes that are often underrepresented in the dataset are not overlooked when constructing the model. The effectiveness of the proposed model has been compared to the state-of-the-art methods on fifteen tasks taken from two benchmark datasets. The experimental results demonstrate the superiority of the proposed model over state-of-the-art ones in terms of classification accuracy and computational time. Besides, the noise analysis proves the robustness of the proposed model.

کلیدواژه‌ها [English]

  • Classification
  • Domain adaptation
  • Fuzzy rough set theory
  • Noisy data
  • Quarter-sphere SVM
  • Transfer learning