دوره 5، شماره 1 - ( سال پنجم-بهار و تابستان 1395 )                   جلد 5 شماره 1 صفحات 14-25 | برگشت به فهرست نسخه ها


XML English Abstract Print


Download citation:
BibTeX | RIS | EndNote | Medlars | ProCite | Reference Manager | RefWorks
Send citation to:

Nabiloo M, Daneshpour N. A clustering algorithm for categorical data with combining measures. SCJ. 2017; 5 (1) :14-25
URL: http://scj.kashanu.ac.ir/article-1-243-fa.html
نبی لو مریم، دانشپور نگین. ارائه یک الگوریتم خوشه بندی برای داده های دسته ای با ترکیب معیارها. نشریه علمی ترویجی محاسبات نرم. 1395; 5 (1) :14-25

URL: http://scj.kashanu.ac.ir/article-1-243-fa.html


1- استادیار دانشگاه تربیت دبیر شهید رجایی، تهران- لویزان- خیابان شعبانلو- دانشگاه تربیت دبیر شهید رجایی ، ndaneshpour@srttu.edu
چکیده:   (374 مشاهده)

خوشه بندی یکی از تکنیک های اصلی داده کاوی است. خوشه بندی فرایندی است که مجموعه داده ها را داخل گروه هایی طبقه بندی می کند. در خوشه بندی داده های موجود در یک خوشه بیشترین شباهت را به هم دارند و داده های موجود در دو خوشه متفاوت بیشترین تفاوت را با هم دارند. الگوریتم های خوشه بندی با توجه به نوع داده ها به دو دسته تقسیم می شوند: الگوریتم های خوشه بندی داده های عددی و الگوریتم های خوشه بندی داده های دسته ای. الگوریتم های خوشه بندی داده های دسته ای به دلیل ماهیت و کاربرد این داده ها نسبت به الگوریتم های خوشه بندی داده های عددی از اهمیت بالایی برخوداراند. هر یک از این الگوریتم ها با توجه به نوع داده (عددی یا دسته ای) از معیارهای شباهت متفاوتی در خوشه بندی استفاده می کنند. در این مقاله یک روش جدید در خوشه بندی با استفاده از ترکیب معیارهای شباهت Overlay و Jaccard روی یک الگوریتم سلسله مراتبی برای داده های دسته ای پیشنهاد می شود. معیار Overlay تفاوت بین داده ها را به صورت صفر و یک بیان می کند که این امر باعث از بین رفتن برخی اطلاعات مربوط به داده ها می شود. معیار Jaccard نیز اگر به تنهایی برای اندازه گیری شباهت میان داده ها استفاده گردد بیشتر خوشه ها در یک ناحیه از مجموعه داده ها انتخاب می شوند. بنابراین در این مقاله ترکیبی از دو معیار به کار رفته است.آزمایشات نشان می دهد که روش ارائه شده در این مقاله توانسته است که نتایج حاصل از خوشه بندی را بهبود ببخشد و بطور متوسط 10 درصد بهبود بر روی هر فاکتور ارزیابی داشته است.

متن کامل [PDF 395 kb]   (196 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: ۱۳۹۴/۲/۱۵ | پذیرش: ۱۳۹۴/۱۰/۲۵ | انتشار: ۱۳۹۵/۱۲/۱۵

ارسال نظر درباره این مقاله : نام کاربری یا پست الکترونیک شما:
کد امنیتی را در کادر بنویسید

ارسال پیام به نویسنده مسئول


کلیه حقوق این وب سایت متعلق به مجله محاسبات نرم می باشد.

طراحی و برنامه نویسی : یکتاوب افزار شرق

© 2015 All Rights Reserved | Soft Computing Journal

Designed & Developed by : Yektaweb