دوره 1، شماره 2 - ( پاییز و زمستان 91-زمان پایان: 1391 )                   جلد 1 شماره 2 صفحات 26-35 | برگشت به فهرست نسخه ها


XML English Abstract Print


1- دانشجوی کارشناسی ارشد ، zeinab.farahmandpoor@gmail.com
2- استاديار
چکیده:   (4201 مشاهده)
پیشرفت سریع ارتباطات اینترنتی و استفاده‌ی نادرست از ناشناس بودن متون آنلاین، باعث به وجود آمدن مسائل امنیتی شده است. هویت ناشناس ابزارهای اینترنتی مانند ایمیل‌ها، وبلاگ‌ها و وب‌سایت‌ها به روش‌های ارتباط مورد علاقه‌ای برای کاربردهای جنایی تبدیل شده است. روابط سیاسی و اجتماعی جهان باعث توجه زیادی به زبان فارسی شده است. که این موضوع خود موجب فراوانی متون فارسی در اینترنت گردیده است. در این مقاله یک روش هوشمند writeprint معرفی شده است که به شناسایی یک نویسنده فارسی زبان بر اساس سبک نوشتاری او کمک می‌کند. در این تحقیق از ویژگی‌های واژگانی، نحوی، معنایی و وابسته به کاربرد، برای شناسایی هویت استفاده شده است. و کارایی انواع مختلف این ویژگی‌ها و همچنین اثرات روش‌های دسته‌بندی KNN و Delta به همراه ترکیب این روش‌ها با الگوریتم ژنتیک روی دو پایگاه داده‌ی جمع‌آوری شده بررسی شده است. در کنار سایر ویژگی‌ها برای پیاده سازی روش پیشنهادی یک pos tagger طراحی شده است که از ساختار کلمات برای تشخیص اسم، صفت و قید استفاده می‌نماید. آزمایشات انجام شده در این تحقیق نشان دادند که در بین روش‌های دسته‌بندی بررسی شده، ترکیب KNN و الگوریتم ژنتیک دقت بالاتری را در تشخیص هویت مالک اثر ادبی تولید کرد.
متن کامل [PDF 513 kb]   (2325 دریافت)    
نوع مطالعه: پژوهشي | موضوع مقاله: تخصصي
دریافت: ۱۳۹۲/۵/۲۰ | پذیرش: ۱۳۹۲/۵/۲۳ | انتشار: ۱۳۹۲/۵/۲۱