نوع فایل:WORD
تعداد صفحه:100
نگارشگر:محمد رنجبر
قابلیت ویرایش: دارد
امروزه با افزایش روزافزون حجم اطلاعات، وجود سیستمی برای دسته بندی خودکار متون ضروری به نظر میرسد. در این پروژه سیستم جدیدی برای دسته بندی خودکار متون فارسی ارائه شده است.
این سیستم شامل دو مرحله اصلی است: مرحله پردازش و مرحله دسته بندی.
در مرحله اول با پردازش داده های آموزشی بهترین ویژگی های نماینده هر کلاس استخراج شده و برای آموزش دسته بندی کننده مبتنی بر ماشین بردار پشتیبان استفاده میشوند و سپس در فازدسته بندی، ماشین بردار پشتیبان قادر خواهد بود دادههای تست را به یکی از کلاسهای آموزش داده شده نسبت دهد. در روش ارائه شده دراین مقاله برای افزایش دقت دسته بندی کننده از دانش معنایی موجود در گنجواژه بهره گرفته شده است.
به این ترتیب که ویژگیهای مربوط به هر کلاس میتواند با استفاده از گنجواژه گسترش یابد. برای ارزیابی روش پیشنهادی مجموعه داده آموزشی و تست لازم شامل متون فارسی از طرق مختلف مانند وب و پیکره هایی به زبان فارسی جمع آوری و برچسب زنی شده و تأثیر تعداد کلاسهای متفاوت و حجم مجموعه داده آموزشی در میزان بهبود حاصل از استفاده گنجواژه مورد آزمایش و بررسی قرار گرفته است. نتایج آزمایشها حاکی از بهبود عملکرد با استفاده از این روش میباشد. همچنین قابل مشاهده است که به کارگیری این روش در حالت کمبود دادههای آموزشی تأثیر قابل توجهی در افزایش کارایی دارد.
در دسته بندی متون بطور معمول از کلمات متن به عنوان خصیصه های آن متن استفاده می شود در نتیجه روشهای دسته بندی متون با تعداد زیادی خصیصه مواجه می باشند به منظور کاهش تعداد...
فهرست مطالب
1-1- کاربردهای مهم پردازش تصویر
1-2- مراحل اساسی پردازش تصویر
1-3- بهبود کیفیت تصویر
1-4- بخش بندی تصویر
1-5- فشرده سازی تصویر
فصل دوم: شبکه های عصبی
2-1- مقدمه ای بر شبکه های عصبی
2-2- شبکه عصبی چیست
2-3- هدف از شبکه های عصبی مصنوعی
2-4- ویژگیهای شبکه های عصبی
2-5- مراحل طراحی شبکه
2-6- نرمافزارها و سخت افزارهای شبکههای عصبی
2-7- مزایا و محدودیت های شبکه عصبی
2-8- برخی اهم کاربرد شبکههای عصبی در مباحث مهندسی صنایع
2-9- مدلسازی و بهینه یابی
2-10- مفهوم هوش
2-11- مدیریت بر تغییرات از طریق یافته های علم عصب شناسی
فصل سوم : طبقه بندی متون
3-1- مروری بر دیدگاه ها و رو شهای موجود طبقه بندی متون
3-2- روش پیشنهادی برای طبقه بندی متون فارسی
3-3- آماده سازی متون سیستم طبقه بند متون فارسی
3-4- پیش پردازش سیستم طبقه بند متون فارسی
3-5- تولید ویژگی متون در سیستم طبقه بند متون فارسی
3-6- انتخاب ویژگی متون در سیستم طبقه بند متون فارسی
فصل چهارم : قطعه بندی عبارات متون فارسی با استفاده از شبکه های عصبی
4-1- روش ارائه شده
4-2- قطعه بندی عبارات متون فارسی
4-3- استفاده از شبکه های عصبی برای دسته بندی عبارات فاز 4
فصل پنجم : دسته بندی متون
5-1- مقدمه ای بر زبانهای طبیعی
5-2 – تعریف ها
5-3- زبان فارسی
5-4- سیستم دسته بندی خودکار متون فارسی
5-5- پیش پردازش
5-6- تحلیل واژگانی
فصل ششم : تشخیص متون چاپی
6-1- پیش زمینه
6-2- کسب تصویر و ملایم سازی آن
6-3- تشخیص متون چاپی
6-4- الگوریتم ارائه شده
6-5- نتیجه گیری
فصل هفتم :الگوریتم KNN
7-1- الگوریتم KNN
7-2- تحلیل الگوریتم :KNN
7-3- دسته بندی متن با استفاده از الگوریتم KNN
7-4- K نزدیک ترین همسایه
فصل هشتم : جمع بندی و نتیجه گیری و منابع
جمع بندی و نتیجه گیری
منابع و مراجع ....
پروژه روشهای دسته بندی متون فارسی