نوع فایل: word
قابل ویرایش 111 صفحه
چکیده:
گراف ها در مطالعات کلاسیک معمولا کوچک و منظم هستند. در مطالعات جدید تکیه بر پردازش رایانه ها راه برای مطالعه ی گراف های بزرگ و نامنظم که مدل های بهتری برای شبکه های واقعی هستند ، باز نموده است. بسیاری از مباحث نظریه ی گراف، امروزه آماری تر و الگوریتمیک تر از گذشته شده است. این نوشتار چکیده ای است از منابع مختلف در زمینه ی مدل ها و روش های الگوریتم های مطالعه و تحلیل شبکه های پیچیده از طریق پیاده سازی آنها بر روی گراف های بزرگ. به این ترتیب نخست سه مدل مهم از گراف ها که برای مدل سازی شبکه های پیچیده پیشنهاد شده اند را معرفی می کنیم و سپس به بررسی میزان انطباق آنها با مدل های واقعی می پردازیم. مهم ترین منبع این مقاله است، به موارد دیگر نیز در طول نوشتار استناد شده است.
مقدمه:
شبکه های پیچیده (Complex Networks): هر جا که در جهان واقعی اشیاء زیادی با ارتباطاتی به یکدیگر پیوند خورده اند، یک شبکه ی پیچیده وجود دارد. شبکه ها را می توانیم با گراف های بزرگ مدل کنیم. شبکه ها همه جا هستند:
- یک سلول، شبکه ی پیچیده ای از مواد شیمیایی متصل شده با واکنش های شیمیایی است.
- اینترنت، شبکه ی پیچیده ای از کامپیوترها و روترها متصل شده با کابل ها یا ارتباطات بی سیم است.
- شبکه های اجتماعی، شبکه های پیچیده ای هستند که در آن ها گره ها انسان و یال ها روابط اجتماعی بین آن ها است.
- وب، شبکه ای پیچیده از صفحات است که توسط پیوندها به یکدیگر متصل شده اند.
شبکه های پیچیده همه جا وجود دارند از سطح مولکولی تا کهکشانی، در ارگانیزم های زنده و شبکه های اجتماعی، در علوم انسانی و طبیعی می توان از آنها سراغ گرفت. دانش تحلیل شبکه های پیچیده مدل های یکسانی را به دست می دهد که قابل به کارگیری در همه ی این سطوح هستند. نمونه های زیادی از این تحقیق ها امروزه وجود دارند و نکته ی جالب در این است که اکثریت قالب شبکه های واقعی در هر سطحی که باشند، ویژگی های مشخصی مانند نمودار توزیع توانی، ضریب کلاسترینگ ثابت، میانگین طول مسیر کم و ... از خود نشان می دهند. به این منظور آگاهی کلی از تعاریف این کمیت ها ضروری به نظر می رسد:
نمودار توزیع درجه: نموداری است که تعداد رؤوسی را که درجه ی خاصی دارند نشان می دهد. بنابراین محور افقی آن درجه ی رؤوس و محور عمودی آن هم بیانگر تعداد رؤوسی از آن درجه می باشد.
ضریب کلاسترینگ: ضریب کلاسترینگ یک رأس از گراف نسبت یالفعل به بالقوه ی یال های بین همسایه گان اش یا احتمال متصل بودن دو رأس همسایه ی آن رأس است. ضریب کلاسترینگ کل یک گراف میانگین حسابی ضرایب کلاسترینگ تک تک رؤوس آن است.
میانگین طول مسیر: کوتاه ترین مسیر بین هر دو رأس از یک گراف، طول کوتاه ترین توالی از یال های آن گراف است که از یک رأس آغاز شده و به رأس دیگر برسد. میانگین طول مسیر در یک گراف متوسط این مقدار روی تک تک رأس ها است.
فهرست مطالب:
فصل اول: مقدمه
(وب)
چکیده
شبکه های پیچیده چیستند؟
کاربرد این شبکه ها در کجا است؟
چه مدل هایی برای تحلیل شبکه های پیچیده به کار می روند؟
آسیب پذیری در گراف مستقل از مقیاس به چه صورت است؟
فصل دوم: خلاصه ای بر مفهوم خوشه بندی
1-مقدمه
۲- خوشه بندی
۲-۱- مقدمه
۲-۲- اجزای تشکیل دهنده فرآیند خوشه بندی
۲-۳- تکنیکهای خوشه بندی
۲-۴- الگوریتمهای خوشه بندی برای مجموعه دادههای بزرگ
۲-۵- خوشه بندی با استفاده از گرافها
۲-۶- خوشه بندی با استفاده از الگوریتمهای ژنتیک
فصل سوم: تکنیک های خوشه بندی
یک مدل خوشه بندی برای کاوش الگوهای کاربر وب جهت توسعه در محیط سیر داده ها
1- مقدمه
2- الگوریتم الگوهای اشتراکی کاوشی
3- مدل خوشه بندی برای رسید داده
4- آزمایشات تجربی
خوشه بندی صفحات وب بر اساس جستجو
1- مقدمه
2- کارهای مرتبط صورت پذیرفته
3- الگوریتم QDC (الگوریتم جستجوی مبنی بر شاخه بندی صفحه وب) دارای 5 مرحله کلید می باشد.
2-3 ادغام خوشه ای
3-3 تقسیم بندی خوشه
4-3- انتخاب خوشه
5-3- پاک کردن خوشه
4- ارزیابی
4-4- قابلیت کاربردی جهان واقعی
5- نتیجه گیری نهایی و کارهای آتی
خاصیت انتقالی بهره وری هایپرلینک برای بهبود بخش خوشه بندی صفحات وب
1- مقدمه
2- برآورد شباهت صفحه وب
3- خوشه بندی سلسله مراتبی صفحه وب
4- ارزیابی ها
5- مطالعات و بحث های مرتبط
6- نتیجه گیری نهایی
خوشه بندی صفحه وب با استفاده از یک نقشه خودسازماندهی نمونه های پیمایشی کاربر
1- مقدمه
2- آماده سازی داده ها
3- کاهش بُعد
4- سازماندهی خودکار الگوهای کاربردی
1-5 یک SOM عادی توسط یک لگوسوم
2-5 تأثیر تغییر دادن پارامترها
6- نتیجه گیری نهایی
دستهبندی صفحات وب با استفاده از جستجوی ذهنی و غیرمستدل در گراف وب
1- مقدمه
2- جستجوی ذهنی چند عاملی
3- مجموعه دادهها
4- نتایج و بحث
دسته بندی مبنی بر لینک برای یافتن صفحات وب دارای زیرمجموعه معتبر
1- مقدمه
2- روش دسته بندی ما
3- تحقیقات قبلی
4- آزمایشات ارزیابی تجربی
5- نتیجه گیر نهایی
منابع و مأخذ:
[1] R. Baeza-Yates and B. Ribeiro-Neto. Modern Information Retrieval. Addison Wesley Longman, 1999.
[2] A. Borodin, G. O. Roberts, J. S. Rosenthal, and P. Tsaparas. Finding authorities and hubs from link structures on the World Wide Web. In Proceedings of the 10th International World Wide Web Conference, pages 415–429, 2001.
[3] E. W. Dijkstra. A note on two problems in connexion with graphs. Numerische Mathematik, 1:269–271, 1959.
[4] K. Eguchi, K. Oyama, E. Ishida, N. Kando, and K. Kuriyama. Overview of the Web retrieval task at the third NTCIR Workshop. In Proceedings of the 3rd NTCIR Workshop, 2003.
[5] J. Hou and Y. Zhang. Utilizing hyperlink transitivity to improve Web page clustering. In Proceedings of the 14th Australasian Database Conference on Database Technologies, pages 49–57, 2003.
[6] T. Kanazawa, A. Aizawa, A. Takasu, and J. Adachi. The effects of the relevance-based superimposition model in cross-language information retrieval. In Proceedings of the 5th European Conference on Digital Libraries, pages 312–324, 2001.
[7] J. M. Kleinberg. Authoritative sources in a hyperlinked environment. Journal of the ACM, 46(5):604– 632, 1999.
[8] T. Ramaswamy, B. Gedik, and L. Liu. Connectivity based node clustering in decentralized peer-to-peer networks. In Proceedings of the 3rd International Conference on Peer-to-Peer Computing (P2P-2003), pages 66–73, 2003.
[9] K. Sugiyama, K. Hatano, M. Yoshikawa, and S. Uemura. Refinement of TF-IDF schemes for Web pages using their hyperlinked neighboring pages. In Proceedings of the 14th ACM Conference on Hypertext and
Hypermedia, pages 198–207, 2003.
[10] T. Takaoka. Theory of trinomial heaps. In Proceedings of the 6th Annual International Computing and Combinatorics Conference (COCOON 2000), pages 362– 372, 2000.
[11] M. Toyoda, M. Kitsuregawa, H. Mano, H. Itoh, and Y. Ogawa. University of Tokyo/RICOH at NTCIR-3 Web retrieval task. In Proceedings of the 3rd NTCIR Workshop, 2002.
پروژه تکنیک های مختلف موجود برای خوشه بندی صفحات وب. doc