پایان نامه : خوشه بندي داده هاي جرياني با استفاده ازموازي سازي الگوريتم هاي تركيبي
فرمت : pdf
تعداد صفحه : 193
قیمت : مبلغ ۱۵ هزار تومان
فهرست مباحثی که در این پایان نامه مطرح شده عبارتند از :
چكيده
كاوش خوشه ها يكي از تكنيك هاي حائز اهميت در زمينه رو به رشد، معروف به داده كاوي اكتشافي مي باشد كه در رشته هاي گوناگون مهندسي و علمي از قبيل زيست شناسي، روان شناسي، پزشكي، بازاريابي، كامپيوتر و نقشه برداري ماهواره اي بكار گرفته شده است. تحليل خوشه ها، اطلاعات را بوسيله يك ساختار اساسي مختصر بدو شكل گروه بندي تنها يا گروه بندي سلسله مراتبي سازماندهي مي نمايد. خوشه بندي، ابزاري براي اكتشاف ساختارهايي از درون داده ها است كه نياز به هيچ فرضي از آنها نيست. اين روش در هوش مصنوعي و شناسايي الگو، يادگيري بدون ناظر ناميده مي شود. الگوريتم هاي خوشه بندي گوناگوني براي استخراج دانش از درون مجموعه اطلاعات مختلف وجود دارد. اما عموما اين الگوريتم ها حساس به داده هاي مورد آزمايش و برخي پارامترهاي اوليه مي باشند، لذا نتايج حاصل از آنها وابسته به ساختار داده ها مي باشد. تاكنون الگوريتمي ارائه نشده است كه بتواند هر گونه ساختار داده اي را استخراج نمايد.
اخيرا يادگيري گروهي بعنوان يك روش قدرتمند بر پايه بكارگيري چند الگوريتم براي تحليل داده ها و تركيب نتايج آنها بمنظور دست يافتن به نتايج با كيفيت تر مورد توجه قرار گرفته است. از قابليت هاي اين روش، توليد خوشه هايي با كيفيت و قدرت بيشتر، استخراج ساختارهاي ناشناخته و گوناگون داده ها و مقياس پذيري آن مي باشد. همچنين، در اين روش نيازي به داشتن اطلاعات زمينه اي در مورد الگوريتم مورد استفاده و يا داده ها وجود ندارد. خوشه بندي تركيبي يكي از موضوعاتي است كه در اين رساله به آن پرداخته شده است.
يكي ديگر از پديده هاي نو ظهور در دنياي اطلاعات، داده هاي جرياني مي باشند. اين پديده، اشاره به حجم وسيعي از اطلاعات انباشته شده دارد كه محدوديت هاي فراواني براي پردازش ايجاد كرده اند. اندازه اين داده ها بيش از حافظه اصلي،يكي از اين موانع مي باشد. لذا مي بايست الگوريتم هاي جديدي براي برخورد با اينگونه داده ها توسعه يابند. بدليل توانمندي روش هاي خوشه بندي تركيبي در توليد خوشه هاي با كيفيت، توسعه اين الگوريتم ها براي مديريت و دسته بندي داده هاي جرياني، يكي از اهداف اين تحقيق مي باشد. از اينرو نخست، الگوريتم خوشه بندي داده هاي جرياني مبتني بر ياديگري ( تركيبي پيشنهاد مي شود. اين روش شامل سه مرحله كلي مي باشد، 1) تقسيم داده هاي جرياني به بلاك هاي كوچكتر، 2 خوشه بندي هر بلاك بوسيله يادگيرنده هاي تركيبي و 3) تركيب نتايج حاصل از خوشه بندي هر بلاك و توليد يك گروه بندي نهايي. يكي از مسائلي كه يادگيرنده هاي گروهي با آن مواجه هستند، زمان پردازش بالاي اين يادگيرنده ها است كه اين امر بدليل اجراهاي گوناگون الگوريتم پايه مي باشد. با توجه به مقياس پذيري روش هاي تركيبي از موازي سازي براي توسعه الگوريتم معرفي شده جهت خوشه بندي داده هاي جرياني، بهره جسته ايم و الگوريتم جديد خوشه بندي موازي مبتني بر يادگيري تركيبي را ارائه كرده ايم. در اين تكنيك ابتدا بلاك هاي كوچك داده هاي جرياني توسط يك پردازنده مركزي به پردازنده هاي ديگر منتقل مي شوند، سپس با استفاده از روش هاي تركيبي اشاره شده، اين بلاك ها خوشه بندي شده و نتايج آنها به كامپيوتر مركزي ارسال مي شود، پردازنده مركزي مجداد نتايج را خوشه بندي كرده و گروه بندي نهايي داده ها را توليد مي نمايد. آزمايش اين الگوريتم بر روي مجموعه داده هاي جرياني استاندارد، نتايج اميدوار كننده اي از كارايي و دقت الگوريتم را نشان داده است.
فهرست مطالب
-
مقدمه
-
پیدایش داده کاوی
-
فرایند داده کاوی
-
تعیین مساله و ساختن فرضیات
-
جمع آوری داده
-
پیش پردازش داده
-
ساختن مدل
-
دسته بندی و پیشگویی
-
خوشه بندی
-
وابسته سازی
-
تخمین
-
توصیف
-
تفسیر مدل و استخراج مدل
-
مجموعه دادهدهای بزرگ
-
اهداف رساله
-
آنچه در این رساله می خوانید
-
فصل دوم-خوشه بندی
-
مقدمه
-
فرآیند خوشه بندی
-
مشکلات پیش روی و نقش تجربیات کاربران
-
تاریخچه
-
تعاریف
-
نمایش الگوها
-
اندازه گیری شباهت
-
تفکیک های خوشه بندی
-
خوشه بندی سلسله مراتبی
-
خوشه بندی افراز بندی
-
الگوریتم های مرجع خطا
-
الگوریتم تئوری گراف
-
الگوریتم های برطرف سازی ترکیبی
-
خوشه بندی نزدیکترین همسایه
-
خوشه بندی فازی
-
خوشه بندی گروهی
-
گوناگونی
-
تابع توافقی
-
روش های مبتنی بر ابرگراف
-
نمایش افرازها بصورت ابر گراف
-
الگوریتم افراز بندی مبتنی بر تشابه خوشه ها
-
الگوریتم افراز بندی ابر گراف
-
الگوریتم فرا خوشه بندی
-
الگوریتم خوشه بندی مبتنی بر ماتریس هم پیشامد
-
اعتبار سنجی خوشه ها
-
اعتبار سنجی خارجی خوشه ها
-
خطای خوشه بندی
-
اندازه گیری بر مبنای شمارش زوج نقاط
-
ثابت هابرت
-
آزمون فرضیات در اعتبار سنجی خارجی خوشه ها
-
اعتبارسنجی درونی خوشه ها
-
روش های مبتنی بر پیکر بندی نقاط
-
روش های مبتنی بر پایداری
-
مقایسه روش های مبتنی بر پایداری
-
نمایش خوشه ها
-
خوشه بندی مجموعه داده های بزرگ
-
روش تقسیم و کنترل
-
خوشه بندی افزایشی
-
پیاده سازی موازی
-
خلاصه
-
فصل سوم – خوشه بندی داده های جریانی
-
مقدمه
-
کاربردهای داده های جریانی
-
شبکه های حسگر
-
تحلیل ترافیک شبکه
-
محرک های مالی
-
تحلیل تراکنش ها
-
مدل داده های جریانی
-
زیر بنای نظری
-
تکنیک های مبتنی بر داده
-
نمونه برداری
-
پراکنده ساختن بار
-
طراحی اولیه
-
ساختمان داده خلاصه
-
انبوه سازی
-
تکنیک های مبتنی بر وظیفه
-
الگوریتم های تخمین
-
الگوریتم های مبتنی بر پنجره
-
الگوریتم های دانه دانه سازی نتایج
-
خوشه بندی داده های جریانی
-
بهبود روش های سنتی
-
الگوریتم CLARANS
-
الگوریتمBIRCH
-
ظهور تکنیک های جدید
-
الگوریتم مبتنی بر چگالیDBSCAN
-
الگوریتم مبتنی بر گریدSTHNG
-
بحث در مورد الگوریتم ها
-
آیا توسعه روش های سنتی درست است؟
-
روش های جدید چه پیشنهاداتی دارند؟
-
خلاصه
-
فصل چهارم- خوشه بندی موازی
-
پیش درآمدی بر معماری کامپیوتر و پردازش موازی
-
چهار دهه از محاسبات
-
دوره پردازش دسته بندی
-
دوره اشتراک زمانی
-
دوره کامپیوترهای رومیزی
-
دوره شبکه های کامپیوتری
-
گرایش های امروز
-
معماری کامپیوتر از دیدگاه فلاین
-
معماری SIMD
-
معماری MIMD
-
مدل حافظه مشترک
-
مدل انتقال پیام
-
اتصالات شبکه داخلی
-
روش عملکرد
-
استراتژی کنترل
-
تکنیک های سو ئیچینگ
-
توپولوژی
-
داده کاوی توزیع شده
-
پیش زمینه
-
خوشه بندی توزیع شده
-
کوشش های انجام گرفته در زمینه الگوریتم های خوشه بندی موازی
-
خلاصه
-
فصل پنجم-معرفی الگوریتم خوشه بندی موازی مبتنی بر یاد گیری ترکیبی
-
مقدمه
-
تعاریف
-
اندازه گیری شباهت
-
الگوریتم خوشه بندی فازی
-
اعتبار سنجی الگوریتم خوشه بندی
-
الگوریتم خوشه بندی ترکیبی مبتنی بر ماتریس هم پیشامد
-
الگوریتم خوشه بندی داده های جریانی مبتنی بر ماتریس هم پیشامد برای دسته بندی داده های جریانی
-
ارزیابی کارایی الگوریتم های ارائه شده
-
معرفی مجموعه داده آموزشی
-
ارزیابی الگوریتم EFCM
-
ارزیابی الگوریتم SEFCM
-
ارزیابی الگوریتم موازی PSEFCM
-
محیط اجرا و شبیه سازی
-
زمان اجرا
-
افزایش سرعت
-
راندمان
-
خلاصه
-
فصل ششم-نتیجه گیری و فعالیت های آینده
-
خلاصه
-
فعالیت های آینده
-
خوشه بندی خصیصه های نمادین
-
بهینه سازی حافظه مصرفی
-
مراجع
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
خوشه بندي داده هاي جرياني ,
|