مقاله : استفاده از استخراج قوانين وابستگی از پايگاه داده
فرمت : word
تعداد صفحه : 26 قیمت :مبلغ ۵ هزار تومان
مقدمه
سیستم های پیشنهاد دهنده سعی می کنند به کاربران خود پیشنهادهایی بدهند، که به علایقشان نزدیک تر است (فیلم, کتاب, جک، مقاله و.....). این سیستم ها به دلیل اهمیتی که در تجارت الکترونیک دارند امروزه بسیار مورد توجه هستند. نمونه ای از سیستم های پیشنهاد دهنده عبارتند از : www.firefly.com، www.wisewire.com, www.contentadvisor.com . تقریبا همه سیستم¬های پیشنهاددهنده را می¬توان به 2 دسته تقسیم کرد: 1)پیشنهاد بر اساس محتوا 2) collaborative recommendation.
پیشنهاد بر اساس محتوا سعی می کند سندهایی که مشابه سندهایی هستند که کاربر قبلا مشابه آنها را پسندیده است به آن پیشنهاد دهند. در حالیکه collaborative recommendation برای پیشنهاد دادن شباهت کاربران را در نظر می گیرد و سعی می کند سندهایی را به کاربر جاری پیشنهاد دهد که کاربران مشابه این کاربر پسندیده اند. پیشنهاد بر اساس محتوا و collaborative recommendation هر دو مزایا و معایبی دارند. اما collaborative recommendation از پیشنهاد بر اساس محتوا معرف تر است زیرا اساسا در بسیاری از دامنه¬ها (مانند موزیک ، رستورانها ) استخراج کردن ویژگی های مهمی از مقاله ها که عموما یک گام مورد نیاز برای پیشنهاد بر اساس محتوا است، مشکل می باشد. تکنیک های ارائه شده در این زمینه دارای کارایی محدودی هستند، به همین دلیل همچنان علاقه زیادی در این زمینه برای بررسی تکنیک های بیشتر وجود دارد. با مطالعات انجام شده در این زمینه متوجه شده اند که قوانین وابستگی برای این منظور بسیار مناسب هستند و با استفاده از آن ها می توان به کارایی های قابل قبولی دست یافت. بنابراین ما این روش را برای مطالعه بیشتر و استفاده از آن ها برای بهبود سیستم های پیشنهاد دهنده انتخاب کرده ایم. در این نوع سیستم ها می توان دو نوع rule در نظر گرفت : 1 وابستگی آیتم : مثلا 90 درصد کاربرهایی که دوست دارند آیتم A و B را بخرند همچنین آیتم C را نیز بخرند و 30 درصد کاربران نیز دوست دارند که هر 3 آن ها را بخرند 2) وابستگی کاربر : 90 درصد آیتم هایی که مورد علاقه کاربر A و B هستند همچنین مورد علاقه کاربر C نیز هستند و 30 درصد همه آیتم ها مورد علاقه همه آن ها هستند که این قوانین برای اهداف پیشنهاد بسیار مفید هستند. در واقع item association ها روابط بین آیتم ها را نمایش می¬دهند و User association ها روابط بین کاربران را نشان می دهند. ما در روش پیشنهادی برای گرفتن نتایج بهتر ترکیبی از هر دو نوع قانون را استفاده کرده ایم. در واقع هدف از بکارگیری قوانین وابستگی تفسیر حجم زیادی از داده ها و استخراج روابط مفید بین آن هاست که این ویژگی می تواند در سیستم های پیشنهاد دهنده بسیار مفید واقع شود.
یک قانون وابستگی یک قانون به فرم است که X و Y مجموعه ای از آیتم ها هستند ( مجموعه آیتم نامیده می شوند) که نباید با یکدیگر اشتراک داشته باشند. معنی این قانون اینست که حضور X در یک تراکنش دلالت بر حضور Y در همان تراکنش دارد. به عنوان مثالی از قانون وابستگی می¬توان فرض کرد که 90 درصد تراکنش ها که شامل A و B هستند همچنین شامل C نیز هستند و 30 درصد تراکنش ها شامل هر 3 آن ها هستند. که در اینجا X = {A, B} و Y = {C} و 90 درصد برابر با confidence قانون و 30 درصد برابر باsupport قانون است. در واقع confidence یک قانون میزان همبستگی بین itemset ها را اندازه گیری می کند در حالی که support یک قانون، اهمیت همبستگی بین itemsetها را اندازه¬گیری می¬کند. باید به دنبال قوانینی بود که می نیمم support و confidence تعریف شده به وسیله کاربر را برآورده کنند. اکثر روش ها از الگوریتم های استخراج قوانین وابستگی قدیمی( الگوریتم Apriori ) استفاده می کنند در حالی که می توان نشان داد که این الگوریتم ها به اندازه کافی برای سیستم های پیشنهاد دهنده مفید نیستند.
هدف ما در این پروژه بررسی روش هایی است که از قوانین وابستگی در سیستم های پیشنهاد دهنده استفاده کرده¬اند و افزودن ویژگی هایی برای بهبود کارایی این روش ها می باشد. در سیستم ارائه شده از هر دو نوع قوانین item association و user association استفاده شده است و امکان پیشنهاد دادن به کاربر توسط هر دوی آن ها میسر است. در واقع برای دادن پیشنهادها به کاربران، به نوعی هم کاربران مشابه به کاربر جاری و هم انتخاب هایی که کاربر جاری قبلا انجام داده است در نظر گرفته می¬شود. برای استخراج قوانین، مجموعه امتیازاتی که کاربران به آیتمها داده اند باید به تراکنش تبدیل شوند. چگونگی تبدیل امتیازات به تراکنش ها وابسته به نوع وابستگی است که می خواهد استخراج شود، برای استخراج هر یک از قوانین امتیازات به شکل خاصی که قوانین را بتوان از آن ها استخراج نمود، تبدیل شده اند و در بخش 3 با جزییات کامل شرح داده می شود. با توجه به اینکه از قوانین استخراج شده برای دادن پیشنهاد به کاربر جاری استفاده می¬شود، بنابراین نیاز نیست که همه قوانین به هر شکلی استخراج شوند و در اینجا فقط قوانینی که در سمت راست آن ها کاربر جاری قرار دارد، استخراج شده اند. برای کارایی بهتر و بالا رفتن سرعت پاسخ item associationها به صورت off-line محاسبه می شوند، اما user associationها به صورت on-line و برای کاربر جاری محاسبه می¬شوند. توجه شود که تعداد قوانین استخراج شده بر کیفیت پیشنهادها تاثیر می¬گذارد و از طرفی تعداد قوانین استخراج شده تا حدی وابسته به support و confidence است که در اینجا برای اینکه این دو پارامتر مقادیر معقولی را داشته باشند، ملاحظاتی درنظر گرفته شده است. در این مقاله از الگوریتم CBA با مقداری تغییر استفاده شده است. از cross validation به همراه معیارهای ارزیابی مناسب برای ارزیابی روش استفاده شده است. آزمایشات با مقادیر مختلف پارامترها تکرار شده¬اند و بهترین مقدار به دست آمده با توجه به نتایج برای هر پارامتر انتخاب گشته است. از مجموعه داده¬ای Movielens با تعداد 943 کاربر و 1682 فیلم که هر کاربر به حداقل 20 فیلم امتیاز داده است برای انجام آزمایشات استفاده شده است. از زبان C#.net برای پیاده سازی الگوریتم استفاده شده است.
در ادامه مطالب در بخش 2 به طور مختصر برخی از کارهای مربوط در این زمینه شرح داده شده است. در بخش 3 تعریف مسئله و الگوریتم پیشنهادی با جزییات کامل بیان شده است. دربخش 4 چگونگی ارزیابی الگوریتم ارائه شده به همراه آنالیز نتایج شرح داده می شود و در بخش 5 نتیجه گیری به همراه کارهای آینده بیان می شود.
فهرست مطالب
1 . مقدمه
2. کارهای مربوط
- شبکه های عصبی به همراه تکنیک¬های کاهش ویژگی
- قوانین وابستگی
- روش Unison-CF
- روشContent-Boosted Collaborative Filtering
- روش کاربرد کاهش ابعاد در سیستم¬های پیشنهاد دهنده
- روش ترکیب کردن فیلترهای همکاری و مبتنی بر محتوا در یک روزنامه بر خط
- روش خوشه¬بندی آیتم¬ها برای Collaborative Filtering
3. تعریف مسئله و ارائه الگوریتم پیشنهادی
4. نتیجه گیری
5. نتیجه گیری و کارهای آینده
6. مراجع
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
پایگاه داده ,
|