پايان نامه : استخراج اتوماتيك اطلاعات بر اساس آنتالوژي
فرمت : pdf
تعداد صفحه : 134
قیمت : مبلغ ۱۴ هزار تومان
چكيده
لازمه توسعه و گسترش وب معنايي ، ازدياد هر چه بيشتر آنتالوژي ها مي باشد . آنتالوژي ها با ايجاد فهم مشترك از مفاه يم موجود در دامنه دانش ، امكان همكاري و تبادل اطلاعات بين ماشين ها را بوجود مي آورند . اما ايجاد دستي آنتالوژي ها سخت و طاقت فرسا بوده و احتمال بروز خطاي انساني نيز بسيار زياد مي باشد . از اين رو ، استخراج اطلاعات از منابع وب بصورت نيمه اتوماتيك و يا تمام اتوماتيك مورد توجه بسياري از محققان قرار گرفته است. اولين ايده در استخراج اطلاعات، تهيه برنامه اي بنام Wrapper است كه اطلاعات موجود در صفحات وب را در يك قالب ساختيافته، استخراج مي كند . ابزار هاي متنوعي جهت توليد Wrapper ها بصورت دستي، نيمه اتوماتيك و اتوماتيك مورد پژوهش قرار گرفته اند. برخي از اين ابزار ها ابتدا قواعد استخراج را آماده كرده و در هنگام استخراج اطلاعات با آگاهي از محل داده ها، به سرعت اطلاعات مورد نياز را استخراج مي نمايند . برخي ديگر نيز با استفاده از آنتالوژي استخراج، داده هاي موجود در صفحه وب را پردازش كرده و مفهوم مرتبط با هر مقدار متني را از آنتالوژي دامنه يافته و در نهايت با توجه به الگوهاي موجود، اطلاعات را استخراج مي نمايند
در اين تحقيق، روش پيشنهادي ما كه منجر به توليد يك سيستم نرم افزاري نيز خواهد شد، توصيف Wrapper با استفاده از زبان نشان گذاري WDML مي باشد . اين زبان با تركيب مكانيزم هاي استخراج مبتني بر مكان و مبتني بر آنتالوژي، از مزاياي هر دو روش بهره مي برد . قواعد استخراج توصيف شده در فايل هاي WDML بصورت درختي تعريف شده و به آن الگوي استخراج گفته مي شود از اين رو نسبت به ساير روش ها د اراي انعطاف پذيري بسيار بالايي مي باشد . همچنين در اين تحقيق روشي را جهت توليد اتوماتيك فايل هاي WDML با استفاده از يك آنتالوژي استخراج ارائه خواهيم كرد.
فهرست مطالب
-
مقدمه
-
وب معنايي
-
بازيابي و استخراج اطلاعات
-
محدوده بحث و دستاورد تحقيق
-
طرح كلي بحث
-
مفاهيم و كليات
-
معرفي آنتالوژي
-
سطوح بازنمايي آنتالوژي
-
زبان هاي تعريف آنتالوژي
-
استخراج اطلاعات و وب معنايي
-
استخراج اطلاعات از انوع مختلف منابع متني وب
-
بازيابي اطلاعات و استخراج اطلاعات
-
"بازيابي داده" در مقابل "بازيابي اطلاعات"
-
"بازيابي اطلاعات براي وب معنايي" در مقابل "بازيابي اطلاعات مبتني بر آنتالوژي
-
ايجاد آنتالوژي براي وب معنايي
-
ايجاد دستي آنتالوژي ها
-
ايجاد اتوماتيك آنتالوژي ها
-
خلاصه مطالب و نتيجه گيري
-
بررسي سوابق مرتبط با تحقيق
-
مقدمه
-
روش هاي مبتني بر زبان هاي پرس و جو
-
روش هاي مبتني بر پردازش زبان طبيعي
-
روش هاي آگاه از HTML
-
روش هاي استنتاج WRAPPER
-
روش هاي مبتني بر آنتالوژي
-
خلاصه مطالب و نتيجه گيري
-
معرفي سيستم ONTOBYONTO
-
مقدمه
-
معماري سيستم - ONTOBYONTO
-
WDML زبان تعريف : - WRAPPER
-
معرفي مستندات ورودي
-
معرفي قالب خروجي
-
معرفي الگوي استخراجWDML ۴- استخراج با استفاده از -
-
الگوريتم استخراج
-
اجراي يك مثال
-
۵ خلاصه مطالب و نتيجه گيري
-
WDML ۵- توليد اتوماتيك فايل هاي
-
مقدمه
-
آنتالوژي استخراج
-
انتخاب زبان
-
تعريف كلاس ها
-
تعريف خصوصيات
-
تعريف الگو ها
-
تعريف فهرست واژگان آنتالوژي
-
آنتالوژي استخراج براي يك صفحه وب نمونه
-
الگوريتم ايجاد اتوماتيك WDML
-
توليد WDML
-
ايجاد Wapper
-
يافتن الگو ها
-
روتين هاي اوليه مورد نياز در پردازش الگو ها
-
اجراي الگوريتم در يك صفحه نمونه
-
خلاصه مطالب و نتيجه گيري
-
ارزيابي و جمع بندي مطالب
-
مقدمه
-
شاخص هاي ارزيابي
-
۳ روش و نتايج ارزيابي
-
نقاط گسترش تحقيق
-
منابع
-
ضمائم
-
آنتالوژي استخراج نمونه براي گوش هاي تلفن همراه
-
فهرست شكل ها
-
فهرست ليست ها
-
فهرست جداول
***************************************************************************************
در صورت تمایل
به دریافت فایل فوق در مدت 10 دقیقه ، لطفاً اینجا کلیک
کنید
***************************************************************************************
مشاوره ؛نگارش پایان نامه ؛ مقاله + شبیه سازی
در تمام مقاطع دانشگاهی پذیرفته می شود
در صورت
تمایل می توانید عنوان و جزئیات پروژه خود را در قسمت نظرات این پست
اعلام فرمایید. ضمنا می توانید اطلاعات درخواستی خود را به ایمیل یا تلگرام
نمایید
ایمیل :
com.dr@yahoo.com
درباره :
مانیتور کردن .استخراج اطلاعات ,
|