جستجوي پيشرفته | کتابخانه مجازی الفبا

جستجوي پيشرفته | کتابخانه مجازی الفبا

کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی

فارسی  |   العربیه  |   English  
telegram

در تلگرام به ما بپیوندید

public

کتابخانه مجازی الفبا
کتابخانه مجازی الفبا
header
headers
پایگاه جامع و تخصصی کلام و عقاید و اندیشه دینی
جستجو بر اساس ... همه موارد عنوان موضوع پدید آور جستجو در متن
: جستجو در الفبا در گوگل
مرتب سازی بر اساس و به صورت وتعداد نمایش فرارداده در صفحه باشد جستجو
  • تعداد رکورد ها : 33
مدیریت برخورد در تطبیق آنتولوژی
نویسنده:
مهدیه کارگرقوی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با پیشرفت فناوری های اطلاعاتی و مخابراتی، مقادیر فراوانی اطلاعات ناهمگن و توزیع شده فراهم شده است. وب معنایی سعی دارد تا این اسناد و اطلاعات را به فرم داده قابل فهم (دانش) برای ماشین نمایش دهد. یکی از راه های نمایش دانش در وب معنایی، آنتولوژی است که واژه ها و ارتباط بین آن ها را در یک دامنه خاص نشان می دهد. امروزه آنتولوژی ها به روش های مختلف و توسط توسعه دهندگان متفاوتی مدل می شوند، بنابراین همواره تفاوت هایی بین مفاهیم مدل شده در آنتولوژی ها وجود خواهد داشت که تعامل میان آن ها را مشکل می سازد. تطبیق آنتولوژی ها، به عنوان زیرساختی مناسب برای انجام تعاملات در وب معنایی مطرح شده است و به فرآیند یافتن روابط و یا شباهت ها بین موجودیت های آنتولوژی های مختلف اشاره دارد. تاکنون تطبیق دهنده های بسیاری مطرح شده اند که در برخی موارد خوب عمل می کنند و در برخی موارد خوب عمل نمی کنند. این مساله، اهمیت خاصی به انتخاب تطبیق دهنده و ترکیب تطبیق دهنده ها می بخشد. از طرفی، تطبیق خودکار آنتولوژی ها به دلیل عدم تعامل با کاربر، نمی تواند نتایجی با کیفیت بالا به ویژه بر روی مجموعه داده های بزرگ حاصل نماید و این چالشی دیگر است که با عنوان عدم قطعیت در تطبیق آنتولوژی ها بیان شده است. در این پایان نامه، یک متاسیستم تطبیق دهنده با نام MixAlign پیشنهاد شده است که از یک سو به ترکیب نتایج تطبیق دهنده های آنتولوژی ها می پردازد و از سوی دیگر به طور همزمان، مساله عدم قطعیت را رفع می کند تا خروجی تطبیق (هم ترازی)، بهبود یابد. معماری پیشنهادی این سیستم، متشکل از سه بخش با نام های تبدیل کننده فازی، تجمیع کننده فازی و استخراج کننده پویا می باشد. در اینجا با استفاده از تئوری مجموعه های فازی که یکی از روش های ارائه عدم قطعیت است، طبیعت غیرقطعی نگاشت ها مدل سازی می شود. در ادامه، این هم ترازی ها با تعریف درجه توافق مبتنی بر مرکز ثقل اعداد فازی ذوزنقه ای، ترکیب می شوند و سپس، نگاشت های مناسب جهت هم ترازی نهایی استخراج می شوند. بدین ترتیب با هم ترازی های ناقص، متناقض و مخرب، به نحوی قابل قبول رفتار می شود تا در نهایت بتوان از میان چندین هم ترازی ارائه شده برای دو آنتولوژی، به یک هم ترازی توافقی با دقت بیشتر رسید. نتایج تجربی نشان داد که ترکیب هم ترازی های خروجی سیستم های تطبیق دهنده به کمک این روش، کیفیت و دقت واقعی هم ترازی نهایی را نسبت به سیستم های اولیه (قبل از ترکیب) و نسبت به سایر روش های تجمیع مشابهت بهبود می بخشد.
تشخیص و اصلاح پیوندهای RDF شکسته شده در داده‌های پیوندی
نویسنده:
محمد پورزعفرانی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
پیوندهای RDF به عنوان یکی از ارکان وب معنایی به شمار می‌آیند. با استفاده از این پیوندها و به کمک آنتولوژی‌های موجود، وب کنونی به ساختاری قابل فهم برای ماشین تبدیل می‌شود. وب حاصله از این تغییر با نام وب داده‌ها شناخته می‌شود. یکی از چالش‌های اساسی در راه توسعه وب داده‌ها، پیوندهای شکسته شده می‌باشند. به دلیل ماهیت تغییرپذیر وب، مجموعه داده‌های موجود در وب داده‌ها نیز دائماً در حال تغییر می‌باشند. این تغییرات باعث می‌شوند پیوندهای موجود در گذر زمان به مکان‌های نادرست یا ناموجود ارجاع داده شده و به اصطلاح شکسته شده تلقی ‌شوند. پژوهش‌های انجام گرفته در این زمینه تا کنون بر اصلاح پیوند، توسط مقصد پیوند تاکید داشته‌اند. این روش‌ها معایبی از جمله ایجاد نقطه شکسته مرکزی و نقض حق مالکیت مجموعه داده‌ها را به همراه دارند. در این تحقیق رویکردی برای اصلاح پیوند از طریق مبدأ پیوند ارائه شده است. زمانی که مقصد پیوند دیگر قابل دسترسی نباشد، الگوریتم در همان لحظه اجرا شده و مقصد تغییر یافته را پیدا می‌نماید. روش پیشنهادی با ایجاد دو مجموعه موجودیت‌های بالا دست و پایین دست، یک ساختار گرافی انحصاری را با نام گراف هویت برای هر موجودیت تشکیل می‌دهد. در ادامه از طریق این گراف کاندیداهای مشابه استخراج شده و مناسب‌ترین گزینه به عنوان خروجی نهایی ارائه می‌شود. روش پیشنهادی بر روی مجموعه داده‌های استاندارد، مورد ارزیابی قرار گرفته و با مهم‌ترین روش‌های ارائه شده تا کنون مقایسه شده است. نتایج بدست آمده، نشان‌ می‌دهد که الگوریتم پیشنهادی در مقایسه با روش‌های دیگر پاسخ قابل قبولی را ارائه داده است.
ژنتیک معنایی در سلامت الکترونیک: ساخت هستان‌نگاری  یک بیماری ژنتیکی
نویسنده:
حسن اسدی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
هستان‌نگاری یکی از راه‌های غلبه بر مشکلات هم‌کنش‌پذیری است. هستان‌نگاری یک توصیف رسمی صریح و روشن از مفاهیم در حوزه خاص است. امروزه محققین زیادی تأثیر هستان‌نگاری را برای ساخت و هم‌کنش‌پذیری بهتر در سیستم‌های اطلاعات تأیید و تصدیق می‌کنند، این تأثیر در حوزه سلامت با توجه به نیاز تعامل میان سیستم ها در آن، می‌تواند بسیار کارآمد باشد. در این پایان‌نامه به معرفی و بررسی ابعاد تأثیرگذار هستان‌نگاری‌های پزشکی و زیست پزشکی پرداخته‌ می شود، سپس روش‌ها و ابزارهای رایج برای طراحی هستان‌نگاری (در یک بیماری ژنتیکی) بررسی‌شده و رهنمودهایی برای طراحی هستان‌نگاری ارائه می‌گردد. هستان‌نگاریطراحی‌شده، حاصل تحلیل حوزه خاص (یک بیماری ژنتیکی) است که شامل مراحل: اهداف و حیطه، اکتساب دانش(استخراج اصطلاحات و لغات-استخراج مفاهیم و روابط)، مفهوم‌سازی(تعریف و انتخاب مفاهیم، سلسله‌مراتب مفاهیم و ایجاد روابط میان مفاهیم) و در نهایت ارزیابی توسط منابع معتبر و گروه متخصص می‌باشد. هستان‌نگاری در محیط نرم‌افزار Protégé 4.3 طراحی گردید.شاخص‌های(مفاهیم) اصلی هستان نگاری طراحی شده عبارتند از: عوامل بیماری، شرایط، تشخیص ها، درمان، روش ها و آزمون های آزمایشگاهی، یافته ها، رویکردهای ارزیابی، راهبردهای پایش، علائم و نشانه‌ها، دسته بندی اختلالات، مدیریت، کدهای بین المللی، پیگیری، دسته بندی بیماری، بافت ها و اندام مرتبط، بیماری های مرتبط، یافته های بالینی، تیم متخصص بالینی؛ این مفاهیم طبق بررسی‌ها و تایید متخصصین حوزه گردآوری شده اند.در پایان براساس روش‌های بررسی‌شده، مدل پیشنهادی برای طراحی هستان‌نگاریاین حوزه ارائه میگردد. این مدل می‌تواند در بازنمایی و تحلیل مفاهیم دانش؛ به‌طور خاص در حوزه پزشکی و زیست پزشکی پرکاربرد و موثر واقع شود و در کاربرد ابعاد موثر هستان‌نگاری در حوزه سلامت الکترونیک حائز اهمیت باشد.
پیمانه‌ای‌کردن آنتولوژی در وب معنایی
نویسنده:
مریم جعفری شریف‌آبادی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
ایده اصلی وب معنایی، ایجاد فراداده‌هایی است که داده را شرح می‌دهند تا کامپیوترها را قادر به پردازش معنی اشیا کنند. هدف از وب معنایی این است که ماشین‌ها نیز همانند انسان‌ها سندها را درک کرده و تفسیر کنند. یکی از مولفه‌های اصلی وب معنایی، آنتولوژی است، که نسبت به سایر مولفه‌ها از قدرت بیان بیشتری برخوردار است. آنتولوژی، مجموعه‌ای از واژگان مشترک را برای محققانی تعریف می‌کند که نیاز به اشتراک‌گذاری اطلاعات در یک دامنه دارند. امروزه استفاده از آنتولوژی در وب افزایش یافته است. بسیاری از آنتولوژی‌های معروف، اندازه بزرگی دارند. اندازه بزرگ این آنتولوژی‌ها باعث کاهش سرعت و کارایی در استفاده‌مجدد، استنتاج، نگهداری و هماهنگی سیستم‌های توزیع‌شده می‌شود. راه‌حل این مساله، پیمانه‌‌ای کردن آنتولوژی می‌باشد. پیمانه‌ای کردن آنتولوژی، بخش مهمی از مهندسی آنتولوژی است که برای کاهش پیچیدگی و اندازه آنتولوژی، یا آن را به کل قطعات تشکیل‌دهنده می‌شکند (تقسیم‌بندی آنتولوژی) و یا اینکه فقط بخش کوچکی از آن را استخراج می‌کند (استخراج پیمانه). هدف از این پژوهش ارائه رهیافتی برای پیمانه‌ای کردن آنتولوژی به پیمانه‌هایی درست، کامل و متصل به هم است، به صورتی که کاربر بتواند بر اساس نیازهای برنامه کاربردی تنظیماتی را در پیمانه‌ای کردن اعمال کند.رهیافت ارائه‌شده در این پژوهش روی تقسیم‌بندی آنتولوژی تمرکز دارد. برای داشتن قطعه‌های کامل، ابتدا یک استنتاج مقدماتی روی آنتولوژی انجام شده و سپس حاصل آن به Pato، که ابزاری برای تقسیم‌بندی است، داده می‌شود. به دلیل انجام استنتاج مقدماتی، نتیجه تقسیم‌بندی، پیمانه‌هایی مرتبط و نیمه‌کامل است. بنابراین، قضایای کامل‌کننده به آن‌ها اضافه می‌شود. سپس پیمانه‌ها توسط زبان آنتولوژی پیمانه‌ای P-DL به هم متصل می‌شوند. به این ترتیب، پیمانه‌های حاصل، پیمانه‌هایی متصل و کامل با اندازه مناسب هستند. هرچند استنتاج روی آنتولوژی‌های بزرگ عملی وقت‌گیر است، اما فقط یکبار صورت می‌گیرد و در عوض مزایای زیادی به همراه دارد که توسط دیگر روش‌ها تامین نمی‌شوند. برای ضمانتِ این ادعا، روش ارائه‌شده و روش‌های قبلی به صورت تئوری و عملی ارزیابی شده و نشان داده می‌شود که این روش باعث می‌شود که آنتولوژی به‌طور متعادلی بخش‌بندی شود و پیمانه‌های حاصل مانند یک آنتولوژی خودشمول، توسط ابزارهای زیادی استفاده شوند.
استخراج حقایق از متون فارسی در قالب RDF
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با توجه به حجم عظیم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمینه‌های مختلف، پردازش زبان‌های طبیعی و تبدیل متون به دانش قابل فهم برای ماشین، مورد توجه قرار گرفته است. با استفاده از سیستم‌های استخراج اطلاعات می‌توان بطور خودکار پایگاه دانشی ساخت‌یافته از متون ایجاد کرد. در واقع هدف یک سیستم استخراج اطلاعات، استخراج حقایق از متون غیرساخت‌یافته و نمایش آن‌ها در قالب‌های ساخت‌یافته مانند سه‌گانه‌های RDF می‌باشد. اگر حقایق در قالب معنایی RDF نگاشت شوند، می‌توان اطلاعات مورد نیاز را با ساخت و ارسال پرس‌وجوهای SPARQL روی پایگاه دانش بدست آورد. در این پایان‌نامه، روشی برای استخراج آزاد حقایق از متون زبان فارسی پیشنهاد شده است که در آن استخراج حقایق در سطح جمله و بر اساس تشخیص افعال و روابط وابستگی‌ بین اجزای جمله انجام می‌شود. راه‌کار پیشنهادی، حقایق اصلی را بر اساس فعل و حقایق فرعی را بر اساس روابط بین گروه‌های اسمی جمله استخراج و برای تبدیل به قالب RDF آماده‌سازی می‌کند. برای نگاشت حقایق در قالب معنایی RDF، URI قسمت‌های نهاد، مسند و گزاره یک حقیقت با استفاده از شبکه واژگان و ویکی‌پدیا شناسایی می‌شود. در نتیجه در راه‌کار پیشنهادی شبکه واژگان فردوس‌نت بصورت خودکار بر اساس شبکه واژگان انگلیسی ایجاد می‌شود. نتایج حاصل از ارزیابی نشان می‌دهد که روش پیشنهادی در استخراج حقایق موفق بوده و باعث بهبود دقت و فراخوانی نسبت به سیستم‌های موجود می‌شود. علاوه بر‌این سیستم پیشنهادی حقایق را در قالب معنایی RDF استخراج می‌کند.
ارائه یک مدل داده‌آمیزی معنایی مبتنی بر JDL
نویسنده:
حوا علیزاده نوقابی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
به دلیل افزایش جریان‌های داده‏ای و اطلاعاتی، بحث داده‏آمیزی به عنوان یکی از مهم‏ترین زمینه‌های تحقیقاتی و عملیاتی محسوب می‌شود. در حوزه‏هايي که اطلاعات زيادي وجود دارد و تصميم‏گيري‏هاي ضعيف باعث پيامدهاي جدي مي‏شود، مسئله داده‏آميزي بسيار حياتي است. داده‏آميزي اطلاعات چندين منبع را يکپارچه مي‏کند و اين عمل به منظور فراهم آوردن داده‏هاي مشخص و قابل درک درباره موجوديت‏ها و روابط بين آن‏ها صورت مي‏گيرد و نهايتا منجر به استخراج دانش جديد نيز خواهد شد. با ظهور وب معنایی و همه‌گیر شدن آن، ضرورت درک اطلاعات توسط ماشین بر هیچ کس پوشیده نیست، اين تحقيق برآن است تا تکنولوژی‏های وب معنایی را وارد حوزه داده‏آمیزی نماید. با توجه به اینکه یکی از رايج‏ترين مدل‏هاي داده‏آمیزی، مدل چندسطحی JDL می‏باشد، با افزودن معنا و گنجاندن آنتولوژی و سایر تکنولوژي‏هاي وب معنايي به این مدل، يک ساختار داده‏آمیزی معنايي ارائه می‏شود. ساختار ارائه‏شده، گام مهمی در رفع چالش معنایی، که يکي از چالش‏هاي اصلي موجود در سيستم‏هاي داده‏آمیزی است به حساب می‏آید و نیز ناهمگونی‏های نحوی، ساختاری و معنایی را برطرف خواهد نمود.مدل ارائه‌شده با مباحث مختلف از جمله طراحی آنتولوژی‌ها، داده‏های سنسوری، وارد نمودن زمان در سه-تایی‌های RDF، استخراج قوانین و نمایش آن‌ها به صورت معنایی، انجام استنتاج معنایی، بازیابی داده‌های ذخیره شده در RDFStore روبه رو می‌باشد که در پیاده‌سازی در نظر گرفته می‌شوند.ساختار پیشنهادی از نظر کمی و کیفی مورد بررسی قرار گرفته شده است و ویژگی‌های اصلی آن در مقایسه با سایر سیستم‌های داده‏آمیزی برشمرده می‌شود و همچنین با پیاده‌سازی مدل، نشان داده می‏شود که این مدل قابلیت عملیاتی شدن را دارد و کارایی آن توسط فرد خبره موردتأیید قرار می‏گیرد.
طراحی سیستم یادگیری مبتنی بر زمینه به کمک عامل‌ها
نویسنده:
مهکامه یغمایی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
امروزه یادگیری و آموزش در دنیای مجازی از اهمیت بالایی برخوردار است. بهمین دلیل نیاز به سیستم‌های یادگیری الکترونیک که یادگیری را در هر مکان و زمانی ممکن می‌سازند بیش از پیش احساس می‌شود. از سوی دیگر با توسعه وب، حجم اطلاعات موجود در آن بصورت چشمگیری رو به افزایش است. این امر سبب می‌شود تا سیستم‌های یادگیری الکترونیک با حجم وسیعی از اطلاعات برای آموزش مواجه شوند. اما اصول مشتری مداری این اجازه را به این سیستم‌ها نمی‌دهند تا فراگیران را با حجم زیادی از اطلاعات درگیر کنند. چراکه اولا این امر موجب سردرگمی فراگیران در انتخاب موضوع برای مطالعه می‌شود، ثانیا بسیاری از این اطلاعات با توجه به مواردی نظیر خصوصیات فراگیر، علایق، اهداف و توانمندی‌های وی قابل استفاده توسط او نیستند.در پاسخ به این مسئله سیستم‌های تطبیق پذیر آموزشی ظهور کردند که هدف کلی آنها ایجاد یک تجربه منحصر به فرد آموزشی برای هر فراگیر است. این سیستم‌ها با مدل کردن خصیصه‌های مختلف فراگیر و دراختیار داشتن فرادانشی نسبت به محتوای آموزشی به شخصی سازی مطالب آموزشی برای تک تک فراگیران می‌پردازند. این مطالعه ابتدا به مرور کارهای انجام شده در زمینه سیستم‌های تطبیق پذیر آموزشی می‌پردازد. ماحصل مرور منابع موجود در این حوزه، شکاف‌های تحقیقاتی فعلی است که به تفصیل بررسی می‌شوند. بر این اساس این تحقیق به ارائه مدلی جهت شخصی سازی محتوای آموزشی می‌پردازد. معماری این مدل مبتنی بر ایده سیستم‌های چند عامله است و برای نگهداری محتویات آموزشی از هستی شناسی و استاندارد محتوایی SCORM در سطوح انتزاعی جداگانه بهره می‌گیرد. به منظور اعتبار سنجی این مدل از رویکرد پیاده سازی و شبیه سازی یک سناریوی ساده استفاده شده است. این سیستم بر روی سیستم مدیریت یادگیری Sakai نصب و راه اندازی شده است و به منظور اثبات کارآمدی آن از یک سناریوی ساده برای تطبیق پذیری استفاده شده است. نتایج این شبیه سازی نشان می‌دهند که این مدل بخوبی می‌تواند محتویات آموزشی را به فراگیران مختلف ارائه دهد.
بهره‌گیری از معیارهای شباهت چندگانه در کشف سرویس‌های وب
نویسنده:
الیاد علائی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با افزایش استفاده از سرویس‌های وب در بسترهای توزیع شده نظیر اینترنت، بر اهمیت بهبود فرآیند کشف آن‌ها افزوده شده است و سرویس‌های وب معنایی و روش‌های همتایابی هیبریدی، سعی در بهبود هرچه بیشتر آن دارند. استفاده از تکنیک‌های حوزه‌هایی نظیر بازیابی اطلاعات، جزو روش‌های معمول مورد استفاده در همتایاب‌های هیبریدی محسوب می‌گردد که محاسبه شباهت میان توصیف سرویس‌های وب، مهم‌ترین بخش این روش‌ها است. کارایی همتایاب‌هایی که از معیارهای شباهت متنی برای این منظوراستفاده کرده‌اند، تا حدود زیادی بر انتخاب این معیارها بستگی دارد زیرا که هر معیار شباهت، در دسته‌ای از پرس‌وجوها، عملکرد بهتری از خود نشان می‌دهد. با توجه به اهمیت این موضوع، ایده اصلی ما، استفاده همزمان از چندین معیار شباهت در فرآیند کشف سرویس‌های وب می‌باشد که برای این منظور به ارائه روشی برای استفاده از معیارهای شباهت چندگانه جهت محاسبه میزان شباهت بین پارامترهای ورودی/خروجی سرویس‌های وب، پرداختیم. بدین ترتیب می‌توان بهبودهای حاصل از عملکرد هر یک از معیارهای شباهت مختلف را تجمیع نمود و به نتایج کلی بهتری به ازای تمام مجموعه پرس‌وجوها رسید. در این روش از میانگین‌گیری مرتب شده وزن‌دار یاگر برای تجمیع مقادیر شباهت حاصل از به‌کارگیری معیارهای شباهت مختلف، استفاده کرده‌ایم. همچنین با توجه به برخی از ویژگی-های سرویس‌های وب، به معرفی دو معیار شباهت نامتقارن پرداخته‌ایم که موجب حصول نتایج متفاوتی نسبت به معیارهای متقارن مشابه خود شده‌اند. همچنین روشی جدید برای تجمیع نهایی شباهت حاصل از پارامترهای ورودی و خروجی سرویس‌های وب ارائه نموده‌ایم. نتایج حاصل ازبه‌کارگیری روش پیشنهادی نشان دهنده عملکرد مطلوب آن در حالت کلی، در مقایسه با نتایج حاصل از به‌کارگیری مجزای معیارهای شباهت می‌باشد. همچنین این روش در مقایسه با دو همتایاب مطرح در این زمینه، عملکرد بهتری از خود نشان داده است.
روشی نوین برای بهبود رتبه بندی نتایج جستجوی وب معنایی بر اساس پایگاه دانش مبتنی بر هستی شناسی
نویسنده:
بهاره افشین پور
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با افزایش روزافزون استفاده از موتور های جستجو برای یافتن صفحات وب، مسئله افزایش دقت و سرعت الگوریتم های رتبه بندی، اهمیت ویژه ی یافته است. الگوریتم رتبه بندی برای تعیین ترتیب نمایش صفحات یافته شده به کاربر، به کار می رود. یک رتبه بندی خوب نتایجی که مطلوب کاربر است را زودتر نمایش می دهد. راهکارهای کنونی رتبه بندی، عمدتا بر مبنای وجود کلمات وارد شده توسط کاربر، در صفحات وب می باشد. در نتیجه، گاه صفحاتی به عنوان نتیجه جستجو بازگردانده می شود که چندان مورد نظر کاربر نیستند و فقط به صرف وجود کلمه ی وارده کاربر در آنها، نمایش داده می شوند. نیاز کاربران به مشاهده صفحاتی که مد نظرشان بوده، سبب شده تا موضوع پیدا کردن روشی جهت رتبه بندی نتایج جستجو بر مبنای نزدیکی به فکر کاربر، اهمیت زیادی پیدا کند. این مشکل می تواند در وب معنایی به عنوان نسل جدید صفحات وب کاهش یابد. موتورهای جستجوی معنایی بر پایه هستی شناسی، می توانند با استفاده از برقراری ارتباط میان کلمات مورد جستجو و دنیای واقعی نتایج دقیق تری را ارائهکنند. در این پایان نامه با به کارگیری هستی شناسی، از ارتباطات موجود میان مفاهیم گنجانده شده در وب معنایی، جهت بهبود روش های رتبه بندی در موتور های جستجوی این نوع وب استفاده می شود. بدین منظور چندین معیار جهت ارزش دهی به صفحات یافت شده، با تکیه بر کاهش بار محاسباتی، پیشنهاد شده است. به منظور ارزیابی معیارهای پیشنهادی یک موتور جستجو ی نمونه پیاده سازی شده است. نتایج بدست آمده از این موتور جستجو با موتور جستجوی گوگل مقایسه و بهبود قابل ملاحظه ای در رتبه بندی نتایج مشاهده شد. این روش نسبت به روش های پیشین پیچیدگی محاسباتی کمتری دارد.
فیلتر صفحات وب با استفاده از آنتولوژی و ابزارهای وب معنایی
نویسنده:
مرتضی جادریان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
در سال‌های اخیر، تکنیک‌های فیلتر محتوایی دانش‌محور مبتنی‌بر پایگاه دانش و آنتولوژی به‌ روش‌هایی کارا و قابل‌قبول برای فیلتر اطلاعات تبدیل شده‌اند. در این تحقیق از ساختار آنتولوژی و پایگاه‌دانش‌های ویکی‌پدیا، وردنت و BNC برای عمل فیلتر اسناد، بهبود نمایش اولویت‌های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می‌شود. همچنین سامان‌دهی علایق کاربری و محتوای اسناد در پروفایل‌ها امکان استخراج دانش درباره‌ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه‌دانش فراهم می‌آورد. این تحقیق روشی نوین و منحصر‌به‌فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می‌کند و مجموعه‌ای از بهترین و کاراترین روش‌های فیلتر را پیاده‌سازی و با هم یکپارچه می‌کند. ارزیابی سیستم در دو مرحله ارزیابی روش‌های محاسبه شباهت معنایی و روش‌های فیلتر محتوایی با استفاده از مجموعه داده‌های میلر- چارلز و 20Newsgroup انجام می‌شود. نتایج ارزیابی، همبستگی زیاد روش‌های محاسبه‌ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می‌دهد. روش‌ مبتنی‌بر ویکی‌پدیا با میزان همبستگی 0.779 نه‌تنها از دیگر روش‌های پیاده‌سازی شده بهتر عمل می‌کند بلکه از روش‌های مشابه و شناخته‌شده‌ای مانند CODC با میزان همبستگی 0.693 و روش ESA با میزان همبستگی 0.58 بهتر عمل می‌کند. به‌علاوه در ارزیابی روش‌های فیلتر دانش‌محور ملاحظه می‌شود که روش مبتنی‌بر آنتولوژی با نرخ صحت و کارآیی98.9 و 98 درصد و روش مبتنی‌بر ویکی‌پدیا با نرخ صحت و کارآیی98.2 و 96 درصد نتایجبهتری نسبت به دیگر روش‌های مشابه و شناخته شده مانند NB-SVM Hybrid دارند. همچنین نتایج ارزیابی روش مبتنی‌بر ساختار ترکیب خبرگانبا نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می‌دهد کهاین روش نه‌تنها از تک‌تک روش‌های پیاده‌سازی شده کارآیی و صحت بالاتری دارد، بلکه می‌تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده‌سازی شده می‌تواند به‌عنوان رویکرد جدیدی در فیلتر محتوایی و به‌عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود.
  • تعداد رکورد ها : 33