جستجوي پيشرفته | کتابخانه مجازی الفبا

جستجوي پيشرفته | کتابخانه مجازی الفبا

کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی

فارسی  |   العربیه  |   English  
telegram

در تلگرام به ما بپیوندید

public

کتابخانه مجازی الفبا
کتابخانه مجازی الفبا
header
headers
پایگاه جامع و تخصصی کلام و عقاید و اندیشه دینی
جستجو بر اساس ... همه موارد عنوان موضوع پدید آور جستجو در متن
: جستجو در الفبا در گوگل
مرتب سازی بر اساس و به صورت وتعداد نمایش فرارداده در صفحه باشد جستجو
  • تعداد رکورد ها : 311
استنتاج مکانی در سیستم‌های اطلاعات مکانی هرجاگاه
نویسنده:
علی جاویدانه
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
سیستم‌های اطلاعات مکانی هرجاگاه، نسل چهارم محیط‌های محاسبات مکانی می‌باشند. این نسل که پس از سیستم‌های توزیع‌یافته، وب و موبایل پا به عرصه گذاشته، کاهش دخالت کاربر و افزایش راحتی استفاده را سرلوحه قرار داده است. بافت، در این سیستم‌ها نقش کلیدی ایفا می‌کند، زیرا منجر به کاهش دخالت کاربر می‌شود. به‌طور کلی بافت‌آگاهی جایگاه مهمی در محیط‌های محاسباتی هرجاگاه جهت انطباق هستنده‌های محاسباتی با وضعیت متغیر از قبیل نیازهای کاربر و توانایی‌های فنی دارد.اساس بافت‌آگاهی، مدلی صوری از بافت بوده که قابل درک و استفاده توسط رایانه باشد. هم‌چنین در محیط‌های توزیع‌یافته، مهم است که اطلاعات بافتی بتوانند میان هستنده‌های محاسباتی مختلف جهت تعامل‌پذیری به اشتراک گذارده شوند. مدلسازی بافت یعنی تعیین هستنده‌ها و روابط بین آنها که جهت تعریف یک بافت، از قبیل مکان، زمان، علایق کاربر و فعالیتهایش و هستنده‌های محاسباتی مورد نیاز است. مشکل خاص مدلسازی بافت در محیط‌های توزیع‌یافته و ناهمگون ، استفاده از رویه نمایشی اختصاصی بوده که مانع تعامل‌پذیری هستنده‌های محاسباتی گوناگون می‌شود. با استفاده از هستی-شناسی، می‌توان این مشکل را حل کرد. در علم کامپیوتر، یک هستی شناسی، بیان صوری مجموعه‌ای از مفاهیم در یک حوزه و نحوه تعامل آنها می‌باشد. هستی‌شناسی جهت استنتاج درآن حوزه یا تعریف آن حوزه به‌کار می‌رود. از سوی دیگر باید جهت حل ناسازگاری‌ها یا استخراج اطلاعات بافتی سطح بالاتر، روی این مدل، امکان استنتاج وجود داشته باشد. استنتاج روی بافت یا استنباط خودکار اطلاعات غیرصریح از اطلاعات صریح، کاربردهای فراوانی در انواع تحلیل‌های مکانی دارد. یک کاربرد اصلی استنتاج بافتی، به‌دست آوردن اطلاعات بافتی سطح بالا از اطلاعات سطح پایین داده‌های حسگرها می‌باشد.در پایان‌نامه حاضر پس از بررسی انواع روش‌های مدلسازی بافت و مقایسه آنها؛ از نظریه فعالیت جهتتعیین پارامترهای بافتی استفاده شده است. نظریه فعالیت ابزار توصیفی برای تحلیل و درک فعالیت به-صورت عمومی یعنی مستقل از هر حوزه خاص کاربردی می‌باشد. اگرچه نظریه فعالیت، فرآیندها و تکنیکها را به‌صورت ازقبل ایجاد شده بیان نمی‌کند اما می‌توان از آن، جهت تعیین اجزای کلیدی هر فعالیت استفاده کرد. سیستم‌های بافت‌آگاه، که جهت تسهیل فعالیت‌های انسان طراحی شده‌اند نیز باید این اجزای کلیدی را بازتاب دهند. تعیین پارامترهای بافتی، مدلسازی و استنتاج روی آنها، مسائل اساسی در سیستم‌های اطلاعات مکانی هرجاگاه بوده که در این پایان‌نامه بررسی شده‌اند. با توجه به اهمیت حریم خصوصی مکانی در سیستم-های اطلاعات مکانی، این موضوع به عنوان یک نمونه موردی، در نظر گرفته شده است. ابتدا به کمک نظریه فعالیت، پارامترهای بافتی مسئله تعیین شده، سپس بافت‌ها برمبنای هستی‌شناسی مدلسازی شده-اند. روند پیشنهادی حل مسئله در قالب یک پایگاه داده بیان شده و استنتاجاتی با استفاده از آن و مدل بدست آمده، انجام شده است.البته طراحی یک محیط هوشمند نیز به صورت خلاصه در بخش پیاده-سازی مورد بررسی قرار گرفته تا بر توانایی مدلسازی با استفاده از هستی‌شناسی در استخراج اطلاعات ضمنی موجود در اطلاعات صریح، تاکید شود.
طراحی یک سیستم تولید مداوم هوش برای سازمانهای آموزشی
نویسنده:
منصوره نوادوست
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
مسئله تصمیم‌گیری و استفاده از سیستم‌های کامپیوتری برای کمک و پشتیبانی‏تصمیم در سازمانهای آموزشی، مسئله جدیدی نیست و لیکن همواره یک مسئله پیچیده و حساس می‌باشد. آموزش به عنوان یک هدف تجاری هم می‌بایستی تصمیم‌های مناسب و موثّر و سریع اتخاذ نماید. استفاده از نگرش‌های جدید، از جمله استفاده از یک سیستم تولید مداوم هوش بر اساس اطلاعات داخل سازمانی و خارج سازمانی، برای کمک به مدیران اینگونه سیستم‌های آموزشی بسیار حیاتی است. در سیستم‏های هوش سازمانی که تاکنون طراحی شده‏اند، امکان استفاده از داده‏های خارجی آن هم به صورت جریانی از داده‏ها، ضمن استفاده از داده‏های داخلی، فراهم نشده است. البته استفاده از داده‏های خارجی و جریانی در یک سیستم هوش سازمانی، چالشهایی را به همراه دارد. تشخیص داده‏های مرتبط با اهداف سازمان و استخراج دانش نهفته در داده‏های جریانی از مهمترین این چالشها می‏باشند. از آنجا که در طراحی سیستم‏های هوش سازمانی متداول، این مسائل در نظر گرفته نشده‏اند، ارائه یک طراحی جدید در این خصوص ضروری می‏باشد. در این رساله طراحی یک سیستم تولید مداوم هوش برای سازمان‏های آموزشی ارائه شده است. آنتولوژی سازمان و کاوش داده‏های جریانی، مهمترین اجزا در طراحی این سیستم می‏باشند. در این تحقیق، سیستم پیشنهادی به صورت محدود پیاده‏سازی شده و مورد ارزیابی قرار گرفته است. در این سیستم کاوش داده‏های جریانی با پیاده‏سازی یکی از الگوریتمهای کاوش اقلام تکراری روی داده‏های جریانی، انجام شده و نحوه اجرای آن در کنار داده‏کاوی داده‏های داخلی نشان داده شده است.
ارائه روشی ترکیبی برای دسته‌بندی موضوعی صفحات وب به صورت خودکار
نویسنده:
یوشا مندنی پور
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
اهمیت دسته بندی موضوعی صفحات وب باعث شده با پیدایش اولین سایت های اینترنتیشرکت های بزرگی مانند یاهو و AOL به فکر ارائه سرویس های فهرست وب که وب سایت های مختلف را با کمک نیروی انسانی بر اساس موضوع دسته بندی می کند بیفتند. با افزایش روز افزون تعداد صفحات وب و عدم امکان دسته بندی صفحات وب به صورت دستی و همچنین پیدایش کاربرد های دیگری برای دسته بندی خودکار صفحات وب از قبیل فیلترینگ هوشمند و ایجاد نسل آینده موتور های جستجو گر، تحقیقاتی در این زمینه صورت گرفته که متاسفانه تا کنون نتیجه ای مطلوب و کاربردی حاصل نشده است. در اکثر تحقیقات پیشین در زمینه دسته بندی خودکار صفحات وب تنها از یک، دو و یا نهایتا سه مورد از ویژگی های قابل استخراج از صفحات وب استفاده گردیده است. از جمله این ویژگی ها می توان به استفاده از خواص تگ هایHTML از قبیل تگ های متا،عنوان صفحات، تگ های تاکید، پیوند ها و صفحات همسایه، آدرس صفحات ، موقعیت مکانی کلمات و فرکانس تکرار آنها و نیز استفاده از تکنیک های آنتالوژیاشاره کرد. در روش پیشنهادی که در این پایان نامه ارائه شده است بر روی ترکیب این موارد تمرکز شده و نشان داده شده است که استفاده همزمان از ویژگی های مختلف می تواند به افزایش دقت دسته بندی صفحات وب کمک کند.
ذخیره و بازیابی آنتولوژی در مدل داده رابطه‌ای
نویسنده:
علی کفاش
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
آنتولوژی به معنای تعریف صوری مفاهیم می‌باشد. برای ذخیره‌سازی آنتولوژی، دو روش مهم، روش‌های مبتنی بر حافظه و روش‌های ذخیره‌سازی در مدل داده رابطه‌ای می‌باشند. یکی از مشکلات روش‌های مبتنی بر حافظه که در برنامه‌های استدلال‌گری مانند pellet استفاده می‌شوند این است که مدت زمان اجرای پرس‌و‌جو نسبتا زیاد می‌باشد. پایگاه‌های داده رابطه‌ای به دلیل مزایایی همچون بالا رفتن سرعت دست‌یابی به اطلاعات، تضمین بالای امنیت محل نگه‌داری اطلاعات، کاهش هزینه‌های نگه‌داری، استفاده همزمان چند کاربر از یک داده و تخصیص سطوح مختلف دسترسی به گروه‌های مختلف کاری و همچنین امکان استفاده برنامه‌های کاربردی گوناگون از اطلاعات موجود در پایگاه‌داده رابطه‌ای، جهت ذخیره‌سازی آنتولوژی مناسب می‌باشند. روش‌های مبتنی بر مدل داده رابطه‌ای نیز که تا کنون ارایه شده‌اند دارای مشکلاتی مانند حجم بالای تعداد جداول تولید‌شده، طولانی بودن مراحل الگوریتم، عدم انعطاف‌پذیری در مقابل اعمالی همچون اضافه و حذف نمودن و همچنین به‌روزرسانی مفاهیم موجود در آنتولوژی و طولانی بودن زمان اعمال تغییرات و در نهایت عدم امکان پیاده‌سازی بیشتر روش‌ها، می‌باشند. روش ارایه‌شده در این پایان‌نامه، روشی مبتنی بر تکنیک نگاشت می‌باشد و با ایجاد تعداد ثابت 5 جدول به ذخیره‌سازی مفاهیم موجود در آنتولوژی نظیر کلاس‌ها و روابط بین آن‌ها، ویژگی کلاس‌ها، محدودیت ویژگی‌ها و همچنین نمونه‌های ایجاد شده از کلاس‌ها، به ذخیره‌سازی مفاهیم در پایگاه‌داده رابطه‌ای می‌پردازد. روش پیشنهادی که به صورت کامل پیاده‌سازی شده است، مزایایی نظیر بهینه بودن زمان پرس‌وجو، کم بودن مراحل الگوریتم، امکان ایجاد تغییرات و قابلیت پیاده‌سازی را به طور کامل پوشش می‌دهد، همچنین فاکتورهایی مانند مدت زمان اجرای پرس‌وجو،صحت، کامل بودن، مقیاس‌پذیری، تعداد مراحل الگوریتم، تعداد جداول ایجاد شده، پیچیدگی مدل نهایی و فهم آسان آزمایش شده اند که نتایج حاصل از روش پیشنهادی، در بسیاری از معیار‌های ذکر شده دارای عملکرد بهتری می‌باشد.
فیلتر صفحات وب با استفاده از آنتولوژی و ابزارهای وب معنایی
نویسنده:
مرتضی جادریان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
در سال‌های اخیر، تکنیک‌های فیلتر محتوایی دانش‌محور مبتنی‌بر پایگاه دانش و آنتولوژی به‌ روش‌هایی کارا و قابل‌قبول برای فیلتر اطلاعات تبدیل شده‌اند. در این تحقیق از ساختار آنتولوژی و پایگاه‌دانش‌های ویکی‌پدیا، وردنت و BNC برای عمل فیلتر اسناد، بهبود نمایش اولویت‌های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می‌شود. همچنین سامان‌دهی علایق کاربری و محتوای اسناد در پروفایل‌ها امکان استخراج دانش درباره‌ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه‌دانش فراهم می‌آورد. این تحقیق روشی نوین و منحصر‌به‌فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می‌کند و مجموعه‌ای از بهترین و کاراترین روش‌های فیلتر را پیاده‌سازی و با هم یکپارچه می‌کند. ارزیابی سیستم در دو مرحله ارزیابی روش‌های محاسبه شباهت معنایی و روش‌های فیلتر محتوایی با استفاده از مجموعه داده‌های میلر- چارلز و 20Newsgroup انجام می‌شود. نتایج ارزیابی، همبستگی زیاد روش‌های محاسبه‌ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می‌دهد. روش‌ مبتنی‌بر ویکی‌پدیا با میزان همبستگی 0.779 نه‌تنها از دیگر روش‌های پیاده‌سازی شده بهتر عمل می‌کند بلکه از روش‌های مشابه و شناخته‌شده‌ای مانند CODC با میزان همبستگی 0.693 و روش ESA با میزان همبستگی 0.58 بهتر عمل می‌کند. به‌علاوه در ارزیابی روش‌های فیلتر دانش‌محور ملاحظه می‌شود که روش مبتنی‌بر آنتولوژی با نرخ صحت و کارآیی98.9 و 98 درصد و روش مبتنی‌بر ویکی‌پدیا با نرخ صحت و کارآیی98.2 و 96 درصد نتایجبهتری نسبت به دیگر روش‌های مشابه و شناخته شده مانند NB-SVM Hybrid دارند. همچنین نتایج ارزیابی روش مبتنی‌بر ساختار ترکیب خبرگانبا نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می‌دهد کهاین روش نه‌تنها از تک‌تک روش‌های پیاده‌سازی شده کارآیی و صحت بالاتری دارد، بلکه می‌تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده‌سازی شده می‌تواند به‌عنوان رویکرد جدیدی در فیلتر محتوایی و به‌عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود.
شناسایی رتبه کالا با ارائه یک مدل جدید از نظرکاوی
نویسنده:
علیرضا یوسفیان نائینی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با افزایش روزافزون کاربران اینترنت، این بستر به منبعی غنی از اطلاعات تبدیل شده و با همگانی شدن آن، بیان نظرات و عقاید کاربران در مورد کالا‌ها، سازمان‌ها و اشخاص با سادگی بیشتری انجام می‌شود. با توجه به تحقیقاتی که در سال 2009 انجام گرفت، موثرترین عامل در تصمیم‌گیری مشتریان در خرید الکترونیک، نظرات ارائه شده توسط کاربران در مورد کالا‌ها می‌باشد. ولی با افزایش نظرات کاربران در مورد کالا‌ها تصمیم‌گیری و نتیجه‌گیری از نظرات مشکل شده است. در این پایان نامه مدل جدیدی از نظرکاوی ارائه شده است. در این مدل بر خلاف کارهای گذشته، برای کلمات بیان کننده احساسات، شدت گرایش تعیین می‌شود و در شناسایی گرایش شخص نسبت به یک کالا لحاظ می‌شود. همچنین در این مدل روشی برای تخصیص وزن به ویژگی‌ها ارائه شده است. کارایی مدل پیشنهادی بر روی مجموعه داده تهیه شده از وب سرویس آمازون ارزیابی و با سایر مدل‌ها مقایسه شده است. خلاصه‌سازی با استفاده از مدل پیشنهادی دارای جزئیات دقیق‌تر و کامل‌تر نسبت به مدل‌های گذشته می‌باشد و همچنین شناسایی رتبه کالا از نظرات با استفاده از این مدل نسبت به سایر مدل‌های با دقت بالاتری انجام می‌شود.
ارائه یک چارچوب برای یادگیری بدون ناظر مبتنی بر جریان اطلاعات در تشخیص و ارزیابی بدافزارها
نویسنده:
فرزانه لشگری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
امروزه یکی از مهمترین چالش‌ها در زمینه امنیت اطلاعات و شبکه‌های ارتباطی، گسترش روزافزون بدافزارها است که به دنبال آن،یافتن راه‌های مناسب جهت حفاظت سیستم‌ها در مقابل نفوذگران الزامی است .یکی از مشکلات اساسی برای درک صحیح رفتارهای مخرب و گرایش‌های جدید در توسعه بدافزارها، این است که بدافزارها نیز مانند کامپیوترها و نرم‌افزارها به سرعت توسعه و بهبود می‌یابند و روز به روز، از روش‌های پیچیده‌تری برای گریز از تشخیص بهره می‌گیرند. لذا روش‌های سنتی، مانند تطابق چند رشته کد از امضای بدافزارها، که قادر به شناسایی بدافزارهای ناشناخته و جدید نبوده و میزان هشدارهای نادرست بالایی دارند، به تنهایی کارایی لازم جهت تشخیص بدافزارها را ندارند. در اینجاست که تشخیص هوشمند به موازات پیچیده‌تر شدن بدافزارها مورد توجه قرار گرفته‌است. روش‌های هوشمند کنونی، با تکیه بر تکنیک‌های یادگیری ماشین، کمک به درک سریع‌تر رفتارهای مخرب کرده و، در نتیجه، راه را برای تشخیص و ارزیابی بدافزارها هموارتر ساخته اند. باتوجه به اهمیت این موضوع، ایده اصلی ما، ارائه یک سیستم تشخیص بدافزار با توانایی درک معنایی است که با استفاده از جریان اطلاعات یعنی روابط میان داده‌ها و استنتاج آنها، بدافزار را شناسایی کرده و، سپس، با استفاده از طبقه‌بندی ابعادی پیشنهادی، بدافزار شناسایی شده را به درستی به خانواده مربوط به خود اختصاص می‌دهد.چارچوب پیشنهادی به معرفی یک سیستم تشخیص نفوذ توزیع شده در سطح شبکه می‌پردازد که شناسایی بدافزارها را با استفاده از مفاهیم هستان‌شناسی انجام داده و آن ها را به خوبی طبقه‌بندی می‌کند. سیستم ارائه شده، قادر به شناسایی حملات ناشناخته بوده و بهبود قابل ملاحظه‌ای در نرخ تشخیص، نسبت به سایر روش‌ها داشته، ضمن اینکه نرخ هشدارهای نادرست آن، در مقایسه با سایر روش‌ها پایین‌تر است.
بررسی عوامل استعلا در فلسفه‌ی علوم اجتماعی و پیشنهاد مسیری بدیل بر مبنای هستی‌شناسی اجتماعی برای پرهیز از استعلا
نویسنده:
امیر خراسانی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
پژوهش حاضر به مسئله‌ی خاص‌بودگی در فلسفه‌ی علوم اجتماعی می‌پردازد. نقطه‌ی عزیمت این پژوهش شیوه‌‌ای است که به واسطه‌ی آن فرد تاریخی (یا همان موضوع پژوهش) در علوم اجتماعی ساخته می‌شود. در این مسیر با پروبلماتیک کردن مفهوم فرد تاریخی دلالت این مفهوم و مسئله‌زا بودن آن را برای علوم اجتماعی بررسیده می‌شود. در فصل نخست این پژوهش، با یک بررسی تاریخی نشان می‌دهیم که چگونه از آغاز بنیان‌گذاری علوم اجتماعی، انگاره‌ی تفرد نزد کلاسیک‌های این حوزه طرح شد، و پس از گذشت یک سده همچنان موضوع تأملات نقادانه است. در این فضل با برجسته‌کردن انگاره‌ی تفرد، می‌بینیم که خاص‌بودگی مورد نظر کلاسیک‌های علوم اجتماعی که بنا بود در انگاره‌ی تفرد رفع شود، همواره ابتر می‌ماند و به نوعی استعلاء می‌انجامد. در ادامه خواهیم دید که دلیل اصلی این ناکامی، نوعی هستی‌شناسی اجتماعی است که در بنِ انگاره‌ی تفرد قرار دارد.نسبت میان هستی‌شناسی و خاص‌بودگی فرد تاریخی ما را به یک تبارشناسی فلسفی می‌کشاند. نقطه‌ی ثقل این تبارشناسی کانت است. از این روی فصول پژوهش برمبنای پیش از کانت، پس از کانت و فراروی از کانت سازمان یافته است. برای تقریر مفهوم خاص‌بودگی در فلسفه ابتدا دو خوانش معاصر (دریدا و دلوز) از فرد نزد افلاطون را طرح می‌کنیم. سپس به سراغ اندیشمندان قرون وسطی می‌رویم، و آرای ایشان را درباره‌ی انگاره‌ی تفرد وامی‌کاویم. این دو بخش، به ترتیب دوگفتار فصل دوم را شکل می‌دهند.سپس به سراغ آثار کانت می‌رویم و درگیری کانت با انگاره‌ی تفرد را وامی‌کاویم. از این منظر کانت را یک‌بار در نقد اول در نظر می‌گیریم، و در گفتار دوم به سراغ انگاره‌ی تفرد کانتی در نقد سوم و مکتوبات پس از مرگ وی می‌رویم. در فصل چهارم دوواکنش به تفرد کانتی را مرور می‌کنیم. این واکنش‌ها یکی در فلسفه‌ی زیست‌‌شناسی طرح شده و دیگری از آنِ وایتهد است. در فصل پنجم به سراغ هستی‌شناسی اجتماعی دلوزی می‌ریوم. در این فصل می‌بینیم که چگونه این هستی‌شناسی جدید افق نوپدیدی بر روی مسئله‌ی تفرد می‌گشاید. داعیه‌ی اصلی این است که این هستی‌شناسی امکاناتی را برای توضیح درون‌ماندگار امر اجتماعی به دست می‌دهد که تا پیش از این قابل‌طرح نبودند.
ارائه الگویی جهت پیاده‌سازی جستجوی معنایی با استفاده از تکنیکهای وب معنایی
نویسنده:
امیر هراتی علمداری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
آنچه که تا کنون در فضای وب جریان داشته است افزایش روزافزون حجم اطلاعات و مستندات موجود در آن بوده است، بدون اینکه این افزایش حجم مستندات تاثیری در کاربرد و بهره برداری خودکار اطلاعات موجود به همراه داشته باشد. به علاوه امروزه اکثریت محتوای وب بر روی پایگاه داده های رابطه ای ذخیره شده اند. حرکتی که گام های اولیه آن درحال شکل گیری است تغییر شکل «وب» به موجودیتی تحت عنوان «وب معنایی» میباشد. وب معنایی یک گسترش از وب موجود است که گاهی اوقات تحت عنوان «وب آینده» و یا «وب نسخه 3» معرفی می شود، که در آن به اطلاعات، معانی خوش تعریفی داده می شود که بتوانند قابلیت همکاری بهتر بین کامپیوتر ها و انسان را فراهم کنند. موفقیت وب معنایی بر تولید انبوه داده های معنایی وابسته است. با توجه به حجم عظیم داده های رابطه ای ذخیره شده در پایگاه داده های رابطه ای موجود در وب، انتشار این داده های رابطه ای بر روی وب معنایی بسیار پر کاربرد خواهد بود. در این پایان نامه، الگویی جهت پیاده سازی جستجوی معنایی بر روی داده های ذخیره شده در پایگاه داده های رابطه ای، با استفاده از تکنیک های وب معنایی ارائه شده است. گام های اصلی الگوی پیشنهادی در این پایان نامه از این قرارند:1-بازنمایی داده های سازمانی ذخیره شده بر روی پایگاه داده های رابطه ای بر اساس گراف های معنایی با استاندارد RDF به صورت یک پایگاه دانش معنایی(نگاشت داده های رابطه ای به گراف های معنایی)2-آنالیز وابستگی های داده ای برنامه و بازنمایی اجزای برنامه و ارائه یک آنتولوژی سازمانی بر اساس آنها3-پیاده سازی یک موتور جستجوگر معنایی که بر پایه آنتولوژی سازمانی تهیه شده و پایگاه دانش نگاشت شده، که به جستجوی معنایی بر روی اطلاعات دامنه مورد نظر می پردازد.
خوشه‌بندی اسناد متنی الکترونیکی بر اساس دانش پس‌زمینه و وزن‌دهی ابعاد و مفاهیم
نویسنده:
محمد زنجانی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
خوشه‌بندی یا دسته‌بندی بدون نظارت با سازمان‌دهی پیکره‌های بزرگ متنی، نقش کلیدی در پیمایش و مرور آسان انبوهی از متون دارد. نقش این سازمان‌دهی در موتورهای جستجو برای ارائه‌ خوشه‌های معنادار مرتبط با پرس‌و‌جو، جهت پیشگیری از سردرگمی کاربر در حجم عظیمی از اسناد بازیابی شده بیشتر نمایان می‌شود. علاوه بر مشکلاتی نظیر تعداد ابعاد بسیار زیاد و تحلیل خوشه‌ای، متاسفانه دیدگاه متعارف خوشه‌بندی‌های افرازی و سلسله‌مراتبی، به متن، همانند کیسه‌ای از کلمات است که در نتیجه در مقایسه‌ها فقط شباهت‌های ظاهری اسناد مورد توجه قرار می‌گیرد. در این نوع دیدگاه، کلمات یا تِرم‌ها کاملا ناهمبسته‌اند و به روابط کلمات (مثل هم‌معنایی و شمول) توجهی نمی‌شود. همچنین تلاشی برای رفع ابهام از کلمات چند‌معنایی صورت نمی‌گیرد. عدم توجه به این گونه مسائل غالبا منجر به خوشه‌بندی با ‌کیفیت پایین و یا غیرمعنایی می‌شود.در این تحقیق، زبان فارسی با توجه به اهمیت آن به عنوان یکی از زبان‌های زنده دنیا و رشد روزافزون متون الکترونیکی به زبان نوشتاری فارسی، مورد توجه قرار گرفته است. ایده اصلی یافتن توصیف‌های مناسب برای دانش پس‌زمینه و غنی‌سازی متن فارسی با استفاده از آن جهت افزایش کیفیت خوشه‌بندی است. برای نیل به این مقصود از منبع دانش خارجی با نام واژ-هستان‌شناسی فارس‌نت استفاده شده است. با کمک فارس‌نت عملیات رفع ابهام از دسته‌های معنایی کلمه صورت پذیرفته، روابط هم‌معنایی و شمول مربوط به معنای کلمه رفع ابهام شده، وارد بردار کلمات متن می‌شود. همچنین برای خوشه‌بندی متنی بر رهیافت نمایش مبتنی بر اجزاء یا فاکتورگیری نامنفی ماتریسِ ترم-متن تاکید شده است. نتایج ارزیابی‌های صورت گرفته بر روی پیکره استاندارد متنی همشهری، نشان از بهبود کیفیت خوشه‌بندی متون فارسی غنی‌شده (بخصوص با رابطه شمول) در مقایسه با خوشه‌بندی خام دارد. همچنین تاثیر این روابط در بهبود کیفیت خوشه‌بندی و نیز توضیح خوشه‌ای بر پایه فاکتورگیری نامنفی ماتریس بیشتر از خوشه‌بندی Bisecting Kmeans بوده است.
  • تعداد رکورد ها : 311