جستجوي پيشرفته | کتابخانه مجازی الفبا

جستجوي پيشرفته | کتابخانه مجازی الفبا

کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی

فارسی  |   العربیه  |   English  
telegram

در تلگرام به ما بپیوندید

public

کتابخانه مجازی الفبا
کتابخانه مجازی الفبا
header
headers
پایگاه جامع و تخصصی کلام و عقاید و اندیشه دینی
جستجو بر اساس ... همه موارد عنوان موضوع پدید آور جستجو در متن
: جستجو در الفبا در گوگل
مرتب سازی بر اساس و به صورت وتعداد نمایش فرارداده در صفحه باشد جستجو
  • تعداد رکورد ها : 21
فیلتر صفحات وب با استفاده از آنتولوژی و ابزارهای وب معنایی
نویسنده:
مرتضی جادریان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
در سال‌های اخیر، تکنیک‌های فیلتر محتوایی دانش‌محور مبتنی‌بر پایگاه دانش و آنتولوژی به‌ روش‌هایی کارا و قابل‌قبول برای فیلتر اطلاعات تبدیل شده‌اند. در این تحقیق از ساختار آنتولوژی و پایگاه‌دانش‌های ویکی‌پدیا، وردنت و BNC برای عمل فیلتر اسناد، بهبود نمایش اولویت‌های کاربری و محتوای اسناد و محاسبه شباهت معنایی استفاده می‌شود. همچنین سامان‌دهی علایق کاربری و محتوای اسناد در پروفایل‌ها امکان استخراج دانش درباره‌ی علایق احتمالی کاربران و محتوای اسناد را با استفاده از آنتولوژی و پایگاه‌دانش فراهم می‌آورد. این تحقیق روشی نوین و منحصر‌به‌فرد در ساختار ترکیب خبرگان برای فیلتر اسناد ارائه می‌کند و مجموعه‌ای از بهترین و کاراترین روش‌های فیلتر را پیاده‌سازی و با هم یکپارچه می‌کند. ارزیابی سیستم در دو مرحله ارزیابی روش‌های محاسبه شباهت معنایی و روش‌های فیلتر محتوایی با استفاده از مجموعه داده‌های میلر- چارلز و 20Newsgroup انجام می‌شود. نتایج ارزیابی، همبستگی زیاد روش‌های محاسبه‌ی شباهت معنایی میان مفاهیم را با قضاوت بشر نشان می‌دهد. روش‌ مبتنی‌بر ویکی‌پدیا با میزان همبستگی 0.779 نه‌تنها از دیگر روش‌های پیاده‌سازی شده بهتر عمل می‌کند بلکه از روش‌های مشابه و شناخته‌شده‌ای مانند CODC با میزان همبستگی 0.693 و روش ESA با میزان همبستگی 0.58 بهتر عمل می‌کند. به‌علاوه در ارزیابی روش‌های فیلتر دانش‌محور ملاحظه می‌شود که روش مبتنی‌بر آنتولوژی با نرخ صحت و کارآیی98.9 و 98 درصد و روش مبتنی‌بر ویکی‌پدیا با نرخ صحت و کارآیی98.2 و 96 درصد نتایجبهتری نسبت به دیگر روش‌های مشابه و شناخته شده مانند NB-SVM Hybrid دارند. همچنین نتایج ارزیابی روش مبتنی‌بر ساختار ترکیب خبرگانبا نرخ صحت و کارآیی 99.4 و 98.9 درصد نشان می‌دهد کهاین روش نه‌تنها از تک‌تک روش‌های پیاده‌سازی شده کارآیی و صحت بالاتری دارد، بلکه می‌تواند خطاهای عمل فیلتر را تصحیح کند. براساس این نتایج، سیستم پیاده‌سازی شده می‌تواند به‌عنوان رویکرد جدیدی در فیلتر محتوایی و به‌عنوان چارچوبی برای استفاده در کاربردهای فیلتر اطلاعات استفاده شود.
یادگیری مفاهیم در سیستم‌های چندعامله: با رهیافت تئوری بازی
نویسنده:
سیدنیما میربخش
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
یادگیری مفاهیم یکی از مباحث مهم در سیستمهای چند عامله است. تمرکز این مبحث بروی عامل هایی است که با استفاده از استقلال خود برای رشد و پیشرفت در محیط پیرامون خود، از دانش یکدیگر برای تعالی دانش خود نسبت به محیط استفاده می کنند.بدین منظور یک عامل با دریافت اطلاعات جدید از محیط و یا دیگر عامل هامی باید قادر باشد تا دانش خود را از جهان پیرامون خود بروز رسانی کند. پس به عنوان بخشی از جهان بینی و یا آنتولوژی عامل نسبت به محیط، مفاهیم نقش بسته در آنتولوژی یک عامل نیز نیازمند رشد و بروز شدن در گذر زمان است.در این رساله به تعریفی جدید از نمایش مفاهیم بر اساس مشخصه مقدار ها و مقادیر احتمالاتی آنها می پردازیم. این تعریف جدید به عامل ها اجازه می دهد تا بتوانند با دریافت حجم پایینی از اطلاعات جدید دانش خود را نسبت به مفاهیم افزایش دهند.همچنین در بخش دوم این رساله با نگاهی تازه به روند یادگیری مفاهیم در سیستم های چند عامله، تعامل و سازو کار تصمیم گیری عامل ها را برای همکاری و یا خیانت به یکدیگر به شکل یک بازی در نظر گرفتیم. در این بازی عامل ها با شناختن ارزش دانشی که از دست می دهند اقدام به محاسبه ارزش دریافتی کرده و با ساز و کاری قاعده مند اقدام به اتخاذ تصمیم می کنند. این نگاه رقابتی به سیستم های چند عامله نگرشی نزدیکتر به محیط های انسانی خواهد بود. در محیط های انسانی مانند مراکز تحقیقاتی و دانشگاه ها، اطلاعات می توانند بسیار حائز اهمیت باشد. دو عامل در چنین محیطی می باید با توجه به آنچه از دست می دهند مراقب سوء استفاده های احتمالی دیگر عامل ها از اطلاعات خود باشند. این نوع نگرش به رابطه میان عامل ها در حقیقت بازتابی از روابط انسانی خواهد بود.
پیمانه‌ای‌کردن آنتولوژی در وب معنایی
نویسنده:
مریم جعفری شریف‌آبادی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
ایده اصلی وب معنایی، ایجاد فراداده‌هایی است که داده را شرح می‌دهند تا کامپیوترها را قادر به پردازش معنی اشیا کنند. هدف از وب معنایی این است که ماشین‌ها نیز همانند انسان‌ها سندها را درک کرده و تفسیر کنند. یکی از مولفه‌های اصلی وب معنایی، آنتولوژی است، که نسبت به سایر مولفه‌ها از قدرت بیان بیشتری برخوردار است. آنتولوژی، مجموعه‌ای از واژگان مشترک را برای محققانی تعریف می‌کند که نیاز به اشتراک‌گذاری اطلاعات در یک دامنه دارند. امروزه استفاده از آنتولوژی در وب افزایش یافته است. بسیاری از آنتولوژی‌های معروف، اندازه بزرگی دارند. اندازه بزرگ این آنتولوژی‌ها باعث کاهش سرعت و کارایی در استفاده‌مجدد، استنتاج، نگهداری و هماهنگی سیستم‌های توزیع‌شده می‌شود. راه‌حل این مساله، پیمانه‌‌ای کردن آنتولوژی می‌باشد. پیمانه‌ای کردن آنتولوژی، بخش مهمی از مهندسی آنتولوژی است که برای کاهش پیچیدگی و اندازه آنتولوژی، یا آن را به کل قطعات تشکیل‌دهنده می‌شکند (تقسیم‌بندی آنتولوژی) و یا اینکه فقط بخش کوچکی از آن را استخراج می‌کند (استخراج پیمانه). هدف از این پژوهش ارائه رهیافتی برای پیمانه‌ای کردن آنتولوژی به پیمانه‌هایی درست، کامل و متصل به هم است، به صورتی که کاربر بتواند بر اساس نیازهای برنامه کاربردی تنظیماتی را در پیمانه‌ای کردن اعمال کند.رهیافت ارائه‌شده در این پژوهش روی تقسیم‌بندی آنتولوژی تمرکز دارد. برای داشتن قطعه‌های کامل، ابتدا یک استنتاج مقدماتی روی آنتولوژی انجام شده و سپس حاصل آن به Pato، که ابزاری برای تقسیم‌بندی است، داده می‌شود. به دلیل انجام استنتاج مقدماتی، نتیجه تقسیم‌بندی، پیمانه‌هایی مرتبط و نیمه‌کامل است. بنابراین، قضایای کامل‌کننده به آن‌ها اضافه می‌شود. سپس پیمانه‌ها توسط زبان آنتولوژی پیمانه‌ای P-DL به هم متصل می‌شوند. به این ترتیب، پیمانه‌های حاصل، پیمانه‌هایی متصل و کامل با اندازه مناسب هستند. هرچند استنتاج روی آنتولوژی‌های بزرگ عملی وقت‌گیر است، اما فقط یکبار صورت می‌گیرد و در عوض مزایای زیادی به همراه دارد که توسط دیگر روش‌ها تامین نمی‌شوند. برای ضمانتِ این ادعا، روش ارائه‌شده و روش‌های قبلی به صورت تئوری و عملی ارزیابی شده و نشان داده می‌شود که این روش باعث می‌شود که آنتولوژی به‌طور متعادلی بخش‌بندی شود و پیمانه‌های حاصل مانند یک آنتولوژی خودشمول، توسط ابزارهای زیادی استفاده شوند.
استفاده از بازی‌های هدف‌دار در وب‌معنایی
نویسنده:
صفورا ذاکری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
پیش‌نیاز وب‌معنایی که با هدف ایجاد ارتباط و تعامل مستقیم ماشین‌ها بدون دخالت بشر طرح شد، وجود مقدار زیادی آنتولوژی و داده‌های حاشیه‌نویسی است. با وجود پیشرفت‌های قابل‌توجه در ابزارها و راه‌حل‌های نیمه‌خودکار، به‌میزان کافی از نیروی انسانی و هوش افراد برای ساخت آنتولوژی، حاشیه‌نویسی داده‌ها در انواع بعدها و قالب‌ها و تنظیم کردن اجزای مفهومی در آنتولوژی‌های متعدد، نیاز است. سری بازی‌های هدف‌دار برای استفاده‌ی مجانی از وقت، هوش و توانایی افراد برای نخستین بار به‌وسیله‌ی لوئیس ون آهِن (در سال 2002) ارائه شد. ایده‌ی استفاده از بازی‌های هدف‌دار در درست کردن وب‌معنایی، به‌وسیله‌ی کاترینا سیورپائس (در سال 2006) مطرح شد. سیورپائس، چند بازی‌ را برای حاشیه‌نویسی معنایی در دامنه‌های مختلف، ارائه داده است. این رساله، به‌دنبال آن است که به‌طور گسترده‌تری از بازی‌های هدف‌دار در ساخت وب‌معنایی استفاده کند؛ بنابر‌این، به‌بررسی آنتولوژی و آنتولوژی فازی، حاشیه‌نویسی داده‌ها بر‌اساس آنتولوژی‌های‌ موجود و تنظیم اجزای مفهومی در آنتولوژی‌ها می‌پردازد. با بررسی مراحل تولید آنتولوژی و آنتولوی متغیر زبانی فازی، مراحلی که انجام‌شان نیازمند نیروی انسانی بودند، شناسایی و بازی‌هایی برای انجام برخی از این مراحل، پیشنهاد می‌شود. در نهایت، یکی از بازی‌های پیشنهادی با نام واژه‌معنا (LingoGame) که برای پیدا کردن مقادیر متغیرهای زبانی است، پیاده‌سازی و نتایج حاصل از آن، بررسی می‌شود.
بررسی میزان اعتماد و اعتبار سیستم‌های چندپیشکاره در وب‌معنایی
نویسنده:
نیکو ذوالفقارکرهرودی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
باتوجه به ذات پویای سیستم‌های چندپیشکاره وب‌معنایی و وجود پیشکارهای مختلف در آن، شناسایی پیشکارهای قابل اعتماد یکی از چالش‌های ایجاد ارتباط بین پیشکارها در وب‌معنایی است. ارزیابی اعتماد در این سیستم‌ها براساس رفتار گذشته‌ی پیشکارها انجام می‌شود. دو منبع اصلی برای کسب اطلاعات از رفتار گذشته‌ی پیشکارها وجود دارد: ارتباط‌ مستقیم بین پیشکارها و اطلاعات به‌دست آمده از سایر پیشکارهای اجتماع. باوجود پیشکارها با سلیقه‌ها و نظرات مختلف، مدل اعتماد پیشنهادی باید بتواند مطابق با نیازهای پیشکارها تنظیم شود. به‌علاوه برای محاسبه‌ی اعتبار پیشکارها باید اطلاعات مربوط به رفتار آن‌ها در گذشته از جامعه‌ی پیشکارها جمع‌آوری شود. همچنین اعتماد ابعاد مختلفی دارد و ممکن است میزان اعتماد به پیشکار مفروضی در ابعاد مختلف متفاوت باشد. این رساله برای حل هر یک از این چالش‌ها راه‌حلی پیشنهاد می‌دهد. مدل پیشنهادی این رساله از روش توزیع شده‌‌‌ای مبتنی‌بر شبکه‌های اجتماعی برای جمع‌آوری اطلاعات از محیط استفاده می‌کند و با بهره‌گیری از شبکه‌های عصبی مصنوعی میزان اعتبار را براساس مشاهدات جمع‌آوری شده ارزیابی می‌کند. شبکه‌های عصبی در طول زمان مطابق دیدگاه پیشکار آموزش می‌بینند، بدین‌ترتیب میزان اهمیت توصیه‌های جمع‌آوری شده باتوجه به دیدگاه پیشکار ارزیابی‌کننده‌ی اعتماد تنظیم شود. همچنین مدل پیشنهادی دراین رساله برای نمایش میزان اعتماد از آنتولوژی‌ها بهره می‌گیرد، بدین وسیله میزان اعتماد در ابعاد مختلف محاسبه می‌شود. این رساله برای بررسی کارایی مدل پیشنهادی، بستری با استفاده از میان‌افزار Jade پیاده‌سازی می‌کند و کارایی مدل به‌‌طور عملی در آن آزمایش می‌شود.
دسته‌بندی اسناد فارسی به کمک هستان‌شناسی فارس‌نت
نویسنده:
صباسادات مدنی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با توجه به رشد روزافزون اسناد الکترونیکی، نیاز به یک دسته بند کارا در حوزه داده کاوی واضح است. اخیراً به منظور افزایش دقت دسته بندی، استفاده از آنتولوژی لغوی به عنوان مرجع خارجی و نیز استخراج دانش از متون در فرآیند دسته بندی، مطرح شده است؛ از این رو، هدف از انجام این پروژه ارائه و پیاده سازی سیستم دسته بندی خودکار اسنادی است که آنتولوژی لغوی فارس نت را در عملیات دسته بندی داخل می نماید. این امر منجر به افزایش اوزان کلمات مرتبط با دانش پیش زمینه متن می شود. راهکار پیشنهادی برای استفاده از آنتولوژی لغوی، تمرکز بر روی بردار مشخصه ی معنایی را محور فعالیت های خود قرار داده است؛ تا بدین وسیله فرآیند دسته بندی را بهبود بخشد. در این پروژه ضمن بررسی و مطالعه ی روش های بکارگیری آنتولوژی لغوی در فرآیند دسته بندی، آنتولوژی لغوی فارس نت را به منظور استخراج روابط معنایی استفاده می نماییم.در سیستم ارائه شده، کلیه ی اجزاء تشکیل دهنده ی سیستم دسته بندی شامل پردازشگر لغوی، کاهنده ی ویژگی، انتخاب کننده ی ویژگی، وزن دهی به ویژگی و طبقه بندی کننده اسناد، لحاظ شده است. در این پروژه الگوریتم χ^2 در بخش انتخاب مشخصه و روش وزن دهی ویژگی نرمال شده TFIDF در بخش وزن دهی به کار گرفته می شود. پیش از اعمال روش وزن دهی به مشخصه ها، بردار مشخصه معنایی برای هر کلمه کلیدی توسط مفاهیم استخراج شده از آنتولوژی لغوی فارس نت، ایجاد می شود. نتایج ارزیابی های انجام شده نشان دهنده ی بهبود قابل توجهی در کارایی و دقت الگوریتم دسته بندی با بکارگیری آنتولوژی لغوی فارس نت است.
بهینه‌سازی فرآیند جست و جو و نگهداری داده‌های پیوندی وب معنایی
نویسنده:
نغمه سهرابیان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
برخلاف وب، هدف اصلی وب‏معنایی قابلیت فهم ماشین از اسناد است. توسعه‏ی وب‏معنایی مستلزم توسعه ی داده‏های پیوندی است. داده‏های‏پیوندی اجزای سازنده ی وب‏معنایی هستند که در قالب مدلآر. دی. اف ، منابع‏داده‏ای مختلف وب را به هم مرتبط می کنند. با گذشت زمان تعداد این داده‏ها رو به افزایش است و این امر بازیابی و نگهداری داده‏ها را با مشکل مواجه کرده است. بنابراین نگهداری داده‏های‏پیوندی به نحوی که بازیابی اطلاعات مورد نیاز با صرف کمترین زمان و پیچیدگی انجام شود، نیاز به نگهداری بهینه ی این داده ها را توجیه می کند.معمولاً از جداول‏ رابطه‏ای بزرگ برای نگهداری داده‏های وب‏معنایی استفاده می‏شود. هدف این پژوهش شکستن این جداول رابطه‏ای به جداول کوچک‏تر به‏منظور مدیریت آسان‏تر داده‏های‏پیوندی و دسته‏بندی آن‏هاست. در روش پیشنهادی، این دسته‏بندی براساس نگاشت ساختارهای آنتولوژی مرتبط ‏با داده‏ها به پایگاه‏داده‏ی رابطه‏ای انجام می‏شود. روش‏ پیشنهادی جهت افزایش دقّت داده‏های‏پیوندی از نوعی استنتاج روی داده‏های‏پیوندی بهره می‏گیرد و سرعت بازیابی داده‏های‏پیوندی را نیز از‏ طریق انتخاب ساختارهای ذخیره‏ی مناسب و شاخص‏گذاری افزایش می‏دهد. نتایج حاصل از مقایسه‏ی روش پیشنهادی با روش‏های مطرح ذخیره‏سازی داده‏های آر. دی. اف مانند روش مستقل از الگو، روش مبتنی‏بر الگو و روش هیبرید افزایش سرعت و دقّت داده‏های بازیابی‏شده را نشان می‏دهد و با به‏کارگیری ساختارهای مناسب امکان پاسخ‏گویی به طیف وسیع‏تری از پرس‏وجوها فراهم می‏آید. به‏منظور ارزیابی نتایج از جعبه‏ی‏ اطلاعات در مجموعه‏داده‏ی دی‏بی‏پدیااستفاده شده است.
تطابق هستان‌شناسی با رویکرد هوش جمعی
نویسنده:
علیرضا محمدی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
امروزه با توجه یه کاربرد وسیع هستان شناسی ها به ساخت و توسعه آنها توجه زیادی می شود. اما به این دلیل که افراد مختلفی با درک و کلمات متفاوتی هستان شناسی ها را توسعه می دهند ممکن است دو هستان شناسی که یک دامنه را توصیف می کنند دارای ساختار و واژگان متفاوت باشند. ایجاد درک مشترک بین هستان شناسی ها موجب ایجاد سامانه های تطابقهستان شناسی ها شده است. آن چه که در توسعه سامانه های تطابق تاکنون مغفول مانده است نگاه به مبحث شناخت شناسی به عنوان اساس هستان شناسی و استفاده از مفاهیم این حوزه در تطابق هستان شناسی هاست.در این پژوهش با پرداختن به حوزه شناخت شناسی، به روشی بر مبنای هوش جمعی رهنمون می شویم و فرا سامانه ای برای تطابق هستان شناسی ها ارائه می دهیم. هم افزایی سامانه های تطابق در این روش موجب انطباق هر چه بهتر هستان شناسی ها با دقت و فراخوانی بیشتری نسبت به سایر سامانه های تطابق می شود.
خوشه‌بندی اسناد مبتنی بر آنتولوژی و رویکرد فازی
نویسنده:
مریم امیری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
داده‌کاوی که به عنوان استخراج دانش از پایگاه داده‌ها نیز شناخته می‌شود، روالی برای استخراج دانش ناشناخته از مقدار زیادی داده است. کاوش اسناد بر اساس روش‌های داده کاوی به استخراج اطلاعات و دانش از اسناد می‌پردازد. خوشه‌بندی اسناد یکی از مهمترین روش‌های کاوش اسناد است که دسته‌بندی بدون سرپرست اسناد به گروه‌های مختلف می‌باشد.سیستم‌های رایج بازیابی اطلاعات و خوشه‌بندی اسناد بر کلمات کلیدی استوار می‌باشند. با توجه به اینکه کلمات کلیدی مختلف می‌توانند برای توصیف یک مفهوم استفاده شوند، این سیستم‌ها می‌توانند نتایج نادرست و ناقصی راایجاد نمایند. همچنین روابط معنایی ممکن است بین کلمات موجود باشد که شناسایی آنها نیاز به استخراج دانش دامنه مورد نظر دارد. مهمترین گام‌ها در خوشه‌بندی اسناد نحوه‌ی نمایش اسناد و معیار اندازه‌گیری شباهت بین آنها است.این تحقیق بر بهبود کارایی خوشه‌بندی اسناد تمرکز دارد. الگوریتم خوشه‌بندی اسناد در سه گام پیشنهاد شده است: نمایش اسناد، اندازه‌گیری شباهت بین اسناد، سیستم استنتاج فازی به منظور اندازه‌گیری شباهت نهایی بین اسناد. در نهایت پس از انجام این سه گام، با استفاده از الگوریتم خوشه‌بندی پایین به بالا خوشه‌بندی اسناد صورت می‌پذیرد. در گام اول، اسناد بر اساس دانش دامنه به صورت یک گراف آنتولوژی نمایش داده می‌شوند. این روش بر خلاف روش مبتنی بر کلمات کلیدی، بر مفاهیم دامنه استوار می‌باشد و یک سند را بر اساس مفاهیم موجود در آن، به صورت زیرگرافی از آنتولوژی دامنه نمایش می‌دهد. مفاهیم استخراج شده گره‌های گراف را تشکیل می‌دهند. برای هر گره با توجه به فرکانس مفهوم، وزن محاسبه می‌گردد. روابط موجودبین مفاهیم سند، یال‌های گراف و میزان این ارتباط اوزان یال‌ها را مشخص می‌نماید. در گام دوم برای هر سند بر اساس نمایش گرافی استخراج شده از مرحله‌ی اول، مفاهیم کلی و جزئی و یال‌های اصلی مشخص می‌گردند. شباهت بین هر جفت از اسناد در سه مقدار و بر اساس این سه عامل محاسبه می‌شود. در گام سوم سیستم استنتاج فازی با سه ورودی و یک خروجی طراحی شده است. ورودی‌ها مفاهیم کلی، مفاهیم جزئی و یال‌های اصلی می‌باشند و خروجی میزان شباهت بین دو سند است. مجموعه‌ای از قوانین فازی برای موتور استنتاج فازی در نظر گرفته شده است که بر اساس سه شباهت ورودی مقدار شباهت نهایی را تخمین می‌زند. در نهایت بر اساس ماتریس شباهت اسناد، الگوریتم خوشه‌بندی سلسله مراتبی پایین به بالا به منظور خوشه‌بندی اسناد اعمال می‌گردد. برای ارزیابی الگوریتم پیشنهادی، نتایج با نتایج حاصل از روش‌های naïve Bayes ، دو الگوریتم مبتنی بر هستان شناسی و یک الگوریتم آماری مقایسه شده است. نتایج به دست آمده نشان می‌دهند که روش پیشنهاد شده مقادیر F-measure و Accuracy را بهبود می‌دهد. همچنین مقادیر FP و Error به میزان قابل توجهی کاهش می‌یابد.
خلاصه‌سازی خودکار متون فارسی مبتنی بر هستی‌شناسی
نویسنده:
مجید رمضانی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با توجه به گسترش روزافزون اطلاعات در دسترس از طریق اینترنت، لزوم استفاده از روش های خلاصه سازی خودکار متن، بیش از پیش احساس می شود. روش هایی که با استخراج مهمترین مطالب موجود در اسناد مانع از مطالعه کامل حجم انبوه از آنها شوند. خلاصه سازی عبارت است از فشرده سازی متن (متون) منبع و تولید یک نسخه کوتاه تر از آن به نحوی که محتوای اطلاعاتی آن حفظ شود. اغلب سیستم های خلاصه ساز با استفاده از روش های سطحی و معیارهای آماری به استخراج مهمترین بخش های متن منبع پرداخته و خلاصه نهایی را شکل می دهند. هدف این پژوهش استفاده از یک روش مبتنی بر پایگاه دانش در فرآیند خلاصه سازی است. در این راستا از پایگاه دانش هستی شناسی فارس نت به منظور دستیابی به مفاهیم موجود در متون و تولید خلاصه آنها استفاده خواهد شد. هستی شناسی یکی از مباحث مربوط به علم فلسفه است که یک ساختار سلسله مراتبی از همه موجودیت های عالم هستی به همراه روابط حاکم بر آنها فراهم می کند. در این پژوهش ابتدا با نگاشت متن مورد خلاصه سازی با پایگاه دانش هستی شناسی، گرافی تحت عنوان گراف موضوعی شکل می گیرد که حامل شمای مفهومی متن منبع است. سپس با استفاده از معیارهای مختلف تعیین اهمیت گرافی، اهمیت نسبی هر یک از گره های گراف ارزیابی می شود. سرانجام از این مقادیر به منظور تعیین اهمیت جملات مختلف موجود در متن منبع و ساخت خلاصه نهایی استفاده خواهد شد. نتایج حاصل از ارزیابی خلاصه های تولید شده، حاکی از برتری روش پیشنهاد شده در این پژوهش نسبت به سیستم های خلاصه ساز موجود است.
  • تعداد رکورد ها : 21