جستجوي پيشرفته | کتابخانه مجازی الفبا

جستجوي پيشرفته | کتابخانه مجازی الفبا

کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی

فارسی  |   العربیه  |   English  
telegram

در تلگرام به ما بپیوندید

public

کتابخانه مجازی الفبا
کتابخانه مجازی الفبا
header
headers
پایگاه جامع و تخصصی کلام و عقاید و اندیشه دینی
جستجو بر اساس ... همه موارد عنوان موضوع پدید آور جستجو در متن
: جستجو در الفبا در گوگل
مرتب سازی بر اساس و به صورت وتعداد نمایش فرارداده در صفحه باشد جستجو
  • تعداد رکورد ها : 21
یادگیری و تکامل پویای آنتولوژی پیشکارهای هوشمند
نویسنده:
علی علی فرد
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
مفهوم «شناخت» و «استدلال» هسته‏ی علوم‏شناختی و هوش‏مصنوعی است. برخی از علوم مانند فلسفه، منطق، روان‏شناسی، عصب‏شناسی و غیره همواره به‏دنبال این هستند که دریابند این فرآیندها دقیقاً چگونه در ذهن انسان انجام می‏شوند. آنچه که قطعی است یا دست‏کم توسط مشاهدات تجربی تایید می‏شود این است که مفهوم شناخت در طبیعت همواره با مفاهیم «یادگیری» و «تکامل» درآمیخته است. طبق مشاهدات طبیعی، بیشتر جانداران درابتدای زندگی شناخت کمی از خود و دنیای اطراف خود دارند. اما در طول زمان به نوعی تکامل شناختی دست می‌یابند. این مفهوم بسیار حیاتی است زیرا هیچ مدل شناختی کاملی از جهان در ابتدای زندگی جانداران دراختیار آنان نیست و هیچ راه مستقیمی هم برای دستیابی سریع به آن وجود ندارد. بلکه شناخت باید در طول زمان حاصل شود. این پایان‏نامه براساس مفهوم تکامل شناختی که در طبیعت وجود دارد، یک مدل/چارچوب کلی برای یادگیری و تکامل شناختیِ پیشکارها/سیستم‏های هوشمند مصنوعی پیشنهاد و ارائه می‌دهد. زیربنای تئوریک مدل چند فرضیه‏ی شناختی است که در این رساله پیشنهاد می‏شود. هسته مرکزی این چارچوب نیز یک دستگاه مختصاتی مفهومی چندبُعدی است که پیشنهاد شده و ذهن مجازی پیشکار را شکل می‏دهد. فرآیند یادگیری مفهومی به‏صورت بدون ناظر و توسط الگوریتم‏های خوشه‏بندی مفهومی و الگوریتم‏های پیشنهادی این رساله جهت ساخت و تکامل آنتولوژی انجام می‏شود. در نهایت ارزیابی‏های عملی مدل/چارچوب نتایج مطلوبی را نشان داد.
بررسی و بهبود روش‌های تطبیق آنتولوژی‌ها
نویسنده:
زهرا قاسمی نیک
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
نیاز به معنا بخشیدن به محتویات وب، به‌گونه‌ای که برای ماشین‌های مختلف قابل فهم باشد، ایده اصلی ظهور وب معنایی است. اما با طراحی آنتولوژی‌ها، توسط افراد و سازمان‌های مختلف در حوزه‌های گوناگون، سطحی از ناهمگونی اطلاعات به سیستم تحمیل شده است که با تطبیق صحیح آنتولوژی‌ها می‌توان این مشکل وب‏معنایی را نیز حل کرد. با وجود تحقیقات بسیاری که در سال‌های اخیر در زمینه‌ی تطبیق خودکار آنتولوژی‌ها انجام شده، چالش بزرگ تعامل میان آنتولوژی‌ها در شرایط گوناگون همچنان به قوت خود باقی است. این پایان‌نامه در پی یافتن روش‌هایی برای افزایش کارایی سیستم‌های موجود در شرایط مختلف است. این تحقیق متشکل از دو بخش است. در پژوهش اول با استفاده از روش ترکیبی یادگیری ماشین، آدابوست، سیستم‌های موفق تطبیق با یکدیگر ترکیب می‌شوند؛ بدین ترتیب تطبیق‌گرهای مختلف نقاط ضعف یکدیگر را پوشش می‌دهند. نتایج ناشی از پژوهش افزایش دقت و کارایی این روش را نسبت به بهترین تطبیق‌گرهای مجزا نشان می‌دهد. در پژوهش دوم از دامنه‌ی گسترده‌ی اطلاعاتی ویکی‌پدیا، به‏عنوان منبع زبانی، استفاده شده است. به این صورت که سیستم با افزایش دامنه‌ی اطلاعاتی هر تطبیق‌گر در حوزه‏های گوناگون، سعی در بهبود نتایج آن دارد. در این پژوهش نیز کارایی هر سیستم نسبت به قبل افزایش یافته است.
استفاده از بازی‌های هدف‌دار در وب‌معنایی
نویسنده:
صفورا ذاکری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
پیش‌نیاز وب‌معنایی که با هدف ایجاد ارتباط و تعامل مستقیم ماشین‌ها بدون دخالت بشر طرح شد، وجود مقدار زیادی آنتولوژی و داده‌های حاشیه‌نویسی است. با وجود پیشرفت‌های قابل‌توجه در ابزارها و راه‌حل‌های نیمه‌خودکار، به‌میزان کافی از نیروی انسانی و هوش افراد برای ساخت آنتولوژی، حاشیه‌نویسی داده‌ها در انواع بعدها و قالب‌ها و تنظیم کردن اجزای مفهومی در آنتولوژی‌های متعدد، نیاز است. سری بازی‌های هدف‌دار برای استفاده‌ی مجانی از وقت، هوش و توانایی افراد برای نخستین بار به‌وسیله‌ی لوئیس ون آهِن (در سال 2002) ارائه شد. ایده‌ی استفاده از بازی‌های هدف‌دار در درست کردن وب‌معنایی، به‌وسیله‌ی کاترینا سیورپائس (در سال 2006) مطرح شد. سیورپائس، چند بازی‌ را برای حاشیه‌نویسی معنایی در دامنه‌های مختلف، ارائه داده است. این رساله، به‌دنبال آن است که به‌طور گسترده‌تری از بازی‌های هدف‌دار در ساخت وب‌معنایی استفاده کند؛ بنابر‌این، به‌بررسی آنتولوژی و آنتولوژی فازی، حاشیه‌نویسی داده‌ها بر‌اساس آنتولوژی‌های‌ موجود و تنظیم اجزای مفهومی در آنتولوژی‌ها می‌پردازد. با بررسی مراحل تولید آنتولوژی و آنتولوی متغیر زبانی فازی، مراحلی که انجام‌شان نیازمند نیروی انسانی بودند، شناسایی و بازی‌هایی برای انجام برخی از این مراحل، پیشنهاد می‌شود. در نهایت، یکی از بازی‌های پیشنهادی با نام واژه‌معنا (LingoGame) که برای پیدا کردن مقادیر متغیرهای زبانی است، پیاده‌سازی و نتایج حاصل از آن، بررسی می‌شود.
یادگیری مفاهیم در سیستم‌های چندعامله: با رهیافت تئوری بازی
نویسنده:
سیدنیما میربخش
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
یادگیری مفاهیم یکی از مباحث مهم در سیستمهای چند عامله است. تمرکز این مبحث بروی عامل هایی است که با استفاده از استقلال خود برای رشد و پیشرفت در محیط پیرامون خود، از دانش یکدیگر برای تعالی دانش خود نسبت به محیط استفاده می کنند.بدین منظور یک عامل با دریافت اطلاعات جدید از محیط و یا دیگر عامل هامی باید قادر باشد تا دانش خود را از جهان پیرامون خود بروز رسانی کند. پس به عنوان بخشی از جهان بینی و یا آنتولوژی عامل نسبت به محیط، مفاهیم نقش بسته در آنتولوژی یک عامل نیز نیازمند رشد و بروز شدن در گذر زمان است.در این رساله به تعریفی جدید از نمایش مفاهیم بر اساس مشخصه مقدار ها و مقادیر احتمالاتی آنها می پردازیم. این تعریف جدید به عامل ها اجازه می دهد تا بتوانند با دریافت حجم پایینی از اطلاعات جدید دانش خود را نسبت به مفاهیم افزایش دهند.همچنین در بخش دوم این رساله با نگاهی تازه به روند یادگیری مفاهیم در سیستم های چند عامله، تعامل و سازو کار تصمیم گیری عامل ها را برای همکاری و یا خیانت به یکدیگر به شکل یک بازی در نظر گرفتیم. در این بازی عامل ها با شناختن ارزش دانشی که از دست می دهند اقدام به محاسبه ارزش دریافتی کرده و با ساز و کاری قاعده مند اقدام به اتخاذ تصمیم می کنند. این نگاه رقابتی به سیستم های چند عامله نگرشی نزدیکتر به محیط های انسانی خواهد بود. در محیط های انسانی مانند مراکز تحقیقاتی و دانشگاه ها، اطلاعات می توانند بسیار حائز اهمیت باشد. دو عامل در چنین محیطی می باید با توجه به آنچه از دست می دهند مراقب سوء استفاده های احتمالی دیگر عامل ها از اطلاعات خود باشند. این نوع نگرش به رابطه میان عامل ها در حقیقت بازتابی از روابط انسانی خواهد بود.
نظرکاوی در وب در سطح ویژگی مبتنی ‌بر آنتولوژی
نویسنده:
بشیر میاحی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با گسترش رسانه‌های اجتماعی در فضای وب (انجمن‌های وب، شبکه‌های اجتماعی، بلاگ‌‌ها و ...) منابعی غنی و ارزان از نظرات به‌وجود آمده‌اند، مردم و تولیدکنندگان برای بررسی نظرات به این رسانه‌ها روی آورده‌اند. تحلیل نظرها از دو جنبه کاربرد فراوان دارد. برای صاحبان تجارت، گرفتن بازخورد مشتریان از محصول و سرویس می‌تواند بسیار مفید باشد تا براساس آن، تصمیم‌های مناسبی را در محصول و سرویس‌های بعدی خود دخیل کنند. همچنین برای کاربرانی که قصد تهیه محصول را دارند، استفاده از نظر سایرین برای رسیدن به خریدی مطمئن و مطابق با سلایق خود می‌تواند کمک کننده باشد. هدف اصلی این تحقیق ایجاد و پیاده‌سازی سیستم کاوش نظرات در وب و تحلیل این نظرات برای به‌دست آوردن میزان نظرات مثبت و منفی مربوط به هر یک از ویژگی‌های محصول است. هدف نهایی این سیستم، مشخص کردن میزان نظرات مثبت و منفی ویژگی‌های محصول و رتبه‌بندی (Rank) ویژگی‌های محصولات موجود بر اساس بیش‌ترین نظرات مثبت و منفی است تا کاربر از بین محصولات موجود، محصولی که دارای بیش‌ترین نظرات مثبت برای ویژگی‌های دلخواه است را بتواند انتخاب کند. در تحقیق پیش‌رو سعی بر آن داریم با استفاده از آنتولوژی و ابزارهای وب‌معنایی با استفاده از معنای جملات و مفاهیم مستتر در محتویات نتایج بهتری نسبت به روش‌های سنتی به‌دست آوریم. در این تحقیق فرض بر این است که در هر نظر، کاربران به ویژگی‌های مختلفی از موضوع اشاره می‌کنند و در آن نظر ممکن است برخی ویژگی‌ها از نظر کاربر مثبت و برخی دیگر از ویژگی‌ها منفی تلقی شود. با این دید، یک نظر از کاربر را به‌جای آن‌که مطلق مثبت یا منفی قلمداد کرد، مثبت، منفی و خنثی را به هر یک از ویژگی‌هایی که کاربر ذکر می‌کند اعمال می‌کنیم.
بهینه‌سازی فرآیند جست و جو و نگهداری داده‌های پیوندی وب معنایی
نویسنده:
نغمه سهرابیان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
برخلاف وب، هدف اصلی وب‏معنایی قابلیت فهم ماشین از اسناد است. توسعه‏ی وب‏معنایی مستلزم توسعه ی داده‏های پیوندی است. داده‏های‏پیوندی اجزای سازنده ی وب‏معنایی هستند که در قالب مدلآر. دی. اف ، منابع‏داده‏ای مختلف وب را به هم مرتبط می کنند. با گذشت زمان تعداد این داده‏ها رو به افزایش است و این امر بازیابی و نگهداری داده‏ها را با مشکل مواجه کرده است. بنابراین نگهداری داده‏های‏پیوندی به نحوی که بازیابی اطلاعات مورد نیاز با صرف کمترین زمان و پیچیدگی انجام شود، نیاز به نگهداری بهینه ی این داده ها را توجیه می کند.معمولاً از جداول‏ رابطه‏ای بزرگ برای نگهداری داده‏های وب‏معنایی استفاده می‏شود. هدف این پژوهش شکستن این جداول رابطه‏ای به جداول کوچک‏تر به‏منظور مدیریت آسان‏تر داده‏های‏پیوندی و دسته‏بندی آن‏هاست. در روش پیشنهادی، این دسته‏بندی براساس نگاشت ساختارهای آنتولوژی مرتبط ‏با داده‏ها به پایگاه‏داده‏ی رابطه‏ای انجام می‏شود. روش‏ پیشنهادی جهت افزایش دقّت داده‏های‏پیوندی از نوعی استنتاج روی داده‏های‏پیوندی بهره می‏گیرد و سرعت بازیابی داده‏های‏پیوندی را نیز از‏ طریق انتخاب ساختارهای ذخیره‏ی مناسب و شاخص‏گذاری افزایش می‏دهد. نتایج حاصل از مقایسه‏ی روش پیشنهادی با روش‏های مطرح ذخیره‏سازی داده‏های آر. دی. اف مانند روش مستقل از الگو، روش مبتنی‏بر الگو و روش هیبرید افزایش سرعت و دقّت داده‏های بازیابی‏شده را نشان می‏دهد و با به‏کارگیری ساختارهای مناسب امکان پاسخ‏گویی به طیف وسیع‏تری از پرس‏وجوها فراهم می‏آید. به‏منظور ارزیابی نتایج از جعبه‏ی‏ اطلاعات در مجموعه‏داده‏ی دی‏بی‏پدیااستفاده شده است.
دسته‌بندی اسناد فارسی به کمک هستان‌شناسی فارس‌نت
نویسنده:
صباسادات مدنی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با توجه به رشد روزافزون اسناد الکترونیکی، نیاز به یک دسته بند کارا در حوزه داده کاوی واضح است. اخیراً به منظور افزایش دقت دسته بندی، استفاده از آنتولوژی لغوی به عنوان مرجع خارجی و نیز استخراج دانش از متون در فرآیند دسته بندی، مطرح شده است؛ از این رو، هدف از انجام این پروژه ارائه و پیاده سازی سیستم دسته بندی خودکار اسنادی است که آنتولوژی لغوی فارس نت را در عملیات دسته بندی داخل می نماید. این امر منجر به افزایش اوزان کلمات مرتبط با دانش پیش زمینه متن می شود. راهکار پیشنهادی برای استفاده از آنتولوژی لغوی، تمرکز بر روی بردار مشخصه ی معنایی را محور فعالیت های خود قرار داده است؛ تا بدین وسیله فرآیند دسته بندی را بهبود بخشد. در این پروژه ضمن بررسی و مطالعه ی روش های بکارگیری آنتولوژی لغوی در فرآیند دسته بندی، آنتولوژی لغوی فارس نت را به منظور استخراج روابط معنایی استفاده می نماییم.در سیستم ارائه شده، کلیه ی اجزاء تشکیل دهنده ی سیستم دسته بندی شامل پردازشگر لغوی، کاهنده ی ویژگی، انتخاب کننده ی ویژگی، وزن دهی به ویژگی و طبقه بندی کننده اسناد، لحاظ شده است. در این پروژه الگوریتم χ^2 در بخش انتخاب مشخصه و روش وزن دهی ویژگی نرمال شده TFIDF در بخش وزن دهی به کار گرفته می شود. پیش از اعمال روش وزن دهی به مشخصه ها، بردار مشخصه معنایی برای هر کلمه کلیدی توسط مفاهیم استخراج شده از آنتولوژی لغوی فارس نت، ایجاد می شود. نتایج ارزیابی های انجام شده نشان دهنده ی بهبود قابل توجهی در کارایی و دقت الگوریتم دسته بندی با بکارگیری آنتولوژی لغوی فارس نت است.
بررسی میزان اعتماد و اعتبار سیستم‌های چندپیشکاره در وب‌معنایی
نویسنده:
نیکو ذوالفقارکرهرودی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
باتوجه به ذات پویای سیستم‌های چندپیشکاره وب‌معنایی و وجود پیشکارهای مختلف در آن، شناسایی پیشکارهای قابل اعتماد یکی از چالش‌های ایجاد ارتباط بین پیشکارها در وب‌معنایی است. ارزیابی اعتماد در این سیستم‌ها براساس رفتار گذشته‌ی پیشکارها انجام می‌شود. دو منبع اصلی برای کسب اطلاعات از رفتار گذشته‌ی پیشکارها وجود دارد: ارتباط‌ مستقیم بین پیشکارها و اطلاعات به‌دست آمده از سایر پیشکارهای اجتماع. باوجود پیشکارها با سلیقه‌ها و نظرات مختلف، مدل اعتماد پیشنهادی باید بتواند مطابق با نیازهای پیشکارها تنظیم شود. به‌علاوه برای محاسبه‌ی اعتبار پیشکارها باید اطلاعات مربوط به رفتار آن‌ها در گذشته از جامعه‌ی پیشکارها جمع‌آوری شود. همچنین اعتماد ابعاد مختلفی دارد و ممکن است میزان اعتماد به پیشکار مفروضی در ابعاد مختلف متفاوت باشد. این رساله برای حل هر یک از این چالش‌ها راه‌حلی پیشنهاد می‌دهد. مدل پیشنهادی این رساله از روش توزیع شده‌‌‌ای مبتنی‌بر شبکه‌های اجتماعی برای جمع‌آوری اطلاعات از محیط استفاده می‌کند و با بهره‌گیری از شبکه‌های عصبی مصنوعی میزان اعتبار را براساس مشاهدات جمع‌آوری شده ارزیابی می‌کند. شبکه‌های عصبی در طول زمان مطابق دیدگاه پیشکار آموزش می‌بینند، بدین‌ترتیب میزان اهمیت توصیه‌های جمع‌آوری شده باتوجه به دیدگاه پیشکار ارزیابی‌کننده‌ی اعتماد تنظیم شود. همچنین مدل پیشنهادی دراین رساله برای نمایش میزان اعتماد از آنتولوژی‌ها بهره می‌گیرد، بدین وسیله میزان اعتماد در ابعاد مختلف محاسبه می‌شود. این رساله برای بررسی کارایی مدل پیشنهادی، بستری با استفاده از میان‌افزار Jade پیاده‌سازی می‌کند و کارایی مدل به‌‌طور عملی در آن آزمایش می‌شود.
محاسبه میزان شباهت میان موجودیت‌های آنتولوژی‌ها
نویسنده:
محمدمهدی کیخا
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
آنتولوژی به عنوان یک روش برای از بین بردن ناهمگنی اطلاعات ارائه شده‌است. در یک حوزه ممکن است چندین آنتولوژی که از دیدگاههای متفاوت ایجاد شده‌اند، وجود داشته باشد که سبب ناهمگنی در یک حوزه خاص می‌شوند. جهت از بین بردن نا‏همگنی‏ها از فرآیند هم تراز سازییا تطابق آنتولوژی‌ها استفاده می‌شود. از آنجا که هنگام هم‌ترازسازی آنتولوژی‌ها سعی بر رفع همه انواع ناهمگنی‌های موجود بین دو آنتولوژی ورودی است پس باید روشی اتخاذ گردد تا به کمک آن بتوان نتایج هم ترازسازی انواع روشهای رفع ناهمگنی بین دو آنتولوژی ورودی را کنار هم گردآوری نمود. به مرحله گردآوری نتایج انواع روشهای ناهمگنی، مرحله جمع‌آوری شباهت‌ها گویند.در این تحقیق در ابتدا یک سیستم هم‌ترازسازی آنتولوژی‌ها با استفاده از سه روش رفع ناهمگنی بین آنتولوژی‌ها پیاده‌سازی شده است. این سیستم برای انواع زبان‌های بیان آنتولوژی‌ها یعنیOWLو RDF قابل استفاده است. در سیستم ارائه شده از سه تطابق‌یاب استفاده شده است. دو تطابق‌یاب از ویژگیهای رشته‌ای اجزای آنتولوژی‌ها استفاده می‌نمایند. یکی از این تطابق‌یاب‌ها ISUB است که از فرم رشته‌ای موجودیت‌های دو آنتولوژی استفاده می‌کند و دیگریVDOC است که قبل از آغاز فرآیند محاسبه شباهت بین رشته‌ها، ابتدا یکسری عملیات پیش پردازش از قبیل حذف حروف اضافه و ربط را انجام می‌دهد و سپس براساس روش‌های بازیابی اطلاعات، میزان شباهت دو رشته را محاسبه می‌نماید.سومین تطابق‌یاب پیاده سازی شده، GMO است که از ساختار سلسله مراتبی دو آنتولوژی ورودی جهت محاسبه میزان شباهت موجودیت‌های دو آنتولوژی بهره می‌گیرد. پس از محاسبه شباهت توسط انواع تطابق‌یاب‌های مختلف، در مرحله جمع‌آوری شباهت‌های انواع تطابق‌یاب‌ها، روشی ارائه شده است که برخلاف سایر روش‌های موجود، فرآیند جمع‌آوری شباهت‌ها را براساس هر دو آنتولوژی و برای هر جفت موجودیت دو آنتولوژی بطور جداگانه انجام می‌دهد که یک روش تطبیقی و مطلع از ساختار است.ارزیابی کار انجام شده برای بررسی روش جمع‌آوری شباهت‌های ارائه شده بوسیله‌ی آنتولوژی‌های مسابقه جهانیتطابق آنتولوژی‌ها یعنیOAEI 2009 صورت گرفته است که حاوییک سری آنتولوژی‌های استاندارد جهت مقایسه انواع سیستم‌های هم ترازسازی آنتولوژی‌ها می‌باشد. مقایسه نتایج سیستم ارائه شده با سیستم‌های جِرُمی سوئیت و نگاشت توسط جمع مورچه‌ها، بهبود دقت تشخیص هم ترازی‌های بین دو آنتولوژی توسط سیستم را نشان می‌دهد.
خوشه‌بندی اسناد مبتنی بر آنتولوژی و رویکرد فازی
نویسنده:
مریم امیری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
داده‌کاوی که به عنوان استخراج دانش از پایگاه داده‌ها نیز شناخته می‌شود، روالی برای استخراج دانش ناشناخته از مقدار زیادی داده است. کاوش اسناد بر اساس روش‌های داده کاوی به استخراج اطلاعات و دانش از اسناد می‌پردازد. خوشه‌بندی اسناد یکی از مهمترین روش‌های کاوش اسناد است که دسته‌بندی بدون سرپرست اسناد به گروه‌های مختلف می‌باشد.سیستم‌های رایج بازیابی اطلاعات و خوشه‌بندی اسناد بر کلمات کلیدی استوار می‌باشند. با توجه به اینکه کلمات کلیدی مختلف می‌توانند برای توصیف یک مفهوم استفاده شوند، این سیستم‌ها می‌توانند نتایج نادرست و ناقصی راایجاد نمایند. همچنین روابط معنایی ممکن است بین کلمات موجود باشد که شناسایی آنها نیاز به استخراج دانش دامنه مورد نظر دارد. مهمترین گام‌ها در خوشه‌بندی اسناد نحوه‌ی نمایش اسناد و معیار اندازه‌گیری شباهت بین آنها است.این تحقیق بر بهبود کارایی خوشه‌بندی اسناد تمرکز دارد. الگوریتم خوشه‌بندی اسناد در سه گام پیشنهاد شده است: نمایش اسناد، اندازه‌گیری شباهت بین اسناد، سیستم استنتاج فازی به منظور اندازه‌گیری شباهت نهایی بین اسناد. در نهایت پس از انجام این سه گام، با استفاده از الگوریتم خوشه‌بندی پایین به بالا خوشه‌بندی اسناد صورت می‌پذیرد. در گام اول، اسناد بر اساس دانش دامنه به صورت یک گراف آنتولوژی نمایش داده می‌شوند. این روش بر خلاف روش مبتنی بر کلمات کلیدی، بر مفاهیم دامنه استوار می‌باشد و یک سند را بر اساس مفاهیم موجود در آن، به صورت زیرگرافی از آنتولوژی دامنه نمایش می‌دهد. مفاهیم استخراج شده گره‌های گراف را تشکیل می‌دهند. برای هر گره با توجه به فرکانس مفهوم، وزن محاسبه می‌گردد. روابط موجودبین مفاهیم سند، یال‌های گراف و میزان این ارتباط اوزان یال‌ها را مشخص می‌نماید. در گام دوم برای هر سند بر اساس نمایش گرافی استخراج شده از مرحله‌ی اول، مفاهیم کلی و جزئی و یال‌های اصلی مشخص می‌گردند. شباهت بین هر جفت از اسناد در سه مقدار و بر اساس این سه عامل محاسبه می‌شود. در گام سوم سیستم استنتاج فازی با سه ورودی و یک خروجی طراحی شده است. ورودی‌ها مفاهیم کلی، مفاهیم جزئی و یال‌های اصلی می‌باشند و خروجی میزان شباهت بین دو سند است. مجموعه‌ای از قوانین فازی برای موتور استنتاج فازی در نظر گرفته شده است که بر اساس سه شباهت ورودی مقدار شباهت نهایی را تخمین می‌زند. در نهایت بر اساس ماتریس شباهت اسناد، الگوریتم خوشه‌بندی سلسله مراتبی پایین به بالا به منظور خوشه‌بندی اسناد اعمال می‌گردد. برای ارزیابی الگوریتم پیشنهادی، نتایج با نتایج حاصل از روش‌های naïve Bayes ، دو الگوریتم مبتنی بر هستان شناسی و یک الگوریتم آماری مقایسه شده است. نتایج به دست آمده نشان می‌دهند که روش پیشنهاد شده مقادیر F-measure و Accuracy را بهبود می‌دهد. همچنین مقادیر FP و Error به میزان قابل توجهی کاهش می‌یابد.
  • تعداد رکورد ها : 21