جستجوي پيشرفته | کتابخانه مجازی الفبا

جستجوي پيشرفته | کتابخانه مجازی الفبا

کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی کتابخانه مجازی الفبا،تولید و بازنشر کتب، مقالات، پایان نامه ها و نشریات علمی و تخصصی با موضوع کلام و عقاید اسلامی

فارسی  |   العربیه  |   English  
telegram

در تلگرام به ما بپیوندید

public

کتابخانه مجازی الفبا
کتابخانه مجازی الفبا
header
headers
پایگاه جامع و تخصصی کلام و عقاید و اندیشه دینی
جستجو بر اساس ... همه موارد عنوان موضوع پدید آور جستجو در متن
: جستجو در الفبا در گوگل
مرتب سازی بر اساس و به صورت وتعداد نمایش فرارداده در صفحه باشد جستجو
  • تعداد رکورد ها : 11
خوشه‌بندی موجودیت‌ها در داده‌های پیوندی
نویسنده:
انسیه داوودی جم
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
وب معنایی شامل قرار دادن داده‌ها روی وب و ساختن ارتباطات به گونه‌ای است که انسان و ماشین بتوانند محتوای وب داده را کاوشنمایند. هدف وب معنایی افزایش توانایی ماشین‌ها در دسترسی به منابع موجود در وب، پردازشو بکارگیریآن‌ها می‌باشد. با توجه به رشد گسترده‌ی داده‌های پیوندی و افزایش مجموعه داده‌ها در چند سال اخیر، نیاز به ابزاری برای کشف پیوند در مقیاس وسیع احساس می‌شود. ابزارهای کنونی برای کشف پیوند مجبور به مقایسه‌ی تمامی موجودیت‌ها در مجموعه داده‌ها هستند. با خوشه بندی موجودیت‌ها، می‌توان قبل از ایجاد پیوند و بر اساس نوع پیوند تعداد مقایسه‌ها بین موجودیت‌ها را کاهش داد. یکی از مهم‌ترین اتصالات معنادار در وب داده، شناسایی و اتصال موجودیت‌هایی است که به یک موجودیت یکسان اشاره می‌کنند ولی دارای شناسه‌های یکتای منبع متفاوت هستند و در مجموعه داده‌های مختلفی قرار دارند. در این تحقیق یک مدل به منظور شناسایی وایجاد خوشه‌هایی با موجودیت‌های همانند در وب داده ارائه شده است. مدل ارائه شده قابل بکارگیری روی مجموعه داده‌ها با دامنه‌های متفاوت است. این روش می‌تواند به عنوان یک مولفه در ابزارهای کشف پیوند مانند ابزار silk استفاده شده و سبب بهبود پبچیدگی زمانیوافزایش دقت کشف پیوند شود.مدل پیشنهادی دارای دو ماژول اصلی است: 1.
استخراج حقایق از متون فارسی در قالب RDF
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با توجه به حجم عظیم دانش و اطلاعات بشر و رشد روزافزون مستندات در زمینه‌های مختلف، پردازش زبان‌های طبیعی و تبدیل متون به دانش قابل فهم برای ماشین، مورد توجه قرار گرفته است. با استفاده از سیستم‌های استخراج اطلاعات می‌توان بطور خودکار پایگاه دانشی ساخت‌یافته از متون ایجاد کرد. در واقع هدف یک سیستم استخراج اطلاعات، استخراج حقایق از متون غیرساخت‌یافته و نمایش آن‌ها در قالب‌های ساخت‌یافته مانند سه‌گانه‌های RDF می‌باشد. اگر حقایق در قالب معنایی RDF نگاشت شوند، می‌توان اطلاعات مورد نیاز را با ساخت و ارسال پرس‌وجوهای SPARQL روی پایگاه دانش بدست آورد. در این پایان‌نامه، روشی برای استخراج آزاد حقایق از متون زبان فارسی پیشنهاد شده است که در آن استخراج حقایق در سطح جمله و بر اساس تشخیص افعال و روابط وابستگی‌ بین اجزای جمله انجام می‌شود. راه‌کار پیشنهادی، حقایق اصلی را بر اساس فعل و حقایق فرعی را بر اساس روابط بین گروه‌های اسمی جمله استخراج و برای تبدیل به قالب RDF آماده‌سازی می‌کند. برای نگاشت حقایق در قالب معنایی RDF، URI قسمت‌های نهاد، مسند و گزاره یک حقیقت با استفاده از شبکه واژگان و ویکی‌پدیا شناسایی می‌شود. در نتیجه در راه‌کار پیشنهادی شبکه واژگان فردوس‌نت بصورت خودکار بر اساس شبکه واژگان انگلیسی ایجاد می‌شود. نتایج حاصل از ارزیابی نشان می‌دهد که روش پیشنهادی در استخراج حقایق موفق بوده و باعث بهبود دقت و فراخوانی نسبت به سیستم‌های موجود می‌شود. علاوه بر‌این سیستم پیشنهادی حقایق را در قالب معنایی RDF استخراج می‌کند.
ارائه نقشه راه استفاده از وب معنایی برای شرکت های تجاری؛ "مطالعه موردی: شرکت ایران خودرو خراسان"
نویسنده:
نوید کیانوش مقدم
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
اگر روشی وجود داشت که می شد به کمک آن معنا و مفهوم داده ها را برای ماشین تبیین و تفسیر کرد، آن گاه طبیعتاً ماشین می توانست بر اساس نیاز کاربر نتایج به مراتب دقیق تری را در اختیار او قرار دهد. به طور کلی وب معنایی ساختارمند کردن داده ها، اضافه کردن معنای آنها و در نهایت بازنمایی دانش به کمک ماشین با استفاده از فناوریها و استانداردهایی است که به وسیله کنسرسیوم وب جهان گستر در حال تدوین و تکمیل هستند. تیم برنرزلی و دوستانش وب معنایی را چنین معرفی می کنند: وب معنایی شاخه ای از وب فعلی است که در آن به اطلاعات، معنایی دقیق تخصیص داده شده است به گونه ای که کامپیوترها و انسان ها بتوانند با یکدیگر به صورت مشترک به کار بپردازند. این تعریف از چندین جنبه حائز اهمیت است. نخست، وب معنایی شاخه ای از وب فعلی است و به آرامی جایگزین آن خواهد شد. دوم این که در وبمعنایی به هر داده، تعدادی معنای مناسب تخصیص داده می شود. سوم این که هدف انجام اعمالی است که به وسیله انسان و ماشین بصورت مشترک انجام شود. در این تحقیق سعی می کنیم نقشه راهی ارائه نماییم تا صاحبان شرکت های تجاری بتوانند وب معنایی را به راحتی درک و عملی نموده و از پیاده سازی آن در ارائه خدمات تجاری خویش بهتر و بیشتر بهره گیرند. چارچوب توصیف منابع ، سرویس های وب ، هستی شناسی و ... فناوریهای وب معنایی هستند که ما در این تحقیق به آنها پرداخته ایم و مطالعه موردی آن در شرکت ایران خودرو خراسان اجرا شده است .
ارائه چارچوبی جهت انتشار اطلاعات کتابخانه بر پایه اصول داده‌های پیوندی
نویسنده:
الهه سخاوتی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
داده های پیوندی که زیرمجموعه ای از وب معنایی می باشد، عبارت است از داده های ساختارمندی، که با یکدیگر توسط ارتباطات معنادار در ارتباط هستند. در حال حاضر، موسسات، سازمانها و افراد مختلفی در تلاش برای انتشار داده های خود به صورت داده های پیوندی می باشند تا آنها را به فضای داده جهانی ملحق کنند، اما به علت آشنا نبودن با مفاهیم تخصصی این روند به کندی صورت می گیرد. از این رو، چارچوبهایی جهت انتشار داده ها در زمینه های مختلف بر پایه اصول داده های پیوندی مورد نیاز است. هدف این تحقیق، ارائه چارچوبی جهت انتشار اطلاعات کتابها، که یکی از نیازهای اساسی محققان و کاربران مختلف است، بر پایه اصول داده های پیوندی می باشد. در چارچوب پیشنهادی ابتدا داده ها دریافت و جهت انتشار آماده سازی می شوند. سپس این داده ها به فرمت RDF تبدیل می شوند و پس از شناسایی منابع داده خارجی مرتبط، پیوندهای لازم با استفاده از هستان شناسی های مناسب برقرار می گردند. یک مجموعه داده نمونه از اطلاعات کتابهای یک کتابخانه، توسط چارچوب مورد نظرمنتشر شده است. ارتباطات برقرار شده بین مجموعه داده نمونه و فضای داده جهانی، توسط معیارهای مقبولیت (دقت و فراخوانی) مورد تحلیل و ارزیابی قرار گرفته است. نتایج این ارزیابی حاکی از دقت بالا در انتخاب منابع هدف می باشد. در انتها با انتشار مجموعه لغات voiD، اطلاعات آماری، ساختاری و بنیادی مجموعه داده نمونه منتشر شده است.
استخراج قوانین مرتبط با نگارش پرس‌وجوهای SPARQL با استفاده از Log پرس وجوهای پایانه های SPARQL
نویسنده:
سعید شفیعی حسن آبادی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
با گسترش روزافزون حجم داده‌ها و اطلاعات در وب معنایی، تولید پرس‌وجوهای ساخت‌یافته بر فراز وب معنایی نیز با استقبال چشم‌گیر توسعه‌دهندگان روبرو شده است. بااین‌حال تولید پرس‌وجوی ساخت‌یافته برای افرادی که با هستان‌شناس تعریف‌شده بر بسترِمجموعه داده های موجودآشنایی ندارند می‌تواند فرایندی پیچیده باشد. از سویی دیگر، در سمت منابعِ دربرگیرنده‌یِ داده‌های وب معنایی، تنها داده‌ها و ساختارهای سلسله‌مراتبی تعریف‌شده‌اندو دراین‌بین عدم وجود الگویی برای چگونگی ساخت و چینش پرس‌وجوهایSPARQL کاربران انسانی تازه‌کار را با مشکل مواجه می‌کند. در سال‌های اخیر،در این راستا سیستم‌هایی باهدف یاری کاربران در استفاده از وب معنایی و ساخت این پرس‌وجوها تولیدشده‌است. سیستم‌های پرسش‌وپاسخ، سیستم‌های بسط پرس‌وجو و سیستم‌هایی با واسط گرافیکی جهت نگارش پرس‌وجوهایSPARQLازجمله این موارد هستند.در این پایان‌نامه با تمرکز روی ساختارو چینش پرس‌وجوهای SPARQL،گونه‌ای از قالب‌های کلی مرتبط با ساختار نگارشی این پرس‌وجوهابررسی می‌گردد. با استفاده ازاین قالب‌ها،با پردازش پرس‌وجوهای پیشین ارسال‌شده به‌سوی پایانه‌ها وبه‌کارگیری روش‌های یادگیری ماشین (قوانین انجمنی ترتیبی)،قوانینی استخراج می‌گردندکه بیانگر الگوی تعریف پرس‌وجوهایکاربران پیشین می‌باشند.کاربرد این قوانین کمک به کاربران آتی در تولید پرس‌وجوهای SPARQL است.نتایج حاصل از ارزیابی این قالب از قوانین بیانگر قابلیت و کارایی این قوانین جهت یاری‌رساندن به کاربران انسانیاست. روی هر پایانه‌ی بخصوصی، در بازه‌های زمانی متفاوت،بر اساس این قالب‌هامی‌توان به دانشی دست‌ یافت که کاربرد این دانش در سیستم‌های یاری‌گر کاربر جهت تولید مستقیم این پرس‌وجوها بروی آن پایانه است.برای ارزیابی این‌گونه از قوانین به فرم خودکار در ابندا روی پرس‌وجوهای بخش آزمایش (پرس‌وجوهای از پیش نگارش شده)کاندیدهای پیشنهادی مطرح می‌گردند.در ادامه این کاندیدها با پرس‌وجوی نگارش شده‌ی کاربرپیشین مقایسه شده و به‌این‌ترتیب دقت پیشنهادهای ارائه‌شده گردآوری می‌گردد. در این پژوهش پرس‌وجوهای موجود در Log پایانه‌ی DBpedia در سال 2012 انتخاب‌شده است. برای معیار ارزیابی در این پژوهش از پارامتر دقت برای صحت کاندیدهای پیشنهادی استفاده‌شده است.
ارائه الگویی جهت پیاده‌سازی جستجوی معنایی با استفاده از تکنیکهای وب معنایی
نویسنده:
امیر هراتی علمداری
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
آنچه که تا کنون در فضای وب جریان داشته است افزایش روزافزون حجم اطلاعات و مستندات موجود در آن بوده است، بدون اینکه این افزایش حجم مستندات تاثیری در کاربرد و بهره برداری خودکار اطلاعات موجود به همراه داشته باشد. به علاوه امروزه اکثریت محتوای وب بر روی پایگاه داده های رابطه ای ذخیره شده اند. حرکتی که گام های اولیه آن درحال شکل گیری است تغییر شکل «وب» به موجودیتی تحت عنوان «وب معنایی» میباشد. وب معنایی یک گسترش از وب موجود است که گاهی اوقات تحت عنوان «وب آینده» و یا «وب نسخه 3» معرفی می شود، که در آن به اطلاعات، معانی خوش تعریفی داده می شود که بتوانند قابلیت همکاری بهتر بین کامپیوتر ها و انسان را فراهم کنند. موفقیت وب معنایی بر تولید انبوه داده های معنایی وابسته است. با توجه به حجم عظیم داده های رابطه ای ذخیره شده در پایگاه داده های رابطه ای موجود در وب، انتشار این داده های رابطه ای بر روی وب معنایی بسیار پر کاربرد خواهد بود. در این پایان نامه، الگویی جهت پیاده سازی جستجوی معنایی بر روی داده های ذخیره شده در پایگاه داده های رابطه ای، با استفاده از تکنیک های وب معنایی ارائه شده است. گام های اصلی الگوی پیشنهادی در این پایان نامه از این قرارند:1-بازنمایی داده های سازمانی ذخیره شده بر روی پایگاه داده های رابطه ای بر اساس گراف های معنایی با استاندارد RDF به صورت یک پایگاه دانش معنایی(نگاشت داده های رابطه ای به گراف های معنایی)2-آنالیز وابستگی های داده ای برنامه و بازنمایی اجزای برنامه و ارائه یک آنتولوژی سازمانی بر اساس آنها3-پیاده سازی یک موتور جستجوگر معنایی که بر پایه آنتولوژی سازمانی تهیه شده و پایگاه دانش نگاشت شده، که به جستجوی معنایی بر روی اطلاعات دامنه مورد نظر می پردازد.
بهبود فرایند تشخیص در کلینیک‌های اورولوژی برپایه‌ی هستان‌نگار
نویسنده:
زهرا المصلاوی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
فهرست گزیده متکلمان،فیلسوفان و عالمان شیعی :
چکیده :
عموما تشخیص پزشکی دارای دو مشکل اساسی می‏باشد. اولا تشخیص نادرست که معمولا نتیجه‏ی انتقال ناکامل اطلاعات ضروری برای تشخیص بیماری به پزشک و ثانیا اتلاف زمان که به دلیل بیان اطلاعات غیرضروری به پزشک می‏باشد. هدف از انجام این تحقیق ارائه‏ی راه حلی برای این دو مشکل می‏باشد. راه‏حل ارائه شده یک چارچوب برپایه‏ی هستان‏نگار می‏باشد که از طرفی به پزشک کمک می‌کند اطلاعات ضروری را در کمترین زمان دریافت نماید و از طرفی می‏تواند آموزشی کلی به بیمار قبل از ورود به اتاق پزشک ارائه کند تا بیمار تشخیص دهد چه اطلاعاتی باید برای پزشک بیان شوند و چه اطلاعاتی نباید بیان شوند. چارچوب مزبور یک سیستم تصمیم‏گیری تولید پرسشنامه می‏باشد که مهمترین و ضروری‏ترین پرسش‏ها برای تشخیص را بین همه‏ی پرسش‏های ممکن انتخاب می‏کند و به کاربر(بیمار یا پزشک) برمی‏گرداند. این چارچوب می‏تواند به وسیله‏ی پزشکان و بیماران برای کارامدتر کردن فرایند تبادل اطلاعات و کاهش زمان ویزیت بیمار، و همچنین برای آموزش بیماران قبل از ورود به اتاق پزشک، به کار رود که به کارگیری آن از لحاظ اقتصادی و انسانی به طور مستقیم تأثیر مثبتی برکارکرد سیستم تشخیص دارد.در این پایان‏نامه پس از تعیین محدوده‏ی تحقیق، به منظور تولید هستان‏نگار داده‏های لازم از منابع مورد نظر استخراج می‏شوند. پس از آن به وسیله‏ی الگوریتم جستجو در هستان‏نگار، پرسش‏نامه‏ تولید می‏شود و سپس توسط متخصصین ویرایش می‏شود و پرسشنامه‏ای مشابه پرسشنامه‏ی قبلی تولید می‏شود.نتایج اجرای پرسشنامه‏ها نشان می‏دهد پرسشنامه‏ی قبل از ویرایش از لحاظ کاهش زمان و پرسشنامه‏ی بعد از ویرایش از لحاظ کیفیت در فرایند تشخیص کارکرد بهتری داشته‏اند. در یک نتیجه‏گیری کلی می‏توان گفت، هردو پرسشنامه‏ی تولید شده از لحاظ کاهش زمان و افزایش کیفیت کارکرد مناسب و رضایت بخشی را در جهت بهبود فرایند تشخیص دارند. برای بهبود خروجی این تحقیق می‏توان جنبه‏های دیگری از جمله روانشناسی ارتباط با بیمار را برای تولید هستان‏نگار در نظر گرفت.
بهینه‌سازی فرآیند جست و جو و نگهداری داده‌های پیوندی وب معنایی
نویسنده:
نغمه سهرابیان
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
برخلاف وب، هدف اصلی وب‏معنایی قابلیت فهم ماشین از اسناد است. توسعه‏ی وب‏معنایی مستلزم توسعه ی داده‏های پیوندی است. داده‏های‏پیوندی اجزای سازنده ی وب‏معنایی هستند که در قالب مدلآر. دی. اف ، منابع‏داده‏ای مختلف وب را به هم مرتبط می کنند. با گذشت زمان تعداد این داده‏ها رو به افزایش است و این امر بازیابی و نگهداری داده‏ها را با مشکل مواجه کرده است. بنابراین نگهداری داده‏های‏پیوندی به نحوی که بازیابی اطلاعات مورد نیاز با صرف کمترین زمان و پیچیدگی انجام شود، نیاز به نگهداری بهینه ی این داده ها را توجیه می کند.معمولاً از جداول‏ رابطه‏ای بزرگ برای نگهداری داده‏های وب‏معنایی استفاده می‏شود. هدف این پژوهش شکستن این جداول رابطه‏ای به جداول کوچک‏تر به‏منظور مدیریت آسان‏تر داده‏های‏پیوندی و دسته‏بندی آن‏هاست. در روش پیشنهادی، این دسته‏بندی براساس نگاشت ساختارهای آنتولوژی مرتبط ‏با داده‏ها به پایگاه‏داده‏ی رابطه‏ای انجام می‏شود. روش‏ پیشنهادی جهت افزایش دقّت داده‏های‏پیوندی از نوعی استنتاج روی داده‏های‏پیوندی بهره می‏گیرد و سرعت بازیابی داده‏های‏پیوندی را نیز از‏ طریق انتخاب ساختارهای ذخیره‏ی مناسب و شاخص‏گذاری افزایش می‏دهد. نتایج حاصل از مقایسه‏ی روش پیشنهادی با روش‏های مطرح ذخیره‏سازی داده‏های آر. دی. اف مانند روش مستقل از الگو، روش مبتنی‏بر الگو و روش هیبرید افزایش سرعت و دقّت داده‏های بازیابی‏شده را نشان می‏دهد و با به‏کارگیری ساختارهای مناسب امکان پاسخ‏گویی به طیف وسیع‏تری از پرس‏وجوها فراهم می‏آید. به‏منظور ارزیابی نتایج از جعبه‏ی‏ اطلاعات در مجموعه‏داده‏ی دی‏بی‏پدیااستفاده شده است.
ذخیره و بازیابی آنتولوژی در مدل داده رابطه‌ای
نویسنده:
علی کفاش
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
آنتولوژی به معنای تعریف صوری مفاهیم می‌باشد. برای ذخیره‌سازی آنتولوژی، دو روش مهم، روش‌های مبتنی بر حافظه و روش‌های ذخیره‌سازی در مدل داده رابطه‌ای می‌باشند. یکی از مشکلات روش‌های مبتنی بر حافظه که در برنامه‌های استدلال‌گری مانند pellet استفاده می‌شوند این است که مدت زمان اجرای پرس‌و‌جو نسبتا زیاد می‌باشد. پایگاه‌های داده رابطه‌ای به دلیل مزایایی همچون بالا رفتن سرعت دست‌یابی به اطلاعات، تضمین بالای امنیت محل نگه‌داری اطلاعات، کاهش هزینه‌های نگه‌داری، استفاده همزمان چند کاربر از یک داده و تخصیص سطوح مختلف دسترسی به گروه‌های مختلف کاری و همچنین امکان استفاده برنامه‌های کاربردی گوناگون از اطلاعات موجود در پایگاه‌داده رابطه‌ای، جهت ذخیره‌سازی آنتولوژی مناسب می‌باشند. روش‌های مبتنی بر مدل داده رابطه‌ای نیز که تا کنون ارایه شده‌اند دارای مشکلاتی مانند حجم بالای تعداد جداول تولید‌شده، طولانی بودن مراحل الگوریتم، عدم انعطاف‌پذیری در مقابل اعمالی همچون اضافه و حذف نمودن و همچنین به‌روزرسانی مفاهیم موجود در آنتولوژی و طولانی بودن زمان اعمال تغییرات و در نهایت عدم امکان پیاده‌سازی بیشتر روش‌ها، می‌باشند. روش ارایه‌شده در این پایان‌نامه، روشی مبتنی بر تکنیک نگاشت می‌باشد و با ایجاد تعداد ثابت 5 جدول به ذخیره‌سازی مفاهیم موجود در آنتولوژی نظیر کلاس‌ها و روابط بین آن‌ها، ویژگی کلاس‌ها، محدودیت ویژگی‌ها و همچنین نمونه‌های ایجاد شده از کلاس‌ها، به ذخیره‌سازی مفاهیم در پایگاه‌داده رابطه‌ای می‌پردازد. روش پیشنهادی که به صورت کامل پیاده‌سازی شده است، مزایایی نظیر بهینه بودن زمان پرس‌وجو، کم بودن مراحل الگوریتم، امکان ایجاد تغییرات و قابلیت پیاده‌سازی را به طور کامل پوشش می‌دهد، همچنین فاکتورهایی مانند مدت زمان اجرای پرس‌وجو،صحت، کامل بودن، مقیاس‌پذیری، تعداد مراحل الگوریتم، تعداد جداول ایجاد شده، پیچیدگی مدل نهایی و فهم آسان آزمایش شده اند که نتایج حاصل از روش پیشنهادی، در بسیاری از معیار‌های ذکر شده دارای عملکرد بهتری می‌باشد.
تشخیص و اصلاح پیوندهای RDF شکسته شده در داده‌های پیوندی
نویسنده:
محمد پورزعفرانی
نوع منبع :
رساله تحصیلی , کتابخانه عمومی
وضعیت نشر :
ایرانداک,
چکیده :
پیوندهای RDF به عنوان یکی از ارکان وب معنایی به شمار می‌آیند. با استفاده از این پیوندها و به کمک آنتولوژی‌های موجود، وب کنونی به ساختاری قابل فهم برای ماشین تبدیل می‌شود. وب حاصله از این تغییر با نام وب داده‌ها شناخته می‌شود. یکی از چالش‌های اساسی در راه توسعه وب داده‌ها، پیوندهای شکسته شده می‌باشند. به دلیل ماهیت تغییرپذیر وب، مجموعه داده‌های موجود در وب داده‌ها نیز دائماً در حال تغییر می‌باشند. این تغییرات باعث می‌شوند پیوندهای موجود در گذر زمان به مکان‌های نادرست یا ناموجود ارجاع داده شده و به اصطلاح شکسته شده تلقی ‌شوند. پژوهش‌های انجام گرفته در این زمینه تا کنون بر اصلاح پیوند، توسط مقصد پیوند تاکید داشته‌اند. این روش‌ها معایبی از جمله ایجاد نقطه شکسته مرکزی و نقض حق مالکیت مجموعه داده‌ها را به همراه دارند. در این تحقیق رویکردی برای اصلاح پیوند از طریق مبدأ پیوند ارائه شده است. زمانی که مقصد پیوند دیگر قابل دسترسی نباشد، الگوریتم در همان لحظه اجرا شده و مقصد تغییر یافته را پیدا می‌نماید. روش پیشنهادی با ایجاد دو مجموعه موجودیت‌های بالا دست و پایین دست، یک ساختار گرافی انحصاری را با نام گراف هویت برای هر موجودیت تشکیل می‌دهد. در ادامه از طریق این گراف کاندیداهای مشابه استخراج شده و مناسب‌ترین گزینه به عنوان خروجی نهایی ارائه می‌شود. روش پیشنهادی بر روی مجموعه داده‌های استاندارد، مورد ارزیابی قرار گرفته و با مهم‌ترین روش‌های ارائه شده تا کنون مقایسه شده است. نتایج بدست آمده، نشان‌ می‌دهد که الگوریتم پیشنهادی در مقایسه با روش‌های دیگر پاسخ قابل قبولی را ارائه داده است.
  • تعداد رکورد ها : 11