Tag: پایگاه لغت نامه

پایگاه لغت نامه قاموس نور

مرکز تحقیقات کامپیوتری علوم اسلامی (نور) برای اشاعه فرهنگ غنی اسلام، تسهیل دستیابی به منابع و متون اصیل دینی و نیز سرعت بخشیدن به امر کاوش و پژوهش در حوزه علوم اسلامی با بهره گیری از فناوری اطلاعات و به کارگیری امکانات رایانه ای برای ارائه معارف و علوم اسلامی پایگاه های علمی مختلفی ایجاد کرده که یکی از این پایگاه های مورد نیاز پژوهشگران و محققان علوم اسلامی پایگاه لغت نامه نور می باشد. هدف پایگاه لغت قاموس نور در فاز اول، ارائه موتور جستجویی هوشمند در جهت ارانه بهترین و نزدیک ترین پاسخ نسبت به درخواست کاربر می باشد. این خدمت نتیجه تلاش چندین ساله گروهی از پژوهشگران علوم اسلامی و همراهی جمعی از کارشناسان فنی در حوزه نرم افزار می باشد. در این مرحله از پایگاه علاوه بر ارائه «مداخل» و «توصیفات» متناسب با در خواست کاربر اطلاعات جانبی دیگری نیز در اختیار کاربر قرار می گیرد که عبارتند از: ● توصیف ریشه مداخل ● مترادفات مداخل ● متضادات مداخل ● مداخل اضداد ● مداخل مرتبط با مدخل مورد نظر ● آیات مرتبط با مداخل ● روایات مرتبط با مداخل که برای تحقق این مهم انجام امور ذیل ضروری به نظر رسید:

  • ساماندهی واژگان موجود در متون عربی
    • از مجموع تقریبی دو ملیارد کلمه که در متون عربی در اختیار مرکز وجود دارد فهرست غیر تکراری مشتمل بر دو ملیون و هفتصد هزار کلمه تهیه شد و در ابزاری نسبت به تعیین وضعیت آنها از حیث ریشه و برچسب گذاری های متنوع اقدام شد.
  • ارزیابی منابع لغوی و استخراج مداخل و توصیفات از آنها
    • شناسایی منابعی که از نظر ویرایشی قابلیت لازم را برای استخراج ماشینی مداخل و توصیفات داشتند
    • استخراج ماشینی مداخل و توصیفات از منابع تعیین شده
    • بازبینی اطلاعات استخراج شده توسط محققین به منظور تکمیل یا اصلاح موارد
  • یکی از اصلی ترین اهداف تولید پایگاه لغت برقراری ارتباط هوشمند بین کلمات استعمال شده در متون یا محاورات (حدود دو ملیارد کلمه) و مداخل نماینده (در حدود یکصد هزار مدخل) بدون نیاز به تحلیل ذهنی کاربر است. برای تحقق این مهم و ارائه بهترین پاسخ به درخواست کاربر چندین مرحله توسط موتور جستجوگر انجام می گیرد:
    • ارائه پاسخ بر اساس جستجوی عین کلمه درخواستی در بین مداخل نماینده
    • ارائه پاسخ بر اساس جستجوی در خواست کاربر پس از پیراسته سازی آن
    • ارائه پاسخ بر اساس شناسایی جایگاه کلمه درخواستی کاربر در درخت نظام اشتقاق و یافتن نزدیک ترین مدخل نماینده به این جایگاه
    • ارائه مداخل نماینده ای که در ریشه با درخواست کاربر مشابهت دارند. موتور جستجو با انجام این مراحل مجموعه ای از پاسخ ها را ارائه می کند که مرتب سازی آنها باید بر اساس تقریب هر چه بیشتر به درخواست کاربر باشد. مرتب سازی پاسخ ها به مرور زمان و در طی فازهای عملیاتی توسعه پایگاه ارتقاء پیدا خواهد کرد . ان شاء الله.
  • ساماندهی و تجمیع مداخل استخراج شده از منابع مختلف لغوی
    • با وجود اینکه مشتقات دارای توصیف (مداخل) به طور طبیعی محدود می باشند و به طور تقریبی می توان آنها را در حدود یکصد هزار عدد تخمین زد ولی تنوع در تنظیم این مداخل از سوی مولفین باعث شده که تعداد این مداخل افزایش چند برابری پیدا کنند. به این خاطر لازم بود هماهنگی حداکثری جهت تجمیع این مداخل و مشخص کردن موارد مشابه صورت گیرد. لذا برای هر یک از مداخل دارای توصیف یک «مدخل نماینده» مشخص گردید. به این ترتیب توانستیم برای مجموع تقریبی هشتصد هزار مدخل استخراج شده از هفت کتاب لغوی تعداد تقریبی ۱۲۰ هزار «مدخل نماینده» مشخص کنیم. با این کار بدون اینکه دخل و تصرفی در مداخل ارائه شده در کتب لغوی کرده باشیم یک دسته بندی جدید برای کاهش دادن تعداد پاسخ ها به کاربر صورت گرفت. لذا هم اکنون در پایگاه پس از هر جستجو دو عدد در صدر پاسخ ها به عنوان آمار ارائه می شود: اول تعداد پاسخ، دوم تعداد دسته
  • ساماندهی توصیفات استخراج شده
    • با توجه به تشابه و تقارب لفظی توصیفات ذکر شده در بسیاری از موارد، لازم است هماهنگی و دسته‏بندی بین این توصیفات نیز صورت پذیرد که ان شاء الله در فاز‏های بعدی محقق خواهد شد.
  • برقراری ارتباط بین مداخل نماینده مترادف
    • در برخی از منابع، کلمات مترادف جمع آوری و دسته بندی شده اند. از جمله مزیت های تعیین «مدخل نماینده» این است که توانستیم در پایگاه ذیل مداخل نماینده ای که دارای مترادف هستند ارتباطی بین مداخل نماینده مترادف در بخش «مترادفات» برقرار کنیم. البته استناد میزان صحت ترادف به منبعی است که در پایگاه معرفی شده است.
  • برقراری ارتباط بین مداخل نماینده هم موضوع
    • در برخی از منابع، مداخل به صورت موضوعی – و نه بر اساس ریشه- مرتب شده اند. لذا مداخلی که اکثرا از نظر ریشه با هم تناسبی ندارند ولی در ذیل یک موضوع مشخص با هم ارتباط دارند در اینگونه منابع ذکر شده اند. در پایگاه برای مداخل نماینده ای که دارای این نوع ارتباط با سایر مداخل هستند بخش «مرتبطات» وجود دارد که فهرست مداخل مرتبط و موضوع ارتباط در آن مشخص شده و کاربر می تواند از این طریق به سایر مداخل دستیابی پیدا کند.
  • برقراری ارتباط مداخل نماینده با احادیث
    • برخی از منابع لغوی به توضیح کلمات مشکل در احادیث تحت عنوان «غریب الحدیث» پرداخته اند. در پایگاه اطلاعات این منابع به مداخل نماینده مربوط به آن متصل شده و در بخش «روایت» از آن مدخل قابل مشاهده می باشد.
  • توصیف ریشه مداخل
    • در کتاب «معجم مقاییس اللغه» در هر بخش قبل از پرداختن به توصیف مداخل، توصیفی کلی از ریشه اصلی مداخل را ارائه می کند. در پایگاه در مقابل هر یک از مداخل ریشه دار، آن ریشه ذکر شده که از طریق آن به صفحه ریشه منتقل می شویم. در این صفحه ابتدا توصیف ریشه از کتاب «معجم مقاییس اللغه » آمده است و سپس فهرستی از مداخل ذیل آن ریشه ارائه می شود.

در فازهای بعدی از توسعه پایگاه علاوه بر موارد فوق اطلاعات جانبی دیگری نیز در اختیار کاربر قرار می گیرد که عبارتند از: متضادات مداخل، مداخل اضداد، آیات مرتبط با مداخل، اصطلاحات مرتبط با مداخل

برای دسترسی به این پایگاه می توانید به آدرس اینترنتی زیر مراجعه نمایید:

www.qamus.inoor.ir