بازیابی اطلاعات
محسن حاجیزینالعابدینی؛ حمید کشاورز؛ مهنام زمانی کلجاهی
چکیده
در عصر انفجار اطلاعات، حوزه علم اطلاعات و دانششناسی به دنبال سادهسازی و ارتقای فرآیند تولید اصطلاحنامه است. این هدف با استفاده از تکنیکهای متنکاوی و الگوریتمهای یادگیری ماشین تحقق مییابد. رویکرد پیشنهادی شامل استخراج خودکار موضوعات از دادههای متنی بدون ساختار و شناسایی مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است. ...
بیشتر
در عصر انفجار اطلاعات، حوزه علم اطلاعات و دانششناسی به دنبال سادهسازی و ارتقای فرآیند تولید اصطلاحنامه است. این هدف با استفاده از تکنیکهای متنکاوی و الگوریتمهای یادگیری ماشین تحقق مییابد. رویکرد پیشنهادی شامل استخراج خودکار موضوعات از دادههای متنی بدون ساختار و شناسایی مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است. هدف اصلی این پژوهش، بهبود و توسعه اصطلاحنامه با تمرکز بر تکنیکهای متنکاوی است. این رویکرد بهطور مؤثری بازیابی اطلاعات را تسهیل میکند و فرآیند تولید اصطلاحنامه را سادهسازی میکند. روششناسی پژوهش شامل چند مرحله اصلی است. ابتدا، چکیدههای مقالات مرتبط با حوزه علم اطلاعات و دانششناسی از پایگاه استنادی Web of Science در بازه زمانی 2022-1968 جمعآوری شدند. دادهها در پایتون پیشپردازش شدند تا از نویسهها و نمادهای غیرضروری پاکسازی شوند. سپس، الگوریتم TextRank با استفاده از کتابخانههای Pandas و NLTK برای کشف موضوعات پنهان در متنها اعمال شد. این فرآیند تکراری به شناسایی موضوعات رأس در حوزه موضوعی منجر شد. در نهایت، با تحلیل و مقایسه اصطلاحنامه دستی موجود و بررسی معیارهای انسجام موضوع و پوشش موضوعی، اثربخشی رویکرد پیشنهادی ارزیابی و اصطلاحات رأس انتخاب شدند. این روش بهطور مؤثری از دادههای بزرگ برای استخراج موضوعات کلیدی در حوزه علم اطلاعات و دانششناسی استفاده کرد. یافتههای پژوهش بیان میکند که این مطالعه با استفاده از تکنیکهای متنکاوی و الگوریتم TextRank، به استخراج موضوعات کلیدی و انتخاب موضوعات رأس پرداخته است. نتایج نشاندهنده شناسایی 17 موضوع اصلی در حوزه علم اطلاعات و دانششناسی است. این موضوعات شامل حوزههای مهمی مانند آرشیوها و مراکز اطلاعاتی، هوش مصنوعی، کتابشناختی، ردهبندی، توسعه مجموعه، واژگان کنترل شده، کتابخانههای دیجیتال، سازماندهی اطلاعات، بازیابی اطلاعات و استخراج دادهها، علم اطلاعات و کتابداری، نظامهای اطلاعات و منابع، مدیریت دانش، کتابخانهها و خدمات اجتماعی، فراداده، خدمات مرجع، سرعنوانهای موضوعی و علمسنجی هستند. این فهرست موضوعات رأس بهطور مؤثری نماینده مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است و میتواند بهعنوان پایهای برای توسعه اصطلاحنامه و بهبود فرآیند بازیابی اطلاعات استفاده شود. این پژوهش با بهرهگیری از روشهای متنکاوی و الگوریتمهای پیشرفته، به استخراج و پیشنهاد موضوعات کلیدی برای اصطلاح رأس از طریق تجزیه و تحلیل دقیق منابع متنی، پرداخت.