بازیابی اطلاعات
محسن حاجیزینالعابدینی؛ حمید کشاورز؛ مهنام زمانی کلجاهی
چکیده
در عصر انفجار اطلاعات، حوزه علم اطلاعات و دانششناسی به دنبال سادهسازی و ارتقای فرآیند تولید اصطلاحنامه است. این هدف با استفاده از تکنیکهای متنکاوی و الگوریتمهای یادگیری ماشین تحقق مییابد. رویکرد پیشنهادی شامل استخراج خودکار موضوعات از دادههای متنی بدون ساختار و شناسایی مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است. ...
بیشتر
در عصر انفجار اطلاعات، حوزه علم اطلاعات و دانششناسی به دنبال سادهسازی و ارتقای فرآیند تولید اصطلاحنامه است. این هدف با استفاده از تکنیکهای متنکاوی و الگوریتمهای یادگیری ماشین تحقق مییابد. رویکرد پیشنهادی شامل استخراج خودکار موضوعات از دادههای متنی بدون ساختار و شناسایی مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است. هدف اصلی این پژوهش، بهبود و توسعه اصطلاحنامه با تمرکز بر تکنیکهای متنکاوی است. این رویکرد بهطور مؤثری بازیابی اطلاعات را تسهیل میکند و فرآیند تولید اصطلاحنامه را سادهسازی میکند. روششناسی پژوهش شامل چند مرحله اصلی است. ابتدا، چکیدههای مقالات مرتبط با حوزه علم اطلاعات و دانششناسی از پایگاه استنادی Web of Science در بازه زمانی 2022-1968 جمعآوری شدند. دادهها در پایتون پیشپردازش شدند تا از نویسهها و نمادهای غیرضروری پاکسازی شوند. سپس، الگوریتم TextRank با استفاده از کتابخانههای Pandas و NLTK برای کشف موضوعات پنهان در متنها اعمال شد. این فرآیند تکراری به شناسایی موضوعات رأس در حوزه موضوعی منجر شد. در نهایت، با تحلیل و مقایسه اصطلاحنامه دستی موجود و بررسی معیارهای انسجام موضوع و پوشش موضوعی، اثربخشی رویکرد پیشنهادی ارزیابی و اصطلاحات رأس انتخاب شدند. این روش بهطور مؤثری از دادههای بزرگ برای استخراج موضوعات کلیدی در حوزه علم اطلاعات و دانششناسی استفاده کرد. یافتههای پژوهش بیان میکند که این مطالعه با استفاده از تکنیکهای متنکاوی و الگوریتم TextRank، به استخراج موضوعات کلیدی و انتخاب موضوعات رأس پرداخته است. نتایج نشاندهنده شناسایی 17 موضوع اصلی در حوزه علم اطلاعات و دانششناسی است. این موضوعات شامل حوزههای مهمی مانند آرشیوها و مراکز اطلاعاتی، هوش مصنوعی، کتابشناختی، ردهبندی، توسعه مجموعه، واژگان کنترل شده، کتابخانههای دیجیتال، سازماندهی اطلاعات، بازیابی اطلاعات و استخراج دادهها، علم اطلاعات و کتابداری، نظامهای اطلاعات و منابع، مدیریت دانش، کتابخانهها و خدمات اجتماعی، فراداده، خدمات مرجع، سرعنوانهای موضوعی و علمسنجی هستند. این فهرست موضوعات رأس بهطور مؤثری نماینده مفاهیم کلیدی در حوزه علم اطلاعات و دانششناسی است و میتواند بهعنوان پایهای برای توسعه اصطلاحنامه و بهبود فرآیند بازیابی اطلاعات استفاده شود. این پژوهش با بهرهگیری از روشهای متنکاوی و الگوریتمهای پیشرفته، به استخراج و پیشنهاد موضوعات کلیدی برای اصطلاح رأس از طریق تجزیه و تحلیل دقیق منابع متنی، پرداخت.
متن کاوی
میثم داستانی؛ ثریا ضیایی؛ فائزه دلقندی
چکیده
پژوهش حاضر به شناسایی روندهای نوظهور در مقالات کتابداری و اطلاعرسانی پزشکی منتشر شده در مجلات علمی- پژوهشی ایرانی پرداخته است. مطالعه اکتشافی حاضر به تجزیه و تحلیل مقالات کتابداری و اطلاعرسانی پزشکی در مجلات این حوزه در ایران از سال 1376 تا 1398 با استفاده از فنون متن کاوی پرداخته است. جهت شناسایی مهمترین واژگان به کار رفته در مقالات ...
بیشتر
پژوهش حاضر به شناسایی روندهای نوظهور در مقالات کتابداری و اطلاعرسانی پزشکی منتشر شده در مجلات علمی- پژوهشی ایرانی پرداخته است. مطالعه اکتشافی حاضر به تجزیه و تحلیل مقالات کتابداری و اطلاعرسانی پزشکی در مجلات این حوزه در ایران از سال 1376 تا 1398 با استفاده از فنون متن کاوی پرداخته است. جهت شناسایی مهمترین واژگان به کار رفته در مقالات از الگوریتم TF-IDF استفاده شده است. زبان برنامهنویسی پایتون نیز جهت اجرای الگوریتمهای متنکاوی به کار گرفته شده است. بررسی واژگان نوظهور در مقالات منتشر شده در مجلات کتابداری و اطلاعرسانی پزشکی نشان میدهد که واژگان لیب کوال، عملی، بابلیوتراپی در بازه زمانی 1384 تا 1394 بهتازگی وارد مقالات و مطالعات حوزه کتابداری و اطلاعرسانی پزشکی در مجلات داخلی شده است. همچنین واژگان اختراع، آلتمتریک، مخزن، بازه زمانی 1394 تا 1399 بهتازگی وارد مقالات و مطالعات حوزه کتابداری و اطلاعرسانی پزشکی در مجلات داخلی شده است. نتایج نشاندهنده آن است که واژگان مقالات کتابداری و اطلاعرسانی پزشکی در طول زمان ثابت نبوده و در بازههای زمانی مختلف، دچار تغییراتی شده است. این امر نشاندهنده آن است که همگام با ظهور و رشد فناوری، این رشته علمی نیز تغییر یافته است.