Page 10 - بررسی تکنیکهای بهبود عملکرد روش های بسامدشماری پیکره بنیاد بر استخراج واژگان (پایه علوم پزشکی)
P. 10
بررسی تکنیکهای بهبود عملکرد روشهای بسامدشماری پیکرهبنیاد در استخراج خودکار واژگان | ...ذوالفقار و دیگران
دسـتوری مـد نظـر قـرار گیـرد .تدویـن اسـتاندارد نـگارش فارسـی ،اسـتفاده از سـیاه ههای از پیـش
تعیی نشـده ،تجهیـز پایـگاه اطلاعاتـی بـه اصطلاحنامـه و فرهن گهـای املایـی ،و تدویـن دسـتنامه
یـا راهنمـای جسـ توجو ،از جملـه راهکارهـای ارائـه شـده اسـت .ایـن راهکارهـا بـا وجـود جامـع
نبـودن ،ک موبیـش اثربخـش بـه نظـر م یرسـند.
«بیرنـگ و بشـیری» در پژوهـش خـود بـه بررسـی بسـامد شـعرهای فارسـی در نفثهالمصـدور
پرداختنـد .آ نهـا نشـان دادنـد کـه از مجموع ۸۵شـاهد شـعری کـه در کتاب آورده شـده ،بیشـترین
بسـامد بـه لحـاظ قالـب شـعری بـه رباعـی و پـس از آن بـه قصیـده اختصـاص دارد .در اوزان شـعری
هـم پـس از وزن رباعـی ،بحـر مضـارع بیشـترین کاربـرد را دارد ( «.)۱۳۹۶جهانگـردی» و همـکاران
بـا اسـتفاده از رو شهـا و ابزارهـای زبا نشناسـی پیکـرهای بـه سـنجش میـزان همپوشـانی و انطبـاق
واژههـای ارائ هشـده در کتا بهـای آمـوزش زبـان فارسـی بـه غی رفارسـ یزبانان ،بـا پُربسـامدترین
واژههـای زبـان فارسـی پرداختنـد .آ نهـا بـر اسـاس مت نهـای موجـود در پایـگاه دادههـای زبـان
فارســی ،یــک پیکــرة زبانــی متــوازن طراحــی کــرده و پُربســامدترین واژههــای آن را ب هعنــوان
مبنـای کار قـرار دادنـد .نتایـج و یافت ههـای پژوهـش آ نهـا نشـان م یدهـد کـه بـهلحـاظ سـطوح
زبا نآمــوزی ،میــزان همپوشــانی واژگانــی هــر یــک ازگروههــای مــورد بررســی بــا گروههــای
متناظـر آ نهـا در پیکـرة مبنـا بسـیار پاییـن اسـت (.)۱۳۹۵
«راد» و همـکاران بـه ارائـة روشـی نـو بـرای شـاخصگذاری خـودکار و اسـتخراج کلمـات
کلیــدی پرداختنــد .آ نهــا بــا اشــاره بــه دشــوار یهای زبــان فارســی ب هخصــوص ویژگ یهــای
نگارشـی و دسـتوری بیـان م یکننـد کـه اسـتخراج خـودکار در زبـان فارسـی دشـوار اسـت .مبنـای
کار آ نهــا خوشــ هبندی بــود؛ بدینمعنــا کــه اطلاعــات خوشــهبندی م یشــدند و بــا جــدا کــردن
نمون ههــا از یکدیگــر و قــرار دادن آ نهــا در گروههــای شــبی هبههم ،واژگان کلیــدی اســتخراج
م یشـدند .نتایـج آزمایـش آنهـا روی چندیـن متـن نشـاندهندة دقـت روش پیشـنهادی آنهاسـت
( .)۱۳۹۵از آنجـا کـه در زبـان فارسـی پژوهـش جامـع در حـوزة اسـتخراج واژگان تخصصـی از
پیکرههـا انجـام نشـده اسـت ،بنابرایـن ،پژوهـش حاضـر را م یتـوان پژوهشـی نـو در ایـن زمینـه
دانسـت.
در اینجـا توجـه بـه چنـد نکتـه ضـروری بـه نظـر م یرسـد .نخسـت آ نکـه اغلـب روشهـای
یادشــده در زبا نهــای فرانســه و انگلیســی مــورد ارزیابــی قــرار گرفت هانــد و بــرای زبا نهــای
دیگـر همچـون فارسـی تاکنـون بهصـورت جـدی مـورد ارزیابـی قـرار نگرفت هانـد .دیگـر آ نکـه
رو شهایـی کـه در بـالا بـه آ نهـا پرداختـه شـد ،درصدهـای موفقیـت گوناگونـی داشـتهاند و در
1025