Page 10 - بررسی تکنیک‌های بهبود عملکرد روش های بسامدشماری پیکره بنیاد بر استخراج واژگان (پایه علوم پزشکی)
P. 10

‫بررسی تکنیک‌های بهبود عملکرد روش‌های بسامدشماری پیکره‌بنیاد در استخراج خودکار واژگان ‪ | ...‬ذوالفقار و دیگران‬

    ‫دسـتوری مـد نظـر قـرار گیـرد‪ .‬تدویـن اسـتاندارد نـگارش فارسـی‪ ،‬اسـتفاده از سـیاه ‪‎‬ههای از پیـش‬
    ‫تعیی ‌نشـده‪ ،‬تجهیـز پایـگاه اطلاعاتـی بـه اصطلاحنامـه و فرهن ‌گهـای املایـی‪ ،‬و تدویـن دسـتنامه‬
    ‫یـا راهنمـای جسـ ‌توجو‪ ،‬از جملـه راهکارهـای ارائـه شـده اسـت‪ .‬ایـن راهکارهـا بـا وجـود جامـع‬

                                                 ‫نبـودن‪ ،‬ک ‌موبیـش اثربخـش بـه نظـر م ‪‎‬یرسـند‪.‬‬
    ‫‌«بیرنـگ و بشـیری» در پژوهـش خـود بـه بررسـی بسـامد شـعرهای فارسـی در نفثه‌المصـدور‬
    ‫پرداختنـد‪ .‬آ ‌نهـا نشـان دادنـد کـه از مجموع ‪ ۸۵‬شـاهد شـعری کـه در کتاب آورده شـده‪ ،‬بیشـترین‬
    ‫بسـامد بـه‌ لحـاظ قالـب شـعری بـه رباعـی و پـس از آن بـه قصیـده اختصـاص دارد‪ .‬در اوزان شـعری‬
    ‫هـم پـس از وزن رباعـی‪ ،‬بحـر مضـارع بیشـترین کاربـرد را دارد (‪ «.)۱۳۹۶‬جهانگـردی» و همـکاران‬
    ‫‌بـا اسـتفاده از رو ‌شهـا و ابزارهـای زبا ‌نشناسـی پیکـر‌های بـه سـنجش میـزان همپوشـانی و انطبـاق‬
    ‫واژ‌ههـای ارائ ‌هشـده در کتا ‌بهـای آمـوزش زبـان فارسـی بـه غی ‌رفارسـ ‌یزبانان‪ ،‬بـا پُربسـامدترین‬
    ‫واژه‌هـای زبـان فارسـی پرداختنـد‪ .‬آ ‌نهـا بـر اسـاس مت ‌نهـای موجـود در پایـگاه داد‌ههـای زبـان‬
    ‫فارســی‪ ،‬یــک پیکــرة زبانــی متــوازن طراحــی کــرده و پُربســامدترین واژ‌ههــای آن را ب ‌هعنــوان‬
    ‫مبنـای کار قـرار دادنـد‪ .‬نتایـج و یافت ‌ههـای پژوهـش آ ‌نهـا نشـان م ‌یدهـد کـه بـه‌لحـاظ سـطوح‬
    ‫زبا ‌نآمــوزی‪ ،‬میــزان همپوشــانی واژگانــی هــر یــک ازگرو‌ههــای مــورد بررســی بــا گرو‌ههــای‬

                                        ‫متناظـر آ ‌نهـا در پیکـرة مبنـا بسـیار پاییـن اسـت (‪.)۱۳۹۵‬‬
    ‫«راد» و همـکاران بـه ارائـة روشـی نـو بـرای شـاخص‌گذاری خـودکار و اسـتخراج کلمـات‬
    ‫کلیــدی پرداختنــد‪ .‬آ ‌نهــا بــا اشــاره بــه دشــوار ‌یهای زبــان فارســی ب ‌هخصــوص ویژگ ‌یهــای‬
    ‫نگارشـی و دسـتوری بیـان م ‌یکننـد کـه اسـتخراج خـودکار در زبـان فارسـی دشـوار اسـت‪ .‬مبنـای‬
    ‫کار آ ‌نهــا خوشــ ‌هبندی بــود؛ بدین‌معنــا کــه اطلاعــات خوشــه‌بندی م ‌یشــدند و بــا جــدا کــردن‬
    ‫نمون ‌ههــا از یکدیگــر و قــرار دادن آ ‌نهــا در گرو‌‌ههــای شــبی ‌هبه‌هم‪ ،‬واژگان کلیــدی اســتخراج‬
    ‫م ‌یشـدند‪ .‬نتایـج آزمایـش آن‌هـا روی چندیـن متـن نشـان‌دهندة دقـت روش پیشـنهادی آن‌هاسـت‬
    ‫(‪ .)۱۳۹۵‬از آنجـا کـه در زبـان فارسـی پژوهـش جامـع در حـوزة اسـتخراج واژگان تخصصـی از‬
    ‫پیکره‌هـا انجـام نشـده اسـت‪ ،‬بنابرایـن‪ ،‬پژوهـش حاضـر را م ‌یتـوان پژوهشـی نـو در ایـن زمینـه‬

                                                                                   ‫دانسـت‪.‬‬
    ‫‌در اینجـا توجـه بـه چنـد نکتـه ضـروری بـه نظـر م ‌یرسـد‪ .‬نخسـت آ ‌نکـه اغلـب روش‌هـای‬
    ‫یادشــده در زبا ‌نهــای فرانســه و انگلیســی مــورد ارزیابــی قــرار گرفت ‌هانــد و بــرای زبا ‌نهــای‬
    ‫دیگـر همچـون فارسـی تاکنـون به‌صـورت جـدی مـورد ارزیابـی قـرار نگرفت ‌هانـد‪ .‬دیگـر آ ‌نکـه‬
    ‫رو ‌شهایـی کـه در بـالا بـه آ ‌نهـا پرداختـه شـد‪ ،‬درصدهـای موفقیـت گوناگونـی داشـته‌اند و در‬

‫‪1025‬‬
   5   6   7   8   9   10   11   12   13   14   15