Page 7 - بررسی تکنیک‌های بهبود عملکرد روش های بسامدشماری پیکره بنیاد بر استخراج واژگان (پایه علوم پزشکی)
P. 7

‫تابستان ‪ | 1399‬دورة ‪ | 35‬شمارة ‪4‬‬

‫اسـت‪ .‬بدین‌معنـا کـه متـون ب ‌هکاررفتـه در آمـوزش زبـان فارسـی بایـد بـا محتـوای مناسـب و بـر‬
‫اسـاس داد‌ههـای واقعـی و پیکـر‌ها ِی زبـان فارسـی به‌صـورت منظـم و سـاخ ‌تیافته تهیـه گردنـد‪.‬‬
‫‌م ‌یدانیــم کــه یکــی از معتبرتریــن مراکــز فعــال در زمینــة آمــوزش زبــان فارســی بــه‬
‫غی ‌رفارســی‌زبانان در ایــران‪« ،‬مرکــز زبــان فارســی دانشــگاه بین‌المللــی امــام خمینــی قزویــن»‬
‫اسـت‪ .‬هـر سـاله زبا ‌نآمـوزان بسـیاری از کشـورهای مختلـف آسـیایی‪ ،‬آفریقایـی و اروپایـی بـرای‬
‫یادگیـری زبـان فارسـی جهـت اخـذ پذیـرش در دانشـگاه‌های ایـران و ادامـة تحصیـل در ایـران‬
‫وارد ایــن مرکــز م ‌یشــوند‪ .‬ایــن زبا ‌نآمــوزان اغلــب داوطلــب رشــت ‌ههای فنــی و پزشــکی و یــا‬
‫علـوم انسـانی هسـتند و یکـی از کمبودهـای مسـلم ایـن زبا ‌نآمـوزان عـدم دسترسـی آ ‌نهـا و نیـز‬
‫اسـاتید ایـن مرکـز بـه واژگان تخصصـی حـوزة مـورد مطالعـة آ ‌نهـا در سـطوح مختلـف اسـت‪.‬‬
‫اهمیـت نقـش واژگان انتخا ‌بشـده جهـت تدریـس بـر کمتـر کسـی پوشـیده اسـت‪ ،‬امـا تاکنـون‬
‫پژوهـش جـدی و عمیقـی در زمینـة تهیـة ایـن واژگان در سـطوح مختلـف در زبـان فارسـی و یـا‬
‫درگرای ‌شهـای مختلـف رشـتة پزشـکی و یـا حـوزه‌ای خـاص انجـام نگرفتـه اسـت‪ .‬ایـن در حالـی‬
‫اسـت کـه یکـی از جنب ‌ههـای مهـم آمـوزش زبـان‪ ،‬داشـتن متـون متناسـب بـا سـطح زبا ‌نآمـوز‬
‫اسـت‪ .‬مدرسـان زبـان فارسـی بـه زبا ‌نآمـوزان متقاضـی حضـور در رشـت ‌ههای پزشـکی در ایـران‪،‬‬
‫نیازمنـد آگاهـی از واژ‌ههـای پرکاربـرد و کلیـدی هسـتند تـا بـر مبنـای آن از توانایـی سـطح‌بندی‬
‫زبا ‌نآمـوزان در رد‌ههـای مبتـدی‪ ،‬متوسـط و پیشـرفته برخـوردار گردنـد و امـکان آشـنایی جام ‌عتـر‬
‫زبا ‌نآمــوزان را بــا واژ‌ههــای پرکاربــرد در ســطوح بالاتــر فراهــم آورنــد‪ .‬از ایــن رو‪ ،‬انتخــاب و‬
 ‫بـ ‌هکار گرفتـن کارآمدتریـن روش‌هـا جهـت تهیـه و تدویـن ایـن منابـع امـری ضـروری اسـت‪.‬‬
‫پژوهش‌هــای گوناگونــی در زبا ‌نهــای مختلــف دنیــا بــرای دســتیابی بــه فهرســت واژگان‬
‫تخصصـی و یـا اصطلاحـات صـورت گرفتـه اسـت کـه در غالـب آن‌هـا از رو ‌شهـای آمـاری‌‪،‬‬
‫زبا ‌نشــناختی و یــا ترکیبــی از هــر دو بهــره برد‌هانــد‪ .‬در ایــن میــان‪ ،‬یکــی از پرکاربردتریــن‬
‫رو ‌شهــای مــورد اســتفاده در اســتخراج خــودکار واژگان‪ ،‬خانــوادة رو ‌شهــای بسامدشــماری‪1‬‬
‫اســت‪ .‬منظــور از رو ‌شهــای بسامدشــماری‪ ،‬شــمارش وقــوع واژ‌ههــا در متــن اســت‪ .‬ایــن دســته‬
‫از رو ‌شهــا تاکنــون بیشــتر در زبان‌هــای انگلیســی‪ ،‬فرانســه و ژاپنــی مــورد اســتفاده قــرار گرفتــه‌‬
‫و مســیر تکامــل خــود را پیمود‌هانــد‪ .‬در زبــان فارســی نیــز شــاهد ب ‌هکارگیــری ایــن خانــواده از‬
‫رو ‌شهــا طــی چنــد ســال اخیــر بوده‌ایــم‪ .‬بــا ب ‌هکارگیــری روش‌هــای بسامدشــماری‪ ،‬رفت ‌هرفتــه‬

‫‪1. frequency based approaches‬‬

                                                                                                                                  ‫‪1022‬‬
   2   3   4   5   6   7   8   9   10   11   12