Page 27 - 6.Machine Learning for Data Science
P. 27
หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop | 26
ตารางที่ 3 ผลลัพธของการแบงกลุมโดยโปรแกรม
คะแนน ผลลัพธ
100 1
25 2
40 2
90 1
50 2
85 1
55 2
42 2
3.การเรียนรูแบบเสริมกำลัง (Reinforcement Learning การเรียนรูในรูปแบบนี้จัดเปนการเรียนรูที่มีรูปแบบเปน
ระบบสมองกลอัจฉริยะ หรือปญญาประดิษฐ (Artificial Intelligence มากที่สุด เนื่องจากมีการเรียนรูและสามารถ
เปลี่ยนแปลงไปตามสิ่งแวดลอม เปนการเรียนรูที่คอมพิวเตอรจะสนใจตอสิ่งแวดลอมเปนพิเศษ ตัวอยางหนึ่งที่ชัดและเขาใจ
งายที่สุดคือการฝกหัดเดินของเด็ก โดยในการฝกเดินแตละครั้ง มีหลายปจจัยที่ตองคิด ที่จะตองทำใหไดเชน
ยืนอยางไร
พื้นเสมอหรือไม
ทิ้งน้ำหนักตัวตรงไหน
กางแขนกี่องศา
กาวเทาระยะเทาไหร
ยกขาสูงแคไหน
สิ่งตาง ๆ เหลานี้ดูยากมากสำหรับเด็กเล็กๆ ดังนั้นจะตองทดลองเดินหลายๆ ครั้ง โดยมีการใหรางวัลเด็กเมื่อสามารถ
เดินไดสำเร็จ ซึ่งรางวัลเปนการเสริมใหเด็กทราบวานี่คือสิ่งที่ดีที่ถูกตอง แตถาไมเดินก็ไมใหรางวัล เด็กก็จะเขาใจวาการทำใน
รูปแบบใดถูกตอง หรือไมถูกตอง ดีหรือไมดี ซึ่งรูปแบบการฝกก็จะเปนไปตามรูปที่ 4.3
รูปที่ 4.3 การฝกเดินของเด็ก
การเรียนรูแบบเสริมกำลังเหมาะมากกับโจทยบางประเภท เชนการหากลยุทธที่ทำใหชนะเกมตางๆ เชนเดินออก
จากเขาวงกต วิธีรูปแบบการเรียนรูแบบเสริมกำลังที่เปนที่นิยมเชน Markov Decision Processes (MDP , Q-learning
INTRODUCTION TO IOT ANALYTICS USING HADOOP สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร