Page 27 - 6.Machine Learning for Data Science
P. 27

หลักสูตรการวิเคราะหอินเทอรเน็ตของทุกสรรพสิ่งเบื้องตนดวย Hadoop  |  26

                  ตารางที่ 3 ผลลัพธของการแบงกลุมโดยโปรแกรม

                                               คะแนน                     ผลลัพธ
                                                 100                       1
                                                 25                        2

                                                 40                        2
                                                 90                        1

                                                 50                        2
                                                 85                        1
                                                 55                        2

                                                 42                        2



                        3.การเรียนรูแบบเสริมกำลัง (Reinforcement Learning  การเรียนรูในรูปแบบนี้จัดเปนการเรียนรูที่มีรูปแบบเปน
                  ระบบสมองกลอัจฉริยะ หรือปญญาประดิษฐ (Artificial Intelligence มากที่สุด เนื่องจากมีการเรียนรูและสามารถ
                  เปลี่ยนแปลงไปตามสิ่งแวดลอม เปนการเรียนรูที่คอมพิวเตอรจะสนใจตอสิ่งแวดลอมเปนพิเศษ ตัวอยางหนึ่งที่ชัดและเขาใจ

                  งายที่สุดคือการฝกหัดเดินของเด็ก โดยในการฝกเดินแตละครั้ง มีหลายปจจัยที่ตองคิด ที่จะตองทำใหไดเชน
                                        ยืนอยางไร
                                        พื้นเสมอหรือไม

                                        ทิ้งน้ำหนักตัวตรงไหน
                                        กางแขนกี่องศา
                                        กาวเทาระยะเทาไหร

                                        ยกขาสูงแคไหน


                         สิ่งตาง ๆ เหลานี้ดูยากมากสำหรับเด็กเล็กๆ ดังนั้นจะตองทดลองเดินหลายๆ ครั้ง โดยมีการใหรางวัลเด็กเมื่อสามารถ
                  เดินไดสำเร็จ ซึ่งรางวัลเปนการเสริมใหเด็กทราบวานี่คือสิ่งที่ดีที่ถูกตอง แตถาไมเดินก็ไมใหรางวัล เด็กก็จะเขาใจวาการทำใน

                  รูปแบบใดถูกตอง หรือไมถูกตอง ดีหรือไมดี ซึ่งรูปแบบการฝกก็จะเปนไปตามรูปที่ 4.3














                                                     รูปที่ 4.3 การฝกเดินของเด็ก


                         การเรียนรูแบบเสริมกำลังเหมาะมากกับโจทยบางประเภท เชนการหากลยุทธที่ทำใหชนะเกมตางๆ  เชนเดินออก
                  จากเขาวงกต วิธีรูปแบบการเรียนรูแบบเสริมกำลังที่เปนที่นิยมเชน Markov Decision Processes (MDP , Q-learning



                   INTRODUCTION TO IOT ANALYTICS USING HADOOP                                        สถาบันสหวิทยาการดิจิทัลและหุนยนต มหาวิทยาลัยเทคโนโลยีราชมงคลพระนคร
   22   23   24   25   26   27   28   29   30   31   32