Page 59 - Python rat la co ban
P. 59

Chương 8. Xử lý file XML







          Trong phần này, chúng ta sẽ parsing nội dung XML thành

          dữ liệu để xử lý. Để xử lý XML, ta sẽ sử dụng thư viện


          Beautifulsoup 4. Đây là một thư viện giúp việc triển khai


          việc parsing html, xml được nhanh chóng và tiện lợi.




          8.1. Cài đặt Beautifulsoup






          Bạn có thể tham khảo hướng dẫn cách cài đặt tại website

          http://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-


          beautiful-soup.




          Trên MacOS, có thể cài bằng  pip  như sau:





           $ sudo pip install beautifulsoup4







          8.2. Cài đặt lxml parser





          Để parsing  xml  từ beautifulsoup, tao sử dụng bộ parser


          xml có tên là  lxml . Xem hướng dẫn cài đặt tại
   54   55   56   57   58   59   60   61   62   63   64