Page 59 - Python rat la co ban
P. 59
Chương 8. Xử lý file XML
Trong phần này, chúng ta sẽ parsing nội dung XML thành
dữ liệu để xử lý. Để xử lý XML, ta sẽ sử dụng thư viện
Beautifulsoup 4. Đây là một thư viện giúp việc triển khai
việc parsing html, xml được nhanh chóng và tiện lợi.
8.1. Cài đặt Beautifulsoup
Bạn có thể tham khảo hướng dẫn cách cài đặt tại website
http://www.crummy.com/software/BeautifulSoup/bs4/doc/#installing-
beautiful-soup.
Trên MacOS, có thể cài bằng pip như sau:
$ sudo pip install beautifulsoup4
8.2. Cài đặt lxml parser
Để parsing xml từ beautifulsoup, tao sử dụng bộ parser
xml có tên là lxml . Xem hướng dẫn cài đặt tại