โมดูล Beautiful Soup สามารถใช้ทำ HTML หรือ XML parser ได้อย่างสะดวกยิ่งขึ้น และยังสามารถแปลงรหัสตัวอักษรเป็น UTF-8 ได้
โมดูล Beautiful Soup มีเวชั่นล่าสุด คือ Beautiful Soup 4 ครับ
- รองรับทั้ง Python 2 และ Python 3
- ใช้ License: MIT
สามารถติดตั้งได้โดยใช้คำสั่ง pip:
$ pip install beautifulsoup4
ตัวอย่างการใช้งาน
ใช้ Beautiful Soup แปลงจาก HTML เป็นข้อความ
[python]
from bs4 import BeautifulSoup
html = """<html>
<head>
<tile>สวัสดี</tile>
</head>
<body>
<h1>สวัสดี</h1><hr><br><pre>
============ ผมกำลังเขียนภาษา HTML อยู่ในขณะนี้ ผมใช้แค่ notepad ในการเขียนโค้ดในขณะนี้ ไม่ได้ใช้เครื่องมือใด ๆ เพราะเครื่องมือยังไงก็ยังเป็นแค่เครื่องมือวันยังค่ำ ผมชอบเรียนภาษา C , Python, HTML เพราะสนุกดี==========
</pre><br>
<a href="https://python3.wannaphong.com/" id="link1">บล็อก Python 3 ที่ผมทำครับ</a><br>
<a href="https://www.google.com/" id="link2">Google</a><br>
<a href="https://login.live.com/" id ="link3">Hotmail</a><br>
<b>ขอบคุณ :D</b>
</body>
</html>"""
soup = BeautifulSoup(html)
print(soup.get_text())
[/python]
ผลลัพธ์
สวัสดี
สวัสดี
============ ผมกำลังเขียนภาษา HTML อยู่ในขณะนี้ ผมใช้แค่ notepad ในการเขียนโค้ดใ
นขณะนี้ ไม่ได้ใช้เครื่องมือใด ๆ เพราะเครื่องมือยังไงก็ยังเป็นแค่เครื่องมือวันยัง
ค่ำ ผมชอบเรียนภาษา C , Python, HTML เพราะสนุกดี==========
บล็อก Python 3 ที่ผมทำครับ
Hotmail
ขอบคุณ :D
อ่านเอกสารการใช้งานโมดูล Beautiful Soup ได้ที่ http://www.crummy.com/software/BeautifulSoup/bs4/doc/
ติดตามบทความต่อไปนะครับ
ขอบคุณครับ
0 ความคิดเห็น:
แสดงความคิดเห็น
แสดงความคิดเห็นได้ครับ :)