10 พฤษภาคม 2558

Published พฤษภาคม 10, 2558 by with 0 comment

โมดูล Beautiful Soup ในภาษา Python

สวัสดีผู้อ่านทุกท่านครับ บทความนี้ผมจะพาผู้อ่านไปรู้จักกับโมดูล Beautiful Soup ในภาษา Python กันครับ

โมดูล Beautiful Soup สามารถใช้ทำ HTML หรือ XML parser ได้อย่างสะดวกยิ่งขึ้น และยังสามารถแปลงรหัสตัวอักษรเป็น UTF-8 ได้
โมดูล Beautiful Soup มีเวชั่นล่าสุด คือ Beautiful Soup 4 ครับ

  • รองรับทั้ง Python 2 และ Python 3

  • ใช้ License: MIT


สามารถติดตั้งได้โดยใช้คำสั่ง pip:
$ pip install beautifulsoup4

ตัวอย่างการใช้งาน
ใช้ Beautiful Soup แปลงจาก HTML เป็นข้อความ

[python]
from bs4 import BeautifulSoup

html = """<html>
<head>
<tile>สวัสดี</tile>
</head>
<body>
<h1>สวัสดี</h1><hr><br><pre>
============ ผมกำลังเขียนภาษา HTML อยู่ในขณะนี้ ผมใช้แค่ notepad ในการเขียนโค้ดในขณะนี้ ไม่ได้ใช้เครื่องมือใด ๆ เพราะเครื่องมือยังไงก็ยังเป็นแค่เครื่องมือวันยังค่ำ ผมชอบเรียนภาษา C , Python, HTML เพราะสนุกดี==========
</pre><br>
<a href="https://python3.wannaphong.com/" id="link1">บล็อก Python 3 ที่ผมทำครับ</a><br>
<a href="https://www.google.com/" id="link2">Google</a><br>
<a href="https://login.live.com/" id ="link3">Hotmail</a><br>
<b>ขอบคุณ :D</b>
</body>
</html>"""

soup = BeautifulSoup(html)
print(soup.get_text())
[/python]

ผลลัพธ์
สวัสดี


สวัสดี
============ ผมกำลังเขียนภาษา HTML อยู่ในขณะนี้ ผมใช้แค่ notepad ในการเขียนโค้ดใ
นขณะนี้ ไม่ได้ใช้เครื่องมือใด ๆ เพราะเครื่องมือยังไงก็ยังเป็นแค่เครื่องมือวันยัง
ค่ำ ผมชอบเรียนภาษา C , Python, HTML เพราะสนุกดี==========

บล็อก Python 3 ที่ผมทำครับ
Google
Hotmail
ขอบคุณ :D

อ่านเอกสารการใช้งานโมดูล Beautiful Soup ได้ที่ http://www.crummy.com/software/BeautifulSoup/bs4/doc/
ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)