LaoNLP เป็นโปรเจคที่ผมพัฒนาขึ้นมาเพื่อช่วยประมวลผลภาษาลาวใน Python ซึ่งเป็นภาษาทางการที่ถูกใช้ในประเทศลาว
เนื่องจากผมค้นหาเครื่องมือสำหรับประมวลผลภาษาลาวแล้วพบว่าภาษาลาวไม่ค่อยมีเครื่องมือด้านนี้เท่าไร จึงพัฒนาขึ้นมา
โดยติดตั้งได้ง่าย ๆ ด้วยคำสั่ง pip install laonlp
การใช้งาน
ตัดคำ
from laonlp.tokenize import word_tokenizeส่วนตัดประโยค
txt= ""
print(word_tokenize("ພາສາລາວໃນປັດຈຸບັນ.")) # ['ພາສາລາວ', 'ໃນ', 'ປັດຈຸບັນ', '.']
from laonlp.tokenize import sent_tokenize
txt= ""
print(word_tokenize("ພາສາລາວໃນປັດຈຸບັນ.ພາສາລາວໃນປັດຈຸບັນ.")) # ['ພາສາລາວໃນປັດຈຸບັນ',ພາສາລາວໃນປັດຈຸບັນ]
อ่านรายละเอียดเพิ่มเติมได้ที่ https://github.com/wannaphong/LaoNLP
0 ความคิดเห็น:
แสดงความคิดเห็น
แสดงความคิดเห็นได้ครับ :)