7 กันยายน 2563

Published กันยายน 07, 2563 by with 0 comment

ตัดคำภาษาลาวด้วย LaoNLP

สวัสดีผู้อ่านทุกท่านครับ ผมได้พัฒนาเครื่องมือสำหรับประมวลผลภาษาลาวขึ้นมา ชื่อว่า LaoNLP โดยเป็นโปรเจคที่ผมทำในเวลาว่าง โดยตอนนี้รองรับการตัดคำภาษาลาว และตัดประโยคภาษาลาว

LaoNLP เป็นโปรเจคที่ผมพัฒนาขึ้นมาเพื่อช่วยประมวลผลภาษาลาวใน Python ซึ่งเป็นภาษาทางการที่ถูกใช้ในประเทศลาว

เนื่องจากผมค้นหาเครื่องมือสำหรับประมวลผลภาษาลาวแล้วพบว่าภาษาลาวไม่ค่อยมีเครื่องมือด้านนี้เท่าไร จึงพัฒนาขึ้นมา

โดยติดตั้งได้ง่าย ๆ ด้วยคำสั่ง pip install laonlp

การใช้งาน
ตัดคำ
from laonlp.tokenize import word_tokenize
txt= ""
print(word_tokenize("ພາສາລາວໃນປັດຈຸບັນ.")) # ['ພາສາລາວ', 'ໃນ', 'ປັດຈຸບັນ', '.']
ส่วนตัดประโยค
from laonlp.tokenize import sent_tokenize
txt= ""
print(word_tokenize("ພາສາລາວໃນປັດຈຸບັນ.ພາສາລາວໃນປັດຈຸບັນ.")) # ['ພາສາລາວໃນປັດຈຸບັນ',ພາສາລາວໃນປັດຈຸບັນ]

อ่านรายละเอียดเพิ่มเติมได้ที่ https://github.com/wannaphong/LaoNLP

0 ความคิดเห็น:

โพสต์ความคิดเห็น

แสดงความคิดเห็นได้ครับ :)