ภาษาไทย เป็นภาษาประจำชาติของประเทศไทย หลาย ๆ คนที่ทำ NLP และ ChatBot คงหวังอยากให้ ChatBot ภาษาไทยใช้งานได้เท่าเทียมกับ ChatBot ภาษาอังกฤษ
GitHub ข้อมูลที่ใช้ในการ Train ของ Chatterbot ตั้งอยู่ที่ https://github.com/gunthercox/chatterbot-corpus
และตัวไฟล์ข้อมูลตั้งอยู่ที่ โฟลเดอร์python\Lib\site-packages\chatterbot_corpus
เรามาทดลอง Train ข้อมูลภาษาไทยกันเลยครับ
ก่อนอื่นให้ทำการโหลดไฟล์ greeting.yml จาก https://raw.githubusercontent.com/gunthercox/chatterbot-corpus/master/chatterbot_corpus/data/thai/greeting.yml แล้วนำไปเก็บไว้ใน โฟลเดอร์python\Lib\site-packages\chatterbot_corpus สร้างโฟลเดอร์ว่า thai แล้วเก็บไว้ใน โฟลเดอร์python\Lib\site-packages\chatterbot_corpus\thai
chatbot.train(โค้ดฉบับเต็ม
"chatterbot.corpus.thai"
)
ผลลัพธ์
Text : สวัสดี
สวัสดี
Text : สวัสดีครับบ
สวัสดี
Text : สวัสดีครับบอิอิ
สวัสดีครับบ
Text : สบายดีไหม
สวัสดีครับบ
Text : ว่าไง
สวัสดีครับบ
Text : กินข้าวยัง
สวัสดีครับบ
Text : กินข้าวยัง
สวัสดีครับบ
จะเห็นได้ว่า การทำงาน Chatterbot กับภาษาไทยนั้นไม่ค่อยจะดีเท่าไร คงต้องใช้ข้อมูลจำนวนมากมา Train ให้ดีกว่านี้
ติดตามบทความต่อไปนะครับ
ขอบคุณครับ
0 ความคิดเห็น:
แสดงความคิดเห็น
แสดงความคิดเห็นได้ครับ :)