12 มีนาคม 2561

Published 3/12/2561 by with 3 comments

หาค่าความคล้ายคลึงประโยคภาษาไทยโดยใช้ thai2vec ด้วย PyThaiNLP

สวัสดีผู้อ่านทุกท่านครับ บทความนี้ผมจะพาผู้อ่านไปหาค่าความคล้ายคลึงประโยคภาษาไทยโดยใช้ thai2vec ด้วย PyThaiNLP

ก่อนอื่นให้ทำการติดตั้ง PyThaiNLP ด้วยคำสั่ง pip install pythainlp
แล้วเขียนโค้ดตามนี้

การใช้งาน
ให้ใช้ฟังก์ชัน sentence_similarity(ประโยคที่1,ประโยคที่2)
ตัวอย่างเช่น
print(sentence_similarity("ผมเป็นนักศึกษาเรียนที่มหาวิทยาลัยขอนแก่น","ผมเป็นนักศึกษามหาวิทยาลัยขอนแก่น"))
ผลลัพธ์
[[ 0.79725734]]

มีความคล้ายคลึงกันถึง 79 %

ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

3 ความคิดเห็น:

  1. สวัสดีครับ
    ผมทำตามแล้ว เออเร่อ แบบนี้ครับ ต้องทำไงดีครับ


    File "C:/Users/SUN1/Documents/Python Scripts/untitled10.py", line 16
    return cosine_similarity(sentence_vectorizer(str(s1)),sentence_vectorizer(str(s2)))
    ^
    IndentationError: expected an indented block

    ตอบลบ
    คำตอบ
    1. ลองเว้นวรรคใหม่ดูครับ

      ลบ
  2. ลองเว้นวรรคใหม่ดูครับ

    ตอบลบ

แสดงความคิดเห็นได้ครับ :)