28 มิถุนายน 2559

Published มิถุนายน 28, 2559 by with 0 comment

ทำ NLP ในภาษา Python : นับจำนวนคำ

สวัสดีผู้อ่านทุกท่านครับ บทความชุดทำ NLP ในภาษา Python เรื่อง นับจำนวนคำ

คุณสามารถนับจำนวนคำ หาคำที่มีจำนวนมากที่สุดได้ง่าย ๆ ด้วยภาษาไพทอน เพื่อนำไปใช้ทำระบบค้นคีย์เวิดและระบบค้นหาเป็นต้น คุณสามารถทำได้โดยใช้โมดูล collections ในฟังก์ชัน Counter ได้ตามตัวอย่างนี้
from collections import Counter
text = ['แมว','ชอบ','ปลา','และ','แมว','ชอบ','นอน','มาก','เลย','คน','เลี้ยง','กลาย','เป็น','ทาส','แมว']
cnt = Counter(text) # นับจำนวนคำที่อยู่ใน list
print(cnt)

ผลลัพธ์
Counter({'แมว': 3, 'ชอบ': 2, 'ปลา': 1, 'เลี้ยง': 1, 'กลาย': 1, 'มาก': 1, 'นอน':
1, 'คน': 1, 'ทาส': 1, 'และ': 1, 'เลย': 1, 'เป็น': 1})

หากต้องการหาโดยเรียงจากอันดับที่มีคำมากที่สุดไปยังอันดับที่ต้องการ สามารถทำได้โดยใช้คำสั่ง
Counter.most_common(จำนวนอันดับที่ต้องการ)
ตัวอย่างเช่น
from collections import Counter
text = ['แมว','ชอบ','ปลา','และ','แมว','ชอบ','นอน','มาก','เลย','คน','เลี้ยง','กลาย','เป็น','ทาส','แมว']
cnt = Counter(text)


def numlist(num):
  return cnt.most_common(int(num))


print(numlist(3))

ผลลัพธ์
[('แมว', 3), ('ชอบ', 2), ('นอน', 1)]

อ่านเอกสารเพิ่มเติมได้ที่ collections

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)