14 ธันวาคม 2557

Published ธันวาคม 14, 2557 by with 2 comments

Speech recognition แบบง่าย ๆ ใน Python 3

สวัสดีผู้อ่านทุกท่านครับ บทความนี้จะพาผู้อ่านไปใช้ Speech recognition แบบง่าย ๆ ใน Python 3 กันครับ

Speech recognition เป็นเทคโนโลยีที่ทำให้คอมพิวเตอร์รู้จำเสียงมนุษย์ เพื่อแปลงเสียงมนุษย์เป็นคำสั่งให้คอมพิวเตอร์เข้าใจ ในการพัฒนาเทคโนโลยี Speech recognition นี้ เป็นเทคโนโลยีขั้นสูง ต้องลงทุนสูงและต้องอาศัยประสบการณ์ ความรู้ของโปรแกรมเมอร์เป็นอย่างยิ่ง ซึ่งยากเกินไปครับ บทความนี้จะพาผู้อ่านไปใช้ Speech recognition ด้วย Google Speech Recognition API (รองรับภาษาไทย)
ในการใช้งาน Speech recognition ด้วย Google Speech Recognition API ใน Python ต้องใช้โมดูล SpeechRecognition (BSD license) รองรับทั้ง Python 2 , Python 3 ครับ และรองรับทั้ง Linux , Mac OS , Windows ครับ
  • รองรับ  Google Speech Recognition API , Wit.ai , IBM Speech to Text และ AT&T Speech to Text
  • รองรับภาษาไทย (เฉพาะ Google Speech Recognition API)
  • ใช้ BSD license
สามารถติดตั้งได้ง่าย ๆ โดยใช้ pip ด้วยคำสั่ง :
pip install SpeechRecognition
โมดูลนี้ ต้องการโมดูล PyAudio ด้วยครับ สามารถติดตั้งได้โดยใช้คำสั่ง pip:
pip install PyAudio
ผู้ใช้ Windows โหลดจาก unofficial PyAudio builds for Windows  ครับ
ตัวอย่างการใช้งาน
รับเสียงมาจาก Microphone

ประมวลเสียงจากไฟล์เสียง wav

อ่านเอกสารการใช้งานเพิ่มเติมได้ที่ https://github.com/Uberi/speech_recognition
มาใช้ Speech recognition ภาษาไทยใน Python กัน

ผลลัพธ์
เมื่อผมพูดคำว่า "สวัสดี" เข้าไป
>>>
You said สวัสดี
จะเห็นว่าเราสามารถใช้ Speech recognition ภาษาไทยใน Python 3 ได้แล้วครับ :D
ติดตามบทความต่อไปนะครับ
ขอบคุณครับ
ปรับปรุงครั้งที่ 1 วันที่ 18/11/2015

2 ความคิดเห็น:

แสดงความคิดเห็นได้ครับ :)