15 มีนาคม 2560

Published มีนาคม 15, 2560 by with 0 comment

หาสัทอักษรสากลด้วย Python

สัทอักษรสากล (International Phonetic Alphabet ย่อว่า IPA) เป็นตัวอักษรที่เป็นสัญลักษณ์แทนเสียงพูดของมนุษย์โดยสามารถใช้แทนเสียงภาษาทุกภาษาในโลกเป็นระบบเดียวกัน


เนื่องจากสัทอักษรไม่ได้มีรูปแบบระบบเดียวกัน จึงทำให้เกิดสัทอักษรสากลขึ้นโดยสมาคมสัทศาสตร์สากล ตั้งแต่ปี ค.ศ. 1886 ปัจจุบันนี้นักภาษาศาสตร์นิยมใช้สัทอักษรสากล

ในการแปลงอักษรเป็นสัทอักษรสากลในภาษาไพทอน (Python) สามารถทำได้อย่างง่ายดายด้วยโมดูล Epitran
ซึ่งใช้ MIT License และรองรับทั้งไพทอนสอง รวมถึงไพทอนสาม

ติดตั้งได้ด้วยคำสั่ง : pip install epitran

การใช้งาน
หากต้องการแปลง "แมว" ไปเป็นสัทอักษรสากล ต้องใช้รหัส tha-Thai ดังนี้
import epitran
epi = epitran.Epitran('tha-Thai')
a=epi.transliterate('แมว')
ดูรหัสการแปลงและอ่านความสามารถเพิ่มเติมได้ที่ https://github.com/dmort27/epitran

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)