Skip to content

หาสัทอักษรสากลด้วย Python

สัทอักษรสากล (International Phonetic Alphabet ย่อว่า IPA) เป็นตัวอักษรที่เป็นสัญลักษณ์แทนเสียงพูดของมนุษย์โดยสามารถใช้แทนเสียงภาษาทุกภาษาในโลกเป็นระบบเดียวกัน

เนื่องจากสัทอักษรไม่ได้มีรูปแบบระบบเดียวกัน จึงทำให้เกิดสัทอักษรสากลขึ้นโดยสมาคมสัทศาสตร์สากล ตั้งแต่ปี ค.ศ. 1886 ปัจจุบันนี้นักภาษาศาสตร์นิยมใช้สัทอักษรสากล

ในการแปลงอักษรเป็นสัทอักษรสากลในภาษาไพทอน (Python) สามารถทำได้อย่างง่ายดายด้วยโมดูล Epitran
ซึ่งใช้ MIT License และรองรับทั้งไพทอนสอง รวมถึงไพทอนสาม

ติดตั้งได้ด้วยคำสั่ง : pip install epitran

การใช้งาน
หากต้องการแปลง "แมว" ไปเป็นสัทอักษรสากล ต้องใช้รหัส tha-Thai ดังนี้

import epitran
epi = epitran.Epitran('tha-Thai') 
a=epi.transliterate('แมว')
a # 'm\u025b\u02d0w'

ดูรหัสการแปลงและอ่านความสามารถเพิ่มเติมได้ที่ https://github.com/dmort27/epitran

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องที่ต้องการถูกทำเครื่องหมาย *