
สมมติ คุณได้ข้อมูลแบบตัวอย่างนี้
มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย 112 หมู่ 7 บ้านหนองเดิ่น ตำบลหนองกอมเกาะ อำเภอเมือง จังหวัดหนองคายมาในแบบ Text จำนวนมาก บรรทัดละที่อยู่ โดยที่ไม่ได้มีการแยกฟิลด์ที่อยู่อย่างข้อมูล ตำบล อำเภอ และจังหวัดมาให้ คุณอาจจะนึกถึงต้องเขียนโปรแกรมมาแยกด้วยตัวของคุณเอง
แต่ได้มีนักพัฒนาคนหนึ่งชื่อ LI Shuai จาก Shopee Singapore ได้พัฒนาโปรแกรมแยกข้อมูลตำบล อำเภอ จังหวัดจากที่อยู่แบบข้อความออกมาในชื่อโมดูล ThaiAddressParser
ThaiAddressParser เป็นโมดูลสำหรับใช้แยกข้อมูลตำบล อำเภอ จังหวัดจากที่อยู่แบบข้อความออกมาให้แบบง่าย ๆ แถมข้อมูลตำบล อำเภอ จังหวัด ที่ได้ออกมา ได้ทั้งภาษาไทยกับภาษาอังกฤษออกมาด้วย โดยอาศัยข้อมูลจากวิกิพีเดีย และใช้ MIT License
การติดตั้ง
สามารถติดตั้งได้โดยใช้คำสั่ง
pip install ThaiAddressParser
การใช้งาน
สามารถใช้แยกข้อมูลตำบล อำเภอ จังหวัดจากที่อยู่แบบข้อความออกมาให้แบบง่าย ๆ ตามตัวอย่างนี้ได้เลย
import ThaiAddressParser address = "มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย 112 หมู่ 7 บ้านหนองเดิ่น ตำบลหนองกอมเกาะ อำเภอเมือง จังหวัดหนองคาย" print(ThaiAddressParser.parse(address))
ผลลัพธ์
{'district': {'en': 'Mueang Nong Khai', 'thai': 'เมืองหนองคาย'}, 'original_address': 'มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย 112 หมู่ 7 บ้านหนองเดิ่น ตำบลหนองกอมเกาะ อำเภอเมือง จังหวัดหนองคาย', 'parsed_address': 'มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย 112 หมู่ 7 บ้านหนองเดิ่น ต.หนองกอมเกาะ อ.เมืองหนองคาย จ.หนองคาย', 'province': {'en': 'Nong Khai', 'thai': 'หนองคาย'}, 'remaining_address': 'มหาวิทยาลัยขอนแก่น วิทยาเขตหนองคาย 112 หมู่ 7 บ้านหนองเดิ่น', 'sub_district': {'en': 'Nong Kom Ko', 'thai': 'หนองกอมเกาะ'}}
Google Colab สำหรับลองรัน : colab.research.google.com/drive/1QOJY15CFwRW2d2JSW-bugUaeIdqEfAtE?usp=sharing
สามารถเข้าไปดู GitHub ของ ThaiAddressParser ได้ที่ github.com/HandsomeBrotherShuaiLi/ThaiAddressParser
0 ความคิดเห็น:
แสดงความคิดเห็น
แสดงความคิดเห็นได้ครับ :)