Skip to content

เข้าถึง Dataset จำนวนมากด้วย PyDataset

สวัสดีผู้อ่านทุกท่านครับ สำหรับนักวิทยาศาสตร์ข้อมูล (Data Scientist) หากต้องการทำ Data science อย่าง Machine Learning เป็นต้น ต้องใช้ Dataset ที่เกี่ยวข้องกับเรื่องที่ทำ แต่หากต้องไปโหลดไฟล์ Dataset มาใช้งานทีละตัว คงไม่สะดวกและยากต่อการเรียกใช้งาน ด้วยเหตุนี้จึงมีโมดูล PyDataset ขึ้นมาในภาษา Python

โมดูล PyDataset เป็นโมดูลที่ช่วยให้เข้าถึง Dataset ให้สะดวก ง่าย และรวดเร็วยิ่งขึ้น โดยข้อมูลจะอยู่ในรูปแบบ pandas DataFrame

  • รองรับทั้ง Python 2 และ Python 3
  • ใช้ MIT License

สามารถติดตั้งได้ด้วยคำสั่ง pip :

pip3 install PyDataset

การใช้งาน
หากผมต้องการโหลด Dataset ที่ชื่อ iris มาใช้

from pydataset import data
iris= data('iris') # โหลด iris
print(iris)

ผลลัพธ์
เข้าถึง Dataset จำนวนมากด้วย PyDataset

สามารถดู Dataset ที่รองรับได้ด้วยคำสั่ง

data()

หน้าหลักและเอกสาร PyDataset https://github.com/iamaziz/PyDataset

ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

ใส่ความเห็น

อีเมลของคุณจะไม่แสดงให้คนอื่นเห็น ช่องที่ต้องการถูกทำเครื่องหมาย *