2 มิถุนายน 2559

Published มิถุนายน 02, 2559 by with 0 comment

เข้าถึง Dataset จำนวนมากด้วย PyDataset

สวัสดีผู้อ่านทุกท่านครับ สำหรับนักวิทยาศาสตร์ข้อมูล (Data Scientist) หากต้องการทำ Data science อย่าง Machine Learning เป็นต้น ต้องใช้ Dataset ที่เกี่ยวข้องกับเรื่องที่ทำ แต่หากต้องไปโหลดไฟล์ Dataset มาใช้งานทีละตัว คงไม่สะดวกและยากต่อการเรียกใช้งาน ด้วยเหตุนี้จึงมีโมดูล PyDataset ขึ้นมาในภาษา Python


โมดูล PyDataset เป็นโมดูลที่ช่วยให้เข้าถึง Dataset ให้สะดวก ง่าย และรวดเร็วยิ่งขึ้น โดยข้อมูลจะอยู่ในรูปแบบ pandas DataFrame

  • รองรับทั้ง Python 2 และ Python 3

  • ใช้ MIT License

สามารถติดตั้งได้ด้วยคำสั่ง pip :
pip3 install PyDataset

การใช้งาน
หากผมต้องการโหลด Dataset ที่ชื่อ iris มาใช้
from pydataset import data
iris= data('iris') # โหลด iris
print(iris)

ผลลัพธ์
เข้าถึง Dataset จำนวนมากด้วย PyDataset

สามารถดู Dataset ที่รองรับได้ด้วยคำสั่ง

data()
หน้าหลักและเอกสาร PyDataset https://github.com/iamaziz/PyDataset

ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)