2 มิถุนายน 2559

Published 6/02/2559 by with 0 comment

เข้าถึง Dataset จำนวนมากด้วย PyDataset

สวัสดีผู้อ่านทุกท่านครับ สำหรับนักวิทยาศาสตร์ข้อมูล (Data Scientist) หากต้องการทำ Data science อย่าง Machine Learning เป็นต้น ต้องใช้ Dataset ที่เกี่ยวข้องกับเรื่องที่ทำ แต่หากต้องไปโหลดไฟล์ Dataset มาใช้งานทีละตัว คงไม่สะดวกและยากต่อการเรียกใช้งาน ด้วยเหตุนี้จึงมีโมดูล PyDataset ขึ้นมาในภาษา Python

โมดูล PyDataset เป็นโมดูลที่ช่วยให้เข้าถึง Dataset ให้สะดวก ง่าย และรวดเร็วยิ่งขึ้น โดยข้อมูลจะอยู่ในรูปแบบ pandas DataFrame

  • รองรับทั้ง Python 2 และ Python 3

  • ใช้ MIT License


สามารถติดตั้งได้ด้วยคำสั่ง pip :
pip3 install PyDataset

การใช้งาน
หากผมต้องการโหลด Dataset ที่ชื่อ iris มาใช้

[python]
from pydataset import data
iris= data('iris') # โหลด iris
print(iris)
[/python]

ผลลัพธ์
เข้าถึง Dataset จำนวนมากด้วย PyDataset

สามารถดู Dataset ที่รองรับได้ด้วยคำสั่ง

[python]data()[/python]

หน้าหลักและเอกสาร PyDataset https://github.com/iamaziz/PyDataset

ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)