ไลบรารีนี้มีใน Python 3.4 ขึ้นไปเท่านั้น
ไลบรารี statistics นี้มีฟังก์ชันสำหรับการคำนวณสถิติทางคณิตศาสตร์ของข้อมูลตัวเลข (ค่าจริง)
ในการใช้งานให้ import statistics เข้ามาครับ
[python]from statistics import *[/python]
ค่าเฉลี่ยและการตำแหน่งค่ากลาง
ฟังก์ชันเหล่านี้คำนวณค่าปกติ หรือค่าเฉลี่ยจากประชากรหรือตัวอย่าง
- statistics.mean(data)
คืนค่าเฉลี่ยเลขคณิต ("ค่าเฉลี่ย") ของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> mean([1, 2, 3, 4, 4])
2.8
>>> mean([-1.0, 2.5, 3.25, 5.75])
2.625
[/python] - statistics.median(data)
คืนค่ามัธยฐาน (ค่ากลาง) ของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> median([1, 3, 5])
3
>>> median([1, 3, 5, 7])
4.0
[/python] - statistics.median_low(data)
คืนค่ามัธยฐานที่ต่ำสุดของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> median_low([1, 3, 5])
3
>>> median_low([1, 3, 5, 7])
3
>>> median([1, 3, 5, 7]) # หากใช้ median() จะเป็นการหาค่ามัธยฐาน (ค่ากลาง) ของข้อมูล
4.0
[/python] - statistics.median_high(data)
คืนค่าค่ามัธยฐานที่สูงสุดของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> median_high([1, 3, 5])
3
>>> median_high([1, 3, 5, 7])
5
[/python] - statistics.median_grouped(data, interval=1)
คืนค่ามัธยฐานของการจัดกลุ่มข้อมูลอย่างต่อเนื่องคิดเป็นร้อยละ 50 โดยใช้การสอดแทรก
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> median_grouped([52, 52, 53, 54])
52.5
[/python]
ในตัวอย่างต่อไปนี้เป็นข้อมูลที่ความโค้งมนเพื่อให้ค่าแต่ละจุดกึ่งกลางของคลาสข้อมูลเช่น 1 เป็นจุดกึ่งกลางของระดับ 0.5-1.5 และ 2 เป็นจุดกึ่งกลางของ 1.5-2.5 และ 3 เป็นจุดกึ่งกลางของ 2.5-3.5 ฯลฯ ด้วยข้อมูลที่กำหนดค่ากลางตกลงที่ไหนสักแห่งในระดับ 3.5-4.5 และการสอดแทรก จะใช้ในการประเมินมัน
[python]
>>> median_grouped([1, 2, 2, 3, 4, 4, 4, 4, 4, 5])
3.7
[/python]
หากเรากำหนดค่า interval ลงไป
[python]
>>> median_grouped([1, 3, 3, 5, 7], interval=1)
3.25
>>> median_grouped([1, 3, 3, 5, 7], interval=2)
3.5
[/python] - statistics.mode(data)
คืนค่า Mode ค่าที่มีมากที่สุดของข้อมูลที่ไม่ต่อเนื่อง
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> mode([1,1,1,9,9,3])
1
[/python]
การวัดการกระจาย (Measures of spread)
ฟังก์ชันเหล่านี้คำนวณวัดว่าประชากรหรือกลุ่มตัวอย่างมีแนวโน้มที่จะเบี่ยงเบนไปจากค่าปกติหรือค่าเฉลี่ย
- statistics.pstdev(data, mu=None)
คืนค่าส่วนเบี่ยงเบนมาตรฐานประชากรของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> pstdev([1.5, 2.5, 2.5, 2.75, 3.25, 4.75])
0.986893273527251
[/python] - statistics.pvariance(data, mu=None)
คืนค่าความแปรปรวนประชากรของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> data = [0.0, 0.25, 0.25, 1.25, 1.5, 1.75, 2.75, 3.25]
>>> pvariance(data)
1.25
[/python]
ถ้าคุณได้คำนวณค่าเฉลี่ยของข้อมูลไว้แล้ว คุณสามารถใช้อาร์กิวเมนต์ mu เพื่อหลีกเลี่ยงการคํานวณ
[python]
>>> mu = mean(data)
>>> pvariance(data, mu)
1.25
[/python] - statistics.stdev(data, xbar=None)
ตัวอย่างส่วนเบี่ยงเบนมาตรฐาน ( รากที่สองของความแปรปรวนของกลุ่มตัวอย่าง ) ของข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> stdev([1.5, 2.5, 2.5, 2.75, 3.25, 4.75])
1.0810874155219827
[/python] - statistics.variance(data, xbar=None)
ความแปรปรวนของตัวอย่างข้อมูล
ตัวอย่างเช่น
[python]
>>> from statistics import *
>>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
>>> variance(data)
1.3720238095238095
[/python]
ถ้าคุณได้คำนวณค่าเฉลี่ยของข้อมูลไว้แล้ว คุณสามารถใช้อาร์กิวเมนต์ xbar เพื่อหลีกเลี่ยงการคํานวณ
[python]
>>> m = mean(data)
>>> variance(data, m)
1.3720238095238095
[/python]
ติดตามบทความต่อไปนะครับ
ขอบคุณครับ
0 ความคิดเห็น:
แสดงความคิดเห็น
แสดงความคิดเห็นได้ครับ :)