25 พฤษภาคม 2558

Published 5/25/2558 by with 0 comment

ไลบรารี statistics ฟังก์ชันสถิติทางคณิตศาสตร์ใน Python

สวัสดีผู้อ่านทุกท่านครับ บทความนี้ผมจะพาผู้อ่านไปเรียนรู้เอกสารการใช้งานไลบรารี statistics ซึ่งเป็นฟังก์ชันสถิติทางคณิตศาสตร์ในภาษา Python กันครับ
ไลบรารีนี้มีใน Python 3.4 ขึ้นไปเท่านั้น

ไลบรารี statistics นี้มีฟังก์ชันสำหรับการคำนวณสถิติทางคณิตศาสตร์ของข้อมูลตัวเลข (ค่าจริง)
ในการใช้งานให้ import statistics เข้ามาครับ

[python]from statistics import *[/python]

ค่าเฉลี่ยและการตำแหน่งค่ากลาง


ฟังก์ชันเหล่านี้คำนวณค่าปกติ หรือค่าเฉลี่ยจากประชากรหรือตัวอย่าง

  • statistics.mean(data)
    คืนค่าเฉลี่ยเลขคณิต ("ค่าเฉลี่ย") ของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> mean([1, 2, 3, 4, 4])
    2.8
    >>> mean([-1.0, 2.5, 3.25, 5.75])
    2.625
    [/python]


  • statistics.median(data)
    คืนค่ามัธยฐาน (ค่ากลาง) ของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> median([1, 3, 5])
    3
    >>> median([1, 3, 5, 7])
    4.0
    [/python]


  • statistics.median_low(data)
    คืนค่ามัธยฐานที่ต่ำสุดของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> median_low([1, 3, 5])
    3
    >>> median_low([1, 3, 5, 7])
    3
    >>> median([1, 3, 5, 7]) # หากใช้ median() จะเป็นการหาค่ามัธยฐาน (ค่ากลาง) ของข้อมูล
    4.0
    [/python]


  • statistics.median_high(data)
    คืนค่าค่ามัธยฐานที่สูงสุดของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> median_high([1, 3, 5])
    3
    >>> median_high([1, 3, 5, 7])
    5
    [/python]


  • statistics.median_grouped(data, interval=1)
    คืนค่ามัธยฐานของการจัดกลุ่มข้อมูลอย่างต่อเนื่องคิดเป็นร้อยละ 50 โดยใช้การสอดแทรก
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> median_grouped([52, 52, 53, 54])
    52.5
    [/python]

    ในตัวอย่างต่อไปนี้เป็นข้อมูลที่ความโค้งมนเพื่อให้ค่าแต่ละจุดกึ่งกลางของคลาสข้อมูลเช่น 1 เป็นจุดกึ่งกลางของระดับ 0.5-1.5 และ 2 เป็นจุดกึ่งกลางของ 1.5-2.5 และ 3 เป็นจุดกึ่งกลางของ 2.5-3.5 ฯลฯ ด้วยข้อมูลที่กำหนดค่ากลางตกลงที่ไหนสักแห่งในระดับ 3.5-4.5 และการสอดแทรก จะใช้ในการประเมินมัน

    [python]
    >>> median_grouped([1, 2, 2, 3, 4, 4, 4, 4, 4, 5])
    3.7
    [/python]

    หากเรากำหนดค่า interval ลงไป

    [python]
    >>> median_grouped([1, 3, 3, 5, 7], interval=1)
    3.25
    >>> median_grouped([1, 3, 3, 5, 7], interval=2)
    3.5
    [/python]


  • statistics.mode(data)
    คืนค่า Mode ค่าที่มีมากที่สุดของข้อมูลที่ไม่ต่อเนื่อง
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> mode([1,1,1,9,9,3])
    1
    [/python]



การวัดการกระจาย (Measures of spread)


ฟังก์ชันเหล่านี้คำนวณวัดว่าประชากรหรือกลุ่มตัวอย่างมีแนวโน้มที่จะเบี่ยงเบนไปจากค่าปกติหรือค่าเฉลี่ย

  • statistics.pstdev(data, mu=None)
    คืนค่าส่วนเบี่ยงเบนมาตรฐานประชากรของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> pstdev([1.5, 2.5, 2.5, 2.75, 3.25, 4.75])
    0.986893273527251
    [/python]


  • statistics.pvariance(data, mu=None)
    คืนค่าความแปรปรวนประชากรของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> data = [0.0, 0.25, 0.25, 1.25, 1.5, 1.75, 2.75, 3.25]
    >>> pvariance(data)
    1.25
    [/python]

    ถ้าคุณได้คำนวณค่าเฉลี่ยของข้อมูลไว้แล้ว คุณสามารถใช้อาร์กิวเมนต์ mu เพื่อหลีกเลี่ยงการคํานวณ

    [python]
    >>> mu = mean(data)
    >>> pvariance(data, mu)
    1.25
    [/python]


  • statistics.stdev(data, xbar=None)
    ตัวอย่างส่วนเบี่ยงเบนมาตรฐาน ( รากที่สองของความแปรปรวนของกลุ่มตัวอย่าง ) ของข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> stdev([1.5, 2.5, 2.5, 2.75, 3.25, 4.75])
    1.0810874155219827
    [/python]


  • statistics.variance(data, xbar=None)
    ความแปรปรวนของตัวอย่างข้อมูล
    ตัวอย่างเช่น

    [python]
    >>> from statistics import *
    >>> data = [2.75, 1.75, 1.25, 0.25, 0.5, 1.25, 3.5]
    >>> variance(data)
    1.3720238095238095
    [/python]

    ถ้าคุณได้คำนวณค่าเฉลี่ยของข้อมูลไว้แล้ว คุณสามารถใช้อาร์กิวเมนต์ xbar เพื่อหลีกเลี่ยงการคํานวณ

    [python]
    >>> m = mean(data)
    >>> variance(data, m)
    1.3720238095238095
    [/python]



ติดตามบทความต่อไปนะครับ
ขอบคุณครับ

0 ความคิดเห็น:

แสดงความคิดเห็น

แสดงความคิดเห็นได้ครับ :)