ความกระจาย การแปรผันของข้อมูล

ตัวแปรที่ใช้ในทางสถิติตัวหนึ่งย่อมมีค่า เช่น X1 คือความสูงของนักเรียนคนหนึ่ง มีค่าเท่ากับ 155 เซนติเมตร ถ้าค่าของความสูงของนักเรียนที่เป็นตัวแทน n คน ย่อมมีความแตกต่าง มีตั้งแต่เตี้ยสุดไปยังสูงสุด การกระจายข้อมูลของตัวแปรมีคุณลักษณะแตกต่างกัน ลักษณะการกระจายอาจเขียนเป็นรูปกราฟได้

การปรากฎมาก น้อย เรียกว่าความถี่ ในทางสถิติถือเป็นความน่าจะเป็นเช่นกัน เช่น ความสูงปานกลางของนักเรียนในชั้นมัธยมปีที่ 1 อยู่ที่ 160-165 เซนติเมตร ช่วงความสูงนี้มีทั้งสิ้น 30 คน จาก 100 คน จะเห็นว่าค่าที่เกิดขึ้นในเรื่องความถี่ คือ มีจำนวนคนที่มีค่าข้อมูลอยู่ในช่วงนี้มีกี่คน หรือ.ดูในรูปของความน่าจะเป็นได้ ค่าความสูงเฉลี่ยปานกลางอยู่ที่ 152 เซนติเมตร
เราใช้  แทนค่าเฉลี่ย      แต่ค่า นี้เป็นค่าเฉลี่ยที่ใช้สำหรับตัวแทน (sample)      แต่สำหรับประชากรแล้วเราใช้  (มิว) แทนค่าเฉลี่ยของประชากร

ดังนั้น  และ  จึงมีความหมายที่แตกต่างกัน

 
ตัวอย่าง เช่น เมื่อเราโยนลูกเต๋า โดยให้ลูกเต๋ามีค่าเป็น 1,2,3,4,5,6 ตามหน้าที่ออก หากพิจารณาค่าเฉลี่ยของตัวเลขที่เกิดจากการโยนลูกเต๋า โดยพิจารณาจากประชากรทั้งหมดซึ่งค่าเฉลี่ยนี้ คือ

แต่ถ้าเราโยนลูกเต๋าเองในลักษณะเพื่อการทดลองหรือทำเป็น sample ซึ่งก็คือตัวแทน โดยมีการโยน 5 ครั้งผลที่ได้ คือ 2,1,5,3,4,3 เมื่อนำมาหาค่าเฉลี่ยได้

จะเห็นว่า    ไม่เท่ากับ 

และจากข้อมูลความกระจายเราอาจได้ตัวเลข เช่นความเป็นไปได้ของนักเรียนที่มีความสุงเกิน 162 เซนติเมตรมี 0.5 เป็นต้น

 


ที่มา : รศ. ยืน ภู่วรวรรณ, สำนักบริการคอมพิวเตอร์ มหาวิทยาลัยเกษตรศาสตร์