การวิเคราะห์ข้อมูลเบื้องต้น

                                                การวิเคราะห์ข้อมูลเบื้องต้น


     1.  การแจกแจงความถี่ของข้อมูล



  เป็นวิธีการทางสถิติอย่างหนึ่งที่ใช้ในการจัดข้อมูลที่มีอยู่ หรือที่เก็บรวบรวมมาได้ให้อยู่เป็นกลุ่มๆ เพื่อสะดวกในการวิเคราะห์ข้อมูลเหล่านั้น
   การแจกแจงความถี่ จัดเป็น ลักษณะ ดังนี้
   1. การแจกแจงความถี่แบบไม่จัดเป็นอันตรภาคชั้น ใช้กับข้อมูลที่มีค่าสูงสุดและต่ำสุดของข้อมูลไม่แตกต่างกันมากนัก หรือข้อมูลที่มีค่าของจำนวนที่ต่างกันมีไม่มาก   2. การแจกแจงความถี่แบบจัดเป็นอันตรภาคชั้น ใช้กับข้อมูลที่มีค่าสูงสุดและต่ำสุดของข้อมูลแตกต่างกันมาก หรือการแจกแจงไม่สะดวกที่จะใช้ค่าสังเกตทุกๆค่า เพื่อความสะดวกจึงใช้วิธีแจกแจงความถี่ของค่าที่เป็นไปได้แทน โดยแบ่งค่าที่เป็นไปได้ออกเป็นช่วง หรืออันตรภาคชั้น (Interval)
     1.1  การแจกแจงความถี่สะสม
 การแจกแจงความถี่สะสม
   
ความถี่สะสม (Commulative Frequencyของค่าที่เป็นไปได้ค่าใดหรืออันตรภาคชั้นใด หมายถึง ผลรวมของความถี่ของค่านั้นหรืออันตรภาคชั้นนั้น กับความถี่ของค่าหรือของอันตรภาคชั้นที่มีช่วงคะแนนต่ำกว่าทั้งหมด หรือสูงกว่าทั้งหมดอย่างใดอย่างหนึ่ง (นิยมใช้ความถี่สะสมแบบต่ำกว่า)

อันตรภาคชั้น
คามถี่
                        ความถี่สะสม
ความถี่สะสมแบบต่ำกว่า
ความถี่สะสมแบบสูงกว่า
10 – 14
15 – 19
20 – 24
25 – 29
30 – 34
2
3
10
4
1
2
5
15
19
20
20
18
15
5
1

                                                 
      1.2  การแจกแจงความถี่สัมพัทธ์และความถี่สะสมสัมพัทธ์

  การแจกแจงความถี่สัมพัทธ์และความถี่สะสมสัมพัทธ์
   
ความถี่สะสมสัมพัทธ์ของอันตรภาคชั้นใด คือ    อัตราส่วนระหว่างความถี่สะสมของ
   อันตรภาคชั้นนั้นกับทั้งหมด ซึ่งอาจแสดงในรูปเศษส่วน ทศนิยม หรือร้อยละ

อันตรภาคชั้น
ความถี่
ความถี่สัมพัทธ์
ร้อยละของความถี่สัมพัทธ์
ความถี่สะสม
ความถี่สะสมสัมพัทธ์
50 – 59
2
4
2
60 – 69
11
22
13
70 – 79
20
40
33
80 – 89
14
28
47
90 - 99
3
6
50

     2.  การแจกแจงความถี่โดยใช้กราฟ

    โดยทั่วไป การใช้กราฟแสดงการแจกแจงความถี่ของตัวแปรสามารถทำให้เห็นการกระจายของข้ อมูลได้ชัดเจนกว่าการดูจากตารางแจกแจงความถี่  โดยเฉพาะอย่างยิ่งตารางแจกแจงความถี่ที่อันตรภาคชั้นมีความกว้างไม่เท่ากันจะดูยากยิ่งขึ้น
    กราฟที่ใช้แสดงการแจกแจงความถี่ที่จะกล่าวถึงต่อไปนี้  ได้แก่
         ฮิสโทแกรม   (histogram)  
         แผนภาพต้น-ใบ  (stem-and-leaf plot  หรือ  stem  plot)  

      2.1  ฮิสโทแกรม

       ฮิสโตรแกรม  เป็นกราฟที่แสดงความถี่ของข้อมูลที่มีความถี่มากๆโดยมีแกนนอนแทนค่าที่เป็นไปได้ของตัวแปร  ความกว้างของรูปสี่เหลี่ยมมุมฉากแทนความกว้างของอันตรภาคชั้น  ส่วนความสูงของรูปสี่เหลี่ยมคือความถี่ของข้อมูล

หลักการสร้างฮิสโตรแกรม

  1 .หาตำแหน่งจุดกึ่งกลางของแต่ละอันตรภาคชั้นบนแกนนอน
  2. ลากเส้นจากจุดกึ่งกลางของแต่ละอันตรภาคชั้นให้เท่ากับความถี่ของอันตรภาคชั้น
  3. สร้างรูปสี่เหลี่ยมมุมฉากตั้งบนแต่ละอันตรภาคชั้นโดยมีความกว้างของรูปเท่ากับความกว้างของอันตรภาคชั้นและมีความสูงเท่ากับความถี่

ตัวอย่าง  1  สร้างฮิสโตรแกรมแสดงการแจกแจงความถี่ของข้อมูล
คะแนน
ความถี่
ขอบล่าง
ขอบบน
3-5
15
2.5
5.5
6-8
20
5.5
8.5
9-11
35
8.5
11.5
12-14
15
11.5
14.5
15-17
10
14.5
17.5
18-20
5
17.5
20.5


แท่งฮิสโตรแกรม


   ข้อสังเกตุ      ความกว้างของแท่งกราฟจะเริ่มที่ขอบล่างของชั้นแรก  2.5  ถึงขอบบนของชั้นสุดท้าย  20.5 และความสูงคือความถี่ของแต่ละช่วงชั้น

  ตัวอย่าง  2  สร้างฮิสโตรแกรมแสดงการแจกแจงความถี่ของข้อมูล

ขีดจำกัด
ข้อมูล
ขอบเขต
ข้อมูล
ค่ากลาง
ความถี่
118 – 122
117.5 - 122.5
120
1
123 – 127
122.5 - 127.5
125
2
128 – 132
127.5 - 132.5
130
2
133 – 137
132.5 - 137.5
135
4
138 – 142
137.5 - 142.5
140
6
143 – 147
142.5 - 147.5
145
8
148 – 152
147.5 - 152.5
150
5
153 – 157
152.5 - 157.5
155
4
158 – 162
157.5 - 162.5
160
2
163 – 167
162.5 – 167.5
165
3
168 – 172
167.5 - 172.5
170
1
173 – 177
172.5 – 177.5
175
2


รวม 40


  แท่งฮิสโตรแกรม
 


   ข้อสังเกตุ      ความกว้างของแท่งกราฟจะเริ่มที่ขอบล่างของชั้นแรก  117.5  ถึงขอบบนของชั้นสุดท้าย 177.5  และความสูงคือความถี่ของแต่ละช่วงชั้น


      2.2  แผนภาพต้น-ใบ
   แผนภาพต้น-ใบ (Stem-and-Leaf Diagram) ใช้เพื่อจัดข้อมูลเป็นกลุ่มๆ และข้อมูลทุกตัวจะถูกแสดงในแผนภาพ ไม่เพียงแค่นับรวมว่าเป็นความถี่ในอันตรภาคชั้นเดียวกันเหมือนกับฮิสโตแกรม สมมติเรามีข้อมูลส่วนสูง(ซม.)ของนักเรียนชั้นป.6 จำนวน 20 คน ดังนี้
150  131  166  136  136  134  144  145  149  140 
145  158  157  160  160  143  161  163  147  139
จะสามารถนำมาทำแผนภาพต้น-ใบ ได้ดังนี้
1. เลือกเอาตัวเลขหลักที่ซ้ำมาทำเป็น “ต้น” ในตัวอย่างนี้จะได้สองหลักซ้ายมือ
2. นำเลขที่เหลือ ของข้อมูลแต่ละตัว มาเขียนลงไปในช่อง “ใบ” (เช่น 150 ก็แยก 15 เป็น “ต้น” และ 0 เป็น “ใบ”)
3. ควรเรียงลำดับจากน้อยไปมาก เพื่อให้สะดวกต่อการวิเคราะห์


จากแผนภาพต้น-ใบนี้ จะบอกได้คร่าวๆว่าข้อมูลที่มีค่าต่ำที่สุดคือ 131 และสูงสุดคือ 166 ช่วงที่มีความถี่สูงสุดคือ 140 – 149
สมมติเราต้องการจะเปรียบเทียบชุดข้อมูล 2 กลุ่ม ก็สามารถทำ ได้ ตัวอย่างเช่น
ความสูงของนักเรียนห้องป.6/1 และ ป.6/2 เป็นดังนี้
ป. 6/1    
150  131  166  136  136  134  144  145  149  140 
145  158  157  160  160  143  161  163  147  139
ป. 6/2              
162  163  163  172  157  156  154  165  161  172 
160  148  144  160  175  190  169  155  157  176
เขียนเป็นแผนภาพต้น-ใบได้ดังนี้


ซึ่งเราจะสามารถวิเคราะห์ข้อมูลทั้ง 2 กลุ่มอย่างคร่าวๆ ได้ว่า
1) นักเรียนชั้นป.6/1 ส่วนใหญ่มีความสูงอยู่ในช่วง 150-159 ซม. ในขณะที่นักเรียนชั้นป.6/2 ส่วนใหญ่มีความสูงอยู่ระหว่าง 140-149 ซม.
2) นักเรียนคนที่เตี้ยที่สุดอยู่ชั้นป.6/2 สูง 131 ซม.ส่วนนักเรียนที่สูงที่สุดอยู่ชั้นป.6/1 สูง 190 ซม.
3) ชั้นป.6/1 มีนักเรียนที่สูงผิดปกติ 1 คน
4) ความสูงเฉลี่ยชั้นป.6/1 น่าจะมากกว่าชั้นป.6/2  
     3.  การวัดค่ากลางของข้อมูล

การหาค่ากลางของข้อมูลที่เป็นตัวแทนของข้อมูลทั้งหมดเพื่อความสะดวกในการสรุปเรื่องราวเกี่ยวกับข้อมูลนั้นๆ  จะช่วยทำให้เกิดการวิเคราะห์ข้อมูลถูกต้องดีขึ้น  การหาค่ากลางของข้อมูลมีวิธีหาหลายวิธี  แต่ละวิธีมีข้อดีและข้อเสีย  และมีความเหมาะสมในการนำไปใช้ไม่เหมือนกัน  ขึ้นอยู่กับลักษณะข้อมูลและวัตถุประสงค์ของผู้ใช้ข้อมูลนั้นๆ
ค่ากลางของข้อมูลที่สำคัญ  มี 3  ชนิด คือ
1.       ค่าเฉลี่ยเลขคณิต    (Arithmetic mean)
2.      มัธยฐาน                  (Median)
3.      ฐานนิยม                  (Mode)

3.1  ค่าเฉลี่เลขคณิต

     ค่าเฉลี่ยเลขคณิต( ) จัดว่าเป็นค่าที่มีความสำคัญมากในวิชาสถิติ เพราะค่าเฉลี่ยเลขคณิตเป็นค่ากลางหรือเป็นตัวแทนของข้อมูลที่ดีที่สุด เพราะ 1)เป็นค่าที่ไม่เอนเอียง 2)เป็นค่าที่มีความคงเส้นคงวา 3)เป็นค่าที่มีความแปรปรวนต่ำที่สุด และ 4)เป็นค่าที่มีประสิทธิภาพสูงสุด แต่ค่าเฉลี่ยเลขคณิตก็มีข้อจำกัดในการใช้ เช่น ถ้าข้อมูลมีการกระจายมาก หรือข้อมูลบางตัวมีค่ามากหรือน้อยจนผิดปกติ หรือข้อมูลมีการเพิ่มขึ้นเป็นเท่าตัว ค่าเฉลี่ยเลขคณิตจะไม่สามารถเป็นค่ากลางหรือเป็นตัวแทนที่ดีของข้อมูลได้
การหาค่าเฉลี่ยเลขคณิตเมื่อข้อมูลไม่ได้มีการแจกแจงความถี่ ()
ในกรณีที่ข้อมูลไม่ได้มีการแจกแจงความถี่ ค่าเฉลี่ยเลขคณิตสามารถหาได้โดย

          สูตร    
เมื่อ xi แทนค่าสังเกตของข้อมูลลำดับที่ i
n แทนจำนวนตัวอย่างข้อมูล

นิยาม ค่าเฉลี่ยเลขคณิต คือ ผลรวมของค่าสังเกตหรือค่าของตัวอย่างที่ได้จากการสำรวจทุกค่าของข้อมูล แล้วหารด้วยจำนวนตัวอย่างของข้อมูล
ตัวอย่าง 1.6 จากการสอบถามนักศึกษาคนหนึ่งเกี่ยวกับรายจ่ายใน 1 สัปดาห์ที่ผ่านมา ได้ข้อมูลดังนี้ 
วัน
จันทร์
อังคาร
พุธ
พฤหัสบดี
ศุกร์
เสาร์
อาทิตย์
รายจ่าย
50
75
40
50
100
100
75
อังคาร พุธ พฤหัสบดี ศุกร์ เสาร์ อาทิตย์
รายจ่าย 50 75 40 50 100 100 75
จากข้อมูลข้างต้นจงหาค่าเฉลี่ยเลขคณิตของค่าใช้จ่ายต่อสัปดาห์ของนักศึกษาผู้นี้
วิธีทำ กำหนด x1 = 50 (รายจ่ายวันที่ 1)
x2 = 75 (รายจ่ายวันที่ 2)
x3 = 40 (รายจ่ายวันที่ 3)
x4 = 50 (รายจ่ายวันที่ 4)
x5 = 100 (รายจ่ายวันที่ 5)
x6 = 100 (รายจ่ายวันที่ 6)
x7 = 75 (รายจ่ายวันที่ 7)
n คือจำนวนข้อมูล n = 7

     จากสูตร   

             

             =   70
รายจ่ายโดยเฉลี่ยต่อวันในสัปดาห์ที่ผ่านมาของนักศึกษาผู้นี้มีค่าเท่ากับ 70 บาท


      3.2  มัธยฐาน
เป็นค่ากลางของข้อมูลที่ได้จากการพิจารณาตำแหน่งของข้อมูลที่อยู่ตรงกลางโดยที่ข้อมูลต้องทำการเรียงลำดับตามปริมาณจากมากไปน้อย หรือจากน้อยไปมากก็ได้ และค่ามัธยฐานยังสามารถใช้เป็นตัวแทนของข้อมูลได้เป็นอย่างดี ในกรณีที่ข้อมูลมีการกระจายที่ผิดปกติ ซึ่งอาจเกิดจากการที่มีข้อมูลบางตัวมีค่ามากหรือน้อยจนผิดปกติ
สำหรับขั้นตอนการหาค่ามัธยฐานมี 2 ขั้นตอนดังนี้
1) เรียงลำดับข้อมูลจากมากไปน้อย หรือจากน้อยไปมาก
2) ทำการหาตำแหน่งกึ่งกลางของข้อมูลที่ได้จากขั้นตอนที่ 1
5.1.2.1 การหาค่ามัธยฐาน เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่และมีจำนวนข้อมูลเป็นจำนวนคี่
ในกรณีที่ต้องการหาค่ามัธยฐานของข้อมูลเมื่อข้อมูลมีจำนวนคี่ จะสามารถกำหนดตำแหน่งของข้อมูลที่มีค่ามัธยฐานได้โดยสูตร
ตำแหน่งของมัธยฐาน = 
ตัวอย่าง 1.7 จงหามัธยฐาน(Me) ของข้อมูลชุดนี้ 15 , 19 , 14 , 12 , 21 , 17 , 150
วิธีทำ
ขั้นที่ 1 เรียงลำดับข้อมูลจากน้อยไปมาก
ตำแหน่งที่ 1 2 3 4 5 6 7
ค่าของข้อมูล 12 14 15 17 19 21 150
ขั้นที่ 2 หาตำแหน่งของมัธยฐาน
ตำแหน่งของมัธยฐาน =  = 4
ข้อมูลที่อยู่ตำแหน่งที่ 4 คือ 17
มัธยฐาน (Me) มีค่า = 17

      3.3  ฐานนิยม
ค่าฐานนิยมเป็นค่ากลางซึ่งจะนำมาใช้ในกรณีที่ข้อมูลมีการซ้ำกันมากๆจนผิดปกติ ซึ่งค่าฐานนิยมจะเป็นค่ากลางหรือตัวแทนของข้อมูลที่สามารถอธิบายลักษณะที่เกิดขึ้นได้ดีกว่าค่าเฉลี่ยเลขคณิตและค่ามัธยฐาน นอกจากนี้ค่าฐานนิยมยังมีข้อพิเศษมากกว่าค่าเฉลี่ยและมัธยฐาน ตรงที่สามารถใช้ได้กับข้อมูลที่เป็นข้อมูลเชิงคุณภาพ(Qualitative) และข้อมูลเชิงปริมาณ(Quantitative) และค่าฐานนิยมยังสามารถมีค่าได้มากกว่า 1 ค่าอีกด้วย
การหาค่าฐานนิยม(Mo) เมื่อข้อมูลไม่ได้มีการแจกแจงความถี่
ในกรณีที่ข้อมูลไม่ได้มีการแจกแจงความถี่ วิธีการหาค่าฐานนิยม(Mo) สามารถทำได้โดยการนับจำนวนข้อมูล ซึ่งข้อมูลชุดใดมีจำนวนซ้ำกันมากที่สุดก็จะเป็นค่าฐานนิยม
ตัวอย่าง 1.9 จงหาค่าฐานนิยมจากข้อมูลชุดนี้ 25,19,32,29,19,21,22,21,19,20,19,22,23,20
วิธีทำ ฐานนิยม(Mo) = ค่าที่ซ้ำกันมากที่สุด = 19
ฐานนิยม (Mo) ของข้อมูลชุดนี้มีค่าเท่ากับ 19



     4.  การวัดการกระจายของข้อมูล
      4.1  พิสัย

พิสัย คือ ค่าความแตกต่างระหว่างคะแนนสูงสุดกับคะแนนต่ำสุดในข้อมูลชุดหนึ่งๆ ซึ่งใช้วัดการกระจายของข้อมูลได้ไม่ละเอียด อาจจะทำให้เข้าใจลักษณะของข้อมูลคลาดเคลื่อนไปเพราะพิสัยจะใช้เฉพาะคะแนนสูงสุดเท่านั้น
พิสัย = ค่าสูงสุด – ค่าต่ำสุด
ตัวอย่างที่ 12 จงหาพิสัยของข้อมูลต่อไปนี้ 5, 8, 9, 11, 13, 14, 18, 19, 20
    1. ข้อมูล 5, 8, 9, 11, 13, 14, 18, 19, 20พิสัย = 20 – 5
              = 15
      ค่าพิสัย คือ 15 แสดงว่าข้อมูลชุดนี้มีการกระจาย
    2. ข้อมูล 10, 10, 10,10, 10, 10, 10,10พิสัย = 10 – 10
              = 0
      ค่าพิสัย คือ 0 แสดงได้ว่าข้อมูลชุดนี้ไม่มีการกระจาย (ข้อมูลเท่ากันหมด)
    3. ข้อมูล 2, 4, 8, 16, 32, 64, 128
พิสัย = 128 – 2    = 126
ค่าพิสัย คือ 126 แสดงว่าข้อมูลนี้มีการกระจายมาก
ตัวอย่างที่ 13  จงหาพิสัยของข้อมูลต่อไปนี้
    1. ข้อมูล 30, 52, 53, 54, 55, 56, 57, 58, 59, 60ค่าพิสัย = 60 –30   = 30
      ค่าพิสัย คือ 30
    2. ข้อมูล 51, 52, 53, 54, 55, 56, 57, 58, 59, 60
ค่าพิสัย = 60 –5  = 9
ค่าพิสัย คือ 9

สังเกตที่ข้อมูลทั้ง 2 ชุด มีลักษณะคล้ายคลึงกันจะแตกต่างกันที่ข้อมูลตัวแรกเท่านั้นแต่ว่าค่าพิสัยจะมีความแตกต่างกันมาก ซึ่งค่าพิสัยนี้ไม่สามารถที่จะอธิบายลักษณะของข้อมูลได้อย่างชัดเจน
ข้อสังเกต
  1. ค่าพิสัยที่ได้เป็น 0 แสดงว่าข้อมูลไม่มีการกระจาย (ค่าเท่ากันหมด)
  2. ถ้าคำนวณได้ค่าพิสัยน้อย แสดงว่าข้อมูลมีการกระจายน้อย
  3. ถ้าคำนวณได้ค่าพิสัยมาก แสดงว่าข้อมูลมีการกระจายมาก
  4. ข้อมูลที่คล้ายคลึงกันอาจมีค่าพิสัยแตกต่างกันมากก็ได้ เพราะคำนวณจากตัวเลขเพียง 2 ค่า โดยเฉพาะถ้ามีข้อมูลมาก หรือ ค่าของข้อมูลค่าใดค่าหนึ่งมากหรือน้อยมากกว่าค่าของข้อมูลทั้งกลุ่มมาก
  5. ค่าพิสัยเหมาะสำหรับใช้วัดการกระจายของข้อมูลที่มีจำนวนน้อย
  6. ใช้เปรียบเทียบการกระจายของข้อมูลหลายๆ ชุด อย่างคร่าวๆ                                                                                                                      
      4.2  ส่วนเบี่ยงเบนมาตรฐานในการวัดการกระจายโดยใช้ส่วนเบี่ยงเบนเฉลี่ยนั้นมีปัญหาในเรื่องการใช้เครื่องหมายสัมบูรณ์ (Absolute Value) ซึ่งทำให้ค่าที่วัดได้ลดความเชื่อถือไป จึงมีการคิดวิธีวัดการกระจายโดยการยกกำลังสองของผลต่างระหว่างคะแนนกับมัชฌิมเลขคณิตของข้อมูลชุดนั้นแล้วถอดกรณ์ที่ 2 ของส่วนเบี่ยงเบนยกกำลังสองเฉลี่ย เป็นวิธีการวัดการกระจายที่ เรียกว่าส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation)
ค่าเบี่ยงเบนมาตรฐานใช้วัดการกระจายของข้อมูล เพื่อพิจารณาว่าคะแนนแต่ละตัวจะแตกต่างไปจากค่ากลางมากน้อยเพียงใด คำนวณโดยเอาคะแนน X แต่ละตัวลบด้วยมัชฌิมเลขคณิต() ของข้อมูลชุดนั้น ซึ่ง X –  แต่ละตัวอาจมีค่าเป็นลบ (X < ) หรือบวก (X>) จึงต้องยกกำลังสองของคะแนนเบี่ยงเบนแต่ละตัวนั้นเพื่อให้เครื่องหมายหมดไป แล้วหาค่าเฉลี่ยของผลบวกของกำลังสองของคะแนนเบี่ยงเบน คือ  ซึ่งจะได้รับค่าความแปรปรวน ถ้าถอดรากที่สองของค่าความ แปรปรวนจะได้ค่าความเบี่ยงเบนมาตรฐาน
ความแปรปรวน (Variance) คือ ค่าเฉลี่ยของผลรวมทั้งหมดของคะแนนเบี่ยงเบนยกกำลังสอง ใช้สัญลักษณ์ S2 แทนความแปรปรวนของกลุ่มตัวอย่างและ s 2 แทนความแปรปรวนของประชากรซึ่งหาได้จากสูตร
                ความแปรปรวนประชากร s 
                ความแปรปรวนของกลุ่มตัวอย่าง S
 คือ มัชฌิมเลขคณิตกลุ่มตัวอย่าง
ส่วนเบี่ยงเบนมาตรฐาน (Standard Deviation) คือ รากที่สองของความแปรปรวน
ส่วนเบี่ยงเบนมาตรฐานของประชากร s ใช้สูตร
    s = 
ส่วนเบี่ยงเบนมาตรฐานของกลุ่มตัวอย่าง S ใช้สูตร        S = 

ซึ่งใช้ในการวิเคราะห์ข้อมูล เพื่อการวิจัย
ในที่นี้เราจะใช้ส่วนเบี่ยงเบนมาตรฐานในการวัดการกระจายซึ่งใช้กับจำนวนข้อมูลจำนวนไม่มากนักและนิยมใช้กันโดยทั่วไป ซึ่งคำนวณได้ดังนี้
    1. ส่วนเบี่ยงเบนมาตรฐานของคะแนนที่ไม่ได้จัดหมวดหมู่ (Ungrouped Data)สูตร S.D. = 
      S.D. คือ ส่วนเบี่ยงเบนมาตรฐาน
      X1 คือ ข้อมูล (i = 1,2,3…N)
       คือ มัชฌิมเลขคณิต
      N คือ จำนวนข้อมูลทั้งหมด
      ตัวอย่างที่ 17 จงหาค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลต่อไปนี้ 1, 2, 4, 6, 8, 9
      วิธีทำ 1. หาค่ามัชฌิมเลขคณิต  = 
      = 5
    2. หาส่วนเบี่ยงเบนมาตรฐาน
สร้างตารางช่วยในการคำนวณ
X
( X-)
( X-)2
1
2
4
6
8
9
-4
-3
1
1
3
4
16
9
1
1
9
16
= 52

                                S.D. =   =    = 
      ค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนี้คือ 2.9
                                   
    1. ส่วนเบี่ยงเบนมาตรฐานของข้อมูลที่จัดหมวดหมู่ (Grouped Data)
S.D. = 
S.D. คือ ส่วนเบี่ยงเบนมาตรฐาน
f คือ ความถี่
X คือ จุดกึ่งกลางชั้น
 คือ มัชฌิมเลขคณิต
N คือ จำนวนข้อมูล
ตัวอย่างที่ 19 จากข้อมูลในตารางจงหาค่าส่วนเบี่ยงเบนมาตรฐานของข้อมูล
คะแนน
f
x
fx
x - 
(x - )2
f(x - )2
5 – 9
10 – 14
15 - 19
20 – 24
25 – 29
30 – 34
35 – 39
3
6
7
8
10
12
14
7
12
17
22
27
32
37
21
72
119
176
270
384
148
-16.8
-11.8
-6.8
-1.8
3.2
8.2
13.2
282.24
139.24
46.24
3.24
10.24
67.24
172.24
846.72
835.44
323.68
25.92
102.4
806.88
696.96
N = 50

วิธีทำ             1. หาค่ามัชฌิมเลขคณิต  = 
2. หาค่าเบี่ยงเบนมาตรฐาน                    สูตร S.D = 
                                    = 
                                    = 
                                    = 
ค่าเบี่ยงเบนมาตรฐานของข้อมูลนี้ คือ 8.53

        ข้อสังเกต
  1. เป็นการวัดการกระจายที่ให้ค่าลักษณะข้อมูลได้ละเอียดและดีที่สุดและเป็นการวัดการกระจายที่ใช้กันมากที่สุด
  2. เมื่อเอาค่าคงที่ (C) บวก หรือ ลบคะแนนทุกตัวของข้อมูลชุดหนึ่ง ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดนั้นจะไม่เปลี่ยนแปลง
  3. เมื่อเอาค่าคงที่ (C) คูณคะแนนทุกตัวของข้อมูลชุดหนึ่ง ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่จะเปลี่ยนแปลงไปดังนี้
  4. เมื่อเอาค่าคงที่ (C) หารคะแนนทุกตัวของข้อมูลชุดหนึ่ง ส่วนเบี่ยงเบนมาตรฐานของข้อมูลชุดใหม่จะเปลี่ยนแปลงไปดังนี้
S = Sx