การแจกแจงทางทฤษฎี (Theoretical distribution) ที่ใช้ในอนุมานสถิติบ่อยๆ มีอยู่ 4 ประเภทด้วยกันคือ
1. การแจกแจงแบบโค้งปกติ (Normal distribution)
2. การแจกแจงแบบไคว์สแควร์ (Chi-square distribution)
3. การแจกแจงแบบ F (F-distribution)
4. การแจกแจงแบบ t (t-distrubution)
1. การแจกแจงแบบโค้งปกติ (Normal distribution)
การแจกแจงแบบโค้งปกติ เป็นการแจกแจงของข้อมูลที่ได้จากตัวแปร ที่มีลักษณะต่อเนื่อง (Continuous variable) โดยมีคุณสมบัติของโค้งปกติ ดังนี้
1. พื้นที่หรือความน่าจะเป็น (Probability) ภายใต้โค้งปกติมีค่าเท่ากับ 1
2. ความสูงของโค้งที่สูงที่สุดอยู่ที่ค่า µ
3.โค้งมีลักษณะเป็นรูประฆังคว่ำ สมมาตร และมีค่าเฉลี่ย มัธยฐาน และฐานนิยมเท่ากัน
4. ลักษณะการกระจายภายใต้โค้งปกติมีลักษณะที่ว่าในช่วงบวกลบ 1 เท่าของค่าเบี่ยงเบนมาตรฐานจากค่าเฉลี่ยหรือจุดกลางของโค้ง (µ±1) มีพื้นที่ประมาณ 68% และ (µ±2) มีพื้นที่ประมาณ 95% และ (µ±3) มีพื้นที่ประมาณ 99%
คะแนนมาตรฐาน
ในการที่จะนำคะแนนแต่ละรายวิชาหรือต่างกลุ่มกันมาเปรียบเทียบกัน ไม่สามารถทำได้ ดังนั้นในการที่จะนำคะแนนมาเปรียบเทียบกันให้ได้ความหมายนั้น ทำได้โดยเปลี่ยนคะแนนดิบให้เป็นคะแนนมาตรฐาน ซึ่งคะแนนมาตรฐานแต่ละชนิดจะมีค่าเฉลี่ย และค่าเบี่ยงเบนมาตรฐานคงที่
1. คะแนนมาตรฐาน Z (Z-Score) คือคะแนนมาตรฐานที่มีลักษณะการกระจายเหมือนกับการกระจายของคะแนนดิบ มีค่าเฉลี่ยเป็นศูนย์และค่าเบี่ยงเบนมาตรฐานเป็นหนึ่ง สามารถคำนวณได้โดยใช้สูตรดังนี้

การสรุปลักษณะต่างๆ ของข้อมูลนั้น ใช้การวัดแนวโน้มเข้าสู่ส่วนกลางเพียงอย่างเดียวไม่เพียงพอ จำเป็นที่จะต้องใช้การวัดการกระจายด้วยเพื่อให้ทราบว่าข้อมูลแต่ละชุดมีการกระจายแตกต่างกันอย่างไร โดยมีวิธีการดังนี้
1. พิสัย (Range) คือความแตกต่างระหว่างข้อมูลที่มีค่าสูงสุดกับข้อมูลที่มีค่าต่ำสุด การจัดการกระจายแบบนี้เป็นการวัดแบบหยาบๆ
2. ค่าเบี่ยงเบนควดไทล์ (Quartile deviation : Q.D.) คือค่าครึ่งหนึ่งของผลต่างระหว่างควอไทล์ที่ 3 กับควอไทล์ที่ 1 ใช้เมื่อข้อมูลนั้นมีการวัดแนวโน้มเข้าสู่ส่วนกลางด้วยค่ามัธยฐาน
3. ค่าเบี่ยงเบนเฉลี่ย (Mean deviation : M.D.) คือค่าเฉลี่ยของค่าเบี่ยงเบนของข้อมูลแต่ละตัวที่เบี่ยงเบนไปจากค่าเฉลี่ยของข้อมูลชุดนั้น โดยไม่คำนึงถึงทิศทางหรือเครื่องหมาย การวัดการกระจายนี้ไม่นิยมใช้เพราะไม่คำนึงถึงเครื่องหมาย แต่ถ้าใช้จะใช้คู่กับค่าเฉลี่ย
4. ค่าเบี่ยงเบนมาตรฐาน (Standard deviation : S.D.) คือ รากที่สองของค่าเฉลี่ยของกำลังสองของค่าเบี่ยงเบนของข้อมูลแต่ละตัวจากค่าเฉลี่ยของข้อมูลชุดนั้น ค่าเบี่ยงเบนมาตรฐานเป็นค่าสถิติที่แก้ไขจุดอ่อนของการใช้ค่าเบี่ยงเบนเฉลี่ย โดยค่าเบี่ยงเบนมาตรฐานนี้จะใช้คู่กับค่าเฉลี่ย
ความแปรปรวน (Variance) คือ ค่ากำลังสองของค่าเบี่ยงเบนมาตรฐาน
สรุปการเลือกใช้สถิติที่ใช้วัดการกระจายของข้อมูล
1. ในกรณีที่ต้องการดูการกระจายอย่างหยาบๆ ของข้อมูล และเพื่อความรวดเร็วใช้พิสัย แต่การใช้พิสัยจะบอกอะไรไม่ได้มากนัก
2. ในกรณีที่ใช้ค่ามัธยฐานเป็นค่าสถิติที่ใช้วัดแนวโน้มเข้าสู่ส่วนกลาง ควรใช้ค่าเบี่ยงเบนควอไทล์ เป็นสถิติที่ใช้วัดการกระจาย
3. ในกรณีที่ใช้ค่าเฉลี่ยเป็นสถิติในการวัดแนวโน้มเข้าสู่ส่วนกลาง ควรใช้ค่าเบี่ยงเบนมาตรฐานเป็นสถิติในการวัดการกระจาย
4. ค่าเบี่ยงเบนเฉลี่ยเป็นสถิติที่นักวิจัยไม่นิยมใช้ เพราะมีปัญหาในการที่ไม่นำเครื่องหมายมาพิจารณาด้วย
สัมประสิทธิ์การกระจาย (Coefficient of variation)
ในการเปรียบเทียบลักษณะการกระจายของข้อมูล 2 ชุดนั้น ถ้าข้อมูลทั้งสองชุดมีค่าเฉลี่ยหรือมัธยฐานใกล้เคียงกัน ใช้ค่าเบี่ยงเบนมาตรฐาน หรือค่าเบี่ยงเบนควอไทล์ในการเปรียบเทียบการกระจายของข้อมูลได้เลย แต่ถ้าข้อมูลสองชุดนั้นมีค่าเฉลี่ยหรือมัธยฐานต่างกัน สถิติที่เหมาะสมในการเปรียบเทียบการกระจายของข้อมูล คือ สัมประสิทธิ์การกระจาย
คุณสมบัติทางพีชคณิตของค่าเฉลี่ยและความแปรปรวน
1. ค่าเฉลี่ยของผลบวกของตัวแปรต่างๆ ที่เป็นอิสระต่อกันมีค่าเท่ากับผลบวกของค่าเฉลี่ยของตัวแปรเหล่านั้น
2. ความแปรปรวนของผลบวกของตัวแปรต่างๆ ที่เป็นอิสระต่อกันมีค่าเท่ากับผลบวกของความแปรปรวนของตัวแปรเหล่านั้น
3. บวกหรือลบค่าคงที่ทุกๆ ค่าของตัวแปรชุดใดๆ ค่าเฉลี่ยของตัวแปรชุดใหม่มีค่าเท่ากับค่าเฉลี่ยของตัวแปรชุดเดิม บวกหรือลบด้วยค่าคงที่นั้น และค่าความแปรปรวนไม่เปลี่ยนแปลง
4. คูณหรือหารทุกๆ ค่าของตัวแปรชุดใดๆ ด้วยค่าคงที่ ค่าเฉลี่ยของตัวแปรชุดใหม่มีค่าเท่ากับค่าเฉลี่ยของตัวแปรชุดเดิมคูณด้วยค่าคงที่นั้น และค่าความแปรปรวนของข้อมูลชุดใหม่มีค่าเท่ากับค่าความแปรปรวนของตัวแปรชุดเดิม คูณด้วยกำลังสองของค่าคงที่

การวัดแนวโน้มเข้าสู่ส่วนกลาง
การสรุปลักษณะของข้อมูลโดยทั่วไป จะคำนึงถึงลักษณะ 2 ประการ คือ ค่าที่เป็นตัวแทนของข้อมูลแต่ละชุด และลักษณะการกระจายของข้อมูล โดยการหาค่าสถิติที่ทีเป็นตัวแทนของข้อมูลแต่ละชุด คือ การวัดแนวโน้มสู่ส่วนกลาง โดยมีค่าสถิติที่นิยมใช้ได้แก่ ค่าเฉลี่ย มัธยฐาน และฐานนิยม
ความสัมพันธ์ระหว่างค่าเฉลี่ย มัธยฐานและฐานนิยมในลักษณะการแจกแจงต่างๆ
1. ถ้าข้อมูลมีลักษณะการแจกแจงเป็นโค้งปกติ คือ เป็นโค้งที่มีลักษณะรูประฆัง ค่าเฉลี่ย มัธยฐานและฐานนิยม จะมีค่าเท่ากัน
2. ถ้าข้อมูลมีลักษณะการแจกแจงเบ้ไปทางขวา ค่าเฉลี่ยจะมากกว่ามัธยฐานและฐานนิยม
3. ถ้าข้อมูลมีลักษณะการแจกแจงเบ้ไปทางซ้าย ค่าเฉลี่ยจะน้อยกว่ามัธยฐานและฐานนิยม
สรุปลักษณะและการใช้สถิติที่ใช้วัดแนวโน้มเข้าสู่ส่วนกลาง
1. ค่าเฉลี่ย (Mean) เป็นค่าสถิติที่ใช้กับข้อมูลชนิดข้อมูลอันตรภาคและข้อมูลอัตราส่วน
2. มัธยฐาน (Median) เป็นค่าสถิติที่ใช้กับข้อมูลชนิดข้อมูลเรียงลำดับ ข้อมูลอันตรภาค และข้อมูลอัตราส่วน
3. ฐานนิยม (Mode) เป็นค่าสถิติที่ใช้กับข้อมูลได้ทุกชนิด เป็นค่าสถิติที่หาง่ายที่สุด แต่เป็นตัวแทนที่มีความหมายน้อยที่สุด มีความคงที่น้อยที่สุด และในการประมาณค่าพารามิเตอร์ ค่าฐานนิยมจะใกล้เคียงความจริงน้อยที่สุด

ตำแหน่งเปอร์เซ็นไทล์ เดไซน์และควอไทล์
ข้อมูลที่รวบรวมมาได้ในแต่ละชุด จะมีลักษณะเฉพาะของตนเอง ในการที่จะเปรียบเทียบตำแหน่งต่างๆ ของข้อมูลคนละชุดนั้น ควรจะแปลงข้อมูลเหล่านั้นให้อยู่ในลักษณะเดียวกันเสียก่อน สถิติที่ใช้ในการเปรียบเทียบและวัดตำแหน่งต่างๆ ที่จะกล่าวถึงในที่นี้ ได้แก่
ตำแหน่งเปอร์เซ็นไทล์ (Percentile : P)
ตำแหน่งเปอร์เซ็นไทล์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่กี่ส่วนจากร้อยส่วนที่มีค่าน้อยกว่าหรือเท่ากับคะแนน ณ ตำแหน่งนั้น เช่น นายยอกสอบได้คะแนนสถิติ 60 คะแนน ซึ่งตรงกับตำแหน่งเปอร์เซ็นไทล์ที่ 70 หมายความว่า มีนิสิตร้อยละ 70 ของนิสิตที่เข้าสอบ สอบได้คะแนนต่ำกว่าหรือเท่ากับ 60 คะแนน
ตำแหน่งเดไซน์ (Dacile : D)
ตำแหน่งเดไซน์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่กี่ส่วนจาก 10 ส่วน ที่มีค่าน้อยกว่าหรือเท่ากับคะแนน ณ ตำแหน่งนั้น
ตำแหน่งควอไทล์ (Quartile : Q)
ตำแหน่งเดไซน์ หมายถึง ตำแหน่งที่บอกให้ทราบว่ามีข้อมูลอยู่กี่ส่วนจาก 4 ส่วน ที่มีค่าน้อยกว่าหรือเท่ากับคะแนน ณ ตำแหน่งนั้น
ชนิดของข้อมูล เนื่องจากสถิติบางอย่างไม่สามารถใช้ได้กับข้อมูลทุกชนิด ผู้วิจัยจึงควรทำความรู้จักกับชนิดของข้อมูล โดยชนิดของข้อมูลแบ่งได้เป็น 4 ชนิด ดังนี้
1. ข้อมูลนามบัญญัติ (Nominal data) เป็นข้อมูลที่แบ่งเป็นกลุ่ม ไม่สามารถนำมาคำนวณได้ เช่น เพศ ชนิดโรงเรียน เป็นต้น
2. ข้อมูลเรียงลำดับ (Ordinal data) เป็นข้อมูลที่นอกจากจะจำแนกเป็นกลุ่มได้แล้ว ยังสามารถนำมาเรียงอันดับได้อีกด้วย ได้แก่ ผลการแข่งขัน ระดับความคิดเห็น เป็นต้น
3. ข้อมูลอันตรภาค (Interval data) เป็นข้อมูลที่มีลักษณะเรียงอันดับความมากน้อย ช่วงของความแตกต่างแต่ละช่วงเท่ากัน สามารถนำมาคำนวณได้ แต่ไม่มีศูนย์แท้ เช่น คะแนนสอบ เป็นต้น
4. ข้อมูลอัตราส่วน (Ratio data) เป็นข้อมูลที่เหมือนกับข้อมูลอันตรภาคชั้น แต่มีศูนย์แท้ เช่น ความสูง อายุ น้ำหนัก เป็นต้น
ตัวแปร (Variable) หมายถึง สิ่งที่มีค่าเปลี่ยนไป ไม่คงที่ เช่น เพศ อายุ เป็นต้น โดยตัวแปรจัดแบ่งได้เป็น 2 ประเภท ตามลักษณะของตัวแปร ดังนี้
1. ตัวแปรต่อเนื่อง (Continuous data) คือตัวแปรที่มีค่าต่างๆ ต่อเนื่องกันทุกค่า เช่น น้ำหนัก อายุ ความสูง เป็นต้น
2. ตัวแปรไม่ต่อเนื่อง (Discrete data) คือตัวแปรที่มีค่าต่างๆ แยกจากกันโดยเด็ดขาด เช่น เพศ การสอบได้-ตก พรรคการเมือง เป็นต้น













Recent Comments || ความคิดเห็นล่าสุด