ข้อมูลที่เก็บบันทึกจากเรื่องใดเรื่องหนึ่ง ค่าของตัวแปรอาจจะมีลักษณะเป็นกลุ่ม (category) เช่น ชนิดของโรคที่ผู้ป่วยเป็น หรือเกรดที่นักศึกษาได้รับ แทนที่จะเป็นค่าปริมาณ แบบต่อเนื่อง ถ้ามีการศึกษาจากข้อมูลที่มี 2 ตัวแปรพร้อมกัน มักจะนำเสนอในรูปตารางที่เรียกว่า ตารางการณ์จร ซึ่งจะบันทึกความถี่ (frequency) ของการเกิดตัวแปรทั้งสองในกลุ่มค่าต่างๆ การวิเคราะห์ข้อมูลเชิงกลุ่ม จะเป็นการศึกษาถึงตัวแปรตามที่มีลักษณะเป็นกลุ่ม โดยตัวแปรอิสระอาจจะเป็นแบบกลุ่มหรือมีค่าปริมาณแบบต่อเนื่องก็ได้ โดยเป็นขบวนการทดสอบสมมติฐานทางสถิติ เพื่อวัดความสัมพันธ์ ของตัวแปร ทางแถวนอนและแถวตั้งในตารางการณ์จรหรือชุดของตารางการณ์จร รวมไปถึงการสร้างโมเดลเพื่อ แสดงถึงความสัมพันธ์ระหว่างตัวแปรตามแบบกลุ่มและชุดของตัวแปรอิสระต่างๆ
มาตรวัดของข้อมูล การเลือกใช้การวิเคราะห์ทางสถิติที่เหมาะสม ต้องคำนึงถึงมาตรวัดข้อมูล ของตัวแปรเป็นสำคัญ ฉะนั้น การเข้าใจถึงมาตรวัดข้อมูลจึงเป็นหัวใจที่สำคัญ ในการเลือกใช้สถิติที่เหมาะสม ( appropriate statistics ) ซึ่งจะนำไปสู่การสรุปผลที่น่าเชื่อถือ
จะบอกกล่าวถึงมาตราวัดข้อมูลในลำดับแรกดังนี้
การวัด หมายถึง การกำหนดค่าตัวเลขให้กับสิ่งของหรือเหตุการณ์ต่างๆ โดยใช้กฎ อย่างใดอย่างหนึ่ง กฎเหล่านี้มีหลายแบบจึงเป็นที่มาของมาตราวัด 4 แบบ คือ
1.มาตรานามบัญญัติ (The Nominal or Classificatory Scale)
เป็นมาตราวัดขั้นต่ำสุดซึ่งนิยมใช้ตัวเลขหรือสัญลักษณ์ใดๆ จัดข้อมูลเป็นกลุ่มต่างที่แยกออกจากกันโดยเด็ดขาด เช่น ใช้ตัวเลข 1 , 2 และ 3 แทนคนไข้ที่ป่วยด้วยโรคต่างๆ ซึ่งมารับรักษาที่โรงพยาบาลแห่งหนึ่ง ตัวเลขหรือสัญลักษณ์เหล่านี้ไม่อาจบอกความแตกต่างในเทอมของการดีกว่า สูงกว่าหรือเลวกว่า คือมีคุณค่าเท่ากันหรือเหมือนกัน และไม่มีความหมายของตัวเลขจะนำมาบวก ลบ คูณ หรือหาร ตามวิธีพีชคณิต ไม่ได้ รวมทั้งอาจสลับเปลี่ยนค่ากันได้ เช่น ให้ 0 แทนเพศหญิง 1 แทนเพศชาย หรือ 0 แทนเพศชาย และ 1 แทนเพศหญิง
ตัวอย่างอื่นๆเช่น การบันทึกข้อมูลตามศาสนาที่นับถือ
การบันทึกข้อมูลตามสถานภาพสมรส เช่น โสด สมรส หม้าย
การบันทึกข้อมูลตามระดับการศึกษา เช่น ประถม มัธยม ปริญญาตรี
สิ่งที่นำมาวิเคราะห์ คือ ความถี่ในแต่ละกลุ่ม
2.มาตราเรียงลำดับ (The Ordinal or Ranking scale)
เป็นการวัดที่แสดงความแตกต่างของคุณภาพเช่นกัน แต่สามารถบอกความแตกต่างของแต่ละกลุ่มได้ในเทอม มากกว่า ดีกว่า เลวกว่าได้ แต่ไม่สามารถวัดเป็นตัวเลขได้ เช่น แบ่งคนไข้ออกเป็นกลุ่มต่างๆ ดังนี้ รักษาไม่ได้ผล รักษาแล้วได้ผลดี หรือแบ่งกลุ่มออกตามความเห็นต่อเรื่องๆหนึ่ง ดังนี้ กลุ่มไม่เห็นด้วย กลุ่มไม่มีความเห็น กลุ่มเห็นด้วย หรือกลุ่มนักศึกษาที่ได้ผลการสอบตามเกรดต่างๆ คือ A B C D F ความแตกต่างระหว่างกลุ่มนั้นสามารถบอกได้เพียงว่า ดีกว่า เลวกว่า อย่างไร แต่ไม่สามารถบอกระยะห่างของความแตกต่างได้ รวมทั้งระยะห่างนั้น ไม่จำเป็นต้องเท่ากันด้วย เช่น นักศึกษาที่สอบได้เกรด A เก่งกว่า นักศึกษาที่ได้เกรดอื่นๆ แต่ไม่ได้เก่งเป็น 4 เท่า ของคนได้ F หรือ 2 เท่าของคนที่ได้เกรด B
การบันทึกข้อมูลบางอย่างจำเป็นต้องใช้มาตราวัดเช่นนี้ เช่น การชิมอาหาร 3 ชนิด ผู้ชิมจะบอกเพียงว่าชนิดใดอร่อยที่สุดและอันดับ 2, 3 หรือ ดมกลิ่นน้ำหอม ก็บันทึกได้เพียงว่า ชอบชนิดใดมากที่สุด และอันดับรองลงไป เราอาจใช้ตัวเลข 1, 2 และ 3 หรืออาจใช้เลข อื่นๆ 8 25 35 (แต่นิยมใช้ 1,2 และ 3 เพราะเข้าใจได้ง่ายกว่า)
การวิเคราะห์ข้อมูลในมาตราวัดนี้ มักนำค่าลำดับที่ (คือ 1 , 2 .......) มาวิเคราะห์ เช่น หาเครื่องหมายของผลต่างของลำดับที่ ( sign difference )
ทั้ง 2 มาตราข้างต้นจัดได้ว่าข้อมูลที่บันทึกมาเป็นข้อมูลเชิงคุณภาพ ดังนั้นการวิเคราะห์ข้อมูลจะใช้ได้เฉพาะสถิติที่ไม่ใช้พารามิเตอร์เท่านั้น
3.มาตราอันตรภาค ( The Interval scale)
เป็นมาตราวัดที่มีคุณสมบัติเพิ่มขึ้นจากมาตราวัดแบบที่ 2 คือ ทราบระยะห่างของความแตกต่างระหว่างกลุ่ม 2 กลุ่ม อย่างชัดเจน เช่น ความแตกต่างระหว่างค่า 20 และ 30 เท่ากับ 10 และเท่ากับ ความแตกต่างระหว่างค่า 30 กับ 40 มาตราวัดนี้มักวัดค่าเป็นเชิงปริมาณ แต่ไม่มีจุดศูนย์ หรือจุดเริ่มต้นที่แท้จริง ตัวอย่างที่นิยมใช้กับมาตราวัดนี้คือ อุณหภูมิ , ค่า I.Q., ความดัน , คะแนนให้แก่ความสามารถต่างๆ (ส่วนมากเป็นคะแนนด้านจิตวิทยา) ข้อมูลเกี่ยวกับอุณหภูมิ เช่น องศาเซลเซียส 0 ? C คือจุดเยือกแข็งในขณะที่ 32 ? F เป็นจุดเยือกแข็งของฟาเรนไฮต์ ความแตกต่างระหว่าง 30 ? C กับ 10 ? C นั้นทราบเพียงว่าห่างกัน = 20 ? C แต่ไม่มีความหมายว่าเป็น 3 เท่าระหว่างกัน ดังนั้นมาตราวัดนี้ใช้ได้เพียงเครื่องหมายบวกและลบในเชิงพีชคณิตเท่านั้นยังไม่รวมกับการใช้เครื่องหมายคูณและหาร
อีกตัวอย่างหนึ่งสำหรับข้อมูลที่มีมาตราวัดนี้ คือ คะแนนสอบ ถ้าได้คะแนนสอบ = 0 ก็ไม่ได้หมายความว่าไม่มีความรู้เลยหรือถ้าได้คะแนนสอบ 50 ก็ไม่ได้หมายความว่ามีความรู้เป็น 2 เท่าของผู้ที่สอบได้คะแนน = 25 การวิเคราะห์ข้อมูลมาตราวัดนี้ อาจใช้แบบใช้พารามิเตอร์เมื่อข้อกำหนดเบื้องต้นนั้นเป็นจริง
4.มาตราอัตราส่วน (The Ratio scale)
มารตราวัดนี้มีความสมบูรณ์ที่สุด คือ มีค่าในเชิงตัวเลขที่แท้จริง มักเป็นข้อมูลทางด้านวิทยาศาสตร์ เช่น ทางฟิสิกส์ ซึ่งวัดความยาว น้ำหนัก ความหนาแน่น ความต้านทานไฟฟ้า เป็นต้น ซึ่งมีจุดศูนย์ที่แท้จริง เช่น น้ำหนัก 0 ก็คือไม่มีน้ำหนักเลย และ น้ำหนัก 5 , 10 กิโลกรัม ก็หนักเป็น 5 และ 10เท่าตามลำดับของน้ำหนัก 1 กิโลกรัม จึงเป็นที่มาของของชื่อมาตราวัด เนื่องจากมีความหมายแท้จริงของอัตราส่วน การวิเคราะห์ข้อมูลมาตราวัดนี้ซึ่งเป็นข้อมูลเชิงปริมาณก็ควรใช้สถิติที่ใช้พารามิเตอร์ถ้าข้อกำหนดเบื้องต้นเป็นจริง แต่ถ้าไม่เป็นจริงก็ควรใช้สถิติที่ไม่ใช้พารามิเตอร์
เนื่องจากข้อมูลที่มีมาตราวัดสูงสามารถจัดใหม่ให้กลายเป็นข้อมูลมาตราวัดแบบต่ำกว่าได้ ตัวอย่างเช่น ข้อมูลเกี่ยวกับรายได้ถ้าสามารถบันทึกรายได้ของแต่ละคนได้ ก็จัดเป็นข้อมูลที่มีมาตราวัดแบบอัตราส่วน แต่เนื่องจากรายได้มักเป็นข้อมูลปกปิดไม่นิยมเปิดเผย วิธีการเก็บข้อมูลอาจทำได้อีกวิธีหนึ่ง คือจัดรายได้เป็นช่วงต่างๆ เช่น 6-10 , 11-15 , 16-20 ... (หน่วยพันบาท) ข้อมูลลักษณะนี้จัดเป็นมาตราวัดแบบนามบัญญัติ การวิเคราะห์ด้วยสถิติที่ไม่ใช้พารามิเตอร์จะทำได้เพียงวิธีเดียว
การวิเคราะห์ข้อมูลเชิงกลุ่ม จะเป็นการศึกษาถึงตัวแปรตามที่มีลักษณะเป็นกลุ่ม ( Categorical response variable ) อาจจะมีลักษณะดังต่อไปนี้
ลักษณะ 2 คำตอบ( Dichotomous )
มาตรวัดแบบเรียงลำดับ ( Ordinal )
มาตรวัดแบบนามบัญญัติ( Nominal )
ลักษณะการนับ ( Discrete count )
ลักษณะเป็นกลุ่มของช่วงเวลา ( Group survival time )
จะยกตัวอย่างเพียง 3 ลำดับแรกซึ่งจะเกี่ยวข้องกับการทดสอบสมมติฐานทางสถิติ ดังนี้ ตารางที่ 1 ผลการรักษาโรคชนิดหนึ่งด้วยยาชนิดใหม่ กับ placebo (ยาเทียม) หลังการรักษาในระยะเวลาหนึ่ง ผู้ป่วยให้ความเห็นเกี่ยวกับยาชนิดนี้ว่า พอใจหรือไม่พอใจ เช่นได้ข้อมูลดังนี้
|
ผลการรักษาผู้ป่วย |
ยา |
พอใจ |
ไม่พอใจ |
รวม |
ยาใหม่ |
16 |
48 |
64 |
ยาเทียม |
40 |
20 |
60 |
ตัวแปรตาม คือผลการรักษาซึ่งมี 2 คำตอบ สามารถนำไปประยุกต์ใช้กับตัวแปรตามที่มีคำตอบลักษณะใช่หรือไม่ใช่ ในปัญหาต่างๆได้
ตัวอย่างเกี่ยวกับตัวแปรตามที่มีลักษณะที่มีลักษณะเป็นค่าเรียงลำดับ เป็นดังนี้
ตารางที่ 2 ผลการรักษาผู้ป่วยจากยา A และยาเทียม
|
การเปลี่ยนแปลงที่ผู้ป่วยรับรู้ |
เพศ |
ยา |
มาก |
ปานกลาง |
น้อย |
รวม |
หญิง |
ยา A |
16 |
5 |
6 |
27 |
หญิง |
ยาเทียม |
6 |
7 |
19 |
32 |
ชาย |
ยา A |
5 |
2 |
7 |
14 |
ชาย |
ยาเทียม |
1 |
0 |
10 |
11 |
ตัวอย่างนี้ ตัวแปรตามคือการเปลี่ยนแปลงที่ผู้ป่วยรับรู้ ตัวแปรอิสระคือเพศ และชนิดของยาที่ใช้
และตัวอย่างเกี่ยวกับตัวแปรตามแบบนามบัญญัติ เป็นดังนี้
ตารางที่ 3 จำนวนสมาชิกพรรคการเมืองต่างๆจากเขตท้องที่ต่างๆ
|
เขตท้องที่ |
พรรคการเมืองที่สังกัด |
เหนือ |
ใต้ |
กลาง |
ตะวันออกเฉียงเหนือ |
พรรค ก |
221 |
160 |
360 |
140 |
พรรค ข |
200 |
291 |
160 |
311 |
พรรค ค |
208 |
106 |
316 |
97 |
ตัวอย่างนี้ตัวแปรตาม คือ พรรคการเมืองที่สังกัด เมื่อเขตท้องที่เป็นตัวแปรอิสระ
ในการทดสอบสมมติฐาน เกี่ยวกับความสัมพันธ์ของตัวแปรทางแนวนอนและแนวตั้ง จำเป็นต้องมีข้อกำหนดเกี่ยวกับการได้มาซึ่งข้อมูล ว่าต้องเป็น ลักษณะสุ่ม ซึ่งอาจได้จากการวางแผนการทดลอง หรือการสำรวจตัวอย่าง ในขณะที่การใช้ข้อมูลในอดีต ( Historical data ) จำเป็นต้องระมัดระวัง อาจจำเป็นต้องกำหนดตัวแปรอิสระอื่นๆให้คงที่ เช่น ข้อมูลในตัวอย่างที่ผ่านมา ในตัวอย่างที่ 2 และข้อควรระวังอีกประการ คือ ขนาดตัวอย่าง เพียงพอที่จะใช้สถิติทดสอบได้หรือไม่ ควรให้ในแต่ละเซล มีความถี่ ที่ไม่เป็น 0 หรือน้อยมาก เป็นจำนวนมาก
ขอบเขตการศึกษา การศึกษาครั้งนี้จะศึกษาเฉพาะการหาค่าสัมประสิทธิ์สหสัมพันธ์ และ การทดสอบ สมมติฐานทางสถิติ ที่วัดความสัมพันธ์ของตัวแปรทางแถวนอนและแถวตั้ง ซึ่งอาจจะเป็นกรณีที่กำหนดว่า ตัวแปรตัวแปรหนึ่งเป็นตัวแปรตามไว้ล่วงหน้า หรือบางครั้งไม่จำเป็นต้องกำหนดไว้ล่วงหน้าก็ได้และจัดลงเป็นตัวแปรทางแถวนอนและแถวตั้งของตารางการณ์จร โดยไม่รวมถึงชุดของตารางการณ์จรแบบต่างๆ เช่น k ชุดของตารางชนิด 2x2 หรือ k ชุดของตารางชนิด r x k และการสร้างโมเดลความสัมพันธ์ระหว่างตัวแปรตามและตัวแปรอิสระ และแม้จะมีวิธีการแบบได้ค่าที่แท้จริง ( Exact Method ) ในโปรแกรมหรือรูปบางชนิดแล้วก็ตาม แต่ขอบเขตการศึกษาครั้งนี้ จะใช้วิธีการประมาณ ( Asymptotic assumption )
การใช้สื่อการสอนนี้ สื่อการสอนนี้ได้สร้างบทเรียนพร้อมทั้งโปรแกรม ที่ใช้คำนวณค่าสถิติจากการทดสอบแบบต่างๆ (อยู่ท้ายของบทเรียนแต่ละเรื่อง) ซึ่งมีมีจุดเด่นคือ บันทึกค่าข้อมูลได้ง่าย คือให้ผู้เรียนใส่ความถี่ลงในเซลต่างๆ ของตาราง 2 ทาง และได้อธิบายการบันทึกค่าไว้ในกรณีที่จำเป็น ซึ่งได้แนวคิดจากโปรแกรมสำเร็จรูป STATEXACT ที่ใช้สำหรับการวิเคราะห์ข้อมูลแบบสถิติไม่ใช้พารามิเตอร์ ( Nonparametric Statistics ) ที่ยังไม่มีการใช้แพร่หลายในประเทศไทย
|