ตารางชนิด rxk แบบมีลำดับที่
ข้อมูลกลุ่มบางประเภท สามารถจัดลำดับความแตกต่างระหว่างกลุ่มได้ เช่น ผลการรักษาผู้ป่วย จำแนกเป็น มีอาการแย่ลง มีอาการคงเดิม มีอาการดีขึ้น ฉะนั้นถ้าสามารถเลือกใช้สถิติที่คำนึงถึงการลดหลั่นกันเหล่านั้น ก็จะเป็นการใช้ข้อมูลได้ครบถ้วนมากยิ่งขึ้น ทำให้ผลสรุปน่าเชื่อถือมากขึ้น ในหัวข้อนี้ จะกล่าวถึงตารางชนิด r x k สองแบบ คือชนิดที่ตัวแปรทางแถวนอนและแถวตั้งจัดลำดับที่ได้ทั้งสองซึ่งจะเรียกตารางที่ได้ว่า Doubly ordered Table หรือจะมีเพียงหนึ่งตัวแปร (อาจเป็นทางแถวนอนหรือแถวตั้ง) ที่จัดลำดับได้ ซึ่งจะเรียกตารางที่ได้ว่า Singly ordered Table โดยลำดับแรกจะกล่าวถึงค่าสัมประสิทธิ์สหสัมพันธ์ และในลำดับท้าย จะกล่าวถึงสถิติที่ใช้ทดสอบความเป็นอิสระของตัวแปร ทางแถวนอนและแถวตั้ง ที่จัดลำดับได้
สถิติ PRE ที่ใช้กับตารางซึ่งตัวแปรเป็นเรียงลำดับ Goodman and Kruskall's Gamma
ตารางแบบอันดับมาตรา ( Ordinal scale ) นั้น แม้ข้อมูล ที่บรรจุอยู่ในตารางจะเป็นความถี่เช่นเดียวกับนามมาตรา แต่เนื่องจากช่วงต่างๆ มีลำดับความมากน้อยต่างกัน สถิติที่ใช้กับตารางอันดับมาตราจึงพยายามใช้ประโยชน์จากการเรียงลำดับมากน้อยของช่วงมาเป็นหลักในการวัด PRE คือดูว่าความรู้หรือข่าวสารในเรื่องอันดับของข้อมูลทางตัวแปรอิสระจะลดความผิดพลาดในการทำนายอันดับของตัวแปรตามได้มากน้อยเพียงไร
เพื่อที่จะเข้าใจการเปรียบเทียบลำดับของข้อมูลแบบอันดับมาตราและความเข้าใจในกฎแห่งความคิดของสถิติแบบ Gamma และ Somer's d และ Kendall Tau ต่างๆ จึงใช้ตัวอย่างต่อไปนี้เป็นแนวทางในการสร้างความเข้าใจ
ตารางที่ 6 ข้อมูลแสดงความสัมพันธ์ระหว่างน้ำหนักและส่วนสูง (เป็นกรณีตัวอย่างขนาดเล็กมาก และไม่มีจำนวนซ้ำ เพื่อเข้าใจได้ง่าย)
|
|
ความสูง |
|
|
สูง |
กลาง |
ต่ำ |
น้ำหนัก |
มาก |
|
ดาว |
|
กลาง |
เดือน |
|
|
ต่ำ |
|
|
เด่น |
สำหรับการเปรียบเทียบลำดับกันนั้น จำเป็นต้องจับคู่ข้อมูลเป็นคู่ๆ เพื่อเทียบดูว่าใครจะสูงกว่ากันและใครจะหนักกว่ากัน
จำนวนคู่ |
ลำดับความสูง |
ลำดับน้ำหนัก |
ลักษณะลำดับทั้งสอง |
เดือนกับดาว |
เดือนสูงกว่าดาว |
ดาวหนักกว่าเดือน |
ขัดแย้งกัน |
เดือนกับเด่น |
เดือนสูงกว่าเด่น |
เดือนหนักกว่าเด่น |
คล้อยตามกัน |
ดาวกับเด่น |
ดาวสูงกว่าเด่น |
ดาวหนักกว่าเด่น |
คล้อยตามกัน |
ข้อมูลจากตารางที่ 6 ซึ่งมีเพียง 3 คน จะได้จำนวนคู่ทั้งหมดที่เป็นไปได้ 3 คู่ สรุปได้ว่ามีลำดับที่ขัดแย้ง ( discordant pair เขียนย่อแทนว่า D ) หนึ่งคู่และมีลำดับคล้อยตามกัน ( concordant pairs เขียนย่อว่า C ) 2 คู่ ดังนั้น ถ้าให้ความสูงเป็นตัวแปรอิสระ และน้ำหนักเป็นตัวแปรตาม ถ้าเราจะทำนายน้ำหนักของคนๆหนึ่งโดยทราบส่วนสูง ก็ควรทำนายในลักษณะคล้อยตามกันจะมีความถูกต้องมากกว่า กล่าวคือ ถ้าทราบว่าสูงมากควรทำนายว่าหนักมากด้วย ทั้งนี้เพราะการจัดลำดับนั้นมีจำนวนคู่ที่คล้อยตามกันมากกว่า จำนวนคู่ที่ขัดแย้งกัน ดังนั้นในการทำนายเช่นนี้ จะมีความผิดพลาดไป 1 คู่ นั่นคือ E 2 = 1 นั่นเอง
สำหรับการหาค่า E 1 คือการหาความผิดพลาดในการทำนายโดยดูจากอันดับของตัวแปรตามแต่เพียงอย่างเดียว และไม่ได้ใช้ความรู้เกี่ยวกับอันดับทางตัวแปรอิสระเข้ามาช่วยเลยนั้น วิธีทำก็คือจับเอาคู่ใดคู่หนึ่งออกมาเปรียบเทียบแล้วทำนายทางด้านน้ำหนัก (ตัวแปรตาม) อย่างเดียว สมมุติว่าเป็นคู่ของดาวกับเดือน การทำนายคงจะต้องใช้หลักการสุ่มเป็นสำคัญ เช่น ถ้าสุ่มหยิบได้ชื่อ ดาวขึ้นมาก็บอกว่า ดาวหนักมากกว่าเดือน (ซึ่งถูกต้องตามความเป็นจริง) หรือถ้าสุ่มได้เดือนก็บอกว่าเดือนหนักกว่าดาว (ซึ่งไม่ถูกต้องตามความเป็นจริง) นั่นคือถ้าสุ่มแบบนี้หลายๆครั้งเป็นระยะเวลายาวนาน จะพบว่าโอกาสของการทำผิดเท่ากับครึ่งหนึ่งของจำนวนการสุ่มครั้งหนึ่งของจำนวนการสุ่มทั้งหมด นั่นคือเกิดความผิดพลาดเป็น 0.50 สำหรับในกรณีนี้มีคู่ที่เป็นไปได้ทั้งหมด 3 คู่ จึงเกิดความผิดพลาดทั้งหมด = 0.5 x 3 = 1.5 ครั้ง ซึ่งเลขจำนวนนี้ก็คือค่า E 1 นั่นเอง 
C คือจำนวนคู่ที่มีลำดับคล้อยตามกันทั้งหมด
D คือจำนวนคู่ที่มีลำดับขัดแย้งกันทั้งหมด
สำหรับค่า untied pairs นั้นคือจำนวน C+D นั้นเอง แต่เพื่อความเข้าใจในการจัดคู่ทั้งหมดของข้อมูลแบบตาราง หัวข้อแทรกต่อไปนี้จะสร้างความเข้าใจในเรื่องการจัดคู่และจะได้ใช้ต่อไปในเรื่องการคำนวณหาค่าสถิติแบบ Somer ‘s d, Kendall 's Tau ต่างๆ
Tied pairs และ Untied pairs (จำนวนคู่แบบผูกและแบบไม่ผูก) ถ้าสมมุติมีข้อมูลจำนวนทั้งหมด 100 หน่วย จะคำนวณหาจำนวนคู่ทั้ง tied pairs และ untied pairs ได้ดังนี้
ตารางที่ 7 ข้อมูลไขว้ระหว่างการศึกษาและรายได้มีดังนี้
|
|
การศึกษา |
|
|
สูง |
กลาง |
ต่ำ |
รายได้ |
สูง |
20 |
10 |
5 |
กลาง |
10 |
10 |
10 |
ต่ำ |
5 |
10 |
20 |

ควรทำนายว่ามีรายได้สูงด้วย เพราะมีคู่ที่มีลักษณะคล้อยตามกันมากกว่าคู่ที่ขัดแย้งกัน เครื่องหมายจึงได้บวก และการทำนายเช่นนี้จะลดความผิดพลาดลงได้ 55%
เนื่องจากสูตรของ Gamma ไม่ได้ใช้คู่ที่ผูกอยู่กับแถวนอนหรือแถวตั้งเข้ามาเกี่ยวข้องเลย การหาจำนวนคู่ที่คล้อยตามกันและขัดแย้งกันไม่ได้บ่งบอกว่าตัวแปรใดเป็นตัวแปรอิสระ ตัวแปรใดเป็นตัวแปรตาม ค่า Gamma จึงเป็น Symmetric หรือ indirectional statistic (ไม่บอกทิศทาง)
ตัวอย่างข้อมูลที่มีคู่ที่ขัดแย้งกันมากกว่าคู่ที่คล้อยตามกัน
ตารางที่ 8 ข้อมูลไขว้ระหว่างการศึกษาและรายได้
Gamma มีค่าผันแปรอยู่ระหว่าง – 1 ถึง +1 แต่ไม่เป็นปัญหาในการตีความ เพราะต้องแยกเครื่องหมายออกจากตัวเลข ความหมายของตัวเลขยังอิงอยู่กับหลัก probability คือดูค่า 0 ถึง 1 หรือเทียบเป็นเปอร์เซนต์คือ จาก 0 ถึง 100 เปอร์เซ็นต์
ค่า – 1 หมายถึง คู่แบบไม่ผูก ( untied pairs ) ทุกคู่เป็นคู่ที่ขัดแย้งกัน ส่วนค่า + 1 คือคู่แบบไม่ผูกทุกคู่เป็นคู่ที่คล้อยตามกัน
โดยสรุป ค่า Gamma เป็นวิธีที่เปลี่ยนจากการดูข้อมูลเป็นกลุ่มในแต่ละเซล (เช่น แบบของ Lambda ) มาเป็นการศึกษาเป็นรายกรณี คือเปรียบเทียบกันเป็นคู่ๆ ซึ่งมีความละเอียดกว่าแบบ Lambda มาก อย่างไรก็ตาม Gamma ก็ไม่ได้เอาคู่ที่เป็นแบบผูก ( tied pairs ) มาศึกษาด้วย ซึ่งถ้าจำนวนคู่แบบผูกมีเป็นจำนวนมากการตีความหมายของ Gamma ก็จะมีการบิดพลิ้วไปจากข้อเท็จจริงมาก อันเป็นจุดอ่อนของ Gamma
ผลกระทบของผลรวมของแถว (นอนหรือตั้ง) ต่อค่า Gamma ถ้าผลรวมมีความเบ้จะทำให้เกิดจำนวนคู่แบบผูก มีมากกว่าจำนวนคู่แบบไม่ผูก , ค่า Gamma เป็นค่าที่หาจากคู่ที่ไม่ผูกโดยตรงซึ่งได้ลดจำนวนลงถ้าจำนวนคู่ที่ผูกเพิ่มขึ้น ดังนั้น การสรุปความสัมพันธ์ของตารางทั้งตารางเกิดจากการดูจำนวนคู่ซึ่งเป็นส่วนน้อย จึงเป็นข้อสรุปที่ไม่แม่นยำและดูไม่สมเหตุสมผลนัก ดังนั้นตารางที่จะใช้หาค่า Gamma จึงควรเป็นตารางที่มีผลรวมกระจายสม่ำเสมอกัน และข้อควรระมัดระวังที่ควรสังเกต คือ การจัดลำดับตัวแปรทางแถวนอนและแถวตั้ง ต้องอยู่ในลักษณะมาก > น้อย หรือ น้อย > มาก เหมือนกัน
|