หน้าแรก     บทเรียน     โปรแกรม     ผู้จัดทำ     เอกสารอ้างอิง
 

- บทนำ
- การวัดความสอดคล้องกัน
- การวัดความสัมพันธ์



- พระจอมเกล้าฯลาดกระบัง
- คณะวิทยาศาสตร์
- ภาควิชาสถิติประยุกต์

 

 

บทที่ 3
การวัดความสัมพันธ์ (Measure of association)


          ตารางชนิด rxk แบบมีลำดับที่

      ข้อมูลกลุ่มบางประเภท สามารถจัดลำดับความแตกต่างระหว่างกลุ่มได้ เช่น ผลการรักษาผู้ป่วย จำแนกเป็น มีอาการแย่ลง มีอาการคงเดิม มีอาการดีขึ้น ฉะนั้นถ้าสามารถเลือกใช้สถิติที่คำนึงถึงการลดหลั่นกันเหล่านั้น ก็จะเป็นการใช้ข้อมูลได้ครบถ้วนมากยิ่งขึ้น ทำให้ผลสรุปน่าเชื่อถือมากขึ้น ในหัวข้อนี้ จะกล่าวถึงตารางชนิด r x k สองแบบ คือชนิดที่ตัวแปรทางแถวนอนและแถวตั้งจัดลำดับที่ได้ทั้งสองซึ่งจะเรียกตารางที่ได้ว่า Doubly ordered Table หรือจะมีเพียงหนึ่งตัวแปร (อาจเป็นทางแถวนอนหรือแถวตั้ง) ที่จัดลำดับได้ ซึ่งจะเรียกตารางที่ได้ว่า Singly ordered Table โดยลำดับแรกจะกล่าวถึงค่าสัมประสิทธิ์สหสัมพันธ์ และในลำดับท้าย จะกล่าวถึงสถิติที่ใช้ทดสอบความเป็นอิสระของตัวแปร ทางแถวนอนและแถวตั้ง ที่จัดลำดับได้

            สถิติ PRE ที่ใช้กับตารางซึ่งตัวแปรเป็นเรียงลำดับ

      Goodman and Kruskall's Gamma

      ตารางแบบอันดับมาตรา ( Ordinal scale ) นั้น แม้ข้อมูล ที่บรรจุอยู่ในตารางจะเป็นความถี่เช่นเดียวกับนามมาตรา แต่เนื่องจากช่วงต่างๆ มีลำดับความมากน้อยต่างกัน สถิติที่ใช้กับตารางอันดับมาตราจึงพยายามใช้ประโยชน์จากการเรียงลำดับมากน้อยของช่วงมาเป็นหลักในการวัด PRE คือดูว่าความรู้หรือข่าวสารในเรื่องอันดับของข้อมูลทางตัวแปรอิสระจะลดความผิดพลาดในการทำนายอันดับของตัวแปรตามได้มากน้อยเพียงไร เพื่อที่จะเข้าใจการเปรียบเทียบลำดับของข้อมูลแบบอันดับมาตราและความเข้าใจในกฎแห่งความคิดของสถิติแบบ Gamma และ Somer's d และ Kendall Tau ต่างๆ จึงใช้ตัวอย่างต่อไปนี้เป็นแนวทางในการสร้างความเข้าใจ

ตารางที่ 6 ข้อมูลแสดงความสัมพันธ์ระหว่างน้ำหนักและส่วนสูง (เป็นกรณีตัวอย่างขนาดเล็กมาก และไม่มีจำนวนซ้ำ เพื่อเข้าใจได้ง่าย)       

ความสูง
สูง
กลาง
ต่ำ
น้ำหนัก
มาก
ดาว
กลาง
เดือน
ต่ำ
เด่น

      สำหรับการเปรียบเทียบลำดับกันนั้น จำเป็นต้องจับคู่ข้อมูลเป็นคู่ๆ เพื่อเทียบดูว่าใครจะสูงกว่ากันและใครจะหนักกว่ากัน

จำนวนคู่ ลำดับความสูง ลำดับน้ำหนัก ลักษณะลำดับทั้งสอง
เดือนกับดาว เดือนสูงกว่าดาว ดาวหนักกว่าเดือน ขัดแย้งกัน
เดือนกับเด่น เดือนสูงกว่าเด่น เดือนหนักกว่าเด่น คล้อยตามกัน
ดาวกับเด่น ดาวสูงกว่าเด่น ดาวหนักกว่าเด่น คล้อยตามกัน

      ข้อมูลจากตารางที่ 6 ซึ่งมีเพียง 3 คน จะได้จำนวนคู่ทั้งหมดที่เป็นไปได้ 3 คู่ สรุปได้ว่ามีลำดับที่ขัดแย้ง ( discordant pair เขียนย่อแทนว่า D ) หนึ่งคู่และมีลำดับคล้อยตามกัน ( concordant pairs เขียนย่อว่า C ) 2 คู่ ดังนั้น ถ้าให้ความสูงเป็นตัวแปรอิสระ และน้ำหนักเป็นตัวแปรตาม ถ้าเราจะทำนายน้ำหนักของคนๆหนึ่งโดยทราบส่วนสูง ก็ควรทำนายในลักษณะคล้อยตามกันจะมีความถูกต้องมากกว่า กล่าวคือ ถ้าทราบว่าสูงมากควรทำนายว่าหนักมากด้วย ทั้งนี้เพราะการจัดลำดับนั้นมีจำนวนคู่ที่คล้อยตามกันมากกว่า จำนวนคู่ที่ขัดแย้งกัน ดังนั้นในการทำนายเช่นนี้ จะมีความผิดพลาดไป 1 คู่ นั่นคือ E 2 = 1 นั่นเอง

      สำหรับการหาค่า E 1 คือการหาความผิดพลาดในการทำนายโดยดูจากอันดับของตัวแปรตามแต่เพียงอย่างเดียว และไม่ได้ใช้ความรู้เกี่ยวกับอันดับทางตัวแปรอิสระเข้ามาช่วยเลยนั้น วิธีทำก็คือจับเอาคู่ใดคู่หนึ่งออกมาเปรียบเทียบแล้วทำนายทางด้านน้ำหนัก (ตัวแปรตาม) อย่างเดียว สมมุติว่าเป็นคู่ของดาวกับเดือน การทำนายคงจะต้องใช้หลักการสุ่มเป็นสำคัญ เช่น ถ้าสุ่มหยิบได้ชื่อ ดาวขึ้นมาก็บอกว่า ดาวหนักมากกว่าเดือน (ซึ่งถูกต้องตามความเป็นจริง) หรือถ้าสุ่มได้เดือนก็บอกว่าเดือนหนักกว่าดาว (ซึ่งไม่ถูกต้องตามความเป็นจริง) นั่นคือถ้าสุ่มแบบนี้หลายๆครั้งเป็นระยะเวลายาวนาน จะพบว่าโอกาสของการทำผิดเท่ากับครึ่งหนึ่งของจำนวนการสุ่มครั้งหนึ่งของจำนวนการสุ่มทั้งหมด นั่นคือเกิดความผิดพลาดเป็น 0.50 สำหรับในกรณีนี้มีคู่ที่เป็นไปได้ทั้งหมด 3 คู่ จึงเกิดความผิดพลาดทั้งหมด = 0.5 x 3 = 1.5 ครั้ง ซึ่งเลขจำนวนนี้ก็คือค่า E 1 นั่นเอง


          C คือจำนวนคู่ที่มีลำดับคล้อยตามกันทั้งหมด

          D คือจำนวนคู่ที่มีลำดับขัดแย้งกันทั้งหมด

สำหรับค่า untied pairs นั้นคือจำนวน C+D นั้นเอง แต่เพื่อความเข้าใจในการจัดคู่ทั้งหมดของข้อมูลแบบตาราง หัวข้อแทรกต่อไปนี้จะสร้างความเข้าใจในเรื่องการจัดคู่และจะได้ใช้ต่อไปในเรื่องการคำนวณหาค่าสถิติแบบ Somer ‘s d, Kendall 's Tau ต่างๆ

Tied pairs และ Untied pairs (จำนวนคู่แบบผูกและแบบไม่ผูก) ถ้าสมมุติมีข้อมูลจำนวนทั้งหมด 100 หน่วย จะคำนวณหาจำนวนคู่ทั้ง tied pairs และ untied pairs ได้ดังนี้

ตารางที่ 7 ข้อมูลไขว้ระหว่างการศึกษาและรายได้มีดังนี้

การศึกษา
สูง
กลาง
ต่ำ
รายได้
สูง
20
10
5
กลาง
10
10
10
ต่ำ
5
10
20



ควรทำนายว่ามีรายได้สูงด้วย เพราะมีคู่ที่มีลักษณะคล้อยตามกันมากกว่าคู่ที่ขัดแย้งกัน เครื่องหมายจึงได้บวก และการทำนายเช่นนี้จะลดความผิดพลาดลงได้ 55%

เนื่องจากสูตรของ Gamma ไม่ได้ใช้คู่ที่ผูกอยู่กับแถวนอนหรือแถวตั้งเข้ามาเกี่ยวข้องเลย การหาจำนวนคู่ที่คล้อยตามกันและขัดแย้งกันไม่ได้บ่งบอกว่าตัวแปรใดเป็นตัวแปรอิสระ ตัวแปรใดเป็นตัวแปรตาม ค่า Gamma จึงเป็น Symmetric หรือ indirectional statistic (ไม่บอกทิศทาง)

ตัวอย่างข้อมูลที่มีคู่ที่ขัดแย้งกันมากกว่าคู่ที่คล้อยตามกัน

ตารางที่ 8 ข้อมูลไขว้ระหว่างการศึกษาและรายได

      Gamma มีค่าผันแปรอยู่ระหว่าง – 1 ถึง +1 แต่ไม่เป็นปัญหาในการตีความ เพราะต้องแยกเครื่องหมายออกจากตัวเลข ความหมายของตัวเลขยังอิงอยู่กับหลัก probability คือดูค่า 0 ถึง 1 หรือเทียบเป็นเปอร์เซนต์คือ จาก 0 ถึง 100 เปอร์เซ็นต์

      ค่า – 1 หมายถึง คู่แบบไม่ผูก ( untied pairs ) ทุกคู่เป็นคู่ที่ขัดแย้งกัน ส่วนค่า + 1 คือคู่แบบไม่ผูกทุกคู่เป็นคู่ที่คล้อยตามกัน

      โดยสรุป ค่า Gamma เป็นวิธีที่เปลี่ยนจากการดูข้อมูลเป็นกลุ่มในแต่ละเซล (เช่น แบบของ Lambda ) มาเป็นการศึกษาเป็นรายกรณี คือเปรียบเทียบกันเป็นคู่ๆ ซึ่งมีความละเอียดกว่าแบบ Lambda มาก อย่างไรก็ตาม Gamma ก็ไม่ได้เอาคู่ที่เป็นแบบผูก ( tied pairs ) มาศึกษาด้วย ซึ่งถ้าจำนวนคู่แบบผูกมีเป็นจำนวนมากการตีความหมายของ Gamma ก็จะมีการบิดพลิ้วไปจากข้อเท็จจริงมาก อันเป็นจุดอ่อนของ Gamma

      ผลกระทบของผลรวมของแถว (นอนหรือตั้ง) ต่อค่า Gamma ถ้าผลรวมมีความเบ้จะทำให้เกิดจำนวนคู่แบบผูก มีมากกว่าจำนวนคู่แบบไม่ผูก , ค่า Gamma เป็นค่าที่หาจากคู่ที่ไม่ผูกโดยตรงซึ่งได้ลดจำนวนลงถ้าจำนวนคู่ที่ผูกเพิ่มขึ้น ดังนั้น การสรุปความสัมพันธ์ของตารางทั้งตารางเกิดจากการดูจำนวนคู่ซึ่งเป็นส่วนน้อย จึงเป็นข้อสรุปที่ไม่แม่นยำและดูไม่สมเหตุสมผลนัก ดังนั้นตารางที่จะใช้หาค่า Gamma จึงควรเป็นตารางที่มีผลรวมกระจายสม่ำเสมอกัน และข้อควรระมัดระวังที่ควรสังเกต คือ การจัดลำดับตัวแปรทางแถวนอนและแถวตั้ง ต้องอยู่ในลักษณะมาก > น้อย หรือ น้อย > มาก เหมือนกัน

 

 

 
 
  © Copyright 2006-2007 Astyleplus.net All Rights Reserved. Design by Interspire