Hotelling's T2

ถ้าเมตริกซ์ความแปรปรวนและความแปรปรวนร่วมถูกประมาณค่าจากกลุ่มตัวอย่างแล้วทดสอบด้วยสถิติที่เหมาะสมในกรณีของการทดสอบตัวแปรหลายตัว (multivariate) จะเป็นการขยายเพิ่มการทดสอบ t-test ซึ่งเป็นสมการที่คล้ายคลึงกับการทดสอบไคสแควร์ แต่เมตริกซ์ความแปรปรวนและความแปรปรวนร่วมจะถูกแทนที่ด้วยการประมาณค่าที่ไม่ลำเอียงของ S นั่นคือสถิติการทดสอบตัวแปรหลายตัวจะใช้สัญลักษณ์ T2 โดย Hotelling (1931) และโดยปกติค่าสถิติ Hotelling's T2 จะมีค่าเท่ากับ

ซึ่งมีความเกี่ยวข้องกับการแจกแจง F ดังนี้

เมื่อ p คือจำนวนของตัวแปรที่สังเกตได้ และ n เท่ากับขนาดของกลุ่มตัวอย่าง ให้สังเกตว่าเมื่อ p = 1 (กรณีเป็น Univariate) จะลดความสัมพันธ์ลงเหลือเพียง t2 = F1,n-1

การทดสอบความแตกต่างระหว่าง 2 กลุ่ม

สถิติ Hotelling สามารถใช้ทดสอบนัยสำคัญระหว่างกลุ่มตัวอย่าง 2 กลุ่มในกรณีที่มีชุดของตัวแปรตามหลายตัว ซึ่งกรณีที่มีตัวแปรตามตัวเดียว สถิติ t นิยามได้ว่า

กับ

จากสมการข้างต้น สามารถขยายสถิตินี้ออกมาให้ใช้กับกรณีที่มีตัวแปรตามหลายตัวสามารถเขียนเป็นสมการใหม่ได้ว่า

หรือเขียนในรูปอย่างง่ายคือ

ในสูตรนี้สามารถใช้คำนวณค่าสถิติ Hotelling's T2 ได้ง่ายมากกว่า อย่างไรก็ตาม เพราะว่าตัวแปรที่เกี่ยวข้องมีหลายตัวแปร จะต้องใช้สัญลักษณะต่าง ๆ ในเมตริกซ์ ดังนั้นสถิติ Hotelling จึงสามารถเขียนได้อีกรูปหนึ่งดังนี้

Hotelling ได้แสดงความสัมพันธ์ของสถิตินี้กับการแจกแจง F ว่า

เมื่อจำนวนของตัวแปรตามคือหนึ่ง (p = 1) ความสัมพันธ์ก็จะลดลงเหลือ t2 = F1,n1+n2-2
ตัวอย่างในการคำนวณด้วยสถิติ Hotelling's T2 นี้ สมมติว่ามีกลุ่มตัวอย่าง 2 กลุ่มที่บริษัทเอกชนแห่งหนึ่งต้องการสำรวจ โดยกลุ่มตัวอย่างแรกเป็นบ้าน 45 หลังคาเรือนที่ติดเครื่องปรับอากาศ (n1 = 45) และกลุ่มที่สองเป็นบ้าน 55 หลังคาเรือนที่ไม่ติดเครื่องปรับอากาศ (n2 = 55) สมมติว่ามีการวัดตัวแปรตาม 2 ตัวคือบริมาณไฟฟ้าที่ใช้ (กิโลวัตต์ ต่อ ชั่วโมง) โดยวัดใน 2 ช่วงเวลา คือช่วงเวลากลางวัน และช่วงเวลากลางคืน ตั้งแต่เดือนพฤษภาคมถึงเดือนสิงหาคม โดยบริษัทเอกชนนี้ต้องการเปรียบเทียบปริมาณการใช้ไฟฟ้าระหว่างบ้านที่ติดเครื่องปรับอากาศกับไม่ติดเครื่องปรับอากาศ มีข้อมูลของกลุ่มตัวอย่างที่เกี่ยวข้องดังนี้

ใช้สถิติ Hotelling's T2 ในการคำนวณทดสอบความแตกต่างระหว่างสองกลุ่มได้ผลดังนี้

แทนค่าต่าง ๆ ในสมการ Hotelling's T2 ได้ดังนี้

แล้วตามด้วยสถิติ F ได้ค่าเท่ากับ

F = [97/(98)(2)]93.55 = 46.29

ที่ระดับนัยสำคัญทางสถิติ 0.01 และ df = 2,97 สรุปได้ว่ามีนัยสำคัญทางสถิติแตกต่างกันระหว่าง 2 กลุ่ม



บรรณานุกรม
Manly, Bryan F. J. Multivariate Statistical Methods. London : Chapman & Hall, 1994.
Marcoulides, George A. and Hershberger, Scott L.Multivariate Statistical Methods : A First Course. New Jersey : Lawrence Erlbaum Associates, Inc., 1997.

เอกสารชุดนี้จัดทำโดย : ฉัตรศิริ ปิยะพิมลสิทธิ์. มิถุนายน ๒๕๔๖