Scatter Plots

เมื่อข้อมูลมี 2 ตัวแปรคู่กัน คือ X และ Y และมีคุณลักษณะของข้อมูลเป็นตัวเลข ในแต่ละค่าของข้อมูลสามารถจับคู่กันได้เช่น (14, 5.2) หรือ (27.63, 18.9) เมื่อค่า x คือตัวเลขตัวแรกมาจากตัวแปร X และค่า y คือตัวเลขตัวที่สองมาจากตัวแปร Y เมื่อจะจับคู่ข้อมูลทั้งหมดของตัวแปร X และ Y เป็นคู่ลำดับ (x, y) ได้แล้ว ต้องการดูการแจกแจงของข้อมูล เราสามารถนำมาสร้างเป็นแผนภาพได้เรียกว่า "แผนภาพกระจัดกระจาย" (Scatter Plots)
แผนภาพกระจัดกระจายจะประกอบไปด้วยเส้นแนวนอนเป็นเส้นแกน x สำหรับค่าในตัวแปร X และเส้นแนวตั้งเป็นเส้นแกน y สำหรับค่าในตัวแปร Y ในรูปภาพ 2 แสดงค่าที่ตำแหน่ง x = 4.5 บนเส้นแกนนอนและค่า y = 15 บนเส้นแกนตั้ง

รูปภาพ 3 แสดงแผนภาพกระจัดกระจาย a) เป็นรูปร่างของกราฟสำหรับลงจุดข้อมูล b) เป็นจุดที่เกิดจากข้อมูลชุด x และ y ที่ตำแหน่ง (4.5, 15)

ข้อมูลในตาราง 4 เป็นคู่ของ X = ความเร็วลมของพายุ และ Y = ระยะทางที่พายุเคลื่อนที่ในครึ่งชั่วโมง มีข้อมูลดังนี้

ตาราง 4 แสดงความเร็วลมของพายุและระยะทางที่พายุเคลื่อนที่ในครึ่งชั่วโมง

12345678910111213
X0.000.060.500.550.750.750.791.001.041.221.641.731.73
Y0.201.801.300.600.500.603.903.305.305.707.003.506.80

จับคู่ข้อมูลในตารางมาลงจุดในแผนภาพกระจัดกระจาย ในลักษณะของคู่ลำดับ (xi, yi) เช่น (x1, y1) = (0.00, 0.20) (x4, y4) = (0.55, 0.60) เป็นต้น แผนภาพกระจัดกระจายปรากฏดังรูปภาพ 4

รูปภาพ 4 แสดงแผนภาพกระจัดกระจายของข้อมูลในตาราง 4

มีข้อสังเกตจากแผนภาพกระจัดกระจายดังนี้
1. มีแนวโน้มที่ y เพิ่มขึ้นเมื่อ x เพิ่มขึ้น นั่นคือพายุเคลื่อนที่ในระยะมากขึ้นเมื่อพายุมีความเร็วลมสูงขึ้น (สหสัมพันธ์ระหว่างตัวแปรเป็นบวก)
2. ปรากฏว่าค่าของ y สามารถจะถูกทำนายได้ด้วย x เพื่อลากเส้นตรงเข้าใกล้จุดที่ลงไว้ให้มากที่สุด

เอกสารชุดนี้จัดทำโดย : ฉัตรศิริ ปิยะพิมลสิทธิ์. เมษายน ๒๕๔๔