การสำรวจข้อมูลโดยใช้กราฟกล่อง
ในทำนองเดียวกันถ้าเราต้องการพล็อตกราฟกล่อง เราจะเริ่มจากการอ่านข้อมูลด้วยคำสั่งในตัวอย่างก่อนหน้านี้ จากนั้นเราจะต้องเตรียมข้อมูลที่จะพล็อตกราฟ แล้วใช้ฟังก์ชันที่ใช้สำหรับพล็อตกราฟกล่อง ซึ่งมีขั้นตอนดังนี้
ขั้นตอนที่ 1: เรียกใช้คำสั่ง read.csv เพื่ออ่านข้อมูลจากไฟล์ชื่อ average-income.csv และนำมาจัดเก็บไว้ใน data frame ชื่อ df โดยใช้คำสั่งดังนี้
df <- read.csv ("average-income.csv", encoding="UTF-8")
ขั้นตอนที่ 2: เตรียมข้อมูลที่จะใช้สำหรับการพล็อตกราฟกล่อง สมมติว่าเราต้องการพล็อตกราฟกล่อง โดยให้แกนนอนเป็นข้อมูลในคอลัมน์ที่ 1 และแกนตั้งเป็นข้อมูลของทุกแถวในคอลัมน์ที่ 2 ถึง 11 ดังนั้นก่อนการพล็อตกราฟเราจะต้องอ่านข้อมูลในคอลัมน์ที่ 1 มาเก็บไว้ในตัวแปร x และอ่านข้อมูลทุกแถวในคอลัมน์ที่ 2 ถึง 11 มาเก็บไว้ในตัวแปร y โดยใช้คำสั่งดังนี้
x <- df[:,1]
y <- t(df[:, c(2:11)])
เนื่องจากข้อมูลที่ต้องการพล็อตกราฟกล่องเป็นข้อมูลตามแนวแถวแต่คำสั่งพล็อตกราฟในภาษา R พล็อตตามแนวคอลัมน์ ดังนั้นจึงต้องมีการทรานโพสก่อนการพล็อตด้วยคำสั่ง t
ขั้นตอนที่ 3: พล็อตกราฟกล่องโดยใช้คำสั่ง boxplot ดังนี้
boxplot(y, main = "กราฟแสดงรายได้ตามกลุ่มจังหวัด", names = x, las = 2)
เนื่องจากมีบางค่าในแนวแกนนอนเป็นข้อความที่ยาวจนไปทับค่าที่อยู่ติดกันบนแกนนอน เราสามารถแก้ปัญหานี้ได้โดยการหมุนข้อความเป็นแนวตั้งโดยการกำหนดค่า las=2
df <- read.csv ("average-income.csv", encoding="UTF-8")
x <- df[:,1]
y <- t(df[:, c(2:11)])
boxplot(y, main = "กราฟแสดงรายได้ตามกลุ่มจังหวัด", names = x, las = 2)