บทที่ 2 การเก็บรวบรวมและสำรวจข้อมูล

การสำรวจข้อมูลโดยใช้กราฟกล่อง

ในทำนองเดียวกันถ้าเราต้องการพล็อตกราฟกล่อง เราจะเริ่มจากการอ่านข้อมูลด้วยคำสั่งในตัวอย่างก่อนหน้านี้ จากนั้นเราจะต้องเตรียมข้อมูลที่จะพล็อตกราฟ แล้วใช้ฟังก์ชันที่ใช้สำหรับพล็อตกราฟกล่อง ซึ่งมีขั้นตอนดังนี้

ขั้นตอนที่ 1: เรียกใช้คำสั่ง read.csv เพื่ออ่านข้อมูลจากไฟล์ชื่อ average-income.csv และนำมาจัดเก็บไว้ใน data frame ชื่อ df โดยใช้คำสั่งดังนี้

                  
                    df <- read.csv ("average-income.csv", encoding="UTF-8")
                  
                

ขั้นตอนที่ 2: เตรียมข้อมูลที่จะใช้สำหรับการพล็อตกราฟกล่อง สมมติว่าเราต้องการพล็อตกราฟกล่อง โดยให้แกนนอนเป็นข้อมูลในคอลัมน์ที่ 1 และแกนตั้งเป็นข้อมูลของทุกแถวในคอลัมน์ที่ 2 ถึง 11 ดังนั้นก่อนการพล็อตกราฟเราจะต้องอ่านข้อมูลในคอลัมน์ที่ 1 มาเก็บไว้ในตัวแปร x และอ่านข้อมูลทุกแถวในคอลัมน์ที่ 2 ถึง 11 มาเก็บไว้ในตัวแปร y โดยใช้คำสั่งดังนี้

                  
                    x <- df[:,1]
                    y <- t(df[:, c(2:11)])
                  
                

เนื่องจากข้อมูลที่ต้องการพล็อตกราฟกล่องเป็นข้อมูลตามแนวแถวแต่คำสั่งพล็อตกราฟในภาษา R พล็อตตามแนวคอลัมน์ ดังนั้นจึงต้องมีการทรานโพสก่อนการพล็อตด้วยคำสั่ง t


ขั้นตอนที่ 3: พล็อตกราฟกล่องโดยใช้คำสั่ง boxplot ดังนี้

                  
                    boxplot(y, main = "กราฟแสดงรายได้ตามกลุ่มจังหวัด", names = x, las = 2)
                  
                

เนื่องจากมีบางค่าในแนวแกนนอนเป็นข้อความที่ยาวจนไปทับค่าที่อยู่ติดกันบนแกนนอน เราสามารถแก้ปัญหานี้ได้โดยการหมุนข้อความเป็นแนวตั้งโดยการกำหนดค่า las=2

R Code

                  
                    df <- read.csv ("average-income.csv", encoding="UTF-8")
                    x <- df[:,1]
                    y <- t(df[:, c(2:11)])
                    boxplot(y, main = "กราฟแสดงรายได้ตามกลุ่มจังหวัด", names = x, las = 2)