บทที่ 2 การเก็บรวบรวมและสำรวจข้อมูล

การสำรวจข้อมูลโดยใช้ฮิสโทแกรม

ในการพล็อตฮิสโทแกรม เราจะต้องเริ่มจากการอ่านข้อมูลและจัดเตรียมข้อมูลที่จะพล็อตฮิสโทแกรมก่อน จากนั้นเราจึงจะใช้คำสั่งพล็อตฮิสโทแกรม ซึ่งมีขั้นตอนดังนี้

ขั้นตอนที่ 1: เรียกใช้คำสั่ง read.csv เพื่ออ่านข้อมูลจากไฟล์ชื่อ average-income.csv และนำมาจัดเก็บไว้ใน data frame ชื่อ df โดยใช้คำสั่งดังนี้

                  
                    df <- read.csv ("average-income.csv", encoding="UTF-8")
                  
                

ขั้นตอนที่ 2: เตรียมข้อมูลที่จะใช้สำหรับการพล็อตฮิสโทแกรม สมมติว่าเราต้องการพล็อตฮิสโทแกรมของข้อมูลในคอลัมน์ที่ 10 เราจะต้องอ่านข้อมูลในคอลัมน์ที่ 10 มาเก็บไว้ในตัวแปร y ก่อน โดยใช้คำสั่งดังนี้

                  
                    y <- df[:,10]
                  
                

โดยที่ df[:, 10] เป็นการเข้าถึงข้อมูลทุกแถวของคอลัมน์ที่ 10 ใน data frame ชื่อ df


ขั้นตอนที่ 3: หลังจากเตรียมข้อมูลที่จะพล็อตแล้ว ขั้นตอนต่อมาก็คือการพล็อตฮิสโทแกรมด้วยฟังก์ชัน hist โดยใช้คำสั่งดังนี้

                  
                    hist(y, xlab = "รายได้เฉลี่ยต่อครัวเรือนต่อเดือน")
                  
                

R Code

                  
                    df <- read.csv ("average-income.csv", encoding="UTF-8")
                    y <- df[:,10]
                    hist(y, xlab = "รายได้เฉลี่ยต่อครัวเรือนต่อเดือน")