บทที่ 2 การเก็บรวบรวมและสำรวจข้อมูล

การสำรวจข้อมูลโดยใช้ฮิสโทแกรม

ในการพล็อตฮิสโทแกรม เราจะต้องเริ่มจากการอ่านข้อมูลและจัดเตรียมข้อมูลที่จะพล็อตฮิสโทแกรมก่อน จากนั้นเราจึงจะใช้คำสั่งพล็อตฮิสโทแกรม ซึ่งมีขั้นตอนดังนี้

ขั้นตอนที่ 1: เรียกใช้คำสั่ง read.csv เพื่ออ่านข้อมูลจากไฟล์ชื่อ average-income.csv และนำมาจัดเก็บไว้ใน data frame ชื่อ df โดยใช้คำสั่งดังนี้

         
          df <- read.csv ("average-income.csv", encoding="UTF-8")
         
        

ขั้นตอนที่ 2: เตรียมข้อมูลที่จะใช้สำหรับการพล็อตฮิสโทแกรม สมมติว่าเราต้องการพล็อตฮิสโทแกรมของข้อมูลในคอลัมน์ที่ 10 เราจะต้องอ่านข้อมูลในคอลัมน์ที่ 10 มาเก็บไว้ในตัวแปร y ก่อน โดยใช้คำสั่งดังนี้

         
          y <- df[:,10]
         
        

โดยที่ df[:, 10] เป็นการเข้าถึงข้อมูลทุกแถวของคอลัมน์ที่ 10 ใน data frame ชื่อ df


ขั้นตอนที่ 3: หลังจากเตรียมข้อมูลที่จะพล็อตแล้ว ขั้นตอนต่อมาก็คือการพล็อตฮิสโทแกรมด้วยฟังก์ชัน hist โดยใช้คำสั่งดังนี้

         
          hist(y, xlab = "รายได้เฉลี่ยต่อครัวเรือนต่อเดือน")
         
        

R Code

         
          df <- read.csv ("average-income.csv", encoding="UTF-8")
          y <- df[:,10]
          hist(y, xlab = "รายได้เฉลี่ยต่อครัวเรือนต่อเดือน")