บทที่ 3 การวิเคราะห์ข้อมูล

การคำนวณค่าความสัมพันธ์

การคำนวณหาค่าความสัมพันธ์ของข้อมูลโดยใช้โปรแกรมภาษา Python สามารถทำได้ ดังนี้

ขั้นตอนที่ 1: import ไลบรารี scipy เพื่อคำนวณค่าทางสถิติ และ ไลบรารี pandas สำหรับอ่านข้อมูล โดยใช้คำสั่ง ดังนี้

         
          from scipy import stats
          import pandas as pd
         
        

ขั้นตอนที่ 2: ใช้ฟังก์ชัน read_csv จากไลบรารี pandas อ่านข้อมูลจากไฟล์ชื่อ predator_dataset.csv แล้วในมาเก็บไว้ใน data frame ชื่อ data โดยใช้คำสั่งดังนี้

         
          data=pd.read_csv('predator_dataset.csv')
         
        

ขั้นตอนที่ 3: คำนวณค่าความสัมพันธ์ โดยใช้ฟังก์ชัน linregress จากไลบรารี scipy โดยใช้คำสั่งดังนี้

         
          _,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])
         
        

โดยที่ cor คือ ตัวแปรที่ใช้สำหรับรับค่าความสัมพันธ์
data['Wildebeest'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Wildebeest ของ data frame ชื่อ data
data['Zebra'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Zebra ของ data frame ชื่อ data
_ (underscore) คือ ตัวแปรที่ใช้สำหรับรับค่าที่เราไม่สนใจ

Python Code

         
          from scipy import stats
          import pandas as pd
          data=pd.read_csv('predator_dataset.csv')
          _,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])