การคำนวณค่าความสัมพันธ์
การคำนวณหาค่าความสัมพันธ์ของข้อมูลโดยใช้โปรแกรมภาษา Python สามารถทำได้ ดังนี้
ขั้นตอนที่ 1: import ไลบรารี scipy เพื่อคำนวณค่าทางสถิติ และ ไลบรารี pandas สำหรับอ่านข้อมูล โดยใช้คำสั่ง ดังนี้
from scipy import stats
import pandas as pd
ขั้นตอนที่ 2: ใช้ฟังก์ชัน read_csv จากไลบรารี pandas อ่านข้อมูลจากไฟล์ชื่อ predator_dataset.csv แล้วในมาเก็บไว้ใน data frame ชื่อ data โดยใช้คำสั่งดังนี้
data=pd.read_csv('predator_dataset.csv')
ขั้นตอนที่ 3: คำนวณค่าความสัมพันธ์ โดยใช้ฟังก์ชัน linregress จากไลบรารี scipy โดยใช้คำสั่งดังนี้
_,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])
โดยที่ cor คือ ตัวแปรที่ใช้สำหรับรับค่าความสัมพันธ์
data['Wildebeest'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Wildebeest ของ data frame ชื่อ data
data['Zebra'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Zebra ของ data frame ชื่อ data
_ (underscore) คือ ตัวแปรที่ใช้สำหรับรับค่าที่เราไม่สนใจ
from scipy import stats
import pandas as pd
data=pd.read_csv('predator_dataset.csv')
_,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])