บทที่ 3 การวิเคราะห์ข้อมูล

การคำนวณค่าความสัมพันธ์

การคำนวณหาค่าความสัมพันธ์ของข้อมูลโดยใช้โปรแกรมภาษา Python สามารถทำได้ ดังนี้

ขั้นตอนที่ 1: import ไลบรารี scipy เพื่อคำนวณค่าทางสถิติ และ ไลบรารี pandas สำหรับอ่านข้อมูล โดยใช้คำสั่ง ดังนี้

                  
                    from scipy import stats
                    import pandas as pd
                  
                

ขั้นตอนที่ 2: ใช้ฟังก์ชัน read_csv จากไลบรารี pandas อ่านข้อมูลจากไฟล์ชื่อ predator_dataset.csv แล้วในมาเก็บไว้ใน data frame ชื่อ data โดยใช้คำสั่งดังนี้

                  
                    data=pd.read_csv('predator_dataset.csv')
                  
                

ขั้นตอนที่ 3: คำนวณค่าความสัมพันธ์ โดยใช้ฟังก์ชัน linregress จากไลบรารี scipy โดยใช้คำสั่งดังนี้

                  
                    _,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])
                  
                

โดยที่ cor คือ ตัวแปรที่ใช้สำหรับรับค่าความสัมพันธ์
data['Wildebeest'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Wildebeest ของ data frame ชื่อ data
data['Zebra'] คือ ข้อมูลในคอลัมน์ที่มีชื่อว่า Zebra ของ data frame ชื่อ data
_ (underscore) คือ ตัวแปรที่ใช้สำหรับรับค่าที่เราไม่สนใจ

Python Code

                  
                    from scipy import stats
                    import pandas as pd
                    data=pd.read_csv('predator_dataset.csv')
                    _,_,cor,_,_ = stats.linregress(data['Wildebeest'], data['Zebra'])