บทที่ 3 การวิเคราะห์ข้อมูล

การวิเคราะห์สมการถดถอยเชิงเส้น

การวิเคราะห์สมการถดถอยเชิงเส้น โดยใช้โปรแกรมภาษา Python สามารถทำได้ดังนี้

ขั้นตอนที่ 1: import ไลบรารี scipy เพื่อคำนวณค่าทางสถิติ และ ไลบรารี pandas สำหรับอ่านข้อมูล โดยใช้คำสั่ง ดังนี้

                  
                    from scipy import stats
                    import pandas as pd
                  
                

ขั้นตอนที่ 2: ใช้ฟังก์ชัน read_csv จากไลบรารี pandas อ่านข้อมูลจากไฟล์ชื่อ predator_dataset.csv แล้วในมาเก็บไว้ใน data frame ชื่อ data โดยใช้คำสั่งดังนี้

                  
                    data=pd.read_csv('predator_dataset.csv')
                  
                

ขั้นตอนที่ 3: หาค่าความชัน (slope) และจุดตัดแกน (intercept) โดยใช้ฟังก์ชัน linregress จากไลบรารี scipy โดยใช้คำสั่งดังนี้

                  
                    slope,intercept, _, _, _ = stats.linregress(data[:,0], data[:,1])
                  
                

โดยที่ slope คือ ตัวแปรที่ใช้สำหรับรับค่าความชัน
intercept คือ ตัวแปรที่ใช้สำหรับรับค่าจุดตัดแกน
data[:,0] คือ ข้อมูลทุกแถวในคอลัมน์ที่ 0 ของ data frame ชื่อ data
data[:,1] คือ ข้อมูลทุกแถวในคอลัมน์ที่ 1 ของ data frame ชื่อ data
_ (underscore) คือ ตัวแปรที่ใช้สำหรับรับค่าที่เราไม่สนใจ

Python Code

                  
                    from scipy import stats
                    import pandas as pd
                    data=pd.read_csv('predator_dataset.csv')
                    slope,intercept, _, _, _ = stats.linregress(data[:,0], data[:,1])