ฉันลองรันโค้ดนี้ใน windows และมันทำงานได้อย่างไม่มีที่ติ แต่ใน Ubuntu ทันทีที่ฉันรันโค้ดนี้ Ubuntu จะหยุดทำงานเป็นเวลา 3-4 นาที จากนั้นผลลัพธ์ก็ออกมา จากนั้น Ubuntu จะทำงานล่าช้าจนกว่าฉันจะรีสตาร์ท
นำเข้า numpy เป็น np
นำเข้าแพนด้าเป็น pd
จาก sklearn.preprocessing นำเข้า StandardScaler
จาก sklearn.model_selection นำเข้า train_test_split
จากการประมวลผลล่วงหน้าการนำเข้า sklearn
จาก xgboost นำเข้า XGBClassifier
นำเข้า xgboost เป็น xgb
จาก sklearn.metrics นำเข้า Accuracy_score
dataset_len = 40000000
dlen = int (ชุดข้อมูล_len/2)
X_11 = pd.Series(np.random.normal(2,2,dlen))
X_12 = pd.Series(np.random.normal(9,2,dlen))
X_1 = pd.concat([X_11, X_12]).reset_index(drop=True)
X_21 = pd.Series(np.random.normal(1,3,dlen))
X_22 = pd.Series(np.random.normal(7,3,dlen))
X_2 = pd.concat([X_21, X_22]).reset_index(drop=True)
X_31 = pd.Series(np.random.normal(3,1,dlen))
X_32 = pd.Series(np.random.normal(3,4,dlen))
X_3 = pd.concat([X_31, X_32]).reset_index(drop=True)
X_41 = pd.Series(np.random.normal(1,1,dlen))
X_42 = pd.Series(np.random.normal(5,2,dlen))
X_4 = pd.concat([X_41, X_42]).reset_index(drop=True)
Y = pd.Series(np.repeat([0,1],dlen))
df = pd.concat([X_1, X_2, X_3, X_4, Y], แกน=1)
df.columns = ['X1', 'X2', 'X3', 'X_4', 'Y']
df.head()