機械学習で以下のプログラムに追記したいです。
学習用データ
良性テスト用データ
悪性テスト用データ
の3つのCSVファイルを使い
評価を二回
2個の誤検知
第1種誤り確率:不正アクセスを正規アクセスと誤判定した
第2種誤り確率:正規アクセスを不正アクセスと誤判定した
というプログラムを作りたいです。
参考になるサイトや参考プログラム、
アドバイスなどありましたら教えてください。
python
1import pandas as pd 2from sklearn.model_selection import train_test_split 3from sklearn.svm import SVC 4from sklearn.metrics import accuracy_score 5 6# データの読み込み --- (*1) 7analysisresults_data = pd.read_csv("analysis_resultstableZZZ.csv",encoding="utf-8") 8 9# データをラベルと入力データに分離する --- (*2) 10y = analysisresults_data.loc[:,"analysis_result"] 11x = analysisresults_data.loc[:,["id","signatures_id","hit_count"]] 12 13# 学習用とテスト用に分離する --- (*3) 14x_train, x_test, y_train, y_test = train_test_split(x, y, test_size = 0.2, train_size = 0.8, shuffle = True, random_state=0) 15 16# 学習する --- (*4) 17clf = SVC() 18clf.fit(x_train, y_train) 19 20# 評価する --- (*5) 21y_pred = clf.predict(x_test) 22print("正解率 = " , accuracy_score(y_test, y_pred)) 23
解決しました。。。。。。。。
回答1件
あなたの回答
tips
プレビュー