既存データに重複データを追加したい。
python2.7.15でCSVファイルから読み出したデータを基に、機械学習(クラスタリング)をするプログラムを作成しています。
データを読み出し散布図を作成するところで、躓いたので教えていただきたいです。
質問
- SecIPで読み取ったデータを基にグラフを作成する。[x軸=Time, y軸=Bytes]
- SecIPで既存のデータと同じデータが出てきた際に、既存のデータのグラフに重複したデータの[x軸=Time, y軸=Bytes=]をプロットする。
- SecIPはグラフのタイトルとして表示する。
現状は、CSVファイルを正しく読み取れているか確認するプログラムになっています。
ここにどのような機能を追加することで、上記で質問したことを達成することができるか教えて頂きたいです。
該当のソースコード
#-*-coding:utf-8 -*- from sklearn.cluster import KMeans from matplotlib import pyplot as plt import numpy as np import csv axis = open('data/Axis.csv', 'r') axis_data = csv.reader(axis) header = next(axis_data) for row in axis_data: x = row[4] y = row[1] plt.scatter(x,y) plt.show()
補足情報(FW/ツールのバージョンなど)
ps.指摘ありがとうございます。まだまだ説明不足なところがあると思いますが…回答よろしくお願いいたします。
質問に書かれたソースコードでは、'data/Axis.csv'から読みだしたデータの2項目(Time)と5項目(SecIP)で散布図を書こうとしているのだと思われますが、TimeもSecIPも数値ではないので、そのままでは散布図のx,y座標に使えません。「SecIPで新しいデータが出てきた際に、グラフを作成する」の"新しいデータ"というのを判断する基準や、その際に作成するグラフのデータが何か明示されていないので、意味が判りません。「グラフにTime,Bytesなどのデータを格納する」も判りません(グラフはデータを表示するものであって、データを格納するものではありませんから)
回答1件
あなたの回答
tips
プレビュー