回答率: 85.48%

質問するログイン新規登録

トップに関する質問 K-means法でデータを文字ごとにプロットしたいです。

編集履歴

質問編集履歴

1

情報の修正

2018/07/04 13:03

投稿

スコア59

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,88 +1,4 @@
 K-means法でデータを文字ごとにプロットしたいです。
-```ここに言語を入力
-{'ID':'AW0495','NAME':'Tom','AGE':'30','SCORE':'A'}{'ID':'SE2947','NAME':'John','AGE':'21','SCORE':'C'}
-・
-・
-・
-{'ID':'AW0495','NAME':'Tom','SCORE2':'B'}
-```
-という連続したjsonがあります。このjsonのSCORE　を縦軸に、SCORE2を横軸にしてIDが同じものを散布図のように値をプロットしたいです。縦軸は軸の下からD・C・B・Aの４つの部分に分かれていて、横軸は軸の左からE・D・C・B・Aの５つの部分に分かれています。
-jsonの中には、SCOREかSCORE2かのどちらかしかデータがないIDもあり、そのようなIDのデータは使わないこととします。
-```ここに言語を入力
-import pandas as pd
-import numpy as np
-from sklearn.cluster import KMeans
-import json
-score = []
-score2 = []
-decoder = json.JSONDecoder()
-f = open('data.json', 'r')
-for line in f.readlines():
-    data = decoder.decode(line)
-    if data['SCORE'] != null:
-    	score.append(data['SCORE’])
-    else:
-    	score2.append(data['SCORE2'])
-cust_array = np.array([score,score2])
-pred = KMeans(n_clusters=2).fit_predict(cust_array)
-```
-とコードを書きました。
-しかし、ValueError: setting an array element with a sequence.　とエラーが出ました。
-今コードにたりないのは、
-・SCOREかSCORE2かのどちらかしかデータがないIDのデータを削除する
-・縦軸を４つの部分に分け、横軸を５つの部分に分ける
-という点です。他にもあるかもしれませんが・・・。