質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

0回答

2554閲覧

pythonのkeyerrorの原因を教えてください。

akasaakasa

総合スコア6

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/11/08 14:19

前提・実現したいこと

pythonでデータフレームを使っていると以下のようなkeyerrorが出ます。
ダミー化をしたことでエラーが出たと思われます。原因を教えてください。

データフレームの中身はすべて数値です。
for文中ではKmeansでクラスタリングしたものをダミー化しています。

発生している問題・エラーメッセージ

Traceback (most recent call last): File "C:\ex.py", line 65, in <module> print(df2[column_name].value_counts()[1], column_name) File "C:\Python37\site-packages\pandas\core\series.py", line 1064, in __getitem__ result = self.index.get_value(self, key) File "C:\Python37\site-packages\pandas\core\indexes\base.py", line 4723, in get_value return self._engine.get_value(s, k, tz=getattr(series.dtype, "tz", None)) File "pandas\_libs\index.pyx", line 80, in pandas._libs.index.IndexEngine.get_value File "pandas\_libs\index.pyx", line 88, in pandas._libs.index.IndexEngine.get_value File "pandas\_libs\index.pyx", line 131, in pandas._libs.index.IndexEngine.get_loc File "pandas\_libs\hashtable_class_helper.pxi", line 690, in pandas._libs.hashtable.UInt64HashTable.get_item File "pandas\_libs\hashtable_class_helper.pxi", line 696, in pandas._libs.hashtable.UInt64HashTable.get_item KeyError: 1

該当のソースコード

python

1df = pd.read_csv('???.csv', sep = ',') 2 3for column_name in df: 4 cust_array = np.array([df[column_name].tolist()],np.int32)    #Kmeansでクラスタリング 5 cust_array = cust_array.T 6 if df[column_name].nunique() < 4: 7 pred = KMeans(n_clusters=df[column_name].nunique()).fit_predict(cust_array) 8 else: 9 pred = KMeans(n_clusters=4).fit_predict(cust_array) 10 11 df[column_name]=pred 12 13 if column_name != 'AAA' :    #AAA列以外をダミー化 14 df_dummy = pd.get_dummies(df[column_name],prefix=column_name,prefix_sep='_') 15 df = pd.concat([df.drop([column_name],axis=1),df_dummy],axis=1) 16 17df.set_index('AAA', inplace=True)    #AAA列をインデックスにする 18df2=df[df.index == 1].copy()       #インデックスが1の行を取り出す 19 20for column_name in df2:         #各列の1の個数を出力 21 print(df2[column_name].value_counts()[1])

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2019/11/09 04:50

df2[column_name].value_counts()の中に1は存在しているのですか?
akasaakasa

2019/11/09 04:57

はい、存在しています。 printも数回は実行されるのですが、df2の全ての列の処理が終わる前にエラーがでて途中で止まってしまうという状況です。
meg_

2019/11/09 05:01

エラーが発生する列にそのキー「1」が存在しないのだと思います。
akasaakasa

2019/11/09 05:13

私もそう思って、df2[column_name].value_counts(ascending=True)で確認したのですが、1がない列はありませんでした。
akasaakasa

2019/11/09 05:19

それでもやはり1が存在しないかもしれません。 dfはKmeansでクラスタリングでしてダミー化したものなので、その可能性はあります。 ちなみに1が存在しないときは上記のエラーがでるのですか?
meg_

2019/11/09 05:32

df2[column_name].value_counts()の戻り値はSeriesなので、そのindexに「1」がないとキーエラーが発生します。 上記で「1がない列はありません」というのはdf2[column_name].value_counts().indexの中に「1」があったという認識で間違いないでしょうか?
akasaakasa

2019/11/09 05:40

すいません、それは私の間違いです。 おそらく1がない列があったと思われます。 クラスタリングにより実行ごとに各列の1の個数は多少変化するため、1がない時もあります。
tanishi_a

2019/11/09 13:36 編集

再現する CSV ファイルを質問文に載せたほうが早いのでは。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問