質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

808閲覧

csvのデータを辞書にしたいが上手くいかない

kaitotokai

総合スコア59

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2018/08/04 08:30

csvのデータを辞書にしたいが上手くいかないです。
画像のようなcsvデータがあります。
イメージ説明
このデータを、
data辞書に、

{"Tom":["AmericaCalforniaSan Diego2-3-40"],"Juddy":["AustorariaNew South WalesSydneyRyde city1-60"]}という形にしたいです。 コードに、 df = pd.read_csv("user.csv") data ={} for name, adress in df.iterrows(): name=str(name) adress=str(adress) if name not in data: data[name] = [] data[name].append(adress)

とコードを書くと、

{"Tom": ["1 AmericaCalforniaSan Diego2-3-40Name: 1, dtype: object"], "Juddy": ["2 AustorariaNew South WalesSydneyRyde city1-60Name: 2, dtype: object"]}

という意図した形でない辞書ができます。
Juddyキーのバリューは、”2AustorariaNew South WalesSydneyRyde city1-6”のようになっていて、2と余計なものが入っています。またName: 1, dtype: objectも余計です。

https://note.nkmk.me/python-pandas-dataframe-for-iteration/
のサイトを参考にして作りました。何が問題で、意図した辞書にならないのでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

問題解決能力が必要です。

データはしっかり読み取れているか?

私の環境では次のようになりました。

Python

1>>> df = pd.read_csv('user.csv') 2>>> df 3 Tom America 40 Tom Calfornia 51 Tom San Diego 62 Tom 2-3-40 73 Juddy Austoraria 84 Juddy New South Wales 95 Juddy Sydney 106 Juddy Ryde city 117 Juddy 1-60

Tom と America が列方向のタグになってしまっています。
ヘッダーが無いことを示さないとダメです。

Python

1>>> df = pd.read_csv('user.csv', header=None) 2>>> df 3 0 1 40 Tom America 51 Tom Calfornia 62 Tom San Diego 73 Tom 2-3-40 84 Juddy Austoraria 95 Juddy New South Wales 106 Juddy Sydney 117 Juddy Ryde city 128 Juddy 1-60

ループはしっかり回っているか?

覗いてみましょう。

Python

1>>> for name, address in df.iterrows(): 2... print(name, address) 3... 40 0 Tom 51 America 6Name: 0, dtype: object 71 0 Tom 81 Calfornia 9Name: 1, dtype: object 102 0 Tom 111 San Diego 12Name: 2, dtype: object 133 0 Tom 141 2-3-40 15Name: 3, dtype: object 164 0 Juddy 171 Austoraria 18Name: 4, dtype: object 195 0 Juddy 201 New South Wales 21Name: 5, dtype: object 226 0 Juddy 231 Sydney 24Name: 6, dtype: object 257 0 Juddy 261 Ryde city 27Name: 7, dtype: object 288 0 Juddy 291 1-60 30Name: 8, dtype: object

使い方を誤っているようです。
『pandas iterrow』とググると、次のようなページに辿り着きます。

note.nkmk.me - pandas.DataFrameのforループ処理(イテレーション)

DataFrame.iterrows()メソッド

iterrows()メソッドを使うと、1行ずつ、インデックス名(行名)とその行のデータ(pandas.Series型)のタプル(index, Series)を取得できる。

タプルの第一要素はindexだそうです。
というわけで、次のように受け取れば良いことに気付きます。

Python

1for index, series in df.iterrows(): 2 name, address = series 3 ...

あるいは

Python

1for index, (name, address) in df.iterrows(): 2 ...

このように、どこが間違っているのか探る能力が非常に重要です。


America Calfornia San Diego 2-3-40と表示するためには、str.joinを使いましょう。

投稿2018/08/04 08:49

編集2018/08/04 08:52
LouiS0616

総合スコア35660

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kaitotokai

2018/08/04 09:11

ありがとうございます、とても勉強になりました!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問