質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.34%

  • Python

    9185questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • pandas

    674questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

pandasでデータフレーム名称に繰り返し処理を用いる方法

解決済

回答 1

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 136

uratatsu

score 1

 ppandasでデータフレーム名称に繰り返し処理を用いたい

Python初心者です。
あるdataframeの特定列の値によってdataframeを分割したい。その際、dataframe名称を列の値によって名づけたい。

 やりたいこと

下記のように10都府県の値が格納されたdataframe "df_location"があるとします。

print(df_location["地域名"].unique().tolist())


['Tokyo', 'Osaka', 'Kanagawa', 'Aichi', 'Hukuoka', 'Hiroshima', 'Miyagi', 'Kochi', 'Hyogo', 'Saitama']

それぞれの地域ごとにdataframeを分割して格納し、dataframeの名称をそれぞれの都府県名称をつけて、df_location_Tokyo, df_location_Osaka,・・・・・というように名付けていきたいです。

 試したこと

for location in l_list:
    df_location_os.path.basename(location) = df_location[df_location["地域名"] == location] )


いろいろ調べてos.path.basenameとか、{}.format()を活用してみようかと試しましたが、うまくできず。。

名称をつけるところがうまくいきません。
どなたかよろしくお願いいたします。

 補足情報(FW/ツールのバージョンなど)

pandas 0.23.0
Python 3.6.4 :: Anaconda custom (64-bit)
jupyter notebookを使用

やりたいこと追記

A

 index        date         
 0               1/1 
 1             1/1 
 3              1/2

B

 date        location          tempA tempB
 1/1               Tokyo  23 30
 1/1          Osaka  25 31
 1/1              Nagoya 22 33
 1/2              Tokyo  24 32
 1/2          Osaka  26 33
 1/2              Nagoya 23 29

AとBの表があって、dateをキーとして、Aの表にそれぞれの地点のtempA,tempB列をt追加したいので、locationの値によって、データフレームを分割し、1つ1つ表Aにマージしていけばできるかなと思いまして、上の質問をしました。
↓こんなイメージ

index  date        tempA_Tokyo tempB_Tokyo tempA_Osaka tempB_Osaka tempA_Kanagawa tempB_Kanagawa
0  1/1          23  30 25 31  22 33
1  1/1          23  30 25 31  22 29
2  1/2          24 32 26 33  23 29

データフレーム名称に繰り返し処理を用いなくてもこの表が作れるのであれば嬉しいですが、
ディレクトリにある複数のCSVファイルを読み込む際に、データフレーム名をfor文の中で回せると便利なので、その解決法もかねて質問させていただきました。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • KojiDoi

    2018/07/22 13:13

    df["Tokyo"]のようにすれば普通にアクセスできるものをわざわざ別のdfにしたい理由は何なのでしょうか。

    キャンセル

  • uratatsu

    2018/07/22 14:30

    返信ありがとうございます。別のデータフレームにしたい理由について、やりたいことを質問本文に追記させていただきました。よろしくお願いします。

    キャンセル

回答 1

checkベストアンサー

0

要するに表の結合(merge)をやりたいわけですね。それならデータフレームの分割などというステップは不要です。

下記のmergeの解説(列の値による結合)を参考にしてみてください。たとえば東京ならB.ix[B.location=="Tokyo",:]を結合すればいいのではないでしょうか。これができたらdf_locationの値を使ってループを回すようにすれば目標達成と思われます。

http://sinhrks.hatenablog.com/entry/2015/01/28/073327

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/07/23 10:57

    この課題については、それで問題なくできました。ありがとうございます。ディレクトリにある複数のCSVファイルを読み込む際に、データフレーム名をfor文の中で回す話は別トピックで質問することにします!

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.34%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python

    9185questions

    Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

  • pandas

    674questions

    Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。