前提・実現したいこと
質問の低評価をいただいて改めて質問した内容を見ると漠然としていましたので修正させていただきます。良い方法があればご共有いただけますと幸いです。
実現したいこと:
DataFrameにおいて、商品名の列があり、そのグループ分けをしたいと考えています。
そしてグループ名を新しい列に追加し、後どれくらいの商品名がグループ化されていないかを確認しながら作業がしたいです。
グループ名としてふさわしいと考えている名称はそれなりの数量の商品をカバーできるものだと考えます。
グループ名作成の一例としては商品名の列に「靴」といキーワードが入った商品名が複数種類ある場合、
それが長靴であれ、革靴であれ靴であることには変わらないため以下のように対象を絞りました。
python
1df1 = df[df['商品名']].str.contains('靴')] 2df1['グループ名'] = '靴'
最終的にconcat()を使用し全てのグループ化されたdfを繋げます。
発生している問題
・作業進捗が確認できない。
・キーワードの数だけdfを作成しないといけない。
試したこと
上記の方法を取ると以下のように複数のdfを作ることになりました。
python
1df1 = df[df['商品名']].str.contains('靴')] 2df2 = df[df['商品名']].str.contains('服')] 3df3 = df[df['商品名']].str.contains('帽子')] 4df4 = df[df['商品名']].str.contains('ズボン')] 5##df5,6,7...と続く
これだと発生している問題として書いた二点がネックとなり非効率だと感じています。
他に良い方法があれば教えていただけると助かります。
補足情報(FW/ツールのバージョンなど)
Windows10
Python 3.7
Pandas
Jupyter notebook
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/07/01 14:19
2020/07/02 07:10