言語
- Python 3.x
問題
データフレームにNGワードを一定回数行っている行だけ削除する、というようなコードを書いています。
たとえばCSVファイルが以下のようになっているとします
index,text 1, 沙也加です。お金貸します、お金、お金、お金、お金いりますか? お金いります?! 2, こんにちは、総務の田中です。8月の件について……
このinput.csvをpandasデータフレームで取り込みます。
python
1df = pd.read_csv("input.csv")
ここまではいいのですが、df['text']列に「お金」という言葉が5つ以上含む行だけ消去して、
新たにdf
が欲しいと考えています。
上のcsvの例だと「沙也加です。……」の行を消して、「こんにちは、人事の田中です……」という行だけ残るようにしたいと思っています。
(上の例は二行だけですが、実際には何万行と処理したいと思っています)
どうしたらいいでしょうか?
やってみたこと
apply関数とcount関数を組み合わせればいいのかと思いましたが、
正直どう組み合わせればいいか分かりませんでした。
ご存じの方、どうかよろしくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/02 11:08