質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

2回答

438閲覧

Python 正規表現  csvファイル

banana_milk

総合スコア16

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/11/30 05:11

前提・実現したいこと

csvファイルで特定の文字が入ったセルの行全部を抽出したいです.

発生している問題・エラーメッセージ

手法がわかりません...

該当のソースコード

python

1# coding: utf-8 2 3import pandas as pd 4 5df = pd.read_csv("csvファイル名",encoding='utf-8',index_col=4) 6print(df.index.str.contains('キーワード'))

試したこと

以上のコードだとそのキーワードが入っているかいないかをTrue Falseで出力してくれます
判別はできているとして,Trueの行を全部別のファイルに抜き出すにはどうしたらいいのでしょうか...

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

df[df.index.str.contains(キーワード) & ~] で行を抽出しto_csv(で別ファイルに出力できます。

Python

1import pandas as pd 2df = pd.DataFrame({'A':['aa','ab','c'],'B':['牛','馬','鹿'],'C':[1,2,3],'D':[4,5,6],'E':[7,8,9]},columns=['A','B','C','D','E']) 3df = df.set_index(['A']) 4df2 = df[df.index.str.contains('a') & df['B'].str.contains('牛')] # indexに'a'を,'B'列に"牛"を含む行を抽出 5print(df2) 6df2.to_csv('out.csv',index=False,columns=df.columns[0:3]) # B~D列を出力

投稿2018/11/30 05:26

編集2018/11/30 06:08
can110

総合スコア38234

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

banana_milk

2018/11/30 05:47

半端な質問に回答してくださりありがとうございます. もう少しお尋ねしたいことがありまして,, csvデータのE列に日本語文字があり,その列に例えば[牛]という文字があれば, その行のA~G列までを別ファイルで出力するということはできますでしょうか... ある期間のツイートデータで,数千行あります...
can110

2018/11/30 06:09

そのまま求めるものではありませんが、回答を修正しました。 インデックスに加え、ある列の値で行を抽出、指定した列のみをCSV出力できます。
banana_milk

2018/11/30 06:57

修正ありがとうございます. 頂いたものを参考に解決できました. 本当にありがとうございます.
guest

0

ベストアンサー様の回答を自分用にしたものです.

Python

1 2def make_dataframe(filename): 3 df = pd.read_csv(filename, encoding='utf-8', na_values='nan') 4 return df 5 6df = make_dataframe('hoge.csv') 7 8df2 = df[df['A'].str.contains('キーワード1') & df['A'].str.contains('キーワード2')] # 'A'列に"キーワード1"と"キーワード2"を含む行を抽出 9print(df2) 10df2.to_csv('out.csv',index=False,columns=df.columns[0:11]) # 指定した列を出力 11

投稿2018/11/30 07:08

banana_milk

総合スコア16

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問