質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

855閲覧

CSVの特定の文字を含む列の抽出について

syasai

総合スコア5

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/08/23 04:10

CSV形式のレポートを解析するために、特定の文字('発生現象')を含む列のみを抽出したいです。

以下の「CSVデータ例」のように'発生現象'がカラムBとカラムEにのみ含まれると事前にわかっている場合は、

df = df.filter(items=['B','E'])

とすることでやりたいことができたのですが、特定の文字がどこの列に含まれるのか分からない場合にはどうやれば良いのか、教えていただけないでしょうか?

CSVデータ例
||A|B|C|D|E|F|
|:--|:--:|--:|
|1|回答者|発生現象||回答者|発生現象
|2|佐々木|XXX||高橋|YYY|
|3|||
|4|回答者|発生現象||回答者|発生現象
|5|山田|ZZZ||鈴木|JJJ

やりたいこと

AB
1発生現象発生現象
2XXXYYY
3
4発生現象発生現象
5ZZZJJJ

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/08/23 04:59

1つ1つの列に対してその文字列が含まれているか調べれば良いかと思いますが、具体的にはどこが分からないのでしょうか?
TakaiY

2021/08/23 10:03

そもそも、このデータはcsvではないし、そのままDataFrameに突っ込んで操作するのは筋が悪いです。 また、答えるにあたって、データの形式がほとんどわからないので考えようがありません。 - もとのテキストデータはどのような形式になっていますか? 質問のような形式ですか? - ヘッダ行の繰り返し数はどうなっていますか?「回答者、発生現象」がいくつ続きますか? - ヘッダ行の下にデータ行は何行続きますか? - 複数あるヘッダ行にある「発生現象」の場所は同一ですか?
syasai

2021/08/24 15:43

>meg_さん ご指摘を受け1つ1つの列に対して処理できないか考えてみたところ、やりたかったことができました。ありがとうございます。 >TakaiYさん 不十分な情報での質問をしてしまいすみません。 元々はウェブブラウザで見ることができるレポートをコピー&ペーストしてCSVデータにすると質問に書いたような形式になります。'発生現象'の列だけを抽出したかったため、なんとなくCSVを使っていたのですが、王道のやり方がありましたら教えていただけないでしょうか? 「回答者、発生現象」は列方向には2つだけ続き、行方向は200行続きますが、汎用性があるように作りたいと思っていました。 また、発生現象の場所は同一です。
guest

回答1

0

自己解決

以下のやり方で解決できました。

python

1import pandas as pd 2import csv 3 4list = [] 5filename = '160235.csv' 6 7df = pd.read_csv(filename, encoding='shift-jis', header=None) 8 9for columns in range(len(df.columns)): 10 columns2 = all(~df.iloc[:, columns].astype(str).str.contains('発生現象')) 11 if columns2: 12 list.append(columns) 13 else: 14 pass 15 16df = df.drop(list, axis=1) 17 18df.to_csv('output.csv', encoding='shift-jis', header=False, index=False)

投稿2021/08/24 15:23

syasai

総合スコア5

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問