🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

263閲覧

pandasでcsvから取得した情報を条件ごとに結合したいです。

m____k

総合スコア1

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/02/25 07:46

編集2021/02/25 08:11

前提・実現したいこと

csvを読み込み値の結合を行いたいです。

今の実行結果だと、
0 ABC111-555-A
1 DEF222-666-
2 GHI333-0-
3 JKL444-0-
となっていますが、条件によって結合のパターンを変えたいと考えています。

付帯番号が0の場合は、番号のみ
記号が存在しない場合は、番号+ '-' +付帯番号
記号が存在する場合は、番号+ '-' +付帯番号+ '-' +記号

上記実行結果を参照すると、
ABC111-555-A
DEF222-666
GHI333
JKL444
という結果になってほしいのですが、if文の条件指定が上手くいきません。

※記号が存在しない場合と記載しましたが、csvの中身を見ると' 'と半角スペースが5つ入っていました。

どなたかご教授お願い致します。
ここに質問の内容を詳しく書いてください。
(例)PHP(CakePHP)で●●なシステムを作っています。
■■な機能を実装中に以下のエラーメッセージが発生しました。

発生している問題・エラーメッセージ

エラーメッセージ

該当のソースコード

df = pd.read_csv('infoList.csv', encoding='cp932', na_filter=False) df['管理番号'] = df['番号'].str.cat(df['付帯番号'].astype(str), sep='-').str.cat(df['記号'].astype(str), sep='-') url = df['管理番号'] print(url)

試したこと

CSVファイルの中身は下記の通りです。
番号 付帯番号 記号
ABC111 555 A
DEF222 666
GHI333 0
JKL444 0

補足情報(FW/ツールのバージョンなど)

ここにより詳細な情報を記載してください。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Daregada

2021/02/25 07:56

処理に使うCSVファイルのサンプルを質問文に記載してください。
m____k

2021/02/25 08:07

Daregada様 失礼致しました。 csvの中身は下記の通りです。 番号 付帯番号 記号 ABC111 555   A DEF222 666 GHI333   0 JKL444   0
Daregada

2021/02/25 08:11

カンマで区切られた元のファイルを提示してください。それとも、元々カンマで区切られていない(CSVではない)のでしょうか?
m____k

2021/02/25 08:19

こちらで! 番号,付帯番号,記号 ABC111,555,A DEF222,666, GHI333,0, JKL444,0,
guest

回答2

0

別解。

Python

1import pandas as pd 2import io 3 4txt = """ 5番号,付帯番号,記号 6ABC111,555,A 7DEF222,666, 8GHI333,0, 9JKL444,0, 10""" 11 12pd.set_option('display.unicode.east_asian_width', True) 13 14df = pd.read_csv(io.StringIO(txt), na_filter=False) 15 16df['管理番号'] = df['番号'] 17df.loc[df['付帯番号'] != 0, '管理番号'] += "-" + df['付帯番号'].astype(str) 18df.loc[df['記号'] != "", '管理番号'] += "-" + df['記号'] 19print(df['管理番号'])

result

10 ABC111-555-A 21 DEF222-666 32 GHI333 43 JKL444 5Name: 管理番号, dtype: object

投稿2021/02/25 08:43

Daregada

総合スコア11990

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

ベストアンサー

こんな感じです。

python

1>>> print(df) 2 番号 付帯番号 記号 30 ABC111 555 A 41 DEF222 666 52 GHI333 0 63 JKL444 0 7>>> 8>>> def mn(row): 9... if row['記号'] != '': 10... return f"{row['番号']}-{row['付帯番号']}-{row['記号']}" 11... elif row['付帯番号'] != 0: 12... return f"{row['番号']}-{row['付帯番号']}" 13... else: 14... return row['番号'] 15... 16>>> df['管理番号'] = df.apply(mn, axis=1) 17>>> url = df['管理番号'] 18>>> print(url) 190 ABC111-555-A 201 DEF222-666 212 GHI333 223 JKL444 23Name: 管理番号, dtype: object

投稿2021/02/25 08:10

ppaul

総合スコア24670

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m____k

2021/02/25 08:32

ppaul 様 ありがとうございます! in で模索していたのですが、rowごとに扱わなければならなかったのですね... pandasを把握しきれていなかったので勉強になりました!!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問