質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

if

if文とは様々なプログラミング言語で使用される制御構文の一種であり、条件によって処理の流れを制御します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

2回答

1982閲覧

pythonによるcsvの行と列の操作が上手くいきません

James1201

総合スコア15

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

if

if文とは様々なプログラミング言語で使用される制御構文の一種であり、条件によって処理の流れを制御します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2018/01/09 07:35

編集2018/01/09 09:11

###前提・実現したいこと
|A|B|C|D|
|:--|:--:|--:|
|a|NaN|NaN|NaN|
|a|NaN|NaN|NaN|
|a|b|NaN|NaN|
|a|b|c|NaN|
|...|
|a|b|c|d|
|a|b|NaN|NaN|
|a|b|c|d|

|A|B|C|D|
|:--|:--:|--:|
|a||||
|a||||
|a|b|||
|a|b|||
|b|c|||
|...|
|a|b|
|b|c|
|c|d|
|a|b|
|a|b|
|b|c|
|c|d|

に変形したいのですがうまくいきません。
どなたかご教授いただけませんでしょうか...。

###発生している問題・エラーメッセージ

エラーメッセージ

###該当のソースコード

python3

1df = pd.read_csv("Sample.csv") 2 3for line in tqdm(len(df)): 4 a = np.array(line.count()) 5 num = len(np.where(a==1)[0]) 6 if num == 1: 7 pass 8 elif num == 2: 9 pass 10 elif num == 3: 11 #やりたいこと→該当する行が[a,b,c]となっているので、[a,b][b,c]のように抽出し、上から順番に積み上げる 12 elif num == 4: 13 #やりたいこと→該当する行が[a,b,c,d]となっているので、[a,b][b,c][c,d]のように抽出し、順番に積み上げる

###試したこと

未完成かつとても煩雑な方法ではあると思うのですが、NaNでない要素を行毎に数え、それぞれの数の場合に要素を二つづつ取り出し下段にペーストしていくというコーディングを考えていました。
もっとスマートな方法があればそちらの方をご教授していただければと思います...。

###補足情報(言語/FW/ツール等のバージョンなど)

イメージとしましてはデータフレームを行ごとに読み込んでいって、3つ以上の要素がある行、

例えば
|列1|列2|列3|列4|
|:--|:--:|--:|
|a|b|c|d|

列1列2
ab

列1列2
bc

列1列2
cd

という風に取り出して、

列1列2
ab
bc
cd

のように積むという作業を全ての行で実行するというものなのですが、なかなかコードが組み立てられずに苦戦しています...。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

KojiDoi

2018/01/09 08:24

例を見ても変形のルールが理解できません。もう少し説明を御願いします。
James1201

2018/01/09 08:30

コメントありがとうございます。稚拙な説明で申し訳ありません。補足の方を修正いたしましたがいかがでしょうか...。
guest

回答2

0

ベストアンサー

元フレームそのものを編集操作するとややこしくなるので、編集結果は別フレームに持つようにしました。
get_next関数に次行データを返す処理をまとめることで、速度的にはメリットないかもしれませんが、処理は分かりやすくなるかと思います。

Python

1import pandas as pd 2from io import StringIO 3 4s = """ 5A,B,C,D 6a,,, 7a,,, 8a,b,, 9a,b,c, 10a,b,c,d 11a,b,, 12a,b,c,d 13""" 14df = pd.read_csv( StringIO(s), sep=",") 15print(df) 16 17df_dst = pd.DataFrame(columns=df.columns) 18 19def get_next( df): 20 for idx, row in df.iterrows(): 21 val_cnt = row.count() 22 if val_cnt <= 2: 23 yield row 24 else: 25 for i in range(val_cnt-1): 26 yield pd.Series([row[i],row[i+1],pd.np.nan,pd.np.nan],index=df.columns) 27 28for d in get_next(df): 29 df_dst = df_dst.append(d, ignore_index=True) 30 31print(df_dst)

投稿2018/01/09 09:13

can110

総合スコア38233

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

James1201

2018/01/09 09:39

お見事です! 本当に助かりました、ありがとうございました!
guest

0

itertoolscombinationsを使ってみるとどうでしょうか?

以下例です。簡単のため適当な配列を用意して行いました。

python

1from itertools import combinations 2 3twoDimArr = [ 4 [0,1,2,3], 5 [4,5], 6 [6,7,8], 7 [9,10,11,12], 8 [13], 9 [14,15], 10 [16,17,18] 11] 12 13result = [] 14 15for arr in twoDimArr: 16 if len(arr) < 3: 17 result.append(arr) 18 else: 19 for c in combinations(arr,2): # 第2引数で個数を指定 20 result.append(list(c)) 21 22for line in result: 23 print(*line)

実行結果

0 1 0 2 0 3 1 2 1 3 2 3 4 5 6 7 6 8 7 8 9 10 9 11 9 12 10 11 10 12 11 12 13 14 15 16 17 16 18 17 18

あ、ごめんなさい組み合わせじゃないのか…上記回答は忘れてください。すみません…m(_ _)m

投稿2018/01/09 09:26

編集2018/01/09 09:39
namnium1125

総合スコア2043

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

James1201

2018/01/09 09:41

考えてくださりありがとうございます。 また機会がありましたらよろしくお願いいたします!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問