質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

3270閲覧

ある一つの列で同じ値を持つもの同士を1行にまとめるコード

Terratale

総合スコア21

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2018/11/28 15:30

現在以下のような内容のcsvファイル「hotelResister.csv」があり、

"部屋","名前","苗字" "Office","ダニング","スミス" "Office","ローザ","フォックス" "215","カイル","ハイド" "219","メリッサ","ウッドワード" "219","ケビン","ウッドワード" "213","ジェフ","エンゼル"

このファイルを

・"部屋"列に同じ値をもつ行を、元のファイルでの順番を維持したまま1行にまとめる
・1行にまとめられたもの同士はスペースで区切られる
・まとめたあとは"部屋"列の値は削除

といった決まりに従いPythonで加工して、

"ダニング","スミス" "ローザ","フォックス" "カイル","ハイド" "メリッサ","ウッドワード" "ケビン","ウッドワード" "ジェフ","エンゼル"

という内容の「heyawari.txt」というファイルを作りたいのですが、
これはどのような処理を書けば実現できるでしょうか。
お手数ですがご教示お願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

pandas にて実現するとこんな感じになります。
やっていることは

  • "名前"と"苗字" を結合して "フルネーム" Column を作成
  • DataFrame.groupby("部屋") にて同じ部屋の "フルネームを結合し、unstack() にて行に展開
  • DataFrame.to_csv() にて出力 (indexとheaderは出力しない、セパレータはスペースを使用)

となります

Python

1import pandas as pd 2import io 3 4data = ''' 5"部屋","名前","苗字" 6"Office","ダニング","スミス" 7"Office","ローザ","フォックス" 8"215","カイル","ハイド" 9"219","メリッサ","ウッドワード" 10"219","ケビン","ウッドワード" 11"213","ジェフ","エンゼル" 12''' 13 14df = pd.read_csv(io.StringIO(data)) 15df['フルネーム'] = '"' + df["名前"] + '","' + df["苗字"] + '"' 16ret = df.groupby('部屋')['フルネーム'].apply(lambda d: d.reset_index(drop=True)).unstack() 17ret.to_csv('heyawari.txt', index=None, header=None, sep=' ', quotechar="'") 18 19# "ジェフ","エンゼル" 20# "カイル","ハイド" 21# "メリッサ","ウッドワード" "ケビン","ウッドワード" 22# "ダニング","スミス" "ローザ","フォックス"

投稿2018/11/28 23:37

編集2018/11/28 23:38
magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Terratale

2018/11/30 12:50

回答ありがとうございました。 参考にさせていただきました! あと、StringIOって初めて知りました。面白いですね。
guest

0

ベストアンサー

以下のようにOrderedDict部屋列をキーとし、リスト値として名前,苗字を追加していけばよいです。
ファイル入出力処理は簡単のため省略してます。

Python

1csv = [["Office","ダニング","スミス"], 2 ["Office","ローザ","フォックス"], 3 ["215","カイル","ハイド"], 4 ["219","メリッサ","ウッドワード"], 5 ["219","ケビン","ウッドワード"], 6 ["213","ジェフ","エンゼル"]] 7 8from collections import OrderedDict 9d = OrderedDict() 10 11# 日時をキーとして、それ以降の列値をリストとして保持 12for row in csv: 13 if row[0] in d: 14 d[row[0]] += row[1:] 15 else: 16 d[row[0]] = row[1:] 17 18# 結果 19for key,val in d.items(): 20 print(val) 21""" 22['ダニング', 'スミス', 'ローザ', 'フォックス'] 23['カイル', 'ハイド'] 24['メリッサ', 'ウッドワード', 'ケビン', 'ウッドワード'] 25['ジェフ', 'エンゼル'] 26"""

投稿2018/11/28 21:30

can110

総合スコア38341

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Terratale

2018/11/30 12:53

回答ありがとうございました! OrderDictなんてものがあるんですね。勉強になりました! 列数が変わってもプログラムを書き換えなくて良いのが気に入ったのでベストアンサーにさせていただきました!
guest

0

Pythonなど不要。そう、シェル芸ならね!

bash

1$ cat hotelResister.csv|awk -F, 'NR>1{k=$1;v=$2","$3;if(b[k]){b[k]=b[k]" "v}else{a[i++]=k;b[k]=v}}END{for(i in a){print b[a[i]]}}' > heyawari.txt 2$ cat heyawari.txt 3"ダニング","スミス" "ローザ","フォックス" 4"カイル","ハイド" 5"メリッサ","ウッドワード" "ケビン","ウッドワード" 6"ジェフ","エンゼル"

投稿2018/11/28 19:22

hichon

総合スコア5739

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Terratale

2018/11/30 12:47

回答ありがとうございました。 シェルでも出来るんですね! 参考になりました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問