質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

1回答

1268閲覧

ファイル名がバラバラのCSVファイルを1つのCSVファイルに統合して書き出したい

Azul_y_rojo_99

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2021/05/29 14:40

Googleのキーワードプランナーで調べた結果のCSVファイルが約250個あり、これを1つのcsvファイルにまとめたく考えております。

条件
・各ファイル、大雑把ではあるが行数は600〜1500くらいある。
・各ファイル最初の1〜3行目は統合後のファイルに反映されなくても問題はない。
・ファイル名はバラバラ (ex.「りんご.csv」「バナナ.csv」「ガッキー.csv」など)

下記URLの内容を参考にしてみたのですが、なかなか上手くいかない状況にあります。

pythonで複数のcsvファイルを1つのcsvファイルにまとめる(ヘッダーが1行だけの前提)
https://qiita.com/minamini1985/items/60047ea416cd49721cf3

import pandas as pd import glob # パスで指定したファイルの一覧をリスト形式で取得. (ここでは一階層下のtestファイル以下) csv_files = glob.glob('test/*.csv') #読み込むファイルのリストを表示 for a in csv_files: print(a) #csvファイルの中身を追加していくリストを用意 data_list = [] #読み込むファイルのリストを走査 for file in csv_files: data_list.append(pd.read_csv(file)) #リストを全て行方向に結合 #axis=0:行方向に結合, sort df = pd.concat(data_list, axis=0, sort=True) df.to_csv("test/total1.csv",index=False)

念の為使用環境を記載しておきます。
・Mac OS Big Sur 11.4
・Spyder 4.1.5
・Python 3.8.1

ご教示くださいますようお願い申し上げます。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

meg_

2021/05/29 15:03

> 下記URLの内容を参考にしてみたのですが、なかなか上手くいかない状況にあります。 具体的にどう”上手くいかない”のでしょうか?
hope_mucci

2021/05/29 15:17

上記のコードでどのような問題が発生しているのか、具体的に説明しましょう。 「なかなかうまくいかない」だけでは全く説明になっていません。 全部結合されていないのか? 処理途中でプログラムが止まってしまうのか? 発生している問題を詳細に書きましょう。説明してくれないと回答側は何も分かりません。 また、結合後のcsvファイルは入力ファイルとは別のフォルダに入れたほうがいいです。繰り返しテストした際、次回実行時にtotal1.csvも入力に含まれるので鼠算式にファイルサイズが増えてしまいます。
guest

回答1

0

csvファイルは単なるテキストファイルですから、単にまとめたいのであれば,csvとかpandasとか複雑なことをやらずに以下で十分です。
data[-1]を見ているのは、ファイルの最後に改行文字が入っている場合と入っていない場合があるためですので、入っているかいないか分かっていれば、より簡略化できます。

python

1import glob 2 3csv_files = glob.glob('test/*.csv') 4 5OUTFILE = 'total.csv' 6def copy_csv(in_file, f_out): 7 with open (in_file) as f_in: 8 data = f_in.read() 9 f_out.write(data) 10 if data[-1] != '\n': 11 f_out.write('\n') 12 13if os.path.exists(OUTFILE): 14 os.remove(OUTFILE) 15 16with open(OUTFILE, 'a') as f_out: 17 for csv_file in csv_files: 18 copy_csv(csv_file, f_out)

投稿2021/05/30 00:03

編集2021/05/30 05:13
ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Azul_y_rojo_99

2021/05/30 06:36

教えてくださいましてありがとうございます。こちらのcodeで試してみましたが、「total.csv」というファイルがフォルダ内、出来ていたことを確認は出来ましたが、「total.csv」の中を見ると何もデータが入っていない状況にありました。自分でも原因を探ってみたのですが、分からずじまいでした。改めてご教示願えますと幸いに存じます。
ppaul

2021/05/30 10:27

カレントディレクトリにtestというディレクトリがないのが原因でしょう。 import os print(os.getcwd()) を実行して、表示されるディレクトリの下にtestをコピーするか移動するかしてください。 そのあとでもう一度プログラムを実行してみてください。
Azul_y_rojo_99

2021/05/31 13:22

ご連絡ありがとうございます。 実際に教えていただいた通りに試したところ、今度は「UnicodeDecodeError: 'utf-8' codec can't decode byte 0xff in position 0: invalid start byte」というエラーが表記されました。 今、手元にある csvファイルがutf-16 Unicodeテキストということでしたので、utf-8に変えるまたは、utf-16のままでも結合できるようにしなくては行けないということは理解できましたが、具体的にどういうcodeをここで描いていけば良いのか、悩んでおります。 「with io.open(path, encoding='utf-16') as f:」 というcodeを入れると解決するという旨を検索して探し出してみたのですが、教えていただいたどの箇所に入れ込むべきかわからない状況にあります。大変にお手数をおかけしますが、引き続き教えてくださいますようお願い申し上げます。
ppaul

2021/06/01 13:04 編集

with io.open(in_file, encoding='utf-16') as f: でも良いですが、 with open (in_file, encoding='utf-16') as f_in: でも同じです。 出力側もutf-16にしたければ、 with open(OUTFILE, 'a') as f_out: を、 with open(OUTFILE, 'a', encoding='utf-16') as f_out: に変更してください。
Azul_y_rojo_99

2021/06/01 13:54

長々とすみませんでした、ありがとうございました。こちらを参考に対応してみます。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問