質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Visual Studio Code

Visual Studio Codeとは、Microsoft社が開発したマルチプラットフォーム対応のテキストエディタです。Visual Studioファミリーの一員でもあります。拡張性とカスタマイズ性が高く、テキストエディタでありながら、IDEと遜色ない機能を備えることができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

2回答

940閲覧

Python CSVファイルの読み込みについて

Waruzo

総合スコア5

Visual Studio Code

Visual Studio Codeとは、Microsoft社が開発したマルチプラットフォーム対応のテキストエディタです。Visual Studioファミリーの一員でもあります。拡張性とカスタマイズ性が高く、テキストエディタでありながら、IDEと遜色ない機能を備えることができます。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/11/22 05:48

編集2022/11/22 09:41

前提

pythonでCSVファイルを読み取りたいです。
値が欠損しているときデータを読み取れません。
値が欠損していなければ読み取れます。

実現したいこと

下記のようなテキストデータを

10,20,30,40,50
40,40,34,40,50
30,49,,49,58
10,,,39,40
10,20,30
このような形式にしたいです。
A10,B20,C30,D40,E50
A40,B40,C34,D40,E50
A30,B49,C,D49,E58
A10,B,C,D39,E40
A10,B20,C30

発生している問題・エラーメッセージ

Traceback (most recent call last): File "c:\Users\00000\Python\test.py", line 6, in <module> msg = "A{0[0]},B{0[1]},C{0[2]},D{0[3]},E{0[4]}".format(row) ^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^^ IndexError: list index out of range

該当のソースコード

import csv import pandas as pd with open('sample.txt')as f: reader =csv.reader(f) for row in reader: msg = "A{0[0]},B{0[1]},C{0[2]},D{0[3]},E{0[4]}".format(row) print(msg)

試したこと

エラーを調べてみました。
IndexError: list index out of range
リスト インデックスが範囲外です

pandas をとりあえずインストールしました。
値が欠損しているサンプルコードがなく、わかりませんでした。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pig_vba

2022/11/22 06:04

なぜに2と4が全角…?
Waruzo

2022/11/22 06:22

誤字です。ご指摘ありがとうございます。
pig_vba

2022/11/22 06:45 編集

現状「実現したいこと」がふわっとしすぎてるかな、と。今書かれているのは読み込んだデータの中身だと思いますが、それを読み込んでどう使いたいかまで明確になっているのであればそちらも合わせて追記してください。csv取り込み自体が想定される用途が幅広すぎるため、現状だと欲しい回答が得られない可能性が高いです 例えばですが、本当にただ読み込むだけなら df=pd.read_csv('sample.txt') これだけで回答になります。
melian

2022/11/22 06:43

Pandas をインストールしているのであれば、 df = pd.read_csv('sample.txt', header=None) とするとよいかと。
guest

回答2

0

ベストアンサー

質問のソースコードをこちらで動かしてみたところ、ちゃんと想定どおりの結果が出力されました。

ソースコードもしくは、元データが提示のものと異なるのではないでしょうか。


追記

5行目があるとそれ以降のデータを表示できないので、5行目のようなパターンのときは読み込まない。 もしくはA20,B30C40のように表示させたいです。

5カラム以外のデータは飛ばすということであれば、リストの数を数えて5でなければ次に行くというコードにすればいいでしょう。
リストはlen()で数えられます。

数が足りないor多い場合にも対応させたいのであれば、考えかたを変える必要があります。

alfa_list = ['A', 'B', 'C', 'D', 'E'] with open('sample.txt')as f: reader =csv.reader(f) for row in reader: msg_list = [] for a, b in zip(alfa_list, row): msg_list.append(a+b) msg = ",".join(msg_list) print(msg)

アルファベットのリストを読んだデータの行をzipで組み合わせて、くっつけてリストにして、最後にカンマで結合しています。
zipは少ない方に合せて動いてくれますので、少なくてもOKです。 なので、アルファベットのリストを増やしておけば5つより多い行にも対応できます。

投稿2022/11/22 07:52

編集2022/11/22 11:00
TakaiY

総合スコア12765

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Waruzo

2022/11/22 09:37

ご指摘ありがとうございます。 10,20,30,40,50 40,40,34,40,50 30,49,,49,58 10,,,39,40 20,30,40 5行目のようにデータの個数が少ないと表示できないです。
TakaiY

2022/11/22 09:42

それはそうでしょうね。 質問の内容と異なりますね。 この場合どうしたいのですか?
Waruzo

2022/11/22 10:31

ご指摘ありがとうございます。 5行目があるとそれ以降のデータを表示できないので、5行目のようなパターンのときは読み込まない。 もしくはA20,B30C40のように表示させたいです。
guest

0

データの個数が異なるとき

python

1import csv 2 3with open('sample.txt') as f: 4 for r in csv.reader(f): 5 msg = ','.join(map(''.join, zip('ABCDE', r))) 6 print(msg) 7 8# A10,B20,C30,D40,E50 9# A40,B40,C34,D40,E50 10# A30,B49,C,D49,E58 11# A10,B,C,D39,E40 12# A10,B20,C30

投稿2022/11/22 07:39

編集2022/11/22 14:46
melian

総合スコア19805

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Waruzo

2022/11/22 08:06

import pandas as pd df = pd.read_csv('sample.txt', header=None, na_filter=False, dtype=str) dfx = df.set_axis([*'ABCDE'], axis=1).apply(lambda x: x.name + x) dfx.to_csv('result.csv', header=None, index=False) dfx = df.set_axis([*'ABCDE'], axis=1) ABCDEの部分をリンゴバナナグレープイチゴトマトのように分類することは可能でしょうか
melian

2022/11/22 08:11

「分類する」という意味がよく判りませんが、以下の様なことでしょうか? import pandas as pd df = pd.read_csv('sample.txt', header=None, na_filter=False, dtype=str) columns = ['リンゴ', 'バナナ', 'グレープ', 'イチゴ', 'トマト'] dfx = df.set_axis(columns, axis=1).apply(lambda x: x.name + x) print(dfx)
Waruzo

2022/11/22 09:35

ありがとうございます。 msg = "A{0[0]},B{0[1]},C{0[2]},D{0[3]},E{0[4]}".format(row) 元のコードのように列で指定することは可能ですか?お手数おかけして申し訳ないです。
melian

2022/11/22 10:01

質問内容が変更されましたが、結局どうしたいのでしょうか?
Waruzo

2022/11/22 10:57

10,20,30,40,50,60,70,80,90,100 20,10 30,50,30,50,50,60,70,80,90,100 10,,30,40,50,60,70,80,90,100 10,20,30,40,50,60,70,80,90,100 上記のデータを下記のように[ ]で指定し、書き出すというのが目的です。 値が欠損していたり、データの個数が異なるときどうすればいいのかわかりません。 説明不足で申し訳ありません。 10,[20],30,[40],[50],60,70,80,90,100 20,[10] 30,[50],30,[50],[50],60,70,80,90,100 10,[],30,[40],[50],60,70,80,90,100 10,[20],30,[40],[50],60,70,80,90,100 書き出す内容 A20,B40,C50 A10,B,C A50,B50,C50 A,B40,C50 A20,B40,C50
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問