質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

0回答

1493閲覧

Python ExcelとCSVの処理速度について

s_kj

総合スコア32

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

2クリップ

投稿2021/04/10 06:46

編集2021/04/10 06:52

データ分析を学習しています。
現在のデータファイルは、Excel形式で読み込みに毎回5分ぐらいかかっています。
毎回、時間がかかっていてめんどくさいです。

読み込み方は下記になります。

df_sample = pd.read_excel('/Users/AAA/BBB/sample.xlsx',sheet_name='XXX',header=1)

データファイルの形式はエクセルからCSVの形式に一旦変えてから、読み込みを行って方が早くなるのでしょうか。

また、処理速度に差があるようでしたらどのぐらい差があるかも興味があります。
場合によるかもしれませんので、整数が格納された3列1万行のファイルの読み込みを例とさせてください。
他の場合でご提示できるようでしたら他のものでも構いません。

ご存知の方ご回答お願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

xail2222

2021/04/10 06:48

まずは、今Excel形式のデータをどのように読み込んでいるかソースを提示してみては如何でしょうか。 同じExcel形式でも読み方次第で速さは結構変わりますよ。
s_kj

2021/04/10 06:52

ご質問ありがとうございます。 コードを記載しました。
xail2222

2021/04/10 07:09

その読み方で3列1万行のファイルで5分は遅いですね。 私のwin8のHDDに保存したxlsxを読み込むので3列整数10万行で6秒程度でした。 環境(win,mac,linuxとかVMとか)やファイルの保存場所とかはどうなっているのでしょうか。 import pandas as pd df_sample = pd.read_excel() しているだけなんですよね?
meg_

2021/04/10 07:29

そのファイルをエクセルで開く場合は何秒かかりますか?
s_kj

2021/04/10 08:32

コメントありがとうございます。 シートの列数は5000行、7列でした。 このエクセルファイルには、他のシートもあります。 シートを指定して読み込んでいるので、今回の話題には加味していませんでした。 その他のシートは、1万行7列のシートが8枚あります。 ファイルの保管場所は、ローカルに保管していて、Jupytor notebookで読み込んでいます。
s_kj

2021/04/10 08:33

エクセルシートの読み込みは、10〜20秒ぐらいです。
s_kj

2021/04/10 08:34

五月雨の回答で申し訳ないです。 この処理は、2分ぐらいかかっています。
xail2222

2021/04/10 08:56

とりあえず原因の切り分けということで 新たなbookを作って読み込むシートの値を張り付けて その新たに作ったシートを読み込むと処理時間はどうなりますか?
s_kj

2021/04/11 01:31

質問ありがとうございます。 新たなシートでも同様の処理時間です。
meg_

2021/04/11 01:38

OS、python、pandasのバージョンは何でしょうか?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問