質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.31%
Django

DjangoはPythonで書かれた、オープンソースウェブアプリケーションのフレームワークです。複雑なデータベースを扱うウェブサイトを開発する際に必要な労力を減らす為にデザインされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

3586閲覧

フォルダにある一時ファイル以外のエクセルを全部取得したい

退会済みユーザー

退会済みユーザー

総合スコア0

Django

DjangoはPythonで書かれた、オープンソースウェブアプリケーションのフレームワークです。複雑なデータベースを扱うウェブサイトを開発する際に必要な労力を減らす為にデザインされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2017/09/08 08:35

編集2017/09/08 08:49

フォルダにある一時ファイル(ファイル名の前に~$がついたもの)以外のエクセルを全部取得したいです。
今、フォルダの中にある全てのエクセルファイルを取得するように

files = glob.glob('./data/*.xlsx')

と書きました。しかし、これだと一時ファイルも取得してしまいます。
どのように書けば一時ファイル以外のエクセルを全部取得できますか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2017/09/08 08:42

「一時ファイル」とそれ以外はどのような違いがあるのか(ファイル名?)かを追記ください。
退会済みユーザー

退会済みユーザー

2017/09/08 08:49

情報を追加しました。一時ファイルとはファイル名の前に~$がついたもののことです
can110

2017/09/08 08:57

ではfilesリストからファイル名先頭が「~$」であるものを判別、除去するだけ(単なる文字操作)でできそうですね。
退会済みユーザー

退会済みユーザー

2017/09/08 08:58

それをどのように書けばいいのかわからなくて...
can110

2017/09/08 09:02

「どのように」はいろいろなやり方があるのでどのようにでもよいのですが、「何が」分からないのか(文字列から特定の文字列を含むかどうかを判定する方法が分からない、など)を追記ください。
退会済みユーザー

退会済みユーザー

2017/09/08 09:09

正規表現の書き方とtry-cathの作り方です
can110

2017/09/08 11:18

正規表現を「どのように」書こうとお考えなのか、try-catchを「どのように」利用としているのかを追記ください。
guest

回答1

0

ベストアンサー

glob.glob()で得られた結果を、リスト内包表記で加工するやり方です。
dataディレクトリの中は下記のようになっているという前提です。dir.xlsxはディレクトリです。

data ├── a.xlsx ├── b.xlsx ├── dir.xlsx └── ~$a.xlsx

python

1# coding: UTF-8 2 3import os 4import glob 5 6files = glob.glob('./data/*.xlsx') # dir.xlsxはディレクトリ 7print(files) 8# ['./data/b.xlsx', './data/~$a.xlsx', './data/dir.xlsx', './data/a.xlsx'] 9 10files2 = [os.path.basename(f) for f in files] # ファイル名のみを取得 11print(files2) 12# ['b.xlsx', '~$a.xlsx', 'dir.xlsx', 'a.xlsx'] 13 14files3 = [f for f in files2 if f[:2] != '~$'] # 一時ファイルを削除 15print(files3) 16# ['b.xlsx', 'dir.xlsx', 'a.xlsx'] 17 18files4 = [f for f in files3 if os.path.isdir(f) == False] # ディレクトリ(dir.xlsx)を削除 19print(files4) 20# ['b.xlsx', 'a.xlsx']

追記
glob()はディレクトリも取得してしまうとのご指摘を受けましたので、修正しました。


追記2
glob(./data/*.xlsx)dataディレクトリを含むファイル名を返すとのご指摘を頂き、全体的に修正しました。

投稿2017/09/08 23:46

編集2017/09/10 08:12
tsuemura

総合スコア663

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

can110

2017/09/09 01:22

glob.glob()の結果にはディレクトリ名も含まれるため、意図した動作をしないと思われます。
tsuemura

2017/09/09 06:46

ご指摘ありがとうございます。修正しました。
can110

2017/09/09 07:33

提示コードは、実際に動作をさせましたでしょうか? ディレクトリ「data」以下に「a.xlsx」「b.xlsx」「~$a.xlsx」「dir.xlsx」ファイルが存在する場合 当方Win10環境では以下のように「./data\\」というディレクトリ名を含むパスのリストが返ります。 files = ['./data\\a.xlsx', './data\\b.xlsx', './data\\dir.xlsx', './data\\~$a.xlsx']
tsuemura

2017/09/10 08:13

度々ご指摘ありがとうございます。修正しました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.31%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問