質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

7092閲覧

Path.glob()を使って検索したパスが一部小文字になる

chibi144

総合スコア64

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

2クリップ

投稿2018/09/03 05:00

編集2018/09/11 00:10

前提・実現したいこと

ファイル名が列挙されたテキストファイルを読み込み、
特定ディレクトリ以下を再帰的に検索してそのパスを出力するプログラムを作成しています。
下にあるプログラムで検索・出力するところまでは出来たのですが、
出力されるパスのファイル名部分が小文字になってしまいます。
検索文字列は大文字、実際に存在するファイルの名前も大文字です。
どうすれば正しいパスが取得できるでしょうか。

該当のソースコード

python

1import csv 2from pathlib import Path, PurePath 3 4/* 5 search()を呼び出す過程で、下の変数には以下の値が入れられています。 6 listFile: 検索したいファイルの名前を列挙したテキストファイル 7 search_target_dir: 検索対象となるディレクトリ 8 9 最終的に返したいのは、 10 検索対象のファイル名,←のファイルが存在したディレクトリへのパス 11 が列挙されたcsvファイル 12*/ 13def search(listFile, search_target_dir): 14 f = open(listFile, 'r', encoding="utf-8") 15 reader = f.read().split('\n') 16 17 # 検索対象のパス 18 search_target_path = Path(search_target_dir) 19 20 iDir = Path(listFile).parent.resolve() 21 22 # 結果のcsvの出力先 23 resultFile = filedialog.asksaveasfilename(\ 24 filetypes = [("テキストファイル","*.csv")],\ 25 initialdir = iDir,\ 26 initialfile = "result",\ 27 defaultextension = ".csv",\ 28 title = "結果ファイルの出力") 29 30 w = open(resultFile, 'w') 31 writer = csv.writer(w, lineterminator='\n') 32 33 for line in reader: 34 # print(line) ここで表示されるファイル名は大文字 35 if list(search_target_path.glob("**/" + line)): 36 [ writer.writerow([line, p]) for p in search_target_path.glob("**/" + line) ] 37 # [ print(p) for p in search_target_path.glob("**/" + line) ] 38 # ここで表示されるパス名は小文字 39 else: 40 writer.writerow([line, ""]) 41 42 f.close() 43 w.close()

listFileとして呼ばれるテキストファイルの例

txt

1180903_A.jpg 2111111_ZA.jpg 3APPLE.jpg

上のファイルをE:\Users\XXX\画像 以下で検索した例

csv

1180903_A.jpg,E:\Users\XXX\画像\tmp\180903_a.jpg 2111111_ZA.jpg,E:\Users\XXX\画像\111111_za.jpg 3APPLE.jpg,E:\Users\XXX\画像\image\color\apple_jpg

補足情報(FW/ツールのバージョンなど)

Python 3.6.5

追記(20180911)

上ののコードの一部書き換えで不具合の回避ができましたので、共有いたします。

python

1- [ writer.writerow([line, p]) for p in search_target_path.glob("**/" + line) ] 2+ [ writer.writerow([line, p.with_name(line)]) for p in search_target_path.glob("**/" + line) ]

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

◆実行環境
3.6.5 (v3.6.5:f59c0932b4, Mar 28 2018, 17:00:18) [MSC v.1900 64 bit (AMD64)]

「pathlib glob lowercase」でググるとWindows pathlib.Path.glob(pattern) fixed part of the pattern changed to lowercase whereas it should be unchanged.のPRがあり、宛先ブランチ間違いでRejectされています。
その後、PRが再送信された形跡がないので、**現状の仕様(不具合)**みたいですね。

_WindowsFlavour#casefold

Python

1 def casefold(self, s): 2 return s.lower() 3 4 def casefold_parts(self, parts): 5 return [p.lower() for p in parts]

◆ミニマムコードで問題が再現できたので追記。
ファイルは大文字で作成し、コマンドプロンプトよりdirにて実際のファイル名を確認。

Python

1# -*- coding: utf-8 -*- 2from pathlib import Path 3search_target_dir = r"K:\BGM\ENE" 4search_target_path = Path(search_target_dir) 5 6line = "111111_ZA.txt" 7 8for p in search_target_path.glob("**/" + line): 9 print(p) # K:\BGM\ENE\111111_za.txt

◆発生条件
0. OSがWindows
0. Pathlib#globの引数に渡したファイル名がcase insensitiveで一致。
※line = "111111_*.txt"なら再現しない。

この2つの条件を満たす時に質問文の問題が発生する。

◆原因
pathlib.py#globより引用

Python

1 pattern = self._flavour.casefold(pattern) # この行でglobで渡された引数を小文字に 2 drv, root, pattern_parts = self._flavour.parse_parts((pattern,)) # pattern_partsに 3 if drv or root: 4 raise NotImplementedError("Non-relative patterns are unsupported") 5 selector = _make_selector(tuple(pattern_parts)) # この行で作成しているselectorが原因 6 for p in selector.select_from(self): 7 yield p

_PreciseSelector#_select_from関数にブレイクポイントを設置して動作確認すると変数の値が分かりやすいかもです。

投稿2018/09/03 06:03

編集2018/09/03 13:56
umyu

総合スコア5846

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

chibi144

2018/09/03 07:08

ありがとうございました。 small letterでずっと調べていたのですが、 lowercaseで検索したら良かったんですね。 勉強になりました。
chibi144

2018/09/10 07:23

遅くなりましたが、検証ありがとうございます。 ディレクトリまでのパスとファイル名を結合する感じで解決しようと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問