質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.09%

Perlでディレクトリを再帰検索できない

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 651

score 39

MacOS(mohave)上で特定の文字列がフォルダ名・ファイル名に含まれているか、Perlで再帰のプログラムを書いたのですが、ちゃんと検索されるフォルダと検索されないフォルダがあります。
チェックしたフォルダ構造は以下です。

/Users/linming/web/members/
  +running
  | +印刷費
  | +印刷物.PNG
  | +copy_recurese.pl
  | +htaccess
  | +sfs.cgi
  | +印刷物.cgi
  +stats
  | +controller.php
  | +model.php
  | +test.php
  +test
  | +hoge.png
  | +印刷物.png
  +印刷物
  | +印刷代
  | +hoge.png
  | +印刷物.png
  | +sfs.cgi
  +sfs.cgi
  +sfss.cgi
  +sfsimple.cgi


プログラムは以下です。

#!/usr/bin/perl -w

use strict;
use utf8;
use CGI;
use URI::Escape;
use File::Basename;
use File::Path;
use Encode;
use FindBin;
binmode STDOUT, ':utf8';

# initialization.
my $q = new CGI;
my $file = "";
my @files = ();
my $dir = "";
my @dirs = ();
my $out = "";

#GET処理
my $searchText = "";
if($q->request_method eq "GET"){
  $searchText = $q->escapeHTML($q->param('text'));
}
#ファイル探索
sub EnumFiles($$@){
  my ($dir, $text, @results) = @_;
    opendir(DIR, decode('UTF-8', $dir)) or die("Can not open directory : $dir\n");
    my @files = readdir(DIR) or die("Can not read files : @files\n");
    closedir(DIR);

  foreach $file(sort @files){
        next if($file =~ /^\.{1,2}$/);
        if(-d $file){
            print("Entering $file<br />\n");
            if("$dir/$file" =~ /$text/){
                push(@results, "$dir/$file");
            }
            @results = &EnumFiles("$dir/$file", $text, @results);
        }
        elsif(-f $file){
            print("Checking $dir/$file<br />\n");
            if("$dir/$file" =~ /$text/){
                push(@results, "$dir/$file");
            }
        }
    }
  return @results;
}
# write header.
$out = <<"EOM";
Content-type: text/html

<?xml version="1.0" encoding="utf-8"?>
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
        "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
<html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja">
<head>
<meta http-equiv = "Content-Type" content = "text/html; charset = utf-8" />
<body>
EOM
print($out) or die($!);

my $fullpath = decode('UTF-8', uri_unescape($FindBin::Bin));
# get files and directories.
my $decText = decode('UTF-8', $searchText);
print("<p>Search Text : $decText</p>\n") or die($!);
print("<ul>") or die($!);
my @result = ();
@result = EnumFiles($fullpath, $searchText, @result);
foreach my $file(@result){
  my $basename = decode('UTF-8', $file);
  $out = <<"EOM";
  <li>$basename</li>
EOM
  print($out);
}
print("</ul>");

# print footer.
$out = <<"EOM";
</body>
</html>
EOM
print($out) or die($!);

undef($q);


プログラムの実行結果は以下です。

Search Text : cgi

Checking /Users/linming/Documents/web/members/.DS_Store
Checking /Users/linming/Documents/web/members/copy_recurse.pl
Checking /Users/linming/Documents/web/members/meets.bass-world.conf
Entering running
Checking /Users/linming/Documents/web/members/running/.DS_Store
Checking /Users/linming/Documents/web/members/running/copy_recurse.pl
Checking /Users/linming/Documents/web/members/running/sfs.cgi
Checking /Users/linming/Documents/web/members/sfs.BAK
Checking /Users/linming/Documents/web/members/sfs.cgi
Checking /Users/linming/Documents/web/members/sfs.cgi.bak20190720
Checking /Users/linming/Documents/web/members/sfss.cgi
Checking /Users/linming/Documents/web/members/sfssimple.cgi
Entering stats
Entering test
Entering 印刷物
Checking /Users/linming/Documents/web/members/印刷物/.DS_Store
Checking /Users/linming/Documents/web/members/印刷物/sfs.cgi
・/Users/linming/Documents/web/members/running/sfs.cgi
・/Users/linming/Documents/web/members/sfs.cgi
・/Users/linming/Documents/web/members/sfs.cgi.bak20190720
・/Users/linming/Documents/web/members/sfss.cgi
・/Users/linming/Documents/web/members/sfssimple.cgi
・/Users/linming/Documents/web/members/印刷物/sfs.cgi


web/members配下のディレクトリを全て舐めていないように思えます。
日本語のディレクトリでうまくいかないのなら、encode/decodeの処理が間違っているからだと思いますが、1バイトコードのディレクトリでもうまく言っていません。(上記「stats」「test」配下)
原因は何でしょうか?

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

+1

"Entering stats"までは到達しているようなので、そこからデバッガでステップ実行してみれば原因が特定できるでしょう。

  1. perl -d スクリプト名
  2. プロンプトが出たらデバッグコマンドでブレイクポイント設定 b 行番号 if $file eq 'stats'
    ここで行番号はif(-d $file){の行でいいでしょう。
  3. cでブレイクポイントまで実行
  4. 止まったらnでステップ実行。期待通りにループ内の分岐を進まないなら条件式を見直す。p 式で任意の条件式や変数の中身を確認できる。

デバッガのl,c,n,b,q コマンドをまず覚えましょう。

しかし、こういう処理を実行したいときのお勧めは、自前で再帰呼び出し関数を苦労して書くのではなく、File::Findモジュールを使うことです。

最短でFile::Findなスクリプトを作る方法

  1. find2perl . -name home > test.pl 書式は標準findコマンドとほぼ同じ。ファイルの処理を実行する代わりにスクリプトのひな形が出力される。
  2. できたtest.plのsub wantedの中にファイルごとにやりたい処理を書く。対象ディレクトリ名とファイル名は初めから$dir$nameで参照できるようになっている。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/09/14 19:05

    具体的なご示唆およびデバッガの使い方、ありがとうございました。
    今回はnomuken様をベストアンサーにしましたが、KojiDoi様もベストアンサーにしたいぐらいでした。
    ありがとうございました。

    キャンセル

checkベストアンサー

0

対象がファイルでもディレクトリでもない可能性(例えばシンボリックリンク)を考えてfilesの要素数やelseブロックを追加してデバッグ出力してみるのはどうでしょうか?

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/09/14 19:02

    ご教示ありがとうございます。
    シンボリックリンク等ではなくファイルなのは確認しているのですが、
    elsif(-f $file){

    else{
    に変えたらちゃんと走査するようになりました。日本語のファイルも思った通りの挙動になりました。
    ありがとうございました。

    キャンセル

  • 2019/09/14 20:55

    よく考えたら
    elsif(-f $file)
    はフルパスで判定していないので'/Users/linming/web/members/'直下だけしか正しく判定できないと思います。

    キャンセル

  • 2019/09/14 21:01

    あ、なるほど。
    ご指摘ありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.09%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

関連した質問

同じタグがついた質問を見る