質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
86.02%
Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

コマンド

コマンドとは特定のタスクを行う為に、コンピュータープログラムへ提示する指示文です。多くの場合、コマンドはShellやcmdようなコマンドラインインターフェイスに対する指示文を指します。

コマンドプロンプト

コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

受付中

findstrコマンドのオプションgでの半角スペース

ashberry
ashberry

総合スコア0

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

コマンド

コマンドとは特定のタスクを行う為に、コンピュータープログラムへ提示する指示文です。多くの場合、コマンドはShellやcmdようなコマンドラインインターフェイスに対する指示文を指します。

コマンドプロンプト

コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

1回答

0グッド

0クリップ

233閲覧

投稿2022/11/28 12:46

編集2022/11/28 15:46

前提

Windows10のコマンドプロンプトでコマンドにて実行

実現したいこと

ファイル同士の共通行(同じ内容の行)をgrepして、ログに出力したいです。
ファイル通しは、基本同一内容なので、同一なら全ての内容がログに出力されるのが期待値です。

発生している問題・エラーメッセージ

ファイル通しの共通行をgrepしたいのですが、半角スペースが含まれてる行は、正しく判定できてなく結果に出力されません。

該当のソースコード

findstr /b /g:aaa.csv bbb.csv >out.csv

・aaa.csvとbbb.csvの内容
aaa bbb 1
aaa bb b1
aaa bbb 1

・out.csvの出力内容
aaa bbb 1
aaa bbb 1

試したこと

検索一致のオプション(b,xなど)は試しました。
ファイルから読み取った行に含まれる、半角スペースをORと認識してると思います。
ORではなく、1行の文字列として扱いたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

下記のような質問は推奨されていません。

  • 質問になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

適切な質問に修正を依頼しましょう。

otn

2022/11/28 13:13

例えばどういうデータでしょうか? 現象が発生する aaa.csv と bbb.csv を提示しましょう。
ashberry

2022/11/28 15:48

すみません、データの具体例を該当ソースコード欄に追記しました。 (中身は全然csvで無いです)

回答1

0

どうも、findstr.exe の多バイト文字処理のバグのようです。
findstr /b /g:aaa.csv aaa.csvで、
2行しか出力されないケース:

text

1aaa bbb 1 2aaa bb b1 3aaa bbb 1

3行とも出力されるケース:

text

1aaa bbb 1 2aaa bx b1 3aaa bbb 1

データを修正していろいろ試しましたが、2行しか出ないことが再現する条件がよくわかりません。
全角文字のある次の行がある条件で無視される、あるいは変形されて認識される、と言うことではあるのでしょうが、単純に先頭何バイトかが欠けて認識されるではなさそうです。
ファイルをUTF-8にして、コマンドプロンプトでchcp 65001して実行しても同じ結果です。

ただ、このデータだと、/xを付ければ全部出力されます。/xにしても駄目だったと言うことなので、その時は違うデータだったのでしょうか。

確認した環境は、Windows10 21H2 で、
2019/12/07 18:09 36,352 findstr.exe

過去に、cmd.exe のバグにいくつか遭遇しましたが、次のWindowsバージョンでは直ってました。
ただ、これはおそらく昔からのバグっぽいので、直るのは望み薄か。

投稿2022/11/29 04:32

otn

総合スコア81082

下記のような回答は推奨されていません。

  • 質問の回答になっていない投稿
  • スパムや攻撃的な表現を用いた投稿

このような回答には修正を依頼しましょう。

回答へのコメント

otn

2022/11/29 05:40

解決方法としては、grepを入れるのでしょうか。MSYS2のgrepならShift_JISに対応しているようです。 set LANG=ja_JP.CP932 grep -F -x -f aaa.csv aaa.csv 正規表現を使うわけじゃなくて固定文字列なので、Shift_JIS非対応のものでも良いかもしれません。

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
86.02%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

コマンド

コマンドとは特定のタスクを行う為に、コンピュータープログラムへ提示する指示文です。多くの場合、コマンドはShellやcmdようなコマンドラインインターフェイスに対する指示文を指します。

コマンドプロンプト

コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。