質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

コマンド

コマンドとは特定のタスクを行う為に、コンピュータープログラムへ提示する指示文です。多くの場合、コマンドはShellやcmdようなコマンドラインインターフェイスに対する指示文を指します。

コマンドプロンプト

コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

Q&A

1回答

419閲覧

findstrコマンドのオプションgでの半角スペース

ashberry

総合スコア0

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

コマンド

コマンドとは特定のタスクを行う為に、コンピュータープログラムへ提示する指示文です。多くの場合、コマンドはShellやcmdようなコマンドラインインターフェイスに対する指示文を指します。

コマンドプロンプト

コマンドプロンプト(cmd.exe)はMicrosoftによって提供されているコマンドラインインタプリタです。OS/2・Windows CE・Windows NTで使用可能です。

正規表現

正規表現とは特定の文字列によるパターンマッチングを行う際に用いられる宣言型プログラミングです。

0グッド

0クリップ

投稿2022/11/28 12:46

編集2022/11/28 15:46

前提

Windows10のコマンドプロンプトでコマンドにて実行

実現したいこと

ファイル同士の共通行(同じ内容の行)をgrepして、ログに出力したいです。
ファイル通しは、基本同一内容なので、同一なら全ての内容がログに出力されるのが期待値です。

発生している問題・エラーメッセージ

ファイル通しの共通行をgrepしたいのですが、半角スペースが含まれてる行は、正しく判定できてなく結果に出力されません。

該当のソースコード

findstr /b /g:aaa.csv bbb.csv >out.csv

・aaa.csvとbbb.csvの内容
aaa bbb 1
aaa bb b1
aaa bbb 1

・out.csvの出力内容
aaa bbb 1
aaa bbb 1

試したこと

検索一致のオプション(b,xなど)は試しました。
ファイルから読み取った行に含まれる、半角スペースをORと認識してると思います。
ORではなく、1行の文字列として扱いたいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2022/11/28 13:13

例えばどういうデータでしょうか? 現象が発生する aaa.csv と bbb.csv を提示しましょう。
ashberry

2022/11/28 15:48

すみません、データの具体例を該当ソースコード欄に追記しました。 (中身は全然csvで無いです)
guest

回答1

0

どうも、findstr.exe の多バイト文字処理のバグのようです。
findstr /b /g:aaa.csv aaa.csvで、
2行しか出力されないケース:

text

1aaa bbb 1 2aaa bb b1 3aaa bbb 1

3行とも出力されるケース:

text

1aaa bbb 1 2aaa bx b1 3aaa bbb 1

データを修正していろいろ試しましたが、2行しか出ないことが再現する条件がよくわかりません。
全角文字のある次の行がある条件で無視される、あるいは変形されて認識される、と言うことではあるのでしょうが、単純に先頭何バイトかが欠けて認識されるではなさそうです。
ファイルをUTF-8にして、コマンドプロンプトでchcp 65001して実行しても同じ結果です。

ただ、このデータだと、/xを付ければ全部出力されます。/xにしても駄目だったと言うことなので、その時は違うデータだったのでしょうか。

確認した環境は、Windows10 21H2 で、
2019/12/07 18:09 36,352 findstr.exe

過去に、cmd.exe のバグにいくつか遭遇しましたが、次のWindowsバージョンでは直ってました。
ただ、これはおそらく昔からのバグっぽいので、直るのは望み薄か。

投稿2022/11/29 04:32

otn

総合スコア84505

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

otn

2022/11/29 05:40

解決方法としては、grepを入れるのでしょうか。MSYS2のgrepならShift_JISに対応しているようです。 set LANG=ja_JP.CP932 grep -F -x -f aaa.csv aaa.csv 正規表現を使うわけじゃなくて固定文字列なので、Shift_JIS非対応のものでも良いかもしれません。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問