質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

Windows 7

Microsoft Windows 7は過去にリリースされたMicrosoft WindowsのOSであり、Windows8の1代前です。2009年の7月にリリースされ販売されました。Windows7の前はWindowsVistaで、その更に3年前にリリースされました。

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

Q&A

解決済

2回答

2381閲覧

Windows7でWord2VecのためのWikiコーパスを用意したいからgrepコマンドと同じようなfindstrコマンドを使いたい

退会済みユーザー

退会済みユーザー

総合スコア0

grep

grepはコマンドライン上でテキスト検索を可能にするユーティリティーです。元はUnixのために用意されたものです。

Windows 7

Microsoft Windows 7は過去にリリースされたMicrosoft WindowsのOSであり、Windows8の1代前です。2009年の7月にリリースされ販売されました。Windows7の前はWindowsVistaで、その更に3年前にリリースされました。

Windows

Windowsは、マイクロソフト社が開発したオペレーティングシステムです。当初は、MS-DOSに変わるOSとして開発されました。 GUIを採用し、主にインテル系のCPUを搭載したコンピューターで動作します。Windows系OSのシェアは、90%を超えるといわれています。 パソコン用以外に、POSシステムやスマートフォンなどの携帯端末用、サーバ用のOSもあります。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

自然言語処理

自然言語処理は、日常的に使用される自然言語をコンピューターに処理させる技術やソフトウェアの総称です。

0グッド

0クリップ

投稿2018/11/16 06:21

編集2018/11/16 08:48

イメージ説明

前提・実現したいこと

このサイトを参考にwikiのコーパスを用意していたのですが,Windowsではgrepコマンドが使えないため,findstrコマンドを使おうとしたところエラーが発生しました.

発生している問題・エラーメッセージ

find text/ | findstr wiki |awk "{system("cat $0" >> wiki.txt")}" FIND: パラメーターの書式が違います awk: cmd. line:2: {system(cat awk: cmd. line:2: ^ unexpected newline or end of sring

補足情報(FW/ツールのバージョンなど)

windows7
Python3.7.1

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

エラーが出てるのはfindstrではなくfindコマンドですね、LinuxのfindとWindowsのfindは機能が全く違いますので。Linuxのfindに近いWinのコマンドはdirになります。
コマンドプロンプトではなく上位版のPowershellを使った方がいいでしょう。後でコードも書き足します。

どこかで見たコマンド列だなと思ったら、先月別のQAサイトで まったく同じ質問 が出て回答しました。
そのサイトでのgrepの使い方は単にファイル名をフィルタしてるだけなのでfindstrも不適です。

コマンド プロンプトではこうなります。(Powershellではありません。)
なおバッチファイルにする場合は%をに%%に変更ください

batch

1for /r text\ %a in (*wiki.*) do type "%a" >>wiki.txt

Powershellで書くとこんな感じです。

powershell

1gci 'C:\hoge\text*wiki.*' -recurse |%{gc $_ -en oem|out-file 'C:\hoge\wiki.txt' -en oem -append}

投稿2018/11/16 10:47

編集2018/11/19 07:45
Turkis_Mond

総合スコア94

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/11/19 03:20

回答ありがとうございます. このままコピペして実行してみようと思ったのですが,'for' の後に始めの '(' が存在しません となりました...
Turkis_Mond

2018/11/19 03:23

Powershellでやったのかな?コマンドプロンプトからやってください。
退会済みユーザー

退会済みユーザー

2018/11/20 01:40

回答ありがとうございます. 承知しました.
guest

0

ベストアンサー

投稿2018/11/16 07:37

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2018/11/16 08:06

実行してみたところFlags not at the start of the expression...などと出てしばらく待機中なのですが,実行したらこういう挙動になるという認識で合っていますか?
hayataka2049

2018/11/16 08:34

画面のスクリーンショットを質問本文に貼ってみてください。
退会済みユーザー

退会済みユーザー

2018/11/16 08:46

添付しました.よろしくお願い致します.
hayataka2049

2018/11/16 09:01

処理そのものは終わる気配はありますか?結果のファイルは生成されていますか?
退会済みユーザー

退会済みユーザー

2018/11/19 03:01

返信が遅れてすみません. はい,生成されましたがサイズが大きすぎて開けないので中身は確認できておりません.
hayataka2049

2018/11/19 05:15

メッセージは警告なので一応無視しても構いません。その後の処理がうまくいけば成功していると思いますが、先に確認してみた方が良いですね(ファイル容量が大きくても部分的に読み込むような機能を持つテキストエディタで読める)
退会済みユーザー

退会済みユーザー

2018/11/20 01:40

うまくいきました.ありがとうございます!
hayataka2049

2018/11/20 02:15 編集

ちなみに、文字コードは何になりましたか? ちょっと気になっているので、確認して伝えていただけるとありがたいです
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問