質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

1729閲覧

subprocessでのエラー(TypeError: a bytes-like object is required, not 'str')

kohekoh

総合スコア140

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

Anaconda

Anacondaは、Python本体とPythonで利用されるライブラリを一括でインストールできるパッケージです。環境構築が容易になるため、Python開発者間ではよく利用されており、商用目的としても利用できます。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2018/05/24 13:11

タイトルのエラーが発生します

関係があるところのコードをのせます

python

1 2tokenizer_cmd = ['./tokenizer.perl', '-l', 'en', '-q', '-'] 3 4 5def tokenize(sentences): 6 7 print('Tokenizing..', end=' ') 8 text = "\n".join(sentences) 9 tokenizer = Popen(tokenizer_cmd, stdin=PIPE, stdout=PIPE, shell=True) 10 tok_text = tokenizer.communicate(text) #もともとはtok_text, _ 11 toks = tok_text.split('\n')[:-1] 12 print('Done') 13 14 return toks 15 16def build_dict(path): 17 sentences = [] 18 currdir = os.getcwd() 19 os.chdir('%s/pos/' %path) 20 for ff in glob.glob("*.txt"): 21 with open(ff, 'r') as f: 22 sentences.append(f.readline().strip()) 23 os.chdir('%s/neg/' %path) 24 for ff in glob.glob("*.txt"): 25 with open(ff, 'r') as f: 26 sentences.append(f.readline().strip()) 27 os.chdir(currdir) 28 29 sentences = tokenize(sentences) 30 31 32def main(): 33 path = dataset_path 34 dictionary = build_dict(os.path.join(path, 'train')) 35 36if __name__ == '__main__': 37 main()

エラーは以下の通りです

python

1Traceback (most recent call last): 2 File "imdb_preprocess.py", line 134, in <module> 3 main() 4 File "imdb_preprocess.py", line 112, in main 5 dictionary = build_dict(os.path.join(path, 'train')) 6 File "imdb_preprocess.py", line 64, in build_dict 7 sentences = tokenize(sentences) 8 File "imdb_preprocess.py", line 44, in tokenize 9 tok_text = tokenizer.communicate(text) #もともとtok_text, _ 10 File "C:\Users\ユーザ名\Anaconda3\envs\py3.5\lib\subprocess.py", line 803, in communicate 11 stdout, stderr = self._communicate(input, endtime, timeout) 12 File "C:\Users\ユーザ名\Anaconda3\envs\py3.5\lib\subprocess.py", line 1039, in _communicate 13'.' は、内部コマンドまたは外部コマンド、 14操作可能なプログラムまたはバッチ ファイルとして認識されていません。 15 self._stdin_write(input) 16 File "C:\Users\ユーザ名\Anaconda3\envs\py3.5\lib\subprocess.py", line 741, in _stdin_write 17 self.stdin.write(input) 18TypeError: a bytes-like object is required, not 'str'

読み込みの仕方を変えたりしたのですが、いまいちわかりませんでした
教えていただければ幸いです

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

環境がわかりませんが、プロンプトから

./tokenizer.perl -l en -q -

とタイプすると実行できるんですか?

. というコマンドを /tokenizer.perl -l en -q -というオプションで実行しろ、という解釈になっているように見えますが。


そもそも実行できないコマンドを指定しても、実行できませんね。当たり前ですが。


TypeError: a bytes-like object is required, not 'str'のエラーはこちらですね。

https://docs.python.jp/3.6/library/subprocess.html#subprocess.Popen

If encoding or errors are specified, (略) Otherwise, they are opened as binary streams.

https://docs.python.jp/3.6/library/subprocess.html#subprocess.Popen.communicate

If streams were opened in text mode, input must be a string. Otherwise, it must be bytes.

から、Popenencoding=付きで作るなどしないと、communicateに渡すのはbytes型である必要がありますね。

投稿2018/05/24 14:36

編集2018/05/24 15:29
quickquip

総合スコア11038

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kohekoh

2018/05/24 15:08

windows上のanacondaでやってます 実行すると '.' は、内部コマンドまたは外部コマンド、 操作可能なプログラムまたはバッチ ファイルとして認識されていません。 このようになりますね…
kohekoh

2018/05/25 05:19

とりあえず強引にbyte型に変えたら 一応進みました ありがとうございました
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問