質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.36%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

Q&A

解決済

2回答

1855閲覧

Linux のwcコマンドをmac OS Catalinaで使い、csvファイルの行数をカウントしたい。

taboopython

総合スコア40

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Linux

Linuxは、Unixをベースにして開発されたオペレーティングシステムです。日本では「リナックス」と呼ばれています。 主にWebサーバやDNSサーバ、イントラネットなどのサーバ用OSとして利用されています。 上位500のスーパーコンピュータの90%以上はLinuxを使用しています。 携帯端末用のプラットフォームAndroidは、Linuxカーネル上に構築されています。

0グッド

0クリップ

投稿2020/02/19 03:50

編集2020/02/19 04:42

Linux のwcコマンドをmac OS Catalinaで使いたいのですが、うまくいきません。

csvファイルの行数をカウントしたく、次のようにwcコマンドを使用しカウントを試みているのですが、次のようなエラーになりうまくいきません。
良い方法があればご教示いただければ幸いです。

python

1 import subprocess 2 line_count = int(subprocess.check_output(['wc', '-l', 'test.csv']).decode().sp 3 lit(' ')[0])

<エラー内容>
ValueError: invalid literal for int() with base 10: ''

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

quickquip

2020/02/19 03:58

wc -l test.csv を実行した結果を自分で確認していますか? 他の人にやってもらったなどで確認できていないということですか?
taboopython

2020/02/19 04:00

はい。実行した結果が本文に記載した内容になります。 ValueError: invalid literal for int() with base 10: ''
tiitoi

2020/02/19 06:02

CSV の行数を得たい場合は Python だけでもできますが、wcコマンドを使って行数を取得することは必須でしょうか?
taboopython

2020/02/19 09:05

ありがとうございます。処理速度が速いと伺い、wcを試している次第です。
taboopython

2020/02/19 09:13

ちなみに、for とenumerateは実証済みです。ありがとうございました。wcもうまく行きました。for文を使うよりも行数が短くなることで、大量処理には向いている、と理解しています。もし他にも、高速処理できそうな方法があればご教示いただければ幸いです。
guest

回答2

0

MacOSを使っているならHomebrewを導入する手もあります。
HomebrewでインストールしたwcコマンドはGNU版なので、
Linux版wcと同じ動作をするかもしれません。

Homebrew版のwc $ wc --version wc (GNU coreutils) 8.31 Copyright (C) 2019 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <https://gnu.org/licenses/gpl.html>. This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent permitted by law.
RaspberryPiのwc $ wc --version wc (GNU coreutils) 8.31 Copyright (C) 2019 Free Software Foundation, Inc. License GPLv3+: GNU GPL version 3 or later <https://gnu.org/licenses/gpl.html>. This is free software: you are free to change and redistribute it. There is NO WARRANTY, to the extent permitted by law.

投稿2020/02/19 06:08

technocore

総合スコア7337

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

taboopython

2020/02/19 09:07

ありがとうございます!wc --version をすると-bash: wc: コマンドが見つかりません。となり、実行できないので、別の方法を考えてみます。
taboopython

2020/02/19 09:15

ありがとうございます。Homebrewでインストールした記憶はなかったのですが、デフォルトで導入していたのか、うまくいきました。
guest

0

ベストアンサー

macOSにもwcコマンドはありますが、wcを実行した際の出力結果がlinuxのwcとは異なっており、出力結果の先頭にスペースが含まれてしまうようです。

sh

1# Linux (Ubuntu) 2$ wc -l hello.txt 311 hello.txt 4 5# macOS 6$ wc -l hello.txt 7 11 hello.txt

そのため、 split(' ')[0] が数字ではなく空文字となり、 int() で整数にキャストする際にエラーが発生しているようです。

wcの実行結果から先頭の空白文字を除去した後 split(' ') を実行することで期待の結果が得られると思われます。

投稿2020/02/19 04:02

notakaos

総合スコア84

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

taboopython

2020/02/19 04:13

ありがとうございます。症状は理解しました。が、今度はwcの実行結果から先頭の空白文字を除去する方法がわからず、lstripを使うのかとは思うのですが、 次の文のどこに記述すれば良いか(もしくは他の良い方法)、お分かりになればご教示いただければ幸いです。 import subprocess line_count = int(subprocess.check_output(['wc', '-l', 'test.csv']).decode().split(' ')[0])
Y.H.

2020/02/19 04:53

>どこに記述すれば splitの直前でいいんじゃないでしょうか。
taboopython

2020/02/19 09:07

ありがとうございます!うまくいきました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問