質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

3回答

2445閲覧

webスクレイピングするならどの言語がよさそうでしょうか?

you88

総合スコア147

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

VBA

VBAはオブジェクト指向プログラミング言語のひとつで、マクロを作成によりExcelなどのOffice業務を自動化することができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

1クリップ

投稿2018/07/22 13:21

編集2018/07/22 23:54

webスクレイピングで情報収集をできるようになりたいのですがどの言語を用いるのが良さそうでしょうか?各方法のメリットデメリットがいまいちわからず選ぶのに困っています。rubyをメインで書いているんですがrubyとの違いを得に知りたいです。nokogiriかbeautiful soupかの違いになるんでしょうか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

m.ts10806

2018/07/22 13:40 編集

どこでそのような情報を目にしたのでしょうか。 >pythonがwebスクレイピングで主流  また、この質問をした意図、落とし所を明確にしてください。「それを聞いてどうしたいの?」という部分です。現時点では課題や問題が発生しているようには思えません。 https://teratail.com/help/avoid-asking >漠然とした興味から票を募るような質問や、意見の主張をすることを目的とした投稿は推奨していません。 何か困っている理由があり、最適解を見つける為の知見を得たい場合は、その理由や何が知りたいのかを明確に記述してください。
you88

2018/07/22 23:56

語弊招いてすみませんでした。たしかに主流という言い方は良くなかったですね。修正させてもらいました。目的は技術選択の相談でwebスクレイピングをするにあたって技術選択する際の各手法のメリットデメリットを相談したいというものでした。こちら修正させていただきました。
m.ts10806

2018/07/23 00:15

いずれにしても今の質問内容では「課題・問題が発生していない」状態です。 また、この質問をした意図、落とし所を明確にしてください。「それを聞いてどうしたいの?」という部分です。
you88

2018/07/23 00:36

繰り返しになりますが技術選択するにあたって選ぶ基準がわからないという課題が発生していてそのメリット・デメリットを教えてもらっている状態です。そしてそれに対しての回答も来ているので課題も目的も提示していてその回答も来ているという状態ですが逆にmts10806さんはなにを求められていますか?
m.ts10806

2018/07/23 01:37

見当違いだったら申し訳ないですが、結局のところ自分でやってみて感じるしかない部分だからです。例えば「Pythonが最適ですよ」という回答がついたとして、学習して使いこなせるかどうかは自身のリソースによるかと思います。結局どのような言語を用いてもおおよそ実現が可能である場合、「メリットデメリット」は人によって違います。各言語の習熟度にもよるでしょう。それと天秤にかけたとき、結局のところ「自分の得意な言語でやります」という回答でとどまることとなり、メリットデメリットの説明までできません。なので他の回答とも重複しますし私は回答を保留しています。
you88

2018/07/23 08:06

なるほど。まず最初あげてもらった問題点が課題が明確じゃないだったと思うんですがそれは問題なかったという認識でいいでしょうか?今あげてもらった次の問題点はメリットデメリットが人によって違うものだからで良いでしょうか?で、もちろん自身のスキルによりますが日本語文献多いかやその後の処理考えて選んだ方が良いよなど僕的には有益な情報をもらえているので引き続き掲載させてもらいます。また問題ありましたら仰ってください。
yukihisa

2018/08/31 06:47

細かいけど語弊は「ある」もので「招く」のは誤解です。語弊=誤解を招く言い方なので。あと、得に→特にですね。mts10806様が言いたいのは、結局回答が「どの言語でも実現可能だし、それぞれにメリットデメリットがあるので最終的に好みの問題」になってしまう可能性が高い(実際そういう回答がついている)ので、落としどころを明確にしないとただのアンケートになってしまうということです。teratailは今後同じ問題に直面する同輩たちの為のサイトでもあるので、あなただけに有意義なものではよろしくないです。
guest

回答3

0

Rubyが一番得意なら、主流がどうとか関係なく、Rubyでコードを書けばいいと思います。
ちなみに私ならまよわずperlを選択します。なぜなら私がもっとも慣れ親しんでいる言語がperlであって、必要十分な機能・性能を発揮できることがはっきりわかっているからです。

なお、スクレイピングにのみ着目するのも考え物です。スクレイピングがゴールではなく、その先の処理が何かあるはずです。その部分も含めて総合的な効率を考えましょう。

投稿2018/07/22 14:30

KojiDoi

総合スコア13671

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

you88

2018/07/22 23:59

>なお、スクレイピングにのみ着目するのも考え物です。スクレイピングがゴールではなく、その先の処理が何かあるはずです。その部分も含めて総合的な効率を考えましょう。 そうですね。そちら抜けていました。ありがとうございます。
guest

0

pythonがwebスクレイピングで主流なんて、これまで聞いたことがありませんが・・・

できれば軽量プログラミング言語で書きたいタスクですよね。そうすると、その時々で主流レベルで流行ってるLLが「webスクレイピングでも主流」という扱いになるのでしょう。最近はpythonです(特に世界的には)。

ということだと思って私は納得しました。本当かどうかはわかりません。


rubyとの違い
nokogiriかbeautiful soupかの違いになるんでしょうか?

nokogiriとbeautiful soupなら、たぶん多少の使い勝手の違い以上の差はないでしょう。

それで、今どきのモダンでリッチなサイトのスクレイピングだとseleniumなんか使う機会も多いでしょう。seleniumはpythonでもrubyでも使えます。

要するに、本質的に違うことはそんなにないので、それほど本質的ではないところ(流行り廃れ、好き嫌い、得手不得手)で選んでも後悔はしません。


ただし、新し目の情報やライブラリに関してはpythonの方が充実しています。なので、そういうところに魅力を感じるのならpython。

(pythonは英語情報はともかく日本語情報が・・・とずっと言われてきましたが、ここ数年は日本語圏でも情報が充実してきた感があります。なので、普通に使えます)

投稿2018/07/22 20:53

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

you88

2018/07/22 23:59

>pythonがwebスクレイピングで主流なんて、これまで聞いたことがありませんが・・・ 主流という言い方たしかに極端な言い方だったので修正させていただきました。 >できれば軽量プログラミング言語で書きたいタスクですよね。そうすると、その時々で主流レベルで流行ってるLLが「webスクレイピングでも主流」という扱いになるのでしょう。最近はpythonです(特に世界的には)。 そうですね。そういう意味で主流と表現させていただきました。 >pythonは英語情報はともかく日本語情報が・・・とずっと言われてきましたが、ここ数年は日本語圏でも情報が充実してきた感があります。なので、普通に使えます ありがとうございます。非常に参考になります。
guest

0

投稿2018/08/31 06:35

Yuki-Sakuraba

総合スコア163

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問