質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Node.js

Node.jsとはGoogleのV8 JavaScriptエンジンを使用しているサーバーサイドのイベント駆動型プログラムです。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Q&A

2回答

1553閲覧

JavaScript: 二次元配列の書き方 - node.js

Tats.N

総合スコア62

Node.js

Node.jsとはGoogleのV8 JavaScriptエンジンを使用しているサーバーサイドのイベント駆動型プログラムです。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

0グッド

0クリップ

投稿2016/03/09 09:15

node.jsのrequestでスクレイプしてきた情報を二次元配列の中に入れたいです。

javascript

1var request = require('request'); 2var cheerio = require('cheerio'); 3 4var pageInfo = new Array; 5 6request('https://teratail.com/',function(error, response, html){ 7 if(!error && response.statusCode == 200){ 8 var $ = cheerio.load(html); 9 $('.ttlItem,txtHiddenQuestion').each(function(i, element){ 10 var title = $(this).find('a'); 11 var desc = $(this).find('.txt'); 12 pageInfo.push([title.text(),desc.text()]); 13 console.log(pageInfo); 14 15 }) 16 } 17}) 18 19

このように、タイトルと説明文を二次元配列としてpageInfoに入れるにはどう書けばいいですか?
それと、このコードを実行すると1度スクレイプし終わってるはずの情報が何度かにわたってまたスクレイプされるのですが、なぜでしょうか?
わかる方宜しくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

「何度もスクレイプされる」のほうは、cheerio に指定しているセレクタ文字列が意図したとおりに機能していないのが原因ではないでしょうか。
現状 $('.ttlItem,txtHiddenQuestion') となっていますが、これだと class='ttlItem' が指定されているすべてのDOM要素と、<txtHiddenQuestion> というタグ名のすべてのDOM要素を列挙した上で、それらすべてに対して .each() 内の function を実行することになると思います。

投稿2016/03/09 13:47

tkanda

総合スコア2425

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

0

なんどもスクレイプされるのは、ちょっとわかりませんが配列に関して。

Javascript

1pageInfo.push([title.text(),desc.text()]); 23pageInfo.push({title:title.text(), desc:desc.text()});

とすると、pageInfo[0].titleとpageInfo[0].descでアクセスできます。
どうでしょう?

投稿2016/03/09 09:38

shi_ue

総合スコア4437

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問