質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Q&A

解決済

2回答

831閲覧

webページから取得したデータを配列に入れたいが、正規表現をどう書けばよいかわからない。

Dolphiiiin

総合スコア19

Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

0グッド

0クリップ

投稿2019/11/25 16:19

編集2019/11/26 15:30

GASでWebページから取得したHTMLを変数sourceに入れて、.matchで複数のデータを配列へと代入しようとしたのですが、
どう正規表現を記述すればよいのかわかりません。


html

1<p class="boid main-root jss439">10日</p> 2:略 3<p class="boid main-root jss569">18日</p> 4:略 5<p class="boid main-root jss659">20日</p>

webページのHTML内で上記の部分があるとして、この中の**日の部分を抜き出し、配列に代入したいです。
この場合の正規表現はどのように記述すればいいのでしょうか?


様々なことを試したのですが、jss***の部分が不特定なため、ページ全体から抜き出すことが自分はできませんでした。

また、jss***の数値部分は3桁ということで確定しています。

その他

HTMLは以下のコードでsourceへ代入しています。

javascript

1 const URL = 'https://example.com'; //Target URL 2 var key = '##-#####-#####-#####-#####-#####'; 3 4 var option = 5 {url:URL, 6 renderType:"HTML", 7 outputAsJson:true}; 8 var payload = JSON.stringify(option); 9 payload = encodeURIComponent(payload); 10 var url = "https://phantomjscloud.com/api/browser/v2/"+ key +"/?request=" + payload; 11 var response = UrlFetchApp.fetch(url); 12 13 var json = JSON.parse(response.getContentText()); 14 var source = json["content"]["data"];

他の部分で少々強引ですが、他の部分は下のようにして抜き出すことができました。

javascript

1 var itemRegexp = new RegExp(/<a href="/events/(.*?)>/g); 2 var item = source.match(itemRegexp); 3 4 for (var i = 0; i < item.length; i++){ 5 item[i] = item[i].replace("<a href=\"/events/", ""); 6 item[i] = item[i].replace("\">", ""); 7 Logger.log(item[i]); 8 }

===
どうかよろしくお願いします

###追記(2019/11/27)

実行環境についてわかりにくかったと思われるため、追記します。

実行環境

Google Apps Script 同スクリプトファイルでは、ES5で記述しているため、基本的にES5を使用したいです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

papinianus

2019/11/26 00:46

ライブラリ使ってもいいですか?正規表現限定でしょうか
Dolphiiiin

2019/11/26 05:29

使っても構いません。 が、GASを使っているため、ES6を使用することができません。
guest

回答2

0

ベストアンサー

matchAllが使えれば以下のように書けますが…

JavaScript

1const days = [...` 2 <p class="boid main-root jss439">10日</p> 3 :略 4 <p class="boid main-root jss569">18日</p> 5 :略 6 <p class="boid main-root jss659">20日</p> 7`.matchAll(/jss\d{3}">(.*?)</g) 8].map(match => match[1]); 9console.log(days); 10//=> ["10日", "18日", "20日"]

まだ使えないでしょうから以下でしょうか。execの説明のこのあたりが参考になると思います。

JavaScript

1const source = ` 2 <p class="boid main-root jss439">10日</p> 3 :略 4 <p class="boid main-root jss569">18日</p> 5 :略 6 <p class="boid main-root jss659">20日</p> 7`; 8const regex = /jss\d{3}">(.*?)</g; 9const days = []; 10let match; 11while ((match = regex.exec(source)) !== null) days.push(match[1]); 12console.log(days); 13//=> ["10日", "18日", "20日"]

replaceの第二引数にreplacer関数を渡して以下のようにすることでも達成可能です。

JavaScript

1const days = []; 2` 3<p class="boid main-root jss439">10日</p> 4:略 5<p class="boid main-root jss569">18日</p> 6:略 7<p class="boid main-root jss659">20日</p> 8`.replace(/jss\d{3}">(.*?)</g, (match, sub) => { 9 days.push(sub); 10}); 11console.log(days); 12//=> ["10日", "18日", "20日"]

投稿2019/11/25 18:34

shinji709

総合スコア805

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Dolphiiiin

2019/11/26 15:22

回答ありがとうございます。 GAS環境下で行っているため、たしかに"matchALL"が使用できません。 なので、頂いた2つ目、3つ目のコードで試したのですが、 共にエラーが発生してしまい、実行することができません。 Firefoxのコンソールで実行してみましたが、Firefoxの場合、正常に動作します。 以下は実行した際のスクリーンショットです。 :GASで実行した場合 https://gyazo.com/d0e1e2fcf2176fb71f42b6efb176a247 https://gyazo.com/5656952d387999ad4a541f7a3748c497 :Firefoxコンソール上で実行した場合 https://gyazo.com/2181409a2ef0b138f4b54f86c723ea24 https://gyazo.com/5656952d387999ad4a541f7a3748c497 GASで実行する場合、構文を変えた方がよいのでしょうか。
shinji709

2019/11/26 16:11

gasはES2015の構文色々と使えないんでしたね…。 constもletもvarに書き換えて、 sourceは、 var source = '<p class="boid main-root jss439">10日</p>' + ':略' + '<p class="boid main-root jss569">18日</p>' + ':略' + '<p class="boid main-root jss659">20日</p>' ; のように+で連結ではどうでしょうか。 clasp( https://github.com/google/clasp )導入も考えてもいいかもしれませんね。
guest

0

複数のデータを配列へと代入しようとした

配列化が目的なら、querySelectorAll() の引数を属性セレクタで指定する方法もあります。

次の3つは、正規表現のようなマッチング機能を実現します。

  1. [属性名^=]
  2. [属性名$=]
  3. [属性名*=]

ご質問の jss を含む場合は、 p[class*=jss] で取得できそうです。

webページのHTML内で上記の部分があるとして、この中の**日の部分を抜き出し、配列に代入したいです。

この場合の正規表現はどのように記述すればいいのでしょうか?

javascript

1let paragraphs = document.querySelectorAll("p[class*=jss]"); 2let days = Array.from(paragraphs).map(el=>el.textContent); 3console.log(days): // ["10日", "18日", "20日"]

追記)
HTMLソースを取得ぜず、DOMで扱う事例となります。

投稿2019/11/25 20:58

編集2019/11/25 21:28
AkitoshiManabe

総合スコア5432

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問