質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

WordPress

WordPressは、PHPで開発されているオープンソースのブログソフトウェアです。データベース管理システムにはMySQLを用いています。フリーのブログソフトウェアの中では最も人気が高く、PHPとHTMLを使って簡単にテンプレートをカスタマイズすることができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

Q&A

0回答

951閲覧

GASでパスワード保護ページにログインしスクレイピングしたい

退会済みユーザー

退会済みユーザー

総合スコア0

Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

WordPress

WordPressは、PHPで開発されているオープンソースのブログソフトウェアです。データベース管理システムにはMySQLを用いています。フリーのブログソフトウェアの中では最も人気が高く、PHPとHTMLを使って簡単にテンプレートをカスタマイズすることができます。

JavaScript

JavaScriptは、プログラミング言語のひとつです。ネットスケープコミュニケーションズで開発されました。 開発当初はLiveScriptと呼ばれていましたが、業務提携していたサン・マイクロシステムズが開発したJavaが脚光を浴びていたことから、JavaScriptと改名されました。 動きのあるWebページを作ることを目的に開発されたもので、主要なWebブラウザのほとんどに搭載されています。

0グッド

0クリップ

投稿2020/08/14 06:04

編集2020/08/14 06:06

前提・実現したいこと

GASでwordpressのパスワード保護ページにログインし、表示される内容をスクレイプしたいのですが、ログインがうまくできません。

発生している問題・エラーメッセージ

403や404

該当のソースコード

php

1<?php if( !post_password_required( $post->ID ) ) : ?> 2 //下記のブロック要素をスクレイプしたい 3 <div class="hg1"> 4 </div> 5<?php else: ?> 6<?php echo get_the_password_form(); ?> 7<?php endif; ?>

試したこと

gs

1function testLogin(){ 2 //下記はvar LOGIN_URL = "https://hghg/wp-login.php"や固定ページのパスなど色々変更しましたがうまくいきませんでした。 3 //Request URLなども参照し行いましたがここが間違えているかもしれません。 4 //hghgは例です。 5 var LOGIN_URL = "https://hghg/wp-login.php?action=postpass"; 6 7 // POSTデータ 8 var payload_data = { 9 //Chromeの開発者ツールのNetwork->Form Dataを参照し設定しました。 10 "post_password":"保護ページにログインするパスワード", 11 "Submit": "確定", 12 }; 13 14 // POSTオプション 15 var post_options = { 16 method: "POST", 17 contentType: "application/x-www-form-urlencoded", 18 payload: payload_data, 19 followRedirects: false 20 }; 21 22 // POSTリクエスト 23 var response = UrlFetchApp.fetch(LOGIN_URL, post_options); 24 25 // レスポンスヘッダーからcookieを取得 26 var cookies = response.getHeaders()["Set-Cookie"]; 27 28 // ログインで認証されたcookieをヘッダーで使用 29 var headers = { Cookie: cookies }; 30 var get_options = { 31 method: "get", 32 headers: headers, 33 followRedirects: true, 34 }; 35 var SCRAPING_URL = "https://hghg/対象の固定ページ/"; 36 37 response = UrlFetchApp.fetch(SCRAPING_URL, get_options); 38 var content = response.getContentText("UTF-8"); 39 Logger.log(content) 40}

と上記のようにCookieの情報を取得し行おうとしました。

期待する結果

期待する結果としては、

<div class="hg1"> </div> を含む文字列を取得したいです。

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問