前提・実現したいこと
GASでwordpressのパスワード保護ページにログインし、表示される内容をスクレイプしたいのですが、ログインがうまくできません。
発生している問題・エラーメッセージ
403や404
該当のソースコード
php
1<?php if( !post_password_required( $post->ID ) ) : ?> 2 //下記のブロック要素をスクレイプしたい 3 <div class="hg1"> 4 </div> 5<?php else: ?> 6<?php echo get_the_password_form(); ?> 7<?php endif; ?>
試したこと
gs
1function testLogin(){ 2 //下記はvar LOGIN_URL = "https://hghg/wp-login.php"や固定ページのパスなど色々変更しましたがうまくいきませんでした。 3 //Request URLなども参照し行いましたがここが間違えているかもしれません。 4 //hghgは例です。 5 var LOGIN_URL = "https://hghg/wp-login.php?action=postpass"; 6 7 // POSTデータ 8 var payload_data = { 9 //Chromeの開発者ツールのNetwork->Form Dataを参照し設定しました。 10 "post_password":"保護ページにログインするパスワード", 11 "Submit": "確定", 12 }; 13 14 // POSTオプション 15 var post_options = { 16 method: "POST", 17 contentType: "application/x-www-form-urlencoded", 18 payload: payload_data, 19 followRedirects: false 20 }; 21 22 // POSTリクエスト 23 var response = UrlFetchApp.fetch(LOGIN_URL, post_options); 24 25 // レスポンスヘッダーからcookieを取得 26 var cookies = response.getHeaders()["Set-Cookie"]; 27 28 // ログインで認証されたcookieをヘッダーで使用 29 var headers = { Cookie: cookies }; 30 var get_options = { 31 method: "get", 32 headers: headers, 33 followRedirects: true, 34 }; 35 var SCRAPING_URL = "https://hghg/対象の固定ページ/"; 36 37 response = UrlFetchApp.fetch(SCRAPING_URL, get_options); 38 var content = response.getContentText("UTF-8"); 39 Logger.log(content) 40}
と上記のようにCookieの情報を取得し行おうとしました。
期待する結果
期待する結果としては、
<div class="hg1"> </div> を含む文字列を取得したいです。よろしくお願いいたします。
あなたの回答
tips
プレビュー