質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

Q&A

0回答

256閲覧

Parserライブラリを使用したスクレイピング

gasgas

総合スコア0

Google スプレッドシート

Google スプレッドシートは、フリーで利用できる表計算ソフト。Webアプリのためインターネットに接続することで利用できます。チャートやグラフの作成のほか、シートを他のユーザーと共有したり、同時に作業を進めることも可能です。

Google Apps Script

Google Apps ScriptはGoogleの製品と第三者のサービスでタスクを自動化するためのJavaScriptのクラウドのスクリプト言語です。

Java

Javaは、1995年にサン・マイクロシステムズが開発したプログラミング言語です。表記法はC言語に似ていますが、既存のプログラミング言語の短所を踏まえていちから設計されており、最初からオブジェクト指向性を備えてデザインされています。セキュリティ面が強力であることや、ネットワーク環境での利用に向いていることが特徴です。Javaで作られたソフトウェアは基本的にいかなるプラットフォームでも作動します。

0グッド

0クリップ

投稿2022/06/29 02:24

gas初心者です。

Parserライブラリを使用して表の中身をスクレイピングをしたいのですが、どうもうまく取得してくれません。

下記コードのどこが間違えているのでしょうか?

function myFunction() { // WEBサイトのURLを指定 var url = "https://www.release.tdnet.info/inbs/I_main_00.html" // UrlFetchAppクラスのfetchメソッドでWEBサイトにアクセス var html = UrlFetchApp.fetch(url).getContentText() // Parserオブジェクトの生成(1段階目) var parser = Parser.data(html) // 抜き出し(1段階目) ※案件ボックスの中身を配列で取得 var res = parser.from('<div id="main-list">').to('</body>').iterate() // ログに出力(配列の中身を1つずつ取り出す) for(var i=0;i<res.length;i++){ var tmp = res[i] Logger.log('No:'+ (i+1)) //これは後でログ見やすくするために付けてる Logger.log(tmp) //ここで中身を書き出してる } }
【実行結果】 ml style="height:100%; overflow:hidden;"> <head> <title>適時開示情報閲覧サービス - 開示情報一覧</title> <meta http-equiv="Pragma" content="no-cache"> <meta http-equiv="Cache-Control" content="no-cache"> <meta http-equiv="Expires" content="0"> <meta name="robots" content="noindex,nofollow"> <meta content="text/html" charset="UTF-8" http-equiv="content-type"> <script type="text/javascript" charset="UTF-8" src="./runtime/jquery-1.8.3.min.js"></script> <script type="text/javascript" charset="UTF-8" src="./js/I_JAVASCRIPT.js"></script> <script type="text/javascript" charset="UTF-8" src="./js/TDJEModal.js"></script> <script type="text/javascript"> <!-- $(document).ready(function(){ $("#searchB-mask").mousedown(function(){ $("#searchB-mask > DIV").attr("id","searchB-button_active"); }); $("#searchB-mask").mouseup(function(){ $("#searchB-mask > DIV").attr("id","searchB-button"); }); $("#searchB-mask").mouseleave(function(){ $("#searchB-mask > DIV").attr("id","searchB-button"); }); $("#refreshB-mask").mousedown(function(){ $("#refreshB-mask > DIV").attr("id","refreshB-button_active"); }); $("#refreshB-mask").mouseup(function(){ $("#refreshB-mask > DIV").attr("id","refreshB-button"); }); $("#refreshB-mask").mouseleave(function(){ $("#refreshB-mask > DIV").attr("id","refreshB-button"); }); $("#infoB-mask").mousedown(function(){ $("#infoB-mask > DIV > DIV").attr("id","infoB-button_active"); }); $("#infoB-mask").mouseup(function(){ $("#infoB-mask > DIV > DIV").attr("id","infoB-button"); }); $("#infoB-mask").mouseleave(function(){ $("#infoB-mask > DIV > DIV").attr("id","infoB-button"); }); }); $(document).ready(function(){ var fHeight = document.documentElement.clientHeight - 126; $("#main_list").css("height",fHeight); }); $(document).ready(function(){ $(window).resize(function(){ var fHeight = document.documentElement.clientHeight - 126; $("#main_list").css("height",fHeight); }); }); $(function() { $( 'div[rel*=modal]').modal({ top: 50, overlay : 0.5, speed : 200 }); }); // --> </script> <link rel="stylesheet" href="./css/I_STYLE.css" media="screen"> <body onSubmit="return false;" style="margin: 0px; height: 100%; *position:relative;"> <form> <table border="0" id="main-body-box"> <tr> <td> <table border="0" id="logo-table"> <tr> <td rowspan="2" id="logo-image"><div><img src="./gif/logo.png"></div></td> <td rowspan="2" align="left" valign="bottom" style="width: 26px;"> </td> <td align="left" id="logo-text-jp">適時開示情報閲覧サービス</td> </tr> <tr> <td align="left" id="logo-text-en">Company Announcements Disclosure Service</td> </tr> </table> </td> </tr> <tr> <td id="headHr"><div></div></td> </tr> <tr> <td> <table border="0" borderColor="#faffff" align="left" id="control-menu-table"> <tr> <td align="center" noWrap id="day-selector-caption"><div>公開日</div></td> <td align="left" class="opendayd" noWrap> <select size="1" name="daylist" onChange="pageChange()" id="day-selector"> <option selected value="">選択してください</option> <option value="I_list_001_20220629.html">2022/06/29(水)</option> <option value="I_list_001_20220628.html">2022/06/28(火)</option> <option value="I_list_001_20220627.html">2022/06/27(月)</option> <option value="I_list_001_20220626.html" style="color:#FF0000;">2022/06/26(日)</option> <option value="I_list_001_20220625.html" style="color:#0000FF;">2022/06/25(土)</option> <option value="I_list_001_20220624.html">2022/06/24(金)</option> <option value="I_list_001_20220623.html">2022/06/23(木)</option> <option value="I_list_001_20220622.html">2022/06/22(水)</option> <option value="I_list_001_20220621.html">2022/06/21(火)</option> <option value="I_list_001_20220620.html">2022/06/20(月)</option> <option value="I_list_001_20220619.html" style="color:#FF0000;">2022/06/19(日)</option> <option value="I_list_001_20220618.html" style="color:#0000FF;">2022/06/18(土)</option> <option value="I_list_001_20220617.html">2022/06/17(金)</option> <option value="I_list_001_20220616.html">2022/06/16(木)</option> <option value="I_list_001_20220615.html">2022/06/15(水)</option> <option value="I_list_001_20220614.html">2022/06/14(火)</option> <option value="I_list_001_20220613.html">2022/06/13(月)</option> <option value="I_list_001_20220612.html" style="color:#FF0000;">2022/06/12(日)</option> <option value="I_list_001_20220611.html" style="color:#0000FF;">2022/06/11(土)</option> <option value="I_list_001_20220610.html">2022/06/10(金)</option> <option value="I_list_001_20220609.html">2022/06/09(木)</option> <option value="I_list_001_20220608.html">2022/06/08(水)</option> <option value="I_list_001_20220607.html">2022/06/07(火)</option> <option value="I_list_001_20220606.html">2022/06/06(月)</option> <option value="I_list_001_20220605.html" style="color:#FF0000;">2022/06/05(日)</option> <option value="I_list_001_20220604.html" style="color:#0000FF;">2022/06/04(土)</option> <option value="I_list_001_20220603.html">2022/06/03(金)</option> <option value="I_list_001_20220602.html">2022/06/02(木)</option> <option value="I_list_001_20220601.html">2022/06/01(水)</option> <option value="I_list_001_20220531.html">2022/05/31(火)</option> <option value="I_list_001_20220530.html">2022/05/30(月)</option> </select> </td> <td> <table class="verticalRule1"> <tr> <td class="vr1"></td> <td class="vr2"></td> </tr> </table> </td> <td align="center" noWrap id="tdSearchB"> <div id="searchB-mask" onClick="openSearch();"> <div id="searchB-button"> <img src="./gif/icn_search.png" alt="適時開示検索へ"></img> <span>適時開示情報検索へ</span> </div> </div> </td> <td> <table class="verticalRule2"> <tr> <td class="vr1"></td> <td class="vr2"></td> </tr> </table> </td> <td align="center" noWrap id="tdInfoB"> <div id="infoB-mask"> <div href="#oinfo" rel="modal"> <div id="infoB-button"> <img src="./gif/info.png" alt="お知らせ" id="info-image"></img> <span>お知らせ</span> </div> </div> </div> </td> <td align="center" noWrap id="tdNewImage"> <img src="./news/new.gif" alt="NEW" id="new-image"></img> </td> <td id="tdTag001"> <table> <tr> <td></td> </tr> </table> </td> <td align="center" noWrap id="last-update"><div>最終更新日時:2022年06月29日 11:00</div></td> <td align="center" noWrap id="tdRefreshB"> <div id="refreshB-mask" onClick="renewalPage()"> <div id="refreshB-button"> <img src="./gif/icn_load.png" alt="更新"></img> <span>更 新</span> </div> </div> </td> </tr> </table> </td> </tr> <tr> <td> <div id="list-page-box"> <iframe id="main_list" src="I_list_001_20220629.html" frameborder="0" mraginheight="0" marginwidth="0" scrolling="auto" width="100%" seamless></iframe> </div> </td> </tr> </table> </form> <iframe src="./news/I_OSHIRASE.html" id="oinfo" class="modal" frameborder="0"></iframe>

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問