質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Laravel 5

Laravel 5は、PHPフレームワークLaravelの最新バージョンで、2014年11月に発表予定です。ディレクトリ構造がが現行版より大幅に変更されるほか、メソッドインジェクションやFormRequestの利用が可能になります。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

Q&A

1回答

556閲覧

htmlからxmlに変換したコードの中身を取得できない

退会済みユーザー

退会済みユーザー

総合スコア0

XML

XMLは仕様の1つで、マークアップ言語群を構築するために使われています。

Laravel 5

Laravel 5は、PHPフレームワークLaravelの最新バージョンで、2014年11月に発表予定です。ディレクトリ構造がが現行版より大幅に変更されるほか、メソッドインジェクションやFormRequestの利用が可能になります。

HTML

HTMLとは、ウェブ上の文書を記述・作成するためのマークアップ言語のことです。文章の中に記述することで、文書の論理構造などを設定することができます。ハイパーリンクを設定できるハイパーテキストであり、画像・リスト・表などのデータファイルをリンクする情報に結びつけて情報を整理します。現在あるネットワーク上のほとんどのウェブページはHTMLで作成されています。

0グッド

0クリップ

投稿2017/09/08 14:50

編集2017/09/08 15:05

###困っていること
いつもお世話になっております。
現在もハローワークのスクレイピングを作成しており、案件ごとの情報を取得しようとパスを作成しようとしています。
ただ、現在取得の仕方が誤っているからなのか、値を取得できておりません。
おそれいりますがご助力いただけないでしょうか?

###コード

php

1foreach ($crawler as $key => $value) { 2 $value = explode('-', $value); 3 4 $former = trim($value[0]); 5 $latter = trim($value[1]); 6 7 $projectUrl = 'https://www.hellowork.go.jp/servicef/130050.do?screenId=130050&action=commonDetailInfo&kyujinNumber1='.$former.'&kyujinNumber2=%0A'.$latter.'&kyushokuUmuHidden=&kyushokuNumber1Hidden=&kyushokuNumber2Hidden='; 8 9 $projectIntent = file_get_contents($projectUrl); 10 11 $dom = @DOMDocument::loadHTML($projectIntent); 12 $xmlString = $dom->saveXML(); 13 $xml = simplexml_load_string($xmlString); 14 $key = $xml->body->div->div->div[3]->div->div[1]->table->tbody->tr[1]->th; 15 $key = (string)$key;var_dump($key); 16}

コードは上記のようになっております。取得できない箇所は、下の方にあります$keyになります。
また、取得できないページは各案件のページになります。
https://www.hellowork.go.jp/servicef/130050.do

よろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

そもそもこれどのくらいのページ数をスクレイピングしてるんですか?
相手サーバーの負荷を考えてない非常識なスクレイピングならやめたほうがいいです。

ハローワークは一応禁止とは書かれてませんが転載に条件はあります。
https://www.hellowork.go.jp/info/sitepolicy.html

ハローワークならAPIもあります。
ただしただのCSVをダウンロードできるだけだし利用許可をもらうのもものすごく難しいという何のためのAPIなのか分からないひどい仕様。
まともな会社ならこのくらいは対応すべきですけど。

投稿2017/09/08 15:44

kawax

総合スコア10377

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

退会済みユーザー

退会済みユーザー

2017/09/09 00:18

ご指摘ありがとうございます。 そちらについても念頭に置きつつ開発は進めております。 ただ、kawax様の内容は私の質問への解答ではないものと思われます。 したがってこちらの質問については閉めさせていただきますね
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問