質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

3回答

269閲覧

施設名×住所でホームページのURLを取得することが可能なのか知りたい

NN77

総合スコア59

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

1グッド

0クリップ

投稿2019/02/14 13:50

前提・実現したいこと

現在ある施設検索サイトを作成しております。

施設詳細ページに「ホームページ」の項目設置し、
その施設のホームページのURLを表示したいと思っています。

知りたいこと

Pythonでスクレイピングする方法を色々検索してみたのですが、
「特定のサイト」から「情報」をスクレイピングしてくる方法は多数出てくるものの、
「特定の情報(今回は施設名×住所/ワイルドカード可)」から「サイト」を特定して
URLを取得してくるような方法が見つけられず、
そういったことができるのかを知りたくご質問いたしました。

そもそも可否や、参考になる記事などございましたら、
知見をご教示願えますと幸いです。何卒よろしくお願いいたします。

bochan2👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

CHERRY

2019/02/14 14:35 編集

単語からURL を探すのは、いわゆる検索エンジンですよね。 つまり、技術的には可能と思います。
pepperleaf

2019/02/14 15:09

検索した結果が本物の "施設"名と"住所"である保証は? 多分、自動で施設検索するには、AIみたいな処理が必要ではないかと。 (単なる一致と期待する対象との判断が必要と思います)
NN77

2019/02/15 00:27

掲載したい施設が1万施設以上にのぼりましたので、 自動で取得→手動でチェックを考えておりました。 コメントいただきありがとうございます。
guest

回答3

0

ベストアンサー

施設名×住所まで揃っているのであれば、「手紙」で公式サイトを確認するのが良いですよ。趣旨説明を適切に行うことができれば、広報としても有用です。

投稿2019/02/14 15:26

退会済みユーザー

退会済みユーザー

総合スコア0

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Zuishin

2019/02/14 15:36

勝手に情報を載せられるより聞いてくれた方が感じがいいし、その検索サイトを知ってもらえるので最も良い方法だと思います。
NN77

2019/02/15 00:32

ありがとうございます。 施設数が1万以上にのぼり、個人で運営しているサイトなのでそこまでの対応は難しそうなのですが、 もっとも理想的な対応として覚えておきます。勉強になりました。
退会済みユーザー

退会済みユーザー

2019/02/15 00:49

一万以上の施設情報の正誤確認を個人のサイト運営者が行うのは非現実です。 サイトの仕組みとして、「承認されたユーザが正しい情報を入力する」ことを検討してみると良いです。 無料コンサルはココまでw
NN77

2019/02/16 12:23

te2ji様 ありがとうございます。 クラウドワークス諸々検討してみようと思います。 アドバイスいただき誠にありがとうございました。
guest

0

それでぐぐるとでてくるんじゃないでしょうか

投稿2019/02/14 14:00

y_waiwai

総合スコア87774

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pepperleaf

2019/02/14 15:10

くぐったサンプルとかが無いと不親切では? (あ、- はしてませんが)
y_waiwai

2019/02/14 15:23

まあ、親切でやってるわけでもないし、それを調べる労力かけるのは質問者の方だとも思いますし
NN77

2019/02/15 00:39 編集

y_waiwai様、pepperleaf様、コメントいただきありがとうございます。 自分で可否を見つけることができなかったのですが、 みなさまのコメントから難しそうである旨理解ができました。 大変ご面倒をおかけしましたm_ _m 自分で調べられる領域が増えるよう、引き続き精進して参ります。
guest

0

無理だと思いますよ。例えばですけど「私の家の名前×住所」で私の家のホームページのURLを特定することは、、、GAFAや通信事業者、政府規模の組織ならともかく、普通の企業にはそんな手立ては存在しないと思います。

投稿2019/02/14 15:09

YouheiSakurai

総合スコア6142

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Zuishin

2019/02/14 15:28

私の住所で検索すると「こちらを検索しますか?」とサイト情報へのリンクが出てきました。Google マイビジネスに事業所の住所とサイトを登録すると案内してくれるようです。自分で登録していない事業所もある程度 Google の方で登録しているようで出てきますが、もちろん全部ではありません。
YouheiSakurai

2019/02/14 16:07 編集

それ多分、検索元がオーストラリアとかヨーロッパなどの検索住所とかけ離れた場所だったり、検索端末を全くの新しいものに変えたりすると、Googleマイビジネスの案内も出なくなると思います。GAFAは、検索してきた人がいつも地球のどの辺にいるのか知れるので別格です。
Zuishin

2019/02/14 21:37

「R. Haddock Lobo, 5 - Estácio, Rio de Janeiro - RJ, 20260-130」を検索すると Google Map が表示され、「この住所のお店やサービス」として「SuperPrix Supermercados Estácio - Rede Unno」が表示されたのでそれをクリックし、表示されたビジネス情報から「SuperPrix」のウェブサイト「https://www.superprix.com.br/」が得られました。 確かにサイトを得るまでの手順は少し違いますが、そう何種類も手順があるとは考えにくいので、対応できないほどではないと思います。 個人宅から個人のサイトを特定することと、施設からその施設の公式サイトを特定することの難易度は大きく違うので、個人情報が得られないことは、施設が自分から発表している施設情報が得られない証明にはならないと思います。
NN77

2019/02/15 00:31

コメントいただきありがとうございます。 自動でクローリングしてくる方法は諦めようと思います。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問