質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

2353閲覧

Pythonを使ったスクレイピング方法について

BLK

総合スコア15

スクレイピング

スクレイピングとは、公開されているWebサイトからページ内の情報を抽出する技術です。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/02/09 12:59

編集2019/02/09 13:01

Python初心者です。
Pythonを使って、投信信託の概要リスト作成を試みております。

Yahooファイナンスでは、投信信託(投信)の概要を調べることができ、下記の通りURLの末尾に投信の協会コード(8桁)指定することで、調べたい投信のページに飛ぶことができます。

東京海上・グローバルヘルスケアREIT(年1回)
https://stocks.finance.yahoo.co.jp/stocks/detail/?code=**4931215B**

スクレイピングしたい箇所は、ページ中断の概要部分で、上記投信の例では以下の部分です。

世界(日本を含む)の金融商品取引所に上場されているヘルスケア関連の不動産投資信託証券(REIT)を実質的な主要投資対象とする。運用にあたっては、流動性、配当利回り、配当の安定性・成長性等を勘案して投資対象候補銘柄を選定する。実質的な運用はメロン・インベストメンツ・コーポレーションが行う。原則として為替ヘッジを行わない。ファミリーファンド方式で運用。10月決算。

下記の取り、1つの銘柄の概要をスクレイピングすることはできたのですが、一度に複数の投信の概要をスクレイピングする方法がわかりません。

import requests
from bs4 import BeautifulSoup
r = requests.get("https://stocks.finance.yahoo.co.jp/stocks/detail/?code=4931215B")
soup = BeautifulSoup(r.content, "html.parser")
print(soup.find(class_="yjMS marB4").text)

投信協会コードについては、別途CSVファイルでリストを用意しており、あとは同CSVファイルにあるコードを何らかの方法で引っ張り、上記のURLの末尾部分のみ変更させて、ループすれば良いのではと思いますが、当方の知識不足でできておりません。どなたか良い方法をご教示いただけると幸いです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

yahooファイナンスはスクレイピングを禁止しています。

Yahoo!ファイナンスヘルプ - Yahoo!ファイナンス掲載情報の自動取得(スクレイピング)は禁止しています

スクレイピングを行うのであれば、少なくとも対象サイト・サービスの規約などを確認し、スクレイピングが許可されているかどうかを確認する必要があります。

投稿2019/02/09 13:05

hayataka2049

総合スコア30933

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

BLK

2019/02/09 13:12

hayataka2049様 大変失礼致しました。Yahooファイナンスから情報取得は控えたいと思います。 ご指摘ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問