Pythonを使って、投信信託(投信)の概要リスト作成を試みております。
モーニングスター社のHPでは、投信の特色を調べることができ、下記の通りURLの末尾をモーニングスター社の投信コードを指定することで、調べたい投信のページに飛ぶことができます。
野村 ブラジル・インフラ関連株投信
http://www.morningstar.co.jp/FundData/SnapShot.do?fnc=2010020501
スクレイピングしたい箇所は、ページ中断のファンドの特色部分で、上記投信の例では以下の部分です。
主要投資対象は、ブラジルのインフラ関連企業の株式。株式への投資にあたっては、ファンダメンタルズ分析に基づき成長性や独自のコーポレートガバナンス評価等の観点から投資銘柄を選定し、信託財産の成長を図ることを目的として積極的な運用を行う。原則として、為替ヘッジは行わない。2月決算。
事前に調べたい投信のidを下記の通りテキストファイルで用意し、以下のスクリプトを用いてCSVファイルに結果を出力したところ、余分な空白スペースが出力されてしまいました。色々調べたのですが、空白スペースを削除する方法が分からず困っております。どなたか解決策をご教示いただけると幸いです。
id_list_MF.txt
2010020501
2008111207
python
1from bs4 import BeautifulSoup 2from urllib.request import urlopen 3import requests 4import pandas as pd 5from time import sleep 6 7id_list = open("id_list_MF.txt", "r") 8 9lines = id_list.readlines() 10 11des = [] 12 13for line in lines: 14 url = "http://www.morningstar.co.jp/FundData/SnapShot.do?fnc=" + line 15 r = requests.get(url) 16 soup = BeautifulSoup(r.content, "html.parser") 17 18 for i in soup.find("div", class_="inftxt"): 19 des.append(i.string.strip()) 20 21df = pd.DataFrame({"des":des}) 22 23print(df) 24 25df.to_csv("des_MF.csv", header=False, index=False,encoding='utf_8_sig')
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/02/27 05:22
2019/02/27 09:09