質問編集履歴

機能2を修正しました。

2019/06/25 09:00

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -96,12 +96,15 @@
 				for tag in soup.find_all("h3","shisetsu_name_s"):
 					link = tag.find("a")
 					url = link.get("href")
+					print(url)
 				for s_tag in soup.find_all("h3","shisetsu_name"):
 					s_link = s_tag.find("a")
 					s_url = s_link.get("href")
+					print(s_url)
 				links = soup.find_all("a","fa_name")
 				for link in links:
 					l_url = link.get('href')
+					print(l_url)
 			else:
 				break
 			num += 1

動作するソースコード、動作しないソースコードをまとめました。

2019/06/25 09:00

投稿

退会済みユーザー

スコア0

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -45,7 +45,6 @@
 		else:
 			break
 		i += 1
-get_href()
 【機能2】
@@ -70,4 +69,73 @@
 ```
 【機能1】【機能2】はそれぞれ動作するのですが、一緒にすると、エラーも表示されなくなってしまいました。
-わかる方、教えていただけると幸いです。
+わかる方、教えていただけると幸いです。
+### 動作するソースコード【機能1】
+```jupyter
+import sys
+import requests
+import re
+import urllib.request, urllib.error
+from bs4 import BeautifulSoup
+def get_href():
+	i = 1
+	num = 2
+	while i < 48:
+		for num in range(1, 300):
+			zero_i = str(i).zfill(2)
+			base = 'https://www.judo-ch.jp/sekkotsuinsrch/{}/list/{}/'
+			url = base.format(zero_i,num)
+			res = requests.get(url)
+			if res.status_code == 200:
+				html = requests.get(url)
+				soup = BeautifulSoup(html.content,"html.parser")
+				for tag in soup.find_all("h3","shisetsu_name_s"):
+					link = tag.find("a")
+					url = link.get("href")
+				for s_tag in soup.find_all("h3","shisetsu_name"):
+					s_link = s_tag.find("a")
+					s_url = s_link.get("href")
+				links = soup.find_all("a","fa_name")
+				for link in links:
+					l_url = link.get('href')
+			else:
+				break
+			num += 1
+		else:
+			break
+		i += 1
+get_href()
+```
+### 動作するソースコード【機能2】
+```jupyter
+import sys
+import requests
+import re
+import urllib.request, urllib.error
+from bs4 import BeautifulSoup
+def get_soup(url):
+    """URLのSoupを取得する"""
+    html = requests.get(url)
+    return BeautifulSoup(html.content, "html.parser")
+def scraping_gh():
+    """Software Design の情報を取得"""
+    soup = get_soup("https://www.judo-ch.jp/sekkotsuinsrch/13/13201/030637/")
+    # 整骨院の名称
+    res_p = soup.find("span", class_="name")
+    res = res_p.find(text=re.compile(""))
+    print(res.string)
+    # ホームページのURL
+    res_p = soup.find("p", class_="lnk_url")
+    res = res_p.find(text=re.compile(""))
+    print(res.string)
+scraping_gh()
+```