質問編集履歴
1
回答が得られなかったため
title
CHANGED
File without changes
|
body
CHANGED
@@ -1,10 +1,12 @@
|
|
1
1
|
requests-htmlで取得し、session.get(url)でスクレイピングしようと思います。
|
2
2
|
リンク先URLは取得できるのですが、リンク元テキストはどのようにして取得するのでしょうか。
|
3
3
|
|
4
|
-
|
4
|
+
url = 'https://www.google.com'
|
5
|
+
response = session.get(url)
|
5
|
-
article.
|
6
|
+
article = response.html.find('#ariticle_content')
|
7
|
+
article = response.html
|
6
8
|
|
7
|
-
できましたら、別でそれぞれを取得するのではなく、URLを取得したらテキストを取得する という感じで、
|
8
|
-
|
9
|
+
t = list(article.absolute_links)
|
9
10
|
|
11
|
+
これでリンクURLはとれます。しかし、aタグのテキストはとれません。
|
10
|
-
|
12
|
+
どうしたらいいですか。
|