質問編集履歴

回答が得られなかったため

2019/04/04 14:25

投稿

スコア168

title CHANGED Viewed

File without changes

body CHANGED Viewed

@@ -1,10 +1,12 @@
 requests-htmlで取得し、session.get(url)でスクレイピングしようと思います。
 リンク先ＵＲＬは取得できるのですが、リンク元テキストはどのようにして取得するのでしょうか。
-bs4では様々な事が書かれておりますが、requests-htmlの資料は少ないです。
+url = 'https://www.google.com'
+response = session.get(url)
-article.absolute_linksとリンク元テキストを同じで取得したいです。
+article = response.html.find('#ariticle_content')
+article = response.html
-できましたら、別でそれぞれを取得するのではなく、ＵＲＬを取得したらテキストを取得する　という感じで、
-それぞれがリンク付けできていることが望ましいです。
+t = list(article.absolute_links)
+これでリンクURLはとれます。しかし、aタグのテキストはとれません。
-何卒、宜しくお願いいたします。
+どうしたらいいですか。