![退会済みユーザー](https://ddjkaamml8q8x.cloudfront.net/profileImages/deletedUser/icnUserSample.jpeg)
###該当のソースコード
import requests import lxml.html import pymysql #DBに接続後(コードは省略),テーブルのデータを全部取得。urlカラムにはクロールしたいurlを、selectorカラムにはそのurlの中で取得したい部分のcssセレクターを記載 cursor.execute('SELECT * from テーブル名') results = cursor.fetchall() for row in results: req = requests.get(row["url"])#辞書形式で取得できる設定のためキーで取得 html = req.text root = lxml.html.fromstring(html) qabc = root.cssselect(row["seletcor"]) content = qabc[0].text_content().strip() content2 = qabc[0].attrib["href"]
これで指定したcssセレクターの中に含まれているテキストと、aタグのhref属性の値のurlを取得することができます。
ただこれですとテキストとURLの二行になってしまうためテキストのみ表示されるようにしテキストをクリックしたらそのurlのページに飛べるようにしたいと思っています。
あああああ
http://www.aaa
ではなく
<a href=http://www.aaa>あああああ<a/>
にしたいです。その場合どのようにすればいいのでしょうか?cssselectライブラリーを使っているのですがこれだとできないのでしょうか?
![guest](/img/icon/icnUserSample.jpg)
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
退会済みユーザー
2018/03/20 18:16