お世話になっております。Ezです。
この度、スクレイピングについて教えて頂きたく質問させて頂きます。
Pythonでスクレイピングを試してみております。
<title> </title> で囲まれている文字を取得するやつなのですが これを参考に、対象URL上のソースで ```lang-<ここに言語を入力> <strong class="icon icon-daisuki"> hoge hoge fuga fuga </strong> ``` これで囲まれている文字「hoge hoge fuga fuga」を取得したいのですが どのような書き方をすればよろしいでしょうか?lang
1#!/bin/python 2import re, urllib2 3res=urllib2.urlopen("対象URL") 4pattern_title=re.compile('<title>(.*?)</title>') 5m=pattern_title.search(res.read()) 6title=m.group(1) 7print title
パターンマッチの部分で <strong cals="icon icon-daisuki">へと変更してあげたのですが
下記エラーが出て
AttributeError: 'NoneType' object has no attribute 'group'
どうやら title=m.group(1)が正しくない?みたいのようです。
プログラミングにお詳しい方いらっしゃいましたらご教授頂けないでしょうか?
よろしくお願い致します。
(PHPでも実装できるのならばPHPでも構いません。ただ、今Pythonを勉強しているので、Pythonでお聞きした次第でございます。)
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2014/11/12 15:58
2014/11/12 16:04
2014/11/13 02:50