回答率: 85.47%

質問するログイン新規登録

トップに関する質問正規表現を使って文字抽出をしたもののエラーが発生しました。

編集履歴

質問編集履歴

3

個人情報が含まれていた

2019/05/29 08:33

投稿

スコア32

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -21,10 +21,6 @@
 ```python
 def main():
-	print("\n時間になりました。予約を開始します。\n\n" + line)
 	session = requests.Session()

2

文章追加

2019/05/29 08:33

投稿

スコア32

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -74,4 +74,4 @@
 ```
-for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。
+for文の中にprint(match.group(1))を入れると、抽出文字が3つ表示はされるもののエラーメッセージは変わりませんでした。

1

文章追加

2019/05/27 14:28

投稿

スコア32

test CHANGED Viewed

File without changes

test CHANGED Viewed

@@ -1,6 +1,18 @@
+### やっていることとエラーメッセージ
 PythonでrequestsとBeautifulSoup4を使ってwebスクレイピングをしています。
-requestsのレスポンス内容をBS4で処理をし以下のHTMLの中からボールドテキスト**cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31**のみを抽出するために正規表現を使って抽出しているのですがエラーがでます。
+requestsのレスポンス内容をBS4で処理をしHTMLの中にある3つの**cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31**を抽出するために正規表現を使って抽出しているのですがエラーがでます。
+**抽出しているHTML**スクレイプしたhtmlには以下のものが3つ含まれている。
+```html
+<button type="button" class="btn style1" name="yoyaku" onclick="location.href='./select_block.php?cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31&ninzu=1&kamoku=1&doctor=1&mod=0'">文字</button>
+```
@@ -45,3 +57,21 @@
 ```
+### 試したこと
+```python
+def main():
+    soup = BeautifulSoup(url , "lxml")
+    for button in soup.find_all('button', onclick=True):
+        match = re.search('cmn_cd=(\w+)', button['onclick'])
+        print(match.group(1))
+```
+for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。