質問編集履歴
3
個人情報が含まれていた
test
CHANGED
File without changes
|
test
CHANGED
@@ -21,10 +21,6 @@
|
|
21
21
|
```python
|
22
22
|
|
23
23
|
def main():
|
24
|
-
|
25
|
-
print("\n時間になりました。予約を開始します。\n\n" + line)
|
26
|
-
|
27
|
-
|
28
24
|
|
29
25
|
session = requests.Session()
|
30
26
|
|
2
文章追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -74,4 +74,4 @@
|
|
74
74
|
|
75
75
|
```
|
76
76
|
|
77
|
-
for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。
|
77
|
+
for文の中にprint(match.group(1))を入れると、抽出文字が3つ表示はされるもののエラーメッセージは変わりませんでした。
|
1
文章追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,18 @@
|
|
1
|
+
### やっていることとエラーメッセージ
|
2
|
+
|
1
3
|
PythonでrequestsとBeautifulSoup4を使ってwebスクレイピングをしています。
|
2
4
|
|
3
|
-
requestsのレスポンス内容をBS4で処理をし
|
5
|
+
requestsのレスポンス内容をBS4で処理をしHTMLの中にある3つの**cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31**を抽出するために正規表現を使って抽出しているのですがエラーがでます。
|
6
|
+
|
7
|
+
|
8
|
+
|
9
|
+
**抽出しているHTML**スクレイプしたhtmlには以下のものが3つ含まれている。
|
10
|
+
|
11
|
+
```html
|
12
|
+
|
13
|
+
<button type="button" class="btn style1" name="yoyaku" onclick="location.href='./select_block.php?cmn_cd=6cbedb4661fcd9876cfdaac86cf28f31&ninzu=1&kamoku=1&doctor=1&mod=0'">文字</button>
|
14
|
+
|
15
|
+
```
|
4
16
|
|
5
17
|
|
6
18
|
|
@@ -45,3 +57,21 @@
|
|
45
57
|
|
46
58
|
|
47
59
|
```
|
60
|
+
|
61
|
+
### 試したこと
|
62
|
+
|
63
|
+
```python
|
64
|
+
|
65
|
+
def main():
|
66
|
+
|
67
|
+
soup = BeautifulSoup(url , "lxml")
|
68
|
+
|
69
|
+
for button in soup.find_all('button', onclick=True):
|
70
|
+
|
71
|
+
match = re.search('cmn_cd=(\w+)', button['onclick'])
|
72
|
+
|
73
|
+
print(match.group(1))
|
74
|
+
|
75
|
+
```
|
76
|
+
|
77
|
+
for文の中にprint(match.group(1))を入れると、抽出文字が表示はされるもののエラーメッセージは変わりませんでした。
|