質問編集履歴
2
追記
test
CHANGED
File without changes
|
test
CHANGED
@@ -41,3 +41,11 @@
|
|
41
41
|
仮に```print('業界は、', dd.text.strip())```ここの部分を```print('業界は、', dd.text.replace('\n','')```とした場合、「業界は、 コンサルティング、シンクタンクSIer、ソフト開発、システム運用」ここのように、「シンクタンク」と「SIer」が繋がってしまいます。
|
42
42
|
|
43
43
|
こちらの問題を解決する為、どなたかご助言頂けましたら幸いです。
|
44
|
+
|
45
|
+
|
46
|
+
|
47
|
+
**追記です**
|
48
|
+
|
49
|
+
```print('業界は、', dd.text.replace('\n','、'))```こちらのようにした場合は、以下のように「、」が複数ついてしまう状態となってしまいます。
|
50
|
+
|
51
|
+
> 業界は、 、、、コンサルティング、シンクタンク、、、SIer、ソフト開発、システム運用、、、
|
1
コード修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -2,27 +2,31 @@
|
|
2
2
|
|
3
3
|
```
|
4
4
|
|
5
|
+
|
6
|
+
|
7
|
+
company_page = BeautifulSoup(get_response(detail_url).text,'html.parser')
|
8
|
+
|
9
|
+
company_name = company_page.select_one('h2 a').text
|
10
|
+
|
11
|
+
dts = company_page.select('.jsDefinitionList dt')
|
12
|
+
|
13
|
+
dds = company_page.select('.jsDefinitionList dd')
|
14
|
+
|
15
|
+
|
16
|
+
|
5
|
-
for dt, dd in zip(dts,dds):
|
17
|
+
for dt, dd in zip(dts,dds):
|
6
18
|
|
7
19
|
if "業界" in dt.text:
|
8
20
|
|
9
21
|
print(type(dt.text.strip()))
|
10
22
|
|
11
|
-
print('業界は、', dd.text.
|
23
|
+
print('業界は、', dd.text.replace('\n',''))
|
12
24
|
|
13
25
|
exit()
|
14
|
-
|
15
|
-
|
16
26
|
|
17
27
|
if "URL" in dt.text:
|
18
28
|
|
19
29
|
print('リンク先は、', dd.select_one('a')['href'])
|
20
|
-
|
21
|
-
|
22
|
-
|
23
|
-
|
24
|
-
|
25
|
-
exit()
|
26
30
|
|
27
31
|
|
28
32
|
|