質問編集履歴
1
「例えば」以降を追記
title
CHANGED
File without changes
|
body
CHANGED
@@ -2,4 +2,17 @@
|
|
2
2
|
|
3
3
|
サイトに掲載されている人名の名簿をSeleniumで作成したいのですが、機種依存文字が画像で表示されているため、textで取得すると、機種依存文字の部分が抜け落ちてしまいます。
|
4
4
|
|
5
|
-
これを回避するため、imgタグも含めて取得するメソッドがあるといいなと考えた次第です。
|
5
|
+
これを回避するため、imgタグも含めて取得するメソッドがあるといいなと考えた次第です。
|
6
|
+
|
7
|
+
例えば、以下のようなHTMLがあるとします。
|
8
|
+
|
9
|
+
<span><img src="/hashigodaka.png">橋 太郎</span>
|
10
|
+
|
11
|
+
「hashigodaka.png」は「髙」(はしごだか)を画像にしたものです。
|
12
|
+
|
13
|
+
この場合に、
|
14
|
+
|
15
|
+
name = driver.find_element(By.XPATH, '//*[@id="wrapper"]/span')
|
16
|
+
print(name.text)
|
17
|
+
|
18
|
+
とすると、「橋 太郎」と出力されてしまいますが、「<img src="/hashigodaka.png">橋 太郎」と出力させたい場合は、どのようにすればよろしいでしょうか?
|