質問編集履歴
1
テキストの重複の有無を追加
test
CHANGED
File without changes
|
test
CHANGED
@@ -8,7 +8,7 @@
|
|
8
8
|
|
9
9
|
```html
|
10
10
|
|
11
|
-
<a>テキスト1</a><h1>テキスト
|
11
|
+
<a>テキスト1</a><h1>テキスト1</h1><h2>テキスト3<a>テキスト4</a></h2>
|
12
12
|
|
13
13
|
```
|
14
14
|
|
@@ -16,7 +16,7 @@
|
|
16
16
|
|
17
17
|
```python
|
18
18
|
|
19
|
-
[{'tag':a,'text':テキスト1,'start_index':0,end_index:4},{'tag':h1,'text':テキスト
|
19
|
+
[{'tag':a,'text':テキスト1,'start_index':0,end_index:4},{'tag':h1,'text':テキスト1,'start_index':5,end_index:9},
|
20
20
|
|
21
21
|
{'tag':h2,'text':テキスト3テキスト4,'start_index':10,end_index:19},{'tag':a,'text':テキスト4,'start_index':15,end_index:19}]
|
22
22
|
|
@@ -27,3 +27,9 @@
|
|
27
27
|
上記のように抽出する方法はないでしょうか。
|
28
28
|
|
29
29
|
よろしくお願いいたします。
|
30
|
+
|
31
|
+
|
32
|
+
|
33
|
+
*追記
|
34
|
+
|
35
|
+
テキストの重複込みで抽出できる方法を探しています。
|