質問編集履歴
3
整形
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,6 @@
|
|
1
1
|
サンプル:https://www.aozora.gr.jp/cards/000329/files/18376_12100.html
|
2
2
|
### 質問
|
3
|
-
div main_textタグの中のコンテンツを<rb>などのタグ込みで取得したいと考えております
|
3
|
+
div main_textタグの中のコンテンツを<rb>などのタグ込みで取得したいと考えております
|
4
4
|
|
5
5
|
contentsメソッドでタグごと取得するところまではできたのですが、
|
6
6
|
リスト形式になっており、また不要な文字が混入しています。
|
2
不十分な部分の修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -1,6 +1,19 @@
|
|
1
1
|
サンプル:https://www.aozora.gr.jp/cards/000329/files/18376_12100.html
|
2
|
+
### 質問
|
3
|
+
div main_textタグの中のコンテンツを<rb>などのタグ込みで取得したいと考えております。
|
2
4
|
|
5
|
+
contentsメソッドでタグごと取得するところまではできたのですが、
|
6
|
+
リスト形式になっており、また不要な文字が混入しています。
|
7
|
+
|
8
|
+
for文でリストから取り出し、消そうとしたのですが、
|
9
|
+
タグは文字列で結合することができないみたいです。
|
10
|
+
|
11
|
+
理想の結果になるように出力したいのですが、
|
12
|
+
どうすればよいか教えていただけると助かります
|
13
|
+
|
14
|
+
※理想の出力結果は下に記載しております。
|
3
15
|
### 実現したいこと
|
16
|
+
- 理想の出力結果になるような形で出力する。
|
4
17
|
- ルビのタグ付きで取得する
|
5
18
|
- '\r\n\u3000等、不要な改行コードなどを消す
|
6
19
|
- txtファイルで出力する
|
1
文字
test
CHANGED
File without changes
|
test
CHANGED
@@ -42,7 +42,7 @@
|
|
42
42
|
ドンブラコッコ、スッコッコ。」<br/>
|
43
43
|
```
|
44
44
|
|
45
|
-
```理想の出力結果
|
45
|
+
```_理想の出力結果
|
46
46
|
桃太郎
|
47
47
|
楠山正雄
|
48
48
|
|