質問編集履歴
6
% python3 pre.pyの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -9,6 +9,7 @@
|
|
9
9
|
### 発生している問題・エラーメッセージ
|
10
10
|
|
11
11
|
```
|
12
|
+
% python3 pre.py
|
12
13
|
result:: <re.Match object; span=(53, 137), match='北海道\\n\\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な>
|
13
14
|
result.group(0): 北海道\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
14
15
|
result.group(1): 北海道\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
@@ -18,6 +19,7 @@
|
|
18
19
|
```
|
19
20
|
実現したいのは下記の出力です。
|
20
21
|
```
|
22
|
+
% python3 pre.py
|
21
23
|
result:: <re.Match object; span=(53, 137), match='北海道>
|
22
24
|
result.group(0): 北海道
|
23
25
|
result.group(1): 北海道
|
5
pre.csvの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -50,6 +50,7 @@
|
|
50
50
|
content
|
51
51
|
"適当な文章:適当な文章\n適当な文章適当な文章適当な文章適当な文章適当な文章\n 適当な文章\n都道府県:北海道\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章\n"
|
52
52
|
"適当な文章:適当な文章\n適当な文章適当な文章適当な文章適当な文章適当な文章\n 適当な文章\n都道府県:青森\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章\n"
|
53
|
+
|
53
54
|
```
|
54
55
|
|
55
56
|
### 試したこと
|
4
試したことの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -60,4 +60,4 @@
|
|
60
60
|
process_regex = "(?<=都道府県:).*(?=\n)"
|
61
61
|
process_regex = "(?<=都道府県:).*(?=\\n)"
|
62
62
|
```
|
63
|
-
だと出来ませんでした。
|
63
|
+
だと出来ませんでした。他にもいろいろやったのですが、全くうまくいかず、、正規表現をあまり使い慣れていないこともありますが、どのように学習したら理解できるようになるのかも知りたいです。
|
3
試したことの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -56,6 +56,8 @@
|
|
56
56
|
|
57
57
|
process_regex = "(?<=都道府県:).*"だと「都道府県:」以降の文字全てを取得することはできます。
|
58
58
|
しかし、
|
59
|
+
```
|
59
60
|
process_regex = "(?<=都道府県:).*(?=\n)"
|
60
61
|
process_regex = "(?<=都道府県:).*(?=\\n)"
|
62
|
+
```
|
61
63
|
だと出来ませんでした。
|
2
エラーの修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -9,8 +9,23 @@
|
|
9
9
|
### 発生している問題・エラーメッセージ
|
10
10
|
|
11
11
|
```
|
12
|
+
result:: <re.Match object; span=(53, 137), match='北海道\\n\\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な>
|
13
|
+
result.group(0): 北海道\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
14
|
+
result.group(1): 北海道\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
15
|
+
result:: <re.Match object; span=(53, 136), match='青森\\n\\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文>
|
12
|
-
|
16
|
+
result.group(0): 青森\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
17
|
+
result.group(1): 青森\n\n豚丼が美味しい適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章適当な文章
|
13
18
|
```
|
19
|
+
実現したいのは下記の出力です。
|
20
|
+
```
|
21
|
+
result:: <re.Match object; span=(53, 137), match='北海道>
|
22
|
+
result.group(0): 北海道
|
23
|
+
result.group(1): 北海道
|
24
|
+
result:: <re.Match object; span=(53, 136), match='青森>
|
25
|
+
result.group(0): 青森
|
26
|
+
result.group(1): 青森
|
27
|
+
```
|
28
|
+
|
14
29
|
|
15
30
|
### 該当のソースコード
|
16
31
|
|
1
文字間違いを修正
test
CHANGED
File without changes
|
test
CHANGED
@@ -3,7 +3,7 @@
|
|
3
3
|
|
4
4
|
### 前提
|
5
5
|
|
6
|
-
- [ ] \nは実際の改行ではなく、文章中にある"\n"です。「」という文字から、\nの間にある文字列を取り出したいのですが、うまく行かず、文字としての"\n"と実際の改行の区別がよくわからなくなってきました。
|
6
|
+
- [ ] \nは実際の改行ではなく、文章中にある"\n"です。「都道府県:」という文字から、\nの間にある文字列を取り出したいのですが、うまく行かず、文字としての"\n"と実際の改行の区別がよくわからなくなってきました。
|
7
7
|
|
8
8
|
|
9
9
|
### 発生している問題・エラーメッセージ
|
@@ -39,8 +39,8 @@
|
|
39
39
|
|
40
40
|
### 試したこと
|
41
41
|
|
42
|
-
process_regex = "(?<=
|
42
|
+
process_regex = "(?<=都道府県:).*"だと「都道府県:」以降の文字全てを取得することはできます。
|
43
43
|
しかし、
|
44
|
-
process_regex = "(?<=
|
44
|
+
process_regex = "(?<=都道府県:).*(?=\n)"
|
45
|
-
process_regex = "(?<=
|
45
|
+
process_regex = "(?<=都道府県:).*(?=\\n)"
|
46
46
|
だと出来ませんでした。
|