回答編集履歴

修正

2018/12/07 03:12

投稿

スコア38350

answer CHANGED Viewed

@@ -45,7 +45,7 @@
         if len(fed) > 0:
             ret.append(fed)
-        fed = {'text':[],'authors':[]}
+        fed = {'name':line, 'text':[],'authors':[]}
         auth= {}
         state = 'GET_FED_TEXT'
         continue
@@ -74,27 +74,40 @@
 pprint( ret)
 """
 [{'authors': [{'name': '  MADISON', 'text': ['    aa', '    bb']}],
+  'name': 'FEDERALIST No.1',
   'text': ['    pen', '    apple']},
  {'authors': [{'name': '  JOHN', 'text': ['    cc']},
               {'name': '  PAUL', 'text': ['    dd']}],
+  'name': 'FEDERALIST No.2',
   'text': ['    banana', '    orange', '    melon']},
  {'authors': [{'name': '  EMILY', 'text': ['    ee', '    ff']}],
+  'name': 'FEDERALIST No.3',
   'text': ['    bass', '    guiter']}]
 """
 ```
 あとは適宜必要なデータを抜き出して出力できます。
+なお、間の空白行は解析に面倒なのでデータ抽出時に捨てています。
+よって、出力時に補う必要はあります。下記例では補っていません。
 ```Python
 for fed in ret:
+    print(fed['name'])
-	for line in fed['text']:
+    for line in fed['text']:
-		print(line)
+        print(line)
+    print(fed['authors'][0]['name'])
 """
+FEDERALIST No.1
     pen
     apple
+  MADISON
+FEDERALIST No.2
     banana
     orange
     melon
+  JOHN
+FEDERALIST No.3
     bass
     guiter
+  EMILY
 """
 ```

追記

2018/12/07 03:11

投稿

スコア38350

answer CHANGED Viewed

@@ -81,4 +81,20 @@
  {'authors': [{'name': '  EMILY', 'text': ['    ee', '    ff']}],
   'text': ['    bass', '    guiter']}]
 """
+```
+あとは適宜必要なデータを抜き出して出力できます。
+```Python
+for fed in ret:
+	for line in fed['text']:
+		print(line)
+"""
+    pen
+    apple
+    banana
+    orange
+    melon
+    bass
+    guiter
+"""
 ```

追記

2018/12/07 02:27

投稿

スコア38350

answer CHANGED Viewed

@@ -1,4 +1,7 @@
+0. 章は「FEDERALIST～」ではじまる
+0. 章のタイトル、章の内容には全部大文字の行がない
-章のタイトル、章の内容には全部大文字の行がないという条件を満たせば、以下のような処理でデータを抜き出せます。
+という条件を満たすデータであれば、以下のような処理でデータを抜き出せます。
 ```Python
 from pprint import pprint