回答編集履歴

修正

2019/11/09 02:58

投稿

スコア35660

test CHANGED Viewed

@@ -62,6 +62,8 @@
 univs = re.split(r'(?<!大大)(?<=大)', text)[:-1]
+# re.split(r'(?<!大.)(?<=大)(?=.)', text) でも良いです。
 print(univs)

追記

2019/11/09 02:58

投稿

スコア35660

test CHANGED Viewed

@@ -43,3 +43,41 @@
 さいあく特定の大学名だけ前以て抽出し、大学名に『大』の字は含まれないという前提で分割します。
+追記
+---
+よく考えたらこういうのもアリですね。
+```Python
+import re
+text = '東京海洋大大阪大富山大宮崎大埼玉県立大国際基督教大大東文化大'
+univs = re.split(r'(?<!大大)(?<=大)', text)[:-1]
+print(univs)
+```
+**実行結果** [Wandbox](https://wandbox.org/permlink/Oh1mBFnsRXCIJRLa)
+```
+['東京海洋大', '大阪大', '富山大', '宮崎大', '埼玉県立大', '国際基督教大', '大東文化大']
+```
+これなら『日本大阪大』のように、人間にもパース不可能なもの以外は上手く処理できます。