前提・実現したいこと
不特定の同じ単語の繰り返しを抽出したいです。
textの例
text1 = "honPythonPythonPythonPythonPyt"
text2 = "Python123Python12PythonPythonPython"
text3 = "Python1234565aaanohtyPPy"
text4 = "テキストてきすとDjangoDjangoDjangoDjangoあPythonあ"
text5 = "PythonPythonPythonとDjangoDjangoDjangoあいうえお"
text1は、Pythonという単語が4回繰り返されているので、Pythonという単語を抽出し4を返したいです。
text2は、Pythonという単語が5回使われていますが、連続で使われているのは最後の3回なので3を返したいです。
text3は、aaa、PPが連続しているので、aaaを抽出し3を返し、PPを抽出し2を返したいです。
text4は、途中でDjangoという単語が4回繰り返されているのでDjangoを抽出し、4を返したいです。
text5は、PythonとDjangoがそれぞれ3回繰り返されているので、Python、Djangoを抽出し3を返したいです。
text1~text5をそれぞれ解決できるコードではなく、まとめて1つの関数で解決できるようにしたいです。
解決策は、正規表現でなくとも、ライブラリ等でも何でも構いません。
どなたかお分かりになる方ご教示いただけますと幸いです。
宜しくお願いします。
回答2件
あなたの回答
tips
プレビュー