回答編集履歴
1
test
CHANGED
@@ -1,4 +1,5 @@
|
|
1
|
+
> urlも解析されてしまい,余計な結果が得られてしまうからです.
|
1
|
-
正規表現を利用して、取得した文字列からURLやハッシュタグを除去すればよいのではないでしょうか。
|
2
|
+
ここが問題ならば、発想を変えて、URLやハッシュタグを含まないツイートをフィルタリングするのではなく、正規表現を利用して、取得したツイート文字列からURLやハッシュタグを除去すればよいのではないでしょうか。
|
2
3
|
```py
|
3
4
|
text = "これはUrl・ハッシュタグを含む文章です。 https://www.teratail.com/ #ハッシュタグ"
|
4
5
|
|