前提・実現したいこと
str_remove_all()を利用し、以下の文字列から「\U0001f970」の部分を取り除きたいです。
処理のテストです\U0001f970。
よって、期待する結果は以下になります。
処理のテストです。
また、解決するのであれば、str_remove_all()を利用することにはこだわりません。
発生している問題・エラーメッセージ
エラーは発生しておりません。期待通りの結果になりません。
該当のソースコード
R
1data <- "処理のテストです\U0001f970。" 2 3# 正規表現を使ったパターン(うまくいかない) 4data <- str_remove_all(data, regex(pattern="\U[0-9a-zA-Z]{4}f[0-9a-zA-Z]{3}")) 5data 6 7# 妥協して文字列で…(うまくいかない) 8data <- str_remove_all(data, "\U0001") 9data 10 11# せめて数字だけなら…(うまくいかない) 12data <- str_remove_all(data, "0001") 13data
結果としては上記の変換パターン3つはどれも以下の結果となり、期待通りいきません。
[1] "処理のテストです\U0001f970。"
試したこと
文字列の文字コードを変換する、などのキーワードで検索を書けておりましたが、
めぼしい情報がなく変換できませんでした。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。