Windows10 64bit環境で、Rの4.0.4を使用しています。
RStudioでRスクリプトを実行しています。
odbcを経由してデータを取得したのですが、そのデータの中に
"\u5927\u4e95"
というデータが存在します。
正しくは「大井」です。
これを正しく「大井」に変換するにはどうしたらいいでしょうか?
こちらのサイトを参考に実験してみました。
https://uribo.hatenablog.com/entry/2017/02/18/120051
実験に使用したデータは以下のような状態です。
head(d$race_track_name,1)
[1] "\u5927\u4e95"
class(d$race_track_name)
[1] "character"
前述したサイトにはこのようなコードが記載されています。
R
1d %<>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", to = "UTF-8")
これは実行できません。以下のようなエラーメッセージが発生します。
Error in d %<>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", : could not find function "%<>%"
恐らくこのように実行するのだと予想し、修正して実行しました。
R
1d %>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", to = "UTF-8")
その後、データがどうなったか確認してみました。
head(d$race_track_name,1)
[1] "\u5927\u4e95"
class(d$race_track_name)
[1] "character"
どうも変わっていないようです。文字コードの指定が間違っているのかもしれないのですが、何に指定するべきなのか調査方法が解りません。
解決方法か、調査方法が解るとありがたいです。
よろしくおねがいします。
回答2件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2021/02/22 08:25
2021/02/22 09:39