Rでunicodeの文字を正しく直したい

Windows10 64bit環境で、Rの4.0.4を使用しています。
RStudioでRスクリプトを実行しています。
odbcを経由してデータを取得したのですが、そのデータの中に

"\u5927\u4e95"

というデータが存在します。
正しくは「大井」です。
これを正しく「大井」に変換するにはどうしたらいいでしょうか？

こちらのサイトを参考に実験してみました。
https://uribo.hatenablog.com/entry/2017/02/18/120051

実験に使用したデータは以下のような状態です。

head(d$race_track_name,1)
[1] "\u5927\u4e95"
class(d$race_track_name)
[1] "character"

前述したサイトにはこのようなコードが記載されています。

R
1d %<>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", to = "UTF-8")

これは実行できません。以下のようなエラーメッセージが発生します。

Error in d %<>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", : could not find function "%<>%"

恐らくこのように実行するのだと予想し、修正して実行しました。

R
1d %>% dplyr::mutate_if(is.character, stringi::stri_conv, from = "sjis", to = "UTF-8")

その後、データがどうなったか確認してみました。

head(d$race_track_name,1)

[1] "\u5927\u4e95"

class(d$race_track_name)

[1] "character"

どうも変わっていないようです。文字コードの指定が間違っているのかもしれないのですが、何に指定するべきなのか調査方法が解りません。

解決方法か、調査方法が解るとありがたいです。
よろしくおねがいします。

行動規範の内容に同意します

回答2件

OSもライブラリも書いてないので具体例は示せませんが、以下のようなページを参考に対処を考えてみてはどうでしょうか。

ODBCで取得したデータの文字化けを解決する - cucumber flesh

投稿2021/02/22 07:32

KojiDoi

総合スコア13692

usugita_san

2021/02/22 08:25

ありがとうございます。そちらのサイトを参考に実験してみました。実験結果と、環境など前提条件を掲載してみました。

usugita_san

2021/02/22 09:39

どうも、文字自体が対応できないようでした。こちらを参考に実験してみました。 https://kitamix.net/archives/convert-to-unicode-with-stringr-in-r/1089 > stri_unescape_unicode(stri_escape_unicode("こんにちは")) > [1] "こんにちは" > stri_unescape_unicode(stri_escape_unicode("大井")) > [1] "\u5927\u4e95" 以上の成果を追記して自己解決としたいと思います。ありがとうございました。

行動規範の内容に同意します