こんにちは。
以下の点で困っています。
入力のExcelファイルに「~(波ダッシュ)」と「〜(全角チルダ)」が混在しているデータを扱っています。
これらを以下のように置換したいのですが、
r
1str_replace_all("1000〜1500", "(~|〜)", "@")
全角チルダがなぜか置換できません。
以下、試しました。
- R studioのコンソールからは可能ですが、scriptとして実行すると置換できません。
- R studioの文字環境として「UTF-8」と「Shift-JIS」の両方で試しました。
- Excelを読み込むライブラリとしてopenxlsx, readxlで試しましたが、ダメでした。
Excelからではなく、以下のように直接変換するコードを書くとスクリプトからの実行でも変換できました。
R
1str_replace_all("11〜12", "〜", "@")
Excelを読み込む際に、意図せぬことが起きているのではと思ったのですが、解決策が分かりません。
調べるとこの問題って結構議論されているのですが、現状に適した解決策は分かりませんでした。
お手数をおかけしますが、よろしくお願いします。
以下、環境情報を追記しました。
R
1sessionInfo() 2R version 3.6.2 (2019-12-12) 3Platform: x86_64-w64-mingw32/x64 (64-bit) 4Running under: Windows >= 8 x64 (build 9200) 5 6Matrix products: default 7 8Random number generation: 9RNG: Mersenne-Twister 10Normal: Inversion 11Sample: Rounding 12 13locale: 14[1] LC_COLLATE=Japanese_Japan.932 LC_CTYPE=Japanese_Japan.932 LC_MONETARY=Japanese_Japan.932 15[4] LC_NUMERIC=C LC_TIME=Japanese_Japan.932 16 17attached base packages: 18[1] stats graphics grDevices utils datasets methods base 19 20other attached packages: 21[1] openxlsx_4.1.4 gtools_3.8.1 rjson_0.2.20 data.table_1.12.8 dplyr_0.8.3 stringi_1.4.3 22[7] stringr_1.4.0 readxl_1.3.1 hash_2.2.6.1 23 24loaded via a namespace (and not attached): 25[1] Rcpp_1.0.3 rstudioapi_0.10 magrittr_1.5 tidyselect_0.2.5 R6_2.4.1 rlang_0.4.2 26[7] fansi_0.4.0 tools_3.6.2 utf8_1.1.4 cli_2.0.0 yaml_2.2.0 assertthat_0.2.1 27[13] tibble_2.1.3 crayon_1.3.4 zip_2.0.4 purrr_0.3.3 vctrs_0.2.1 zeallot_0.1.0 28[19] glue_1.3.1 pbdZMQ_0.3-3 compiler_3.6.2 pillar_1.4.2 cellranger_1.1.0 backports_1.1.5 29[25] pkgconfig_2.0.3
回答1件
あなたの回答
tips
プレビュー