質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

Q&A

解決済

2回答

15554閲覧

「不正なマルチバイト文字があります」のエラーを解決したい

K.Saitoh

総合スコア6

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

MacOS(OSX)

MacOSとは、Appleの開発していたGUI(グラフィカルユーザーインターフェース)を採用したオペレーションシステム(OS)です。Macintoshと共に、市場に出てGUIの普及に大きく貢献しました。

0グッド

0クリップ

投稿2020/11/12 03:25

前提・実現したいこと

あるサイトからCSVファイルを引っ張ってこようと思っています。
引っ張ってくるときに「不正なマルチバイト文字があります」のエラーが出てうまくデータを引っ張ってこれません。
ネットにも同じようなエラーの解決法が乗っていましたが試してもだめでした。
何卒ご指導お願い致します。

発生している問題・エラーメッセージ

> h_work <- data.frame(fread("https://www.harp.lg.jp/opendata/dataset/1369/resource/2853/covid19_data.csv", encoding = "UTF-8")) [100%] Downloaded 20062 bytes... make.names(vnames, unique = TRUE) でエラー: '<83>O<83><89><83>t<94><f1><95>\<8e><a6>' に不正なマルチバイト文字があります

エラーではないと思うのですがライブラリ読み込むときに警告でました。関係あるかわかりません。

ダウンロードされたパッケージは、以下にあります /var/folders/lg/xk499zmn2h19815pdp9_4w0c0000gn/T//RtmpHPeigA/downloaded_packages > library(data.table) data.table 1.13.2 using 1 threads (see ?getDTthreads). Latest news: r-datatable.com ********** This installation of data.table has not detected OpenMP support. It should still work but in single-threaded mode. This is a Mac. Please read https://mac.r-project.org/openmp/. Please engage with Apple and ask them for support. Check r-datatable.com for updates, and our Mac instructions here: https://github.com/Rdatatable/data.table/wiki/Installation. After several years of many reports of installation problems on Mac, it's time to gingerly point out that there have been no similar problems on Windows or Linux. ********** 警告メッセージ: パッケージ ‘data.table’ はバージョン 4.0.2 の R の下で造られました > library(curl) 警告メッセージ: パッケージ ‘curl’ はバージョン 4.0.1 の R の下で造られました

該当のソースコード

R

1h_work <- data.frame(fread("https://www.harp.lg.jp/opendata/dataset/1369/resource/2853/covid19_data.csv", encoding = "UTF-8")) 2

試したこと

h_work <- data.frame(fread("https://www.harp.lg.jp/opendata/dataset/1369/resource/2853/covid19_data.csv", encoding = "CP932))
h_work <- data.frame(fread("work <- data.frame(fread("/ローカル/covid19_data.csv", encoding = "UTF-8"))
h_work <- read.csv("https://www.harp.lg.jp/opendata/dataset/1369/resource/2853/covid19_data.csv", encoding = "UTF-8")

補足情報(FW/ツールのバージョンなど)

R 4.0.0
macOS Catalina

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

上記のファイルをダウンロードして、サクラエディタで開いて文字コードを確認しましたが、SJISでした。
encoding = "UTF-8"となっていますので、SJISに変更すれば良いと思います。

投稿2020/11/12 04:40

akiruno-oneone

総合スコア815

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

akiruno-oneone

2020/11/12 05:06

エラーメッセージをみる限りは、SJISには対応していないようですね。 CSVファイルをUTF-8に変換してから、ローカルから読み込むのはどうでしょうか。
K.Saitoh

2020/11/12 08:40

CSVをUTF-8に治すためにWIndowsで直してからローカルから読み込んで見ました。 その結果うまく行きました。ありがとうございます。
guest

0

試してませんが、あらかじめ設定を施すことでSJISに対応する方法があるようです。

????文字化けこわい、こわくない? - cucumber flesh

localeを設定し、read_delimを使えばおk

投稿2020/11/12 06:40

KojiDoi

総合スコア13692

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

K.Saitoh

2020/11/12 08:08

すみません、もう少し詳しく教えていただければと思います。 system("locale")をうってみたら以下のようになりました。 ここにSJISが入るのでしょうか? … > system("locale") LANG="ja_JP.UTF-8" LC_COLLATE="ja_JP.UTF-8" LC_CTYPE="ja_JP.UTF-8" LC_MESSAGES="ja_JP.UTF-8" LC_MONETARY="ja_JP.UTF-8" LC_NUMERIC="ja_JP.UTF-8" LC_TIME="ja_JP.UTF-8" LC_ALL= > … read\_delimをうっても以下のようになってしまいます。 … > read\_delim エラー: 想定外の入力です in "read\" …
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問