質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

RStudio

RStudioは、Rのプログラミングを効率化する統合開発環境です。統計計算とグラフィックスができるプログラミング言語であるRのIDEでOSSで公開されています。ソースコードやコンソールなどが一つの画面に見やすく配置されている点が特徴。コマンド名以外に、関数名やパッケージ名も補完できます。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Q&A

0回答

505閲覧

Rstudioにてtsvファイルの読み込み時に出るエラー

maltines

総合スコア12

Windows 10

Windows 10は、マイクロソフト社がリリースしたOSです。Modern UIを標準画面にした8.1から、10では再びデスクトップ主体に戻され、UIも変更されています。PCやスマホ、タブレットなど様々なデバイスに幅広く対応していることが特徴です。

RStudio

RStudioは、Rのプログラミングを効率化する統合開発環境です。統計計算とグラフィックスができるプログラミング言語であるRのIDEでOSSで公開されています。ソースコードやコンソールなどが一つの画面に見やすく配置されている点が特徴。コマンド名以外に、関数名やパッケージ名も補完できます。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

0グッド

0クリップ

投稿2022/12/12 19:07

編集2022/12/13 10:02

前提・実現したいこと

Rstudioにて、データハンドリングを行っています。
その過程で生成したファイルをもう一度読み込もうとすると、やや不可解なエラーが出ました。

発生している問題・エラーメッセージ

あるファイルを読み込もうとすると、以下のエラーメッセージが出ます。
読み込んだコードは以下の通りです。

R

1app <- read_tsv("upd_pmab_gr_appl_case_biblog_3columns.tsv", 2 locale = locale(encoding="UTF-16"), 3 show_col_types = FALSE, 4 )

読み込むと、以下のメッセージが出ました。

Error: The size of the connection buffer (131072) was not large enough to fit a complete line: * Increase it by setting `Sys.setenv("VROOM_CONNECTION_SIZE")`

詳しくないのですが自分なりに調べると、

Sys.setenv("VROOM_CONNECTION_SIZE")

こちらで十分な大きさのCONNECTION SIZE?を指定すればいいとみたため、

R

1Sys.setenv("VROOM_CONNECTION_SIZE" = 500000000) 2

こちらのコードを、いくつか数値を読み込ませた後にもう一度ファイルを読み込もうとしても、数値が変わっただけで読み込めませんでした。また、数値を大きくしすぎるとメモリ不足になりました。

元ファイルが大きい(約1.5GB)のが原因かと思い、いくつか分割したファイル(各ファイル約200MB)を読み込もうとしたものの、結果は変わりませんでした。

また、C:の容量が足りてないかと思ったのですが、60GB近く残っているため違うと思います。

そのため、ファイル自体に問題があると思ったのですが、どこに原因があるのかわかりません。どなたか原因が分かる方がいたら教えていただきたいです。

その他試したこと

こちらのコードも試しましたが、結果は変わりませんでした。

R

1app <- read.csv("upd_pmab_gr_appl_case_biblog_3columns.tsv", 2 sep = "\t", 3 fileEncoding="utf-16", 4 header = TRUE, 5 )

いくつか分割したファイル(各ファイル約200MB)

こちらを別デバイスで読み込んでも、同じ結果が出ました。そのため、ハード面でのエラーではないのかな...と思います。そうなると、ファイルに問題があるのか...

元データをpowershellで冒頭を見てみたところ以下の通りでした。n行3列のデータです。特に変な所はないと思うのですが...

powershell

1PS C:\Users\~> Get-Content "upd_pmab_gr_appl_case_biblog_3columns.tsv" | Select-Object -First 10 2app_num abii_inventor_name abii_inventor_addr 31966049771 鈴元 稔 東京都杉並区 41966049771 卯賀 順是 浦和市 51966076588 東沢 純一 仙台市 61966076588 多木 二郎 仙台市 71968006778 ロジヤー・ジョージ・ノーレン イギリス国 81968006778 モーリソン・ジエイムズ・レフト イギリス国 91968029671 バーナン・ラッセン・トンプソン アメリカ合衆国 101968047890 ゲイン・ステイーブンソン アメリカ合衆国 111969016552 ラルフ、エジソン、ホーム、ジユニア アメリカ合衆国

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

cuttlefish44

2022/12/16 04:45

関係あるのかわかりませんが、ぱっと見、powershell出力の2行目 (列名) の区切りがtabになっていないような気がします。`read_tsv(ry, col_names = FALSE, skip = 1)` で改善されたりしませんかね?
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問