質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

Q&A

解決済

2回答

8997閲覧

Rでファイルの読み込み

krn

総合スコア7

ファイル

ファイルとは、文字列に基づいた名前又はパスからアクセスすることができる、任意の情報のブロック又は情報を格納するためのリソースです。

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

0グッド

1クリップ

投稿2017/12/12 05:25

###前提・実現したいこと
Rで重回帰分析を行おうとしています。
初歩中の初歩の質問ですが、いくら調べても解決策が見つからない(分からない)ので質問します。

ファイルの読み込みに関してです。
作業ディレクトリをファイルのある場所に変更した上で、作業しています。

###発生している問題・エラーメッセージ

重複した 'row.names' は許されません

###該当のソースコード

R

1> read.table("ファイル名.csv", header=TRUE, sep=",", row.names=1)

###試したこと

read.table("ファイル名.csv", header=TRUE, sep=",")

ここまでは読み込めるのですが、行名を指定するとエラーになってしまいます。

###補足情報(言語/FW/ツール等のバージョンなど)
ファイルはUTF-8のcsvにしてあります。
ある都市の町丁目を扱っているのですが、行名に指定したい部分に漢字・ひらがな・半角英数字が混ざっている事は関係あるのでしょうか。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答2

0

ベストアンサー

googleで「R 重複 検出」などとすれば色々見つかります。

つまり、row.names=1、という指定は、一列目の値を各行を判別可能なIDに指定する、という意味なので、同じ値があるとその二つ(以上の行を)区別できなくなるためエラーがでる、というわけです。

以下のようなコードでどこが(一列目のデータのどれが)重複したものなのか検出できると思います。

R

1data <- read.table("test.tsv", header=T, sep=",") 2sort(data[,1]) 3duprows <- duplicated(data[,1]) 4data[,1][duprows]

ご参考までに。

投稿2017/12/12 07:43

.M.

総合スコア98

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

krn

2017/12/12 18:27

回答ありがとうございます。 エラーの内容を正しく理解出来ていなかったことが根本的な原因のようです。 エラーは無事解決出来ました。 本当にありがとうございました。
guest

0

メッセージにあるように、正に重複があるのだと思います。
つまり1桁目の内容が同じであるような行が二行以上ある。デコードや文字種の問題ではないでしょう。チェックで見落とし勝ちなのは『空』のデータがいくつか混じってしまっているケースです。

ただ、IDに漢字カナ文字列を使うと、いろいろ中間処理が面倒です。ABC123みたいなIDを別途ふる事にして、今の1桁目は普通にデータとして扱う事をオススメします。

投稿2017/12/12 06:24

KojiDoi

総合スコア13671

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問