前提・実現したいこと
R studioでlibrary(arules)を使ってアソシエーション分析を行おうとしています。
コンマ区切りのデータ(x.txt)を読み込みたいのですがエラーが発生してしまいます。
また、警告メッセージについても何が起きているか分かりませんでした。
x.txtのデータの上から3行は以下のイメージです。(データが公開出来ないものなので)
実際のデータではアルファベットに、日本語の無数にある固有名詞が入ります。
行数は約30万行あります。
1行を1transactionとして考えています。
各行には重複の要素がありますが削除せず別々の要素として読み込ませたいです。
各行の要素数は不定です。(要素数>1)
--- x.txt ---
A,B,C,A
D,E,A
F,G,H,I
発生している問題・エラーメッセージ
validObject(.Object) でエラー:
invalid class “ngCMatrix” object: row indices are not sorted within columns
追加情報: 警告メッセージ:
scan(text = l, what = "character", sep = sep, quote = quote, で:
クオートで囲まれた文字列中にEOFがあります
該当のソースコード
y <- read.transactions(file='x.txt',sep=',',format='basket',rm.duplicate=T)
R言語
試したこと
x.txtの行数を数千程度にしたところエラーが発生せずに読み込まれました。
補足情報(FW/ツールのバージョンなど)
RStudio
Version 1.2.1335
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/09/22 07:49
2019/09/22 08:23
2019/09/22 10:21
2019/09/22 15:03
2019/09/22 16:12