質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

Q&A

解決済

2回答

3414閲覧

複数のcsvデータの平均をとったファイルの出力方法

essa

総合スコア81

R

R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

0グッド

0クリップ

投稿2019/02/14 09:28

編集2019/02/14 09:37

標記について質問させてください。

現在、大量のCSVファイルがあり、
それらの値の平均値をとったCSVファイルがほしいです。

1.csv

hoge1hoge2hoge3
123
456
789

2.csv

hoge1hoge2hoge3
123
456
789

3.csv

hoge1hoge2hoge3
639
2611
117

それぞれのセルと同一の場所の値をとった平均値を取得したいです。

new.csv

hoge1hoge2hoge3
(1+1+6)/3(2+2+3)/3(3+3+9)/3
(4+4+2)/3(5+5+6)/3(6+6+11)/3
(7+7+1)/3(8+8+1)/3(9+9+7)/3

みたいな感じです。

できればsqlでできればと思っております。

私の環境としては、Rのsqldfパッケージを使っております。

どうぞよろしくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

tiitoi

2019/02/14 09:36

python タグが付いていますが、Rの質問でしょうか? あと CSV ファイルで SQL とはどういうことでしょうか?データベースからデータを取得するのに使うものだと思っていましたが。
essa

2019/02/14 09:39

tiitoi様 Pythonタグはこちらのミスです。すみません。 CSVファイルをSQLで扱えるようにするRパッケージ(sqldf)を使用しているため、RタグとSQLタグをつけております。
Orlofsky

2019/02/16 09:15

3つのCSVは元はデータベースから作成したのでしょうか?3つのCSVとも同じデータベースから作成しているのであれば、SQLで直接new.csvを作成する方が簡単では?質問に3つのテーブルのCREATE TABLEを追加しては?
essa

2019/02/25 14:09

Orlofsky様 返信が大変遅れました。申し訳ありません。 SQLの質問をする際、どのデータベースを使うのか、バージョンはいくつか明記するようにします。 今回の場合はSQliteかと思われますが、バージョンはわかりませんでした...。 3つのCSVは、データベースから作成したものではありません。 今回、後段の処理で使うための前処理でCSVファイルを扱う必要がありました。 正直前処理(今回でいうと各ファイルのすべての平均値を算出したCSVファイル)ができれば何でもよいのですが、個人的にSQLを学び中だったため、SQLでやっていました。
guest

回答2

0

ベストアンサー

こんなのでどうでしょう。大雑把にしかテストしてないのでなにかバグっているかもしれません。

R

1d <- list() 2# infilesは入力元ファイル名がリストアップされたベクトルとして既に定義されているとする。 3for(infile in infiles){ 4 d[[infile]] <- read.table(infile, sep="\t", header = T) 5} 6 7res <- as.data.frame(matrix(ncol=ncol(d[[1]]), nrow=nrow(d[[1]]))) 8colnames(res) <- colnames(d[[1]]) 9for(i in 1:nrow(d[[1]])){ 10 for(j in 1:ncol(d[[1]])){ 11 res[i,j] <- mean(sapply(d, function(x){return(x[i,j])})) 12 } 13} 14res

投稿2019/02/14 14:09

KojiDoi

総合スコア13669

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

essa

2019/02/15 02:21

kojidoi様 回答ありがとうございます。 ># infilesは入力元ファイル名がリストアップされたベクトルとして既に定>義されているとする。 ここは、例えば、 AAA.txt,BBB.txt,CCC.txtという3つのファイルがあったばあい infile.txt  AAA.txt BBB.txt CCC.txt というファイルを作成しておき infiles <- read.table("infile.txt",header=F) をしておく。 ということでしょうか? どうぞよろしくお願い致します。
KojiDoi

2019/02/15 04:40

その場合はforループはfor(infile in infiles[,1])ですね。infile.txtなんてわざわざ作るのでなくdir()を使ったほうが便利かもしれない。書き方はいろいろあるはずだし、前後で何をするかによってどれが最適かは変わります。
guest

0

R

1for (i in 1:3) { 2assign(paste("dat",i,sep=""),read.csv(paste(i,".csv",sep=""),header=T,sep=",")) 3} 4 5datnew <- dat1 6for (i in 2:3) { 7datnew <- datnew+get(paste("dat",i,sep="")) 8} 9 10write.csv(datnew/3, "new.csv")

"3"をcsvファイルの数に置き換えて使って下さい。

投稿2019/02/17 12:02

shimiken

総合スコア368

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問