質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.51%

  • SQL

    3014questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • R

    413questions

    R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。

複数のcsvデータの平均をとったファイルの出力方法

解決済

回答 2

投稿 編集

  • 評価
  • クリップ 0
  • VIEW 263

essa

score 31

標記について質問させてください。

現在、大量のCSVファイルがあり、
それらの値の平均値をとったCSVファイルがほしいです。

1.csv

hoge1 hoge2 hoge3
1 2 3
4 5 6
7 8 9

2.csv

hoge1 hoge2 hoge3
1 2 3
4 5 6
7 8 9

3.csv

hoge1 hoge2 hoge3
6 3 9
2 6 11
1 1 7

それぞれのセルと同一の場所の値をとった平均値を取得したいです。

new.csv

hoge1 hoge2 hoge3
(1+1+6)/3 (2+2+3)/3 (3+3+9)/3
(4+4+2)/3 (5+5+6)/3 (6+6+11)/3
(7+7+1)/3 (8+8+1)/3 (9+9+7)/3

みたいな感じです。

できればsqlでできればと思っております。

私の環境としては、Rのsqldfパッケージを使っております。

どうぞよろしくお願い致します。

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • Orlofsky

    2019/02/16 13:27

    同じSQLでもデータベースによって方言が大きいですから、どのデータベースを使うのかを質問のタグで明示したり、バージョンも明記した方が適切なコメントが付き易いです。 SQLの観点から Oracle Database, PostgreSQL, MySQL の特徴を整理しよう!https://www.ashisuto.co.jp/corporate/column/technical-column/detail/1197236_2274.html

    キャンセル

  • Orlofsky

    2019/02/16 18:15

    3つのCSVは元はデータベースから作成したのでしょうか?3つのCSVとも同じデータベースから作成しているのであれば、SQLで直接new.csvを作成する方が簡単では?質問に3つのテーブルのCREATE TABLEを追加しては?

    キャンセル

  • essa

    2019/02/25 23:09

    Orlofsky様

    返信が大変遅れました。申し訳ありません。
    SQLの質問をする際、どのデータベースを使うのか、バージョンはいくつか明記するようにします。
    今回の場合はSQliteかと思われますが、バージョンはわかりませんでした...。

    3つのCSVは、データベースから作成したものではありません。
    今回、後段の処理で使うための前処理でCSVファイルを扱う必要がありました。
    正直前処理(今回でいうと各ファイルのすべての平均値を算出したCSVファイル)ができれば何でもよいのですが、個人的にSQLを学び中だったため、SQLでやっていました。

    キャンセル

回答 2

checkベストアンサー

+1

こんなのでどうでしょう。大雑把にしかテストしてないのでなにかバグっているかもしれません。

d <- list()
# infilesは入力元ファイル名がリストアップされたベクトルとして既に定義されているとする。
for(infile in infiles){
  d[[infile]] <- read.table(infile, sep="\t", header = T)
}

res <- as.data.frame(matrix(ncol=ncol(d[[1]]), nrow=nrow(d[[1]])))
colnames(res) <- colnames(d[[1]])
for(i in 1:nrow(d[[1]])){
  for(j in 1:ncol(d[[1]])){
    res[i,j] <- mean(sapply(d, function(x){return(x[i,j])}))
  }
}
res

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2019/02/15 11:21

    kojidoi様

    回答ありがとうございます。

    ># infilesは入力元ファイル名がリストアップされたベクトルとして既に定>義されているとする。
    ここは、例えば、
    AAA.txt,BBB.txt,CCC.txtという3つのファイルがあったばあい

    infile.txt
     AAA.txt
    BBB.txt
    CCC.txt
    というファイルを作成しておき

    infiles <- read.table("infile.txt",header=F)
    をしておく。

    ということでしょうか?

    どうぞよろしくお願い致します。

    キャンセル

  • 2019/02/15 13:40

    その場合はforループはfor(infile in infiles[,1])ですね。infile.txtなんてわざわざ作るのでなくdir()を使ったほうが便利かもしれない。書き方はいろいろあるはずだし、前後で何をするかによってどれが最適かは変わります。

    キャンセル

0

for (i in 1:3) {
assign(paste("dat",i,sep=""),read.csv(paste(i,".csv",sep=""),header=T,sep=","))
}

datnew <- dat1
for (i in 2:3) {
datnew <- datnew+get(paste("dat",i,sep=""))
}

write.csv(datnew/3, "new.csv")

"3"をcsvファイルの数に置き換えて使って下さい。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

同じタグがついた質問を見る

  • SQL

    3014questions

    SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

  • R

    413questions

    R言語は、「S言語」をオープンソースとして実装なおした、統計解析向けのプログラミング言語です。 計算がとても速くグラフィックも充実しているため、数値計算に向いています。 文法的には、統計解析部分はS言語を参考にしており、データ処理部分はSchemeの影響を受けています。 世界中の専門家が開発に関わり、日々新しい手法やアルゴリズムが追加されています。