Rに関しての質問です。
2つのファイル(2010年と2011年)があります。
この中にはお店のコードと売上と従業員数が列で入っています。行は250000行ぐらいあります。
売上と従業員数は年毎に異なりますが、お店のコードは変わりません。
そのコードを用いて、それぞれのファイル同士で「共通している(つまり2010年も2011年もある)お店のコード」「2010年にしかない(つまり倒産した)お店のコード」「2011年にしかない(つまり新しく始められた)お店のコード」の数を出したい(もしくはそれぞれを抽出して新たなファイルにしたい)と思っております。
よくわからない質問で申し訳ございません。
なにかいい関数はないでしょうか?
どうぞよろしくお願いいたします。
追記
2010年のデータ
ID Lng lat EnCode FmCode
1 140.74928 40.75985 ABCD 1
2 140.72859 40.83229 AAAA 2
3 140.73715 40.7667 BCDF 5
2011年のデータ
ID Lng lat EnCode FmCode
4 141.48582 40.5518 ABCD 1
5 141.44881 40.56466 ABCD 3
6 141.46973 40.53376 AAAA 2
7 141.4315 41.39995 ABCF 89
データとしてはこのようなものになります。
ここからEnCodeとFmCodeが共通かどうかで抽出したいです。2010年と2011年両方あるもの(IDでいうと1と4、2と6)を抽出するもの、2010年しかないもの(IDでいうと3)、2011年に新設したもの(IDでいうと5,7)を抽出できる関数があればいいなと考えています。
開発プラットフォームはWindowsです。もし、R以外でもいい案があればおしえていただきたいですが、Rしか使えないので、できればRでお願いします。
あなたの回答
tips
プレビュー