列に東京都足立区、大阪府守口市、など都道府県が複数行に渡り存在しており、市区町村を削除し、都道府県だけにしたい場合はどのようなコーディングで処理できるのでしょうか?
また、東京都、大阪府などにできた後、関東、関西等に分類する場合のコーディングもご教示頂けたら幸いです。
宜しくお願いします。
気になる質問をクリップする
クリップした質問は、後からいつでもMYページで確認できます。
またクリップした質問に回答があった際、通知やメールを受け取ることができます。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
回答2件
0
ベストアンサー
回答依頼をいただきましたので
R
1library(stringr) 2a<-c('東京都渋谷区', '北海道札幌市', '大阪府吹田市', '沖縄県那覇市', '青森県青森市') 3str_extract(a, pattern="^.*[都|道|府|県]")
で、
'東京都','北海道','大阪府','沖縄県','青森県'
もし市区町村のほうが欲しければ
R
1substring(str_extract(a, pattern="[都|道|府|県].*$"), 2)
'渋谷区','札幌市','吹田市','那覇市','青森市'
また、東京都、大阪府などにできた後、関東、関西等に分類する場合のコーディングもご教示頂けたら幸いです。
'東京都渋谷区'の中に直接「関東」の情報がありませんので、
「東京都」-「関東」を紐付ける必要があります。
if文で実行
都道府県と地方を紐付けるリストを別途読み込む
等々あるかと思いますが、すこしはご自身で考えられたほうが良いです。
Teratailは丸投げは禁物で、本来はご自身でコーディングした結果、この入力でこの出力が欲しいが、こういうエラーが出てしまっている、思い通りの結果がでない、と質問する場です。
投稿2021/03/07 06:22
総合スコア2240
0
複数行に渡り存在しており
行の分割に法則性があるなら何とかなるかもしれませんが、表記ゆれが大きい場合は、自動化は不可能な場合もありえます。
ただ「分割されている」だけではコーディングをどうするかは判断しようがありません。実データを見せてください。
東京都、大阪府などにできた後、関東、関西等に分類する場合のコーディング
tidyverseを導入してgroup_byを使う方法を勉強すればよいでしょう。
Rでデータを加工・集計する3つの操作を解説。 マーケターが1からRを勉強します【第5回】 | [マナミナ]まなべるみんなのデータマーケティング・マガジン
投稿2021/02/23 10:50
総合スコア13692
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
あなたの回答
tips
太字
斜体
打ち消し線
見出し
引用テキストの挿入
コードの挿入
リンクの挿入
リストの挿入
番号リストの挿入
表の挿入
水平線の挿入
プレビュー
質問の解決につながる回答をしましょう。 サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。 また、読む側のことを考えた、分かりやすい文章を心がけましょう。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。