テーブル内のURLの取得方法

回答率: 85.48%

質問するログイン新規登録

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

新規登録して質問してみよう

ただいま回答率: 85.48%

トップ Rに関する質問

Q&A

0回答

846閲覧

テーブル内のURLの取得方法

総合スコア10

0グッド

0クリップ

投稿2019/01/26 07:30

0

0

前提・実現したいこと

Rでスクレイピングをしております。
対象サイト
https://www.coingecko.com/en/ico?show_by=ended

テーブル内にいくつか、URLリンクがあり、各行単位にこのURLのリンクを取得し、
データフレームにしたいです。

以下のように実施すると、テーブル内のテキストは取れますが、URLのリンクは取れません。

coin_ico_url <- "https://www.coingecko.com/ja/ico?show_by=ended"
coin_ico <- read_html(coin_ico_url, encoding = "UTF-8") %>%
  html_nodes(xpath= '//*[contains(concat( " ", @class, " " ), concat( " ", "table-scrollable", " " ))]
') %>%
  html_table()

一方、以下のように実行するとURLは取れますが、テキストの情報とは泣き別れになります。

coin_ico_url <- "https://www.coingecko.com/ja/ico?show_by=ended"
coin_ico_href <- read_html(coin_ico_url, encoding = "UTF-8") %>%
  html_nodes(xpath= '//*[contains(concat( " ", @class, " " ), concat( " ", "table-scrollable", " " ))]') %>%
  html_nodes(xpath = "//a[starts-with(@href, 'http')]") %>%
　　html_attr("href")

うまく、行単位にURLを取得する方法はないでしょうか？

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

関連した質問

トップ Rに関する質問

テーブル内のURLの取得方法

関連した質問

同じタグがついた質問を見る

運営からのお知らせ

【重要なお知らせ】いつもteratailをご利用いただきありがとうございます。現在、認証システムの修正により、一部のユーザーが強制的にログアウトされる可能性がございます。お手数おかけしますが、再度ログインを行なっていただきますよう宜しくお願いいたします。ご不便をおかけし申し訳ございません。

過去のお知らせを見る