質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

Q&A

解決済

1回答

530閲覧

【Ruby】selemiumで取得したデータを精査してからcsvに入れたい

kaori_oka

総合スコア176

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Ruby

Rubyはプログラミング言語のひとつで、オープンソース、オブジェクト指向のプログラミング開発に対応しています。

selenium

Selenium(セレニウム)は、ブラウザをプログラムで作動させるフレームワークです。この原理を使うことにより、ブラウザのユーザーテストなどを自動化にすることができます。

0グッド

0クリップ

投稿2020/01/17 04:14

編集2020/01/17 05:04

前提・実現したいこと

selemiumで新着記事一覧のようなページから、記事のURLを取得する動作を実装しています。
URL取得はできたのですが、たまに配信終了した列があり、その部分データは空欄として配列に入ってしまいます。

urls = ["url","url","","url"]

上記のような感じに配列に格納されています。

発生している問題・エラーメッセージ

上記のような配列をcsvに入れる際に下記のように保存されています。
|/|A|B|
|:--|:--:|
|1|URL||
|2|URL||
|3|||
|4|URL||

ここで生成されたCSVを、さらに読み込み
そのURLを伝って記事の情報を取得するようにしたいので、
この空欄があることで、途中で処理が止まってしまいます。
なので、保存の時点で空欄は保存しないようにしたいと思っています。

該当のソースコード

ruby

1newsUrl = [] 2 3# ▼ここで記事のURLを取得 4index = 0 5while true do 6 index = index + 1 7 sleep 1 8 begin 9 news = driver.find_element(:xpath, "/html/body/div[3]/div[1]/div[2]/div[2]/div/table/tbody/tr[#{index}]/td[2]/a") 10#↑たまにtd自体はあるけど、aが存在していない行がある 11 href = news.attribute('href') 12 newsUrl << href 13 rescue Selenium::WebDriver::Error::NoSuchElementError 14 break 15 end 16end 17# ▲ここで記事のURLを取得 18 19# ▼ここでURLをいったんCSVに保存する 20count = 0 21CSV.open('news_url.csv','w') do |nu| 22 newsUrl.each do |u| 23 nu << [u] 24 count = count + 1 25 end 26end 27# ▲ここでURLをいったんCSVに保存する 28

試したこと

検索してみると、文字内の空欄(半角スペースなど)を除外するものはあったのですが、
そのそも空のものを保存しないようにしないと解決しなさそうでしたので、このような質問をさせていただきました。
皆様の知見拝借させていただきたく!

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

配列から空文字の要素を除外してループを回せばよいのではないでしょうか。

rb

1CSV.open('news_url.csv','w') do |nu| 2 newsUrl.reject(&:empty?).each do |u| 3 nu << [u] 4 end 5end

投稿2020/01/17 04:42

Mugheart

総合スコア2344

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

kaori_oka

2020/01/17 05:30

やってみます!
kaori_oka

2020/01/17 07:18

無事に空欄無しで取得できました!ありがとうございます!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問