前提・実現したいこと
selemiumで新着記事一覧のようなページから、記事のURLを取得する動作を実装しています。
URL取得はできたのですが、たまに配信終了した列があり、その部分データは空欄として配列に入ってしまいます。
urls = ["url","url","","url"]
上記のような感じに配列に格納されています。
発生している問題・エラーメッセージ
上記のような配列をcsvに入れる際に下記のように保存されています。
|/|A|B|
|:--|:--:|
|1|URL||
|2|URL||
|3|||
|4|URL||
ここで生成されたCSVを、さらに読み込み
そのURLを伝って記事の情報を取得するようにしたいので、
この空欄があることで、途中で処理が止まってしまいます。
なので、保存の時点で空欄は保存しないようにしたいと思っています。
該当のソースコード
ruby
1newsUrl = [] 2 3# ▼ここで記事のURLを取得 4index = 0 5while true do 6 index = index + 1 7 sleep 1 8 begin 9 news = driver.find_element(:xpath, "/html/body/div[3]/div[1]/div[2]/div[2]/div/table/tbody/tr[#{index}]/td[2]/a") 10#↑たまにtd自体はあるけど、aが存在していない行がある 11 href = news.attribute('href') 12 newsUrl << href 13 rescue Selenium::WebDriver::Error::NoSuchElementError 14 break 15 end 16end 17# ▲ここで記事のURLを取得 18 19# ▼ここでURLをいったんCSVに保存する 20count = 0 21CSV.open('news_url.csv','w') do |nu| 22 newsUrl.each do |u| 23 nu << [u] 24 count = count + 1 25 end 26end 27# ▲ここでURLをいったんCSVに保存する 28
試したこと
検索してみると、文字内の空欄(半角スペースなど)を除外するものはあったのですが、
そのそも空のものを保存しないようにしないと解決しなさそうでしたので、このような質問をさせていただきました。
皆様の知見拝借させていただきたく!
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2020/01/17 05:30
2020/01/17 07:18