質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

88.61%

pythonを使ってseleniumでスクレイピングしたデータを上手くリストの中に格納することができません。

解決済

回答 2

投稿

  • 評価
  • クリップ 0
  • VIEW 162

sakanaku

score 13

前提・実現したいこと

こんにちわ。python初学者です。
seleniumでスクレイピングしたデータを順番にリストに格納して出力したいのですが、上手くいきません。

現在、下記の該当コードでarryリストのなかに
arry = 
["テキスト要素", "テキスト要素","テキスト要素"....],["数字", "数字", "数字",...],["テキスト要素2""テキスト要素2""テキスト要素2"....]
このような感じで出力されてしまっているのですが、僕としては
arry=
[["テキスト要素", "数字", "テキスト要素2"]["テキスト要素", "数字", "テキスト要素2"]["テキスト要素", "数字", "テキスト要素2"]......]
このように1セットづつリストに格納したいのですが、どのようにすればいいのでしょうか??ぜひお力を貸していただけないでしょうか??よろしくお願いします。

該当のソースコード

from selenium import webdriver
import chromedriver_binary
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.options import Options
import urllib.request

options = Options()
options.headless = True
options.add_argument('--headless')

driver = webdriver.Chrome(options=options)
driver.get("スクレイピングサイトURL")

arry = []

selector = 'テキスト要素'
element = driver.find_elements_by_css_selector(selector)
element = [a.get_attribute("href") for a in element]


date_element = "数字"
dates = driver.find_elements_by_css_selector(date_element)
dates = [b.text for b in dates]

i = 'テキスト要素2'
items = driver.find_elements_by_css_selector(i)
items = [c.text for c in items]

arry.append((element, dates, items))
print(arry)

for q in arry:
print(q)

試したこと

for文で回せばいいのかな?と考え最後に
for q in arry:
print(q)
このようなコードを書いたのですが結果は同じでした。すいません、ぜひご教授願いたいです。よろしくお願いします。

補足情報(FW/ツールのバージョンなど)

mac10.15.3
python3.8

  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 過去に投稿した質問と同じ内容の質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

回答 2

checkベストアンサー

+1

Ref: https://docs.python.org/ja/3/library/functions.html#zip

zipped = zip(element, dates, items)
print(zipped) # [("テキスト要素", "数字", "テキスト要素2"),("テキスト要素", "数字", "テキスト要素2")]

とすれば良いがします。
が、 element と dates と items がそれぞれ同じ数とは限らない気がするため、
元の形式でも特に問題はないように思えます。

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/09/12 23:16

    すいません、早くにご回答ありがとうございます。
    zipped = zip(element, dates, items)
    こちらで出力するとこのような文字列が出てしまいました。ので、
    zipped = list(zip(element, dates, items))
    このように出力すると
    [("テキスト要素", "数字", "テキスト要素2"),("テキスト要素", "数字", "テキスト要素2")]
    理想の形になりました。すいませんご教授いただきありがとうございまいた。感動しました。

    キャンセル

  • 2020/09/13 02:04

    すいません、少し質問なのですが、zip()関数を使って
    zipped = list(zip(element, dates, items))
    こちら出力は無事にできたのですが、ローカルホストに表示させようとするとページが表示されず、エラーも何も出ず、ずっと検索エンジンが検索中のようにグルグル回りっぱなしになってしまうのですが、zip()でローカルホストに表示さすにはコードの加工が必要なのでしょうか??
    追記の質問ですいません、ぜひ何かアドバイスいただきたいです。
    よろしくお願いします。

    キャンセル

  • 2020/09/13 02:06

    ローカルホストに表示させようとする が何を指しているのかわかりませんが、別に書いたコードが有るのであれば、別に質問を立ててください。

    キャンセル

  • 2020/09/13 02:52

    わかりました。また、少し試行錯誤してみようと思います。
    ありがとうございました。

    キャンセル

+1

unhappychoiceさんが回答している様にzip()を使用するか
またはnumpyを使用して.Tで以下の様に転置を行う事が可能です。

import numpy as np

array = [['a', 'b', 'c'], [1, 2, 3], ['あ', 'い', 'う']]
print(np.array(array).T)

>>>    [['a' '1' 'あ']
>>>  ['b' '2' 'い']
>>>  ['c' '3' 'う']]

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2020/09/12 23:19

    ご回答ありがとうございます。
    print(np.array(array).T)
    こちらの方法でも試させていただきました。いろいろな出力方法があるのですね。numpyも使いこなせるように頑張ります。幅広い視点からご教授いただきありがとうございました。

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 88.61%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • トップ
  • Pythonに関する質問
  • pythonを使ってseleniumでスクレイピングしたデータを上手くリストの中に格納することができません。