beautifulsoupでスクレイピングしたデータの格納（ヘッダーにあわせて格納したい）

###前提・実現したいこと
スクレイピングしたデータをヘッダーに合わせて格納したい

###発生している問題・エラーメッセージ
ヘッダーA,B摘出要素a1,a2,b1,b2に対して
A B
a1
a2
b1
b2
となっているのを

A B
a1 b1
a2 b2

として出力したいです。
プログラミング初心者すぎて困っています。

###該当のソースコード
python

# -*- coding: utf-8 -*-
import csv
import requests
from bs4 import BeautifulSoup
f = open('output.csv', 'w', newline='')

#アクセスするURL url検索
line = ["https://r.nikkei.com/search?keyword=経済","https://r.nikkei.com/search?keyword=株価"]

# ヘッダ書き込み
f.write('経済,株価\n')

for url in line:

    r = requests.get(url)

    # スクレイピング抽出要素を指定
    soup = BeautifulSoup(r.text, 'lxml')

    for list in soup.find_all('a' , class_='nui-card__meta-pubdate'):
        nlist = list.get('href')

        # データをリストに保持
        csvlist = {nlist}

        # 出力
        writer = csv.writer(f, lineterminator='\n')
        writer.writerow(csvlist)
    f.write(',')

# ファイルクローズ
f.close()

###試したこと
poko_pokoさんご回答ありがとうございます、試してみたのですがうまくいきませんでした…

###補足情報(言語/FW/ツール等のバージョンなど)
python3.6 beautifulsoup4.6.0

LouiS0616

2017/11/08 09:05

インデントが崩れてコードを読めないです。編集画面を開き、コードを選択した状態で<code>ボタンを押してください。

行動規範の内容に同意します

回答2件

ベストアンサー

期待する出力結果は以下でしょうか。

経済	株価
経済のhref１	株価のhref１
経済のhref２	株価のhref２

外側のループでは列方向に経済、株価の順にデータ取得しているので、２列目の株価の列データを取るまで行を出力することができません。つまり、経済と株価のデータを貯めたあとに出力する必要があります。

以下のような流れでできます。（ややソースを改変しています。）

Python
1import csv
2import requests
3from bs4 import BeautifulSoup
4
5keywords = ['経済','株価']
6cols = [] # 経済と株価 の列リストを保持
7for kw in keywords: # 経済と株価
8    url = "https://r.nikkei.com/search?keyword=" + kw;
9
10    col = [] # １列分のリスト
11    r = requests.get(url)
12    soup = BeautifulSoup(r.text, 'lxml')
13    for l in soup.find_all('a' , class_='nui-card__meta-pubdate'):
14        nlist = l.get('href') # URL
15        col.append(nlist) #
16
17    cols.append(col) # 列全体を追加
18
19# 全列を行（タプル）に展開
20for line in zip(*cols): # = for c1,c2 in zip(cols[0],cols[1]):
21    print(line)

投稿2017/11/09 01:40

can110

総合スコア38262

A.Kobayashi

2017/11/09 01:44

無事できました、ありがとうございます！

行動規範の内容に同意します

多分で申し訳ありませんが、list.getの部分で１行ずつ入力していっているからでは無いでしょうか。
かなり適当ですが、流れで言うとこんな感じになるのでは無いかと思います。

やりたいこと「A1,B1\n　の１行のwriteを繰り返す」

count = 0
for list in soup.find_all('a' , class_='nui-card__meta-pubdate'):
    count += 1
    nlist = nlist + list.get('href')
    if(count == 1):
       nlist = nlist + ','
    if(count == 2):
       f.write(nlist + '\n')
       nlist = ''
       count = 0
f.close()

投稿2017/11/08 09:44