pythonのbs4スクレイピング機能を使って、Wikipedia情報をロウごとにforの中でコンテンツを収集する機能を作りました。このコンテンツをロウごとにCSV出力したいのですが、文字カンマで区切られてしまいます。文, 次のロウの文, 次のロウの文として出力するにはどうしたらいいですか。
python
1import csv 2import requests, bs4 3 4url = 'https://ja.wikipedia.org/wiki/%E3%82%A4%E3%82%B0%E3%83%8E%E3%83%BC%E3%83%99%E3%83%AB%E8%B3%9E%E5%8F%97%E8%B3%9E%E8%80%85%E3%81%AE%E4%B8%80%E8%A6%A7' 5res= requests.get(url) 6soup = bs4.BeautifulSoup(res.text,'html.parser') 7 8contents =[] 9 10with open('ignovel_content.csv','w') as f: 11 writer = csv.writer(f) 12 13 14 for year in range(1,20): 15 print(1991+(year-1)) 16 for row in range(2,12): 17 print(row-2) 18 table = soup.select(f'tbody:nth-of-type({year}) > tr:nth-of-type({row}) > td:nth-of-type(2)') 19 20 for t in table: 21 text = t.getText() 22 print(text) 23 contents.append(list(text)) 24 writer.writerow(contents) 25
とすると
"['水', 'が', '知', '性', 'を', '持', 'っ', 'た', '液', '体', 'で', 'あ', 'る', 'と', 'い', 'う', '事', 'を', '執', '拗', 'に', '「', '発', '見', '」', 'す', 'る', 'と', 'と', 'も', 'に', '、', '\n', '水', 'は', 'あ', 'る', '出', '来', '事', 'の', '痕', '跡', 'が', '完', '全', 'に', '消', '滅', 'し', 'た', '後', 'で', '、', 'し', 'ば', 'ら', 'く', '経', 'っ', 'て', 'も', 'そ', 'れ', 'を', '覚', 'え', 'て', 'い', 'ら', 'れ', 'る', 'と', 'い', 'う', '、', '彼', 'の', 'お', '気', 'に', 'め', 'す', '結', '果', 'を', '立', '証', 'し', 'た', 'こ', 'と', 'に', '対', 'し', 'て', '。', '\n', '\n']","['膨', '張', '感', '・', 'お', 'な', 'ら', '・', '不', '快', '感', 'な', 'ら', 'び', 'に', '気', '恥', 'ず', 'か', 'し', 'さ', 'を', '防', 'ぐ', 'た', 'め', 'の', '「', '対', 'ガ', 'ス', '液', '」', 'を', '用', 'い', 'た', '、', '彼', 'の', '先', '駆', '的', 'な', '仕', '事', 'に', '対', 'し', 'て', '。', '\n']","['科', '学', '教', '育', 'の', '必', '要', '性', 'を', '誰', 'よ', 'り', 'も', 'よ', 'く', '論', '証', 'し', 'た', 'こ', 'と', 'に', '対', 'し', 'て', '。', '\n']","['ノ', 'ー', 'ベ', 'ル', '賞', '受', '賞', '者', 'と', 'オ', 'リ', 'ン', 'ピ', 'ッ', 'ク', '出', '場', '者', 'か', 'ら', 'の', 'み', 'の', '提', '供', 'を', '受', 'け', '入', 'れ', 'る', '精', '子', 'バ', 'ン', 'ク', '「', '胚', '選', '択', 'の', 'た', 'め', 'の', '倉', '庫', '」', 'の', '先', '駆', '的', 'な', '発', '展', 'に', '対', 'し', 'て', '。', '\n]"
のようになってしまいます。
writer.writerows(contents)
にしても
水,が,知,性,を,持,っ,た,液,体,で,あ,る,と,い,う,事,を,執,拗,に,「,発,見,」,す,る,と,と,も,に,、," ",水,は,あ,る,出,来,事,の,痕,跡,が,完,全,に,消,滅,し,た,後,で,、,し,ば,ら,く,経,っ,て,も,そ,れ,を,覚,え,て,い,ら,
のように途切れてしまいます。水が知性を持った液体である-, 次の文, 次の文といった形にするにはどうしたらいいですか。
動作環境はCorabratoryです。よろしくお願いします。
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。