csvファイル化するには

自身で作成したcsvファイルから、条件で抽出したリストを新たにcsvファイル化するにはどのようなコードを記述すればよろしいでしょうか。

import requests
from bs4 import BeautifulSoup
import pandas as pd

df_file = pd.read_csv("lyrics2023.csv")

def get_popular(year):
    
    # ページの内容を取得
    response = requests.get(year)
    
    # ページの内容をBeautifulSoupで解析
    soup = BeautifulSoup(response.text, 'html.parser')
    
    # 歌手名が含まれる要素を抽出
    artist_elements = soup.find_all(class_='jp-page-sl-cell-artist')
    
    # 曲名が含まれる要素を抽出
    songname_elements = soup.find_all(class_='jp-page-sl-cell-song')
    
    popular_artist = []
    
    popular_songname = []
    
    for artist_element in artist_elements:
        popular_artist.append(artist_element.text)
    
    for songname_element in songname_elements:
        popular_songname.append(songname_element.text)
    
    return popular_artist, popular_songname

#1980年人気曲抽出

url = 'https://www.joysound.com/web/s/karaoke/memories/ranking/1980'

filtered = []
    
popular_artist, popular_songname =  get_popular(url)
    
for a, t in zip(popular_artist, popular_songname):
    
    filtered.append(df_file[(df_file["Artist"] == a) & (df_file["SongTitle"] == t)])
    
    df_filtered_1980 = pd.concat(filtered)
    
df_filtered_1980

コード

TakaiY

2024/05/30 01:16

> 自身で作成したcsvファイルから、条件で抽出したリストを新たにcsvファイル化する「から」とあるのに、Web「から」条件で抽出しているように見えるのですが、やりたいこととできていること、わからないことを整理していただけますか。回答はここではなく、質問を編集してください。

行動規範の内容に同意します

回答1件

ベストアンサー

新たにcsvファイル化する

pandas.DataFrame.to_csv — pandas 2.2.2 documentation を使うとよいかと思います。

python
1import pandas as pd
2
3def get_popular(url):
4    # ページの内容を取得
5    df = pd.read_html(url, attrs = {'class': 'jp-page-sl-songlist-ptn01'})[0]
6    return df[['歌手名', '曲名']].set_axis(column_names, axis=1)
7
8#1980年人気曲抽出
9url = 'https://www.joysound.com/web/s/karaoke/memories/ranking/1980'
10column_names = ['Artist', 'SongTitle']
11
12popular =  get_popular(url)
13df_file = pd.read_csv('lyrics2023.csv')
14df_filtered_1980 = pd.merge(df_file, popular)
15df_filtered_1980.to_csv('filtered_1980.csv', index=False)

投稿2024/05/29 20:52

編集2024/05/29 21:14

melian

総合スコア21727

otetsu04310431

2024/05/30 02:20

回答ありがとうございます！コード試したのですが、上記の画像とは全く違ったリストになります。うまく歌手名と曲名を適応できていないのですが、どのように修正すればよろしいでしょうか。

otetsu04310431

2024/05/30 02:24

すみません！勘違いでした。コードうまく実行できました！

otetsu04310431

2024/05/31 04:33

繰り返し質問すみません！ url = https://www.sound-cafe.jp/search/year-list/12006 を使用する場合 df = pd.read_html(url, attrs = {'class': 'jp-page-sl-songlist-ptn01'}　この部分をどのように変更すればよろしいでしょうか。