seleniumとbeautifulsoupを用いたスクレイピングでのCSSセレクタの指定の方法

Question

### 前提・実現したいことスクレイピング初学者です. このサイトを参考に自分でも何か作ってみようと思っていました. https://qiita.com/Fujimon_fn/items/16adbd86fad609d993e8 そこでこのサイトで紹介されていたCSSセレクタの指定の方法についての質問です. なぜこのようなCSSセレクタになっているのか文法がわかりません. 2つある"[0]"などが特にわからないので教えていただけると嬉しいです. ### 該当のソースコード ```python #時間が書かれた部分をCSSセレクタで指定し、テキストを抜き出す time = soup.select(".routeSummary li.time")[0].select("span")[0].text ``` ```html

: 22:40発→22:54着 ``` ### 試したこと ```python #時間が書かれた部分をCSSセレクタで指定し、テキストを抜き出す time = soup.select("#route01 > dl > dd:nth-of-type(1) > ul > li.time > span").text ``` サイトの通りにやればもちろんうまくいきます. しかしサイトの文法を理解することができなかったので, 私はchromeのcopyselectorを参考にして, その部分をこのコードに変えました. しかし以下のようなエラーが出ます. AttributeError: ResultSet object has no attribute 'text'. You're probably treating a list of elements like a single element. Did you call find_all() when you meant to call find()? エラーの意味もあまりわかりません. あとhtmlへのリンクは以下のようになっています. https://transit.yahoo.co.jp/search/result?flatlon=&fromgid=&from=%E6%9D%B1%E4%BA%AC&tlatlon=&togid=&to=%E6%96%B0%E5%AE%BF&viacode=&via=&viacode=&via=&viacode=&via=&y=2021&m=03&d=12&hh=22&m2=2&m1=5&type=1&ticket=ic&expkind=1&ws=3&s=0&al=1&shin=1&ex=1&hb=1&lb=1&sr=1&kw=%E6%96%B0%E5%AE%BF

Accepted Answer

> 2つある"[0]"などが特にわからないので教えていただけると嬉しいです.  

`select`はリストを返すので、リストの要素(選択したHTMLノード)を取り出すためには添え字が必要です。先頭要素を取り出すので`[0]`を付けているのでしょう。ただ、それであれば`select`でなく`select_one`を使えば良いのに。

> しかし以下のようなエラーが出ます. 

上で説明したように、`select`結果はリストなのにそれを要素だと思いこんで`text`プロパティを取ろうとしたからですね。

「リストとは何か？」がよく分からない場合は、まずPythonに入門しましょう。スクレイピングは入門し終わってからです。

前提・実現したいこと

該当のソースコード

試したこと

関連した質問