質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

264閲覧

pythonでのスクレイピングのやり方

karasuma

総合スコア39

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2022/05/26 09:35

コメントにあるようなHTMLから日本語部分だけ抽出する場合どのようなコードを書けばいいいのでしょうか

python

python

1import requests 2from requests import Response 3from bs4 import BeautifulSoup 4import re 5 6response: Response = requests.get('https://qiita.com/') 7soup: BeautifulSoup = BeautifulSoup(response.text, "html.parser") 8 9data = soup.find_all(href = re.compile("a" and "qiita.com/*/items/*")) 10#<a class="abc-1234" href="https://qiita.com/hogehoge/items/ae9e583163efc28a73d2">日本語部分</a> 11 12print(data)

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

python

1import requests 2from requests import Response 3from bs4 import BeautifulSoup 4from pprint import pprint 5 6response: Response = requests.get('https://qiita.com/') 7soup: BeautifulSoup = BeautifulSoup(response.text, "html.parser") 8 9data = soup.select('h2 > a') 10title = [d.text for d in data] 11pprint(title) 12 13# 14['誰でも始められる!発信活動を継続しながら楽しく成長する方法', 15 '日は沈む。考える事を放棄した日本産UIの日没', 16 '「ミノ駆動本」読書感想文', 17 'WHERE句を忘れただけなのに', 18 'RFCに追加されたuseEventについて', 19 'TypeScriptの等価演算子(==)と厳密等価演算子(===)について', 20 'Youtube上にカフェを作った話', 21 '「ハッカーと画家」は非エンジニアにも読んでほしいオタク野郎の取説', 22 '【Shopifyアプリ調査】YouTube動画埋め込みアプリをつかってみた', 23 '「偏見と妄想で語るスクリプト言語としての Swift」登壇補足', 24 '【初学者向け】誰でも理解できるSQLの基礎', 25 'エンジニアは専門書籍を買ってはいけない', 26 '【2022】業務でRustを使うことは無いと言ったが本当か?512MBの環境で様々なGUIを動かしてみた【Windows,業務システム】', 27 '「Android絵文字ポリシー」に開発者が対応する事', 28 'Python実装のWebアプリケーションフレームワークOSSの比較(2022年版) ', 29 'Python基礎文法まとめ', 30 'LCPの改善でLighthouseだけ見てない?効果的に改善していくためのステップ', 31 '【Shopifyアプリ調査】商品レビューアプリの最適解見つけた件', 32 'GitHub ActionsでC#のビルド可否の確認とユニットテストを自動化する方法', 33 'インフラ未熟者がDevSecOpsThonに参加してみた', 34 '2022年6月施行の改正特定商取引法に対応するための、Stripe Checkout / Payment Links設定ガイド', 35 '【Shopifyアプリ】ランキング形式に表示できるアプリを導入してみた!', 36 'フルスタックエンジニアへの道 part 1 ~Rails 7 × Dockerの環境構築 1', 37 'MATLAB講習会を行う際に意識すること', 38 'PowerApps と Azure を連携させるベストプラクティス', 39 '[GCP] Identity Platform で有効期限付きパスワードの認証機能を実装してみるよ', 40 '【個人開発】英語の発音精度を診断するアプリ「Speaking Checker」を作りました', 41 '最新のタグを取得するGitコマンド', 42 'Microsoft Office アプリでの CO2 の入力方法', 43 'Spotifyで自分が聞いた曲を分析してみた']

投稿2022/05/26 09:51

melian

総合スコア19803

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

karasuma

2022/05/26 09:55

わざわざ正解まで!ありがとうございました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問