質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.50%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

2373閲覧

BeautifulSoupで検索した<a>のhrefの文字列を取得・流用するには

color_

総合スコア12

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

0クリップ

投稿2019/03/08 16:43

前提・実現したいこと

①htmlページから<a>の要素を文字列として取得する。
②取得した文字列から特定の部分を切り出す
③切り出した文字列を組み込んだURLを作成し、request.getのURLとして使いたい

現状

■対象htmlの<a>タグ
<a class="back" href="./exsample/?page_id=123&amp;form_token=a06acf2c07d919e2bd7f0f7906670755&amp;init=1">リンクへ移動</a>

■作成コード(抜粋)
url = http://sample.html
res = session.get(url)
soup = BeautifulSoup(res.text,'lxml')
link = soup.find('a',class_='back')

print(link)
print("form_token" in link)
print(link.find("form_token")) #link[n:nn]で切り出すためのnを調査

■結果
<a class="back" href="./exsample/?page_id=123&amp;form_token=a06acf2c07d919e2bd7f0f7906670755&amp;init=1">リンクへ移動</a>
リンクへ移動
False
None

欲しい結果

最終的には、form_tokenに設定されている文字列を取得して、流用したい次第です。
そのために今は、link[n:nn]で切り出すためのn が欲しいのですが、文字列として認識できていません。
文字列として扱うには、どのような処理が必要でしょうか。

よろしくお願いします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

(link[n:nn]で切り出すためのn が詳しくわからなかったのですが)
1.form_token_link = link.get('href')でlinkのhrefのみ取得
2.moji = moform_token_linkji.split('form_token=')[1]
でform_token以降のリンクの文字列がmojiに代入されると思います...!

投稿2019/03/08 16:54

hatsu

総合スコア1809

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

color_

2019/03/09 07:46

ありがとうございます! 解決しました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.50%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問