python requestsモジュールで取得したHTML文字列について

requests.getで取得したHTML文字列を行単位で編集したいのですが、
取得した文字列が1文字毎に改行コードが入っており、編集しづらい状態となっております。
どのようにすれば本来の行構成で扱うことができるのでしょうか？

python $ python --version
Python 2.7.5

python $ cat web.py
#!/usr/bin/env python
#coding: utf-8
import requests

s = requests.get("https://www.google.com")
for line in s.text:
print line

以下、実行結果抜粋

o
a
d
.
t
)
{
g
o
o
g
l
e
.
t
i
m
e
r
s
.
l
o
a
d
.
t
.

行動規範の内容に同意します

回答2件

既に解決されているようですが、
公式ドキュメントにこういう方法が書かれていました。
これでも出来ますでしょうか？

lang
1for line in s.iter_lines():
2    if line:
3        print line

参考: Advanced Usage — requests-docs-ja 1.0.4 documentation

投稿2015/01/20 14:13

ryunix

総合スコア1656

nob

2015/01/20 14:49

ryunixさん、ご回答ありがとうございます。確認したところ期待した動作となりました。下記のとおり、requests.getで取得したオブジェクト s のアトリビュートを確認したところ、iter_linesが存在してました。こちらの方がシンプルです。 s = requests.get("https://www.google.com") print dir(s) ・実行結果 ['__attrs__', '__bool__', '__class__', '__delattr__', '__dict__', '__doc__', '__format__', '__getattribute__', '__getstate__', '__hash__', '__init__', '__iter__', '__module__', '__new__', '__nonzero__', '__reduce__', '__reduce_ex__', '__repr__', '__setattr__', '__setstate__', '__sizeof__', '__str__', '__subclasshook__', '__weakref__', '_content', '_content_consumed', 'apparent_encoding', 'close', 'connection', 'content', 'cookies', 'elapsed', 'encoding', 'headers', 'history', 'is_permanent_redirect', 'is_redirect', 'iter_content', 'iter_lines', 'json', 'links', 'ok', 'raise_for_status', 'raw', 'reason', 'request', 'status_code', 'text', 'url']

ryunix

2015/01/20 14:51

期待した動作となり、よかったです :)

行動規範の内容に同意します

自己解決

自己解決しました。
pythonの文字列は1文字毎のリストで格納されていることを意識しておりませんでした。
下記のように改行コード毎に切り出すようにすると、期待したとおりの動作となりました。

lang
1s = requests.get("https://www.google.com")
2for line in s.text.split("\n"):
3    print line

失礼しました。

投稿2015/01/20 14:07

nob

総合スコア8

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

python requestsモジュールで取得したHTML文字列について

関連した質問