質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

Q&A

解決済

1回答

497閲覧

Pythonのループ方法について

AbcdefgFirst

総合スコア33

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

ループ

ループとは、プログラミングにおいて、条件に合致している間、複数回繰り返し実行される箇所や、その制御構造を指します

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

0グッド

0クリップ

投稿2018/11/21 08:30

お世話になっております。

Pythonモジュールのbeautifulsoupを用いてhtmlを解析した後に、all_tableにtable要素を入れています。

その後のfor文の中でall_tablesから取り出しているvalueの中には<tag>~</tag>の中身が1つずつ入っているかと思うのですが、その中で指定した番号の並びにあるtd要素の値をprocessed_tablesに入れています。
###分からない部分
一番下にあるコードにて、for文の中でtd要素の番号を指定している部分があるかと思うのですが、そこを変数などを用いて汎用的に書く方法が分かりません。

具体的には、row_numberに入っている(tr要素の)数だけ番号に+8する処理をして、その値をprocessed_tablesに追加していきたいです。

for文の中にカウント用とtd要素の並び番号を持っておく変数を用意して、下のようなコードを書いてみましたが、iの中にただのintが入ってしまいエラーが出てしまいます。

for index, value in enumerate(all_tables): row_number = len(value.tbody.find_all('tr')) sequence = 1 counter = 1 for i in range(row_number): processed_table[index] = { 'element': [i.find_all('td')[sequence].text], 'value': [i.find_all('td')[sequence+1].text], 'remark':[i.find_all('td')[sequence+6].text] } sequence += 8 counter += 1

初歩的な質問でお見苦しい点があるかと思いますが、ご教授頂けませんでしょうか。
以上、よろしくお願いします。

###コード

python

1#取得するtable数 2number = int(input()) 3 4#入力された数だけtableタグを取得する 5all_tables = soup.find_all('table', limit = number) 6 7 8#指定数の配列を用意して0で初期化 9processed_tables = [ 0 for i in range(number) ] 10 11 12 13for index, value in enumerate(all_tables): 14 row_number = len(value.tbody.find_all('tr')) 15 16 processed_tables[index] = { 17 'element': [ 18 value.find_all('td')[1].text, 19 value.find_all('td')[9].text, 20 value.find_all('td')[17].text, 21 ], 22 'value': [ 23 value.find_all('td')[2].text, 24 value.find_all('td')[10].text, 25 value.find_all('td')[18].text, 26 ], 27 'remark': [ 28 value.find_all('td')[7].text, 29 value.find_all('td')[15].text, 30 value.find_all('td')[23].text, 31 ] 32 } 33

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

おそらくC言語とかからプログラムを勉強し始めたのかと思いますが、
pythonではC言語などでやっていたindexを使ったforの回し方とニュアンスが違ってくるので
慣れるまではしっくりこないと思います

しかし慣れてしまえば下記のように非常に理解がしやすい?記述が可能になりますので
ぜひとも慣れてしまうことをお勧めします
自分もC言語から始めたので大変でした(**)

パパっと適当に書いたので間違ってるかもしれませんがこれでおそらくニュアンスがつかめるのではないでしょうか
詳しくはpythonの公式サイトや本を参考にすることをお勧めします

python

1for index, value in enumerate(all_tables): 2 row_number = len(value.tbody.find_all('tr')) 3 4 for i in range(0, 8*row_number, 8): 5 processed_tables[index]['element'].append(value.find_all('td')[1+i].text) 6 processed_tables[index]['value'].append(value.find_all('td')[2+i].text) 7 processed_tables[index]['remark'].append(value.find_all('td')[7+i].text)

追記

python

1#指定数の配列を用意して0で初期化 2processed_tables = [ 0 for i in range(number) ]

ここのコードを読み飛ばしておりここがエラーになっていました
processed_tableに入ってるのは数字のリストなのに
数字に添え字で['element']ってやってもアクセスできないよねってことでした

pythonではリストを宣言する際にサイズを気にする必要はありません
初期化してそこに要素をappendすれば勝手に要素数を増やしていってくれます
多分これでエラーを回避できると思います(最初のやつよりだいぶ変わっちゃいました)

python

1#取得するtable数 2number = int(input()) 3 4#入力された数だけtableタグを取得する 5all_tables = soup.find_all('table', limit = number) 6 7# init List 8processed_table = [] 9 10for value in all_tables: 11 row_number = len(value.tbody.find_all('tr')) 12 13 dir_dict = {'element':[], 'value':[], 'remark':[]} 14 for i in range(0, 8*row_number, 8): 15 dir_dict['element'].append(value.find_all('td')[1+i].text) 16 dir_dict['value'].append(value.find_all('td')[2+i].text) 17 dir_dict['remark'].append(value.find_all('td')[7+i].text) 18 processed_table.append(dir_dict)

おそらくこれで実行できて、
processed_tableにはdir_dictのリストが入っていて
processed_table[all_tableの数]でアクセスできる

processed_table[all_tebleの数]にはdir_dictが入っていて
processed_table[all_tableの数]['element']などでアクセスできる

processed_table[all_tableの数]['element']にはリストが入っていて
processed_table[all_tableの数]['element'][row_number]でアクセスできる

processed_table[all_tableの数]['element'][row_number]には
value.find_all('td')[2+i].textなどが入っていて
そこから先はbeautifulsoupにお任せします

ただdictの中にあんまりlistを入れたくないので、
自分であれば
processed_table[all_tableの数]['element'][row_number]の並びよりも
processed_table[all_tableの数][row_number]['element']の並びにすると思います
なかなか分からない事だらけだと思いますが頑張ってください(^o^)/

投稿2018/11/21 08:58

編集2018/11/22 06:27
ko.tu

総合スコア178

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

AbcdefgFirst

2018/11/21 12:19

ko.tu様 ご回答頂きありがとうございます。 見慣れない書き方が出てきたので、勉強しておこうと思います。 アドバイス頂いたコードを試したところ、以下のエラーが出ました。 processed_tables[index]['element'].append(value.find_all('td')[1+i].text) TypeError: 'int' object is not subscriptable エラー内容をググってみたのですが、リストで無くタプルを使うと解決するみたいなのですがイマイチよく分かりませんでした。 何か書き方が違うのでしょうか...?
ko.tu

2018/11/22 06:32

追記しました もし自分のコメントがまだ残っていても 勘違いしていた時に書いたコメントが残っているだけなので 追記の方を参照してください
AbcdefgFirst

2018/11/22 12:13

ko.tu様 何とか希望の動作を実装する事が出来ました。 配列と辞書等の型が入り混じって色々と遠回りしていたようです。。 ご親切に教えていただき有難うございました。大変助かりました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問