質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

ただいまの
回答率

90.40%

  • Python 3.x

    10699questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • リファクタリング

    17questions

    リファクタリングとはコードの本体を再構築するための手法であり、外見を変更せずに内部構造を変更/改善させることを指します。

pythonのextend

解決済

回答 1

投稿

  • 評価
  • クリップ 0
  • VIEW 162

imaharu

score 20

pythonのextendを使って下記コードを実行してresult_docsのようなリストを作成しました。
このコードは問題があり、extendで追加したリストのidが同じであるためresult_doc[1][2]の要素を変更するとresult_doc[1][3]も変わってしまいます。

改善策としてfor文でextendを繰り返し実行すると上手くいくのですが、もう少しシンプルに書きたいです。

よろしくお願いします

データ

docs = [[ [3 , 7 , 4], [1 , 2],  [4 , 10 , 1, 444, 7 , 8], [1 , 2], [3 , 11, 58] ],
[ [ 738, 185, 596], [10 , 20 ,5, 10 ,2 , 3, 4 , 5, 10]]
max_ds_num  = 4
問題コード

def sentence_padding(docs, max_ds_num):
    for doc in docs:
        if len(doc) < max_ds_num:
            padding_list = [[0]] * (max_ds_num - len(doc))
            doc.extend(padding_list)
    return docs
return時のdocs状態
result_docs = [[[3, 7, 4], [1, 2], [4, 10, 1, 444, 7, 8], [1, 2], [3, 11, 58]], 
                [[738, 185, 596], [10, 20, 5, 10, 2, 3, 4, 5, 10], [0], [0]]]
print(id(result_doc[1][2])) -> 1
print(id(result_doc[1][2])) -> 1

改善策

def sentence_padding(docs, max_ds_num):
    for doc in docs:
        if len(doc) < max_ds_num:
            padding_list = [[0]] * (max_ds_num - len(doc))
            for i in range(0, (max_ds_num - len(doc))):
                doc.extend([[0]])
    return docs
print(id(result_doc[1][2])) -> 1
print(id(result_doc[1][2])) -> 2
  • 気になる質問をクリップする

    クリップした質問は、後からいつでもマイページで確認できます。

    またクリップした質問に回答があった際、通知やメールを受け取ることができます。

    クリップを取り消します

  • 良い質問の評価を上げる

    以下のような質問は評価を上げましょう

    • 質問内容が明確
    • 自分も答えを知りたい
    • 質問者以外のユーザにも役立つ

    評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

    質問の評価を上げたことを取り消します

  • 評価を下げられる数の上限に達しました

    評価を下げることができません

    • 1日5回まで評価を下げられます
    • 1日に1ユーザに対して2回まで評価を下げられます

    質問の評価を下げる

    teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

    • プログラミングに関係のない質問
    • やってほしいことだけを記載した丸投げの質問
    • 問題・課題が含まれていない質問
    • 意図的に内容が抹消された質問
    • 広告と受け取られるような投稿

    評価が下がると、TOPページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

    質問の評価を下げたことを取り消します

    この機能は開放されていません

    評価を下げる条件を満たしてません

    評価を下げる理由を選択してください

    詳細な説明はこちら

    上記に当てはまらず、質問内容が明確になっていない質問には「情報の追加・修正依頼」機能からコメントをしてください。

    質問の評価を下げる機能の利用条件

    この機能を利用するためには、以下の事項を行う必要があります。

質問への追記・修正、ベストアンサー選択の依頼

  • fuzzball

    2018/11/08 13:49

    質問とは関係ないですが max_ds_num じゃなくて min_ds_num ではないでしょうか?

    キャンセル

  • imaharu

    2018/11/08 14:09

    変数名のことでしょうか?機械学習で利用するデータを作成しています。padding処理というものがありまして、mini-batchするために文章で出現する文の総数を合わせるため文の最大値(max_sentence_num > max_ds_num)を基準値としてpaddingするためこのような変数名となっています。おそらく処理の意図的に間違っていないかと

    キャンセル

  • imaharu

    2018/11/08 14:11

    ちなみに max_doc_sentence_num = max([*map(lambda x: len(x), source_docs )]) こんな感じでとっております

    キャンセル

  • fuzzball

    2018/11/08 14:26 編集

    あぁ、sentence_padding関数内での変数名のことです。max_ds_numには最小要素数を渡しているようなので min の方が適切かなと思っただけです。

    キャンセル

回答 1

checkベストアンサー

+1

こんなふうに解決できるかと。

def sentence_padding(docs, max_ds_num):
    for doc in docs:
        while len(doc) < max_ds_num:  # for _ in range(max_ds_num - len(doc)): でも良い
            doc.append([0])
    return docs

投稿

  • 回答の評価を上げる

    以下のような回答は評価を上げましょう

    • 正しい回答
    • わかりやすい回答
    • ためになる回答

    評価が高い回答ほどページの上位に表示されます。

  • 回答の評価を下げる

    下記のような回答は推奨されていません。

    • 間違っている回答
    • 質問の回答になっていない投稿
    • スパムや攻撃的な表現を用いた投稿

    評価を下げる際はその理由を明確に伝え、適切な回答に修正してもらいましょう。

  • 2018/11/08 13:50

    ありがとうございます。時間計測して使ってみます

    キャンセル

15分調べてもわからないことは、teratailで質問しよう!

  • ただいまの回答率 90.40%
  • 質問をまとめることで、思考を整理して素早く解決
  • テンプレート機能で、簡単に質問をまとめられる

同じタグがついた質問を見る

  • Python 3.x

    10699questions

    Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

  • リファクタリング

    17questions

    リファクタリングとはコードの本体を再構築するための手法であり、外見を変更せずに内部構造を変更/改善させることを指します。