[pandas]pythonのpandasデータフレームで動的に列追加するコード

tekitou.txt
1あいうえお
2かきくけこ
3さしすせそ
4たちつてと
5なにぬねの
6はひふへほ
7まみむめも
8やゆよ
9らりるれろ
10わをん
11あかさたな
12はまやらわ
13いきしちに
14ひみり
15うくすつぬ
16ふむゆる

こんな感じのファイルがあったとして、これを、
1行を1つの単語として扱い、そして、5行ごとを1つの文書として扱いSCDVしたいのですが、その前準備として、このファイルを

0 あいうえお
0 かきくけこ
0 さしすせそ
0 たちつてと
0 なにぬねの
1 はひふへほ
1 まみむめも
1 やゆよ
1 らりるれろ
1 わをん
2 あかさたな
2 はまやらわ
2 いきしちに
2 ひみり
2 うくすつぬ
3 ふむゆる

のようなデータフレームにする必要がありそうなのですが、
pandasデータフレームにこのように文書番号の列を追加するコードがわかりません。

Python2.7
1# coding: UTF-8
2
3#必要なライブラリをインポート
4import pandas as pd
5
6#
7
8df = pd.read_csv('tekitou.txt',sep=('\n'),header=None)#ファイル読み込み
9
10df['text_num'] = 0#とりあえずハリボテの列を追加
11

この後どのようなコードを書けば考えている通りの列を追加できるでしょうか。
お手数ですがご教示よろしくお願いします。

行動規範の内容に同意します

回答2件

ベストアンサー

2例提示します。

python
1l = len(df.index)
2num = int(l/5) + 1
3print("num :", num)
4no = [y for y in range(num) for x in [0]*5]
5print(no)
6
7no = no[:l]
8df.loc[:,'text_num'] = no
9print(df)
10

python
1no = df.reset_index().loc[:,"index"].apply(lambda x: x // 5)
2df.loc[:,'text_num'] = no
3print(no)
4print(df)
5

投稿2018/09/18 14:20

t_obara

総合スコア5488

Terratale

2018/09/18 14:54

回答ありがとうございます。先にズラーっと文書番号を並べた後でそれを入れるという方法があったんですね！無事に狙い通りのデータフレームを作成することができました！

行動規範の内容に同意します

取り急ぎ、列追加のコードだけでも。
pandas.DataFrameに列や行を追加

Python3
1df['A'] = 0

投稿2018/09/18 14:16

opyon

総合スコア1009

Terratale

2018/09/18 14:56

回答ありがとうございます！参考になるページありがとうございました。

行動規範の内容に同意します

あなたの回答

tips

プレビュー

行動規範の内容に同意します

質問の解決につながる回答をしましょう。サンプルコードなど、より具体的な説明があると質問者の理解の助けになります。また、読む側のことを考えた、分かりやすい文章を心がけましょう。

15分調べてもわからないことは
teratailで質問しよう！

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう！

[pandas]pythonのpandasデータフレームで動的に列追加するコード

関連した質問