🎄teratailクリスマスプレゼントキャンペーン2024🎄』開催中!

\teratail特別グッズやAmazonギフトカード最大2,000円分が当たる!/

詳細はこちら
COUNT

COUNT は、広く使用されているSQLの関数です。COUNT関数は、行数、もしくは配列のエンティティの数をカウントします。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Q&A

解決済

1回答

992閲覧

for文の作業を効率化する方法を教えてください.

Guroguro

総合スコア8

COUNT

COUNT は、広く使用されているSQLの関数です。COUNT関数は、行数、もしくは配列のエンティティの数をカウントします。

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

for

for文は、様々なプログラミング言語で使われている制御構造です。for文に定義している条件から外れるまで、for文内の命令文を繰り返し実行します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

0グッド

2クリップ

投稿2019/12/11 01:10

####【やりたいこと】
csvファイル中の80万行×14列のデータの中で複数条件にあてはまった列が存在する行ごとに個数をカウントし、その個数を新しい列に出したい。

アドバイス等頂いた方々のおかげでカウントのためのスクリプトがかけました.

【今ここ】
しかし,現在の書き方では80万×80万のデータ参照→カウント→出力が行われているはずなので,データ集計をもっと効率的に行いたいのです.

####【質問内容】
現在のスクリプトをどのようにしたらもっと効率的に作業が行われるのか知りたい.

####【現在のスクリプト】

"""csvデータをインポート""" T = pd.read_csv(r'C:\Users****\Desktop\py\T.csv') """条件にあったデータのカウント""" T['FlontVCount'] = T.apply(lambda r: ((T['SimSec']==r['SimSec']) & (T['Lane']==r['Lane']) & (T['SD']<r['SD'])).sum(), axis=1) """csvデータをエクスポート""" T.to_csv("T.csv",index=False,encoding='UTF_8_sig')

###出力される'T.csv'データ
下の画像は少ないデータでやった時のものです.上手くいけばFlontVCountが加わる.
イメージ説明

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Orlofsky

2019/12/11 02:46

なぜ、80万件もあったらきちんとしたデータベースに移行した方が良いですよ、って誰も書かないのだろうか?
Guroguro

2019/12/13 20:20

御礼が遅くなり,申し訳ありません. 情報ありがとうございました. データベースについて調べてみて,同じことが出来ました. 処理が物凄く速くなりました.
guest

回答1

0

ベストアンサー

回答の前に。
過去の質問を見なければ回答するために必要な状況を掴むのが困難でした。
あまりいい質問とは言えません。

回答ですが、アルゴリズムの一例を示します。

No A B C D 1 3 6 1 ? 2 3 2 0 ? 3 4 4 1 ? 4 3 3 0 ? 5 3 2 0 ? 6 3 1 1 ?

データを並べ替える。
順番は、A の値が昇順になるように、A の値が等しいもの同士は C の値が昇順になるように、A の値も C の値も等しいもの同士は B の値が昇順になるように。

No A B C D 2 3 2 0 ? 5 3 2 0 ? 4 3 3 0 ? 6 3 1 1 ? 1 3 6 1 ? 3 4 4 1 ?

A の値と C の値が等しいものを同じグループとして、データを分割する。

No A B C D 2 3 2 0 ? 5 3 2 0 ? 4 3 3 0 ? No A B C D 6 3 1 1 ? 1 3 6 1 ? No A B C D 3 4 4 1 ?

分割したデータそれぞれについて、B の値を元に D の値を設定する。
(B の値を元に D の値を設定するアルゴリズムは省略。)

No A B C D 2 3 2 0 0 5 3 2 0 0 4 3 3 0 2 No A B C D 6 3 1 1 0 1 3 6 1 1 No A B C D 3 4 4 1 0

分割したデータを結合する。

No A B C D 2 3 2 0 0 5 3 2 0 0 4 3 3 0 2 6 3 1 1 0 1 3 6 1 1 3 4 4 1 0

No の値が昇順になるように並べ替える。

No A B C D 1 3 6 1 1 2 3 2 0 0 3 4 4 1 0 4 3 3 0 2 5 3 2 0 0 6 3 1 1 0

投稿2019/12/13 03:12

2KOH

総合スコア999

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Guroguro

2019/12/13 20:18

ありがとうございます. 今後はもう少しわかりやすく質問するように致しますね.
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.36%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問