質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

336閲覧

PythonでDataFrameのfor文の高速化

GardenTree

総合スコア22

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2022/05/22 12:44

Python

1import pandas as pd 2 3pd.set_option('display.unicode.east_asian_width', True) 4df = pd.read_csv("./csv/sorted3.csv") 5 6for i in range(20001, 291421): # 60002 7 print(df.loc[i, "name"]) 8 k = 0 9 for j in range(i-1, i-20000, -1): 10 if df.loc[j, "name"] == df.loc[i, "name"]: 11 print(i, j) 12 if pd.isna(df.loc[i, "1p_result"]) == True: 13 df.loc[i, "1p_result"] = df.loc[j, "result"] 14 elif pd.isna(df.loc[i, "1p_result"]) == False and pd.isna(df.loc[i, "2p_result"]) == True: 15 df.loc[i, "2p_result"] = df.loc[j, "result"] 16 elif pd.isna(df.loc[i, "1p_result"]) == False and pd.isna(df.loc[i, "2p_result"]) == False and pd.isna(df.loc[i, "3p_result"]) == True: 17 df.loc[i, "3p_result"] = df.loc[j, "result"] 18 if pd.isna(df.loc[i, "1p_speed"]) == True: 19 df.loc[i, "1p_speed"] = df.loc[j, "distance"] / df.loc[j, "time"] 20 elif pd.isna(df.loc[i, "1p_speed"]) == False and pd.isna(df.loc[i, "2p_speed"]) == True: 21 df.loc[i, "2p_speed"] = df.loc[j, "distance"] / df.loc[j, "time"] 22 elif pd.isna(df.loc[i, "1p_speed"]) == False and pd.isna(df.loc[i, "2p_speed"]) == False and pd.isna(df.loc[i, "3p_speed"]) == True: 23 df.loc[i, "3p_speed"] = df.loc[j, "distance"] / df.loc[j, "time"] 24 k += 1 25 if k == 3: 26 break 27 28df[20001:291421].to_csv("./csv/dataset.csv", index=False)

sorted3.csv

1date,place,race,course,distance,surface,weather,total,number,name,age,weight,weight_diff,result,time,time_diff,popularity,odds,abnormal,1p_result,2p_result,3p_result,1p_speed,2p_speed,3p_speed 22015-01-04,京都,1,ダ,1200,重,曇,16,1,ディアエナ,3,510.0,2.0,2,72.4, 0.4,2.0,4.3,0,,,,,, 32015-01-04,中山,8,ダ,1200,良,晴,16,7,ナスケンリュウジン,4,460.0,0.0,10,72.7, 1.1,13.0,55.3,0,,,,,, 42015-01-04,中山,8,ダ,1200,良,晴,16,8,ヒカリマサムネ,5,468.0,4.0,2,71.6, 0.0,7.0,21.4,0,,,,,, 52015-01-04,中山,8,ダ,1200,良,晴,16,9,サンライズマーチ,5,484.0,0.0,9,72.6, 1.0,2.0,6.0,0,,,,,, 6. 7. 8.

こちらのコードを高速化したいのですが、どなたか知恵を貸していただけませんか?

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

自己解決

DataFrameをndarrayに変換してループを回すことによって高速化できました。

投稿2022/05/22 15:29

GardenTree

総合スコア22

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問