質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.37%
SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

パフォーマンス

コード効率の向上や計算に関する質問には、このタグを使ってください。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

0回答

109閲覧

pythonのpandasライブラリでのdf同士の結合アルゴリズムとインデックスについて

paella_

総合スコア11

SQL

SQL(Structured Query Language)は、リレーショナルデータベース管理システム (RDBMS)のデータベース言語です。大きく分けて、データ定義言語(DDL)、データ操作言語(DML)、データ制御言語(DCL)の3つで構成されており、プログラム上でSQL文を生成して、RDBMSに命令を出し、RDBに必要なデータを格納できます。また、格納したデータを引き出すことも可能です。

アルゴリズム

アルゴリズムとは、定められた目的を達成するために、プログラムの理論的な動作を定義するものです。

パフォーマンス

コード効率の向上や計算に関する質問には、このタグを使ってください。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

1グッド

1クリップ

投稿2024/11/09 23:06

困っていることというより分からないことになります。

pandasライブラリの結合アルゴリズムは具体的にどういうアルゴリズムになるのでしょうか?

と言いますのも、当方はsqlクエリを業務で書いてあり最近pandasを使うようになりました。
データベースであれば結合するテーブルそれぞれの大きさなどからパフォーマンスに応じてネステッドループからハッシュ結合になるようにヒント句を加えるなどできます。
pandasではこういった結合方式の指定などはなさそうで、たんにネステッドループ結合のようなfor文でぐるぐるするようなことをやっているのかなとは思ってますが、あってますか?

またそもそもdbであればインデックスを貼ることにより高速な検索が可能(bツリーインデックスが内部的に生成され利用できる)となります。

pandasにもdfの生成時にindexを作成することはできますが、dbでいうインデックスとはことなりbツリーインデックスが作られて検索が高速になるなどはなく、スライシングがてきるようになる程度だと思ってますがあってますか?

melian👍を押しています

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

bsdfan

2024/11/10 07:53 編集

pandasのindexは行へのラベル付けみたいなもんです。高速化の役にはたたないし、むしろ行番号の数値でアクセスする方が速いはず。 pandasのmergeがどうなっているかは具体的に書かれたドキュメントが見つからないので、上にコメントあるようにソースを追って実装を確認するしかないんじゃないかと。 pandasの速度に不満があるケースでは、polarsとかduckdbとか別のライブラリを使うというのが、最近の流れだと思います。
paella_

2024/11/11 21:30

うーむそうですよね ありがとうございます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだ回答がついていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.37%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問