困っていることというより分からないことになります。
pandasライブラリの結合アルゴリズムは具体的にどういうアルゴリズムになるのでしょうか?
と言いますのも、当方はsqlクエリを業務で書いてあり最近pandasを使うようになりました。
データベースであれば結合するテーブルそれぞれの大きさなどからパフォーマンスに応じてネステッドループからハッシュ結合になるようにヒント句を加えるなどできます。
pandasではこういった結合方式の指定などはなさそうで、たんにネステッドループ結合のようなfor文でぐるぐるするようなことをやっているのかなとは思ってますが、あってますか?
またそもそもdbであればインデックスを貼ることにより高速な検索が可能(bツリーインデックスが内部的に生成され利用できる)となります。
pandasにもdfの生成時にindexを作成することはできますが、dbでいうインデックスとはことなりbツリーインデックスが作られて検索が高速になるなどはなく、スライシングがてきるようになる程度だと思ってますがあってますか?
あなたの回答
tips
プレビュー