回答編集履歴

typo

2024/05/05 00:50

投稿

スコア2194

answer CHANGED Viewed

@@ -55,7 +55,7 @@
 と実行時間が逆転します。これはコピー有無の差ですね。
-`@view a[in.(a.a, [testList]), :]` : 4.746 ms
+`@benchmark @view a[in.(a.a, [testList]), :]` : 4.746 ms
 なので，これが一番速そうです。なお，蛇足ですが

思いついてやってみたことを再追記

2024/05/05 00:47

投稿

スコア2194

answer CHANGED Viewed

@@ -37,3 +37,28 @@
 ### 追記
 結果はDataFrameではなくSubDataFrameになるので，大元のDataFrameを変更すると変になったりするので，少し注意が必要かもしれません。
+### 再追記
+なお，テストについては，実際のDataFrameと同じ12列でやった方がいいと思います。
+例えば次のように12列のデータフレームを設定した場合，
+```julia
+a = DataFrame(
+    NamedTuple(map(x -> x => rand(1:10, 1000000), Symbol.('a':'l')))
+)
+```
+手元の環境だと
+`@benchmark a[in.(a.a, [testList]), :]` : 12.929 ms
+`@benchmark filter(:a => in($testList2), $a, view = true)` : 9.107 ms
+と実行時間が逆転します。これはコピー有無の差ですね。
+`@view a[in.(a.a, [testList]), :]` : 4.746 ms
+なので，これが一番速そうです。なお，蛇足ですが
+`df = @view a[in.(a.a, [testList]), :]`
+のような感じで使います。

@viewで得られる結果の型が元のソースと違う旨を追記

2024/05/04 15:41

投稿

スコア2194

answer CHANGED Viewed

@@ -33,3 +33,7 @@
  Memory estimate: 9.27 MiB, allocs estimate: 23.
 ```
+### 追記
+結果はDataFrameではなくSubDataFrameになるので，大元のDataFrameを変更すると変になったりするので，少し注意が必要かもしれません。