回答編集履歴
1
inplaceオプションの説明を追加
answer
CHANGED
@@ -30,4 +30,31 @@
|
|
30
30
|
あと、``keep``オプションは重複があった場合に残す行(削除する行)を選択するためのオプションとなります。
|
31
31
|
上記の例では2行目を残して、5行目を削除しておりますが、(`keep='first'`[default])
|
32
32
|
``keep='last'``とすると最後の行(5行目)が残ります。
|
33
|
-
また、``keep=False``とすると両方の行が削除されます
|
33
|
+
また、``keep=False``とすると両方の行が削除されます
|
34
|
+
|
35
|
+
---
|
36
|
+
|
37
|
+
**【追記】**
|
38
|
+
|
39
|
+
``inplace`` オプションの説明です。
|
40
|
+
|
41
|
+
例えば、``df`` 変数に対して、
|
42
|
+
|
43
|
+
```Python
|
44
|
+
df.drop_duplicates(inplace=True)
|
45
|
+
```
|
46
|
+
|
47
|
+
のように ``inplace=True`` の引数と共に ``drop_duplicates()`` を実行すると、 ``df`` 変数に格納されているデータフレーム**自身**から重複行が削除されます。つまりこのメソッドは``df``の内容を**変更**してしまうことになります。
|
48
|
+
> このようにオブジェクト自身の内容を変更してしまうメソッドを 『**破壊的メソッド**』とよびます。
|
49
|
+
|
50
|
+
一方、
|
51
|
+
|
52
|
+
```Python
|
53
|
+
df2 = df.drop_duplicates(inplace=False)
|
54
|
+
```
|
55
|
+
|
56
|
+
のように ``inplace=False`` の引数と共に ``drop_duplicates()`` を実行すると、 ``df`` 変数に格納されているデータフレーム自体は全く変更されません。
|
57
|
+
その代わり、``df`` 変数に格納されているデータフレームから重複行の削除を行った結果がリターン値として戻ります。(結果、``df2``に格納されることになります)
|
58
|
+
> このようにオブジェクト自身の内容を変更しないメソッドを 『**非破壊的メソッド**』とよびます。
|
59
|
+
|
60
|
+
Pythonでは慣習的に、**破壊的メソッド** の戻り値は ``None`` となっており、**破壊的メソッド**と**非破壊的メソッド**の 誤用を避けられるようになっております。
|