質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
関数

関数(ファンクション・メソッド・サブルーチンとも呼ばれる)は、はプログラムのコードの一部であり、ある特定のタスクを処理するように設計されたものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

1回答

2904閲覧

Pandas の関数 loc のスライス [start:stop] に stop が含まれるのはなぜでしょうか?

atta

総合スコア8

関数

関数(ファンクション・メソッド・サブルーチンとも呼ばれる)は、はプログラムのコードの一部であり、ある特定のタスクを処理するように設計されたものです。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2020/06/25 08:08

Pandas の関数 loc のスライス [start:stop] に stop が含まれるのはなぜでしょうか?

Python においてリストなどにスライス [start:stop] を用いると一般的に start 以上 stop 未満となります。
例えば

python

1list1 = [1, 2, 3, 4, 5] 2print(list1[0:3])

の出力はこのようになります。

[1, 2, 3]

--
一方、Pandas の関数 loc にスライスを用いると start 以上 stop 以下となります。

python

1df = pd.DataFrame([[1, 1], [2, 2], [3, 3], [4, 4], [5, 5]]) 2df.loc[0:3]

の出力は以下のようになります。

0 1 0 1 1 1 2 2 2 3 3 3 4 4

--
なぜ、loc 関数だけ start 以上 stop 以下となるのでしょうか?
そういうものだからと言われれればそうなのかもしれませんが、設計思想のようなものがあるのなら伺いたです。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

なぜ、loc 関数だけ start 以上 stop 以下となるのでしょうか?

loc によるスライスは、行や列の位置に基づくスライスではなく、ラベルに基づくスライスだからです。
DataFrame は行方向に index (列名)、列方向に columns (行名) というラベルを持っています。
ここでいうインデックス (index) という用語は、リストやタプルなどの文脈で使うインデックスの意味ではなく、DataFrame.index で取得できる行方向のラベルを指していることに注意してください。

インデックスは明示的に指定しない場合、0, 1, ... と整数が割り当てられますが、文字を割り当てることもでき、df.loc["a":"c"] のようにスライスもできます。

python

1import pandas as pd 2 3df = pd.DataFrame([[1, 1], [2, 2], [3, 3], [4, 4], [5, 5]], index=["a", "b", "c", "d", "e"]) 4print(df.loc["a":"c"]) 5# 0 1 6# a 1 1 7# b 2 2 8# c 3 3

なので、loc[0:3] は「1行目~4行目までを取得する」という意味ではなく、「index の値が 0 ~ 3 の行を取得する」という意味になります。
位置を基準にスライスする場合は別に iloc を使います。こちらはリストやタプルのスライス同様、終端は含まれません。

python

1import pandas as pd 2 3df = pd.DataFrame([[1, 1], [2, 2], [3, 3], [4, 4], [5, 5]]) 4print(df.loc[0:3]) 5# 0 1 6# 0 1 1 7# 1 2 2 8# 2 3 3 9# 3 4 4 10 11df = pd.DataFrame([[1, 1], [2, 2], [3, 3], [4, 4], [5, 5]]) 12print(df.iloc[0:3]) 13# 0 1 14# a 1 1 15# b 2 2 16# c 3 3

投稿2020/06/25 08:27

編集2020/06/25 08:32
tiitoi

総合スコア21956

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

atta

2020/06/25 08:35

「ラベルに基づくスライス」ということなんですね。納得しました。 ご回答ありがとうございました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問