常連

### 前提

ネットワーク上にあるExcelファイルを取り込んで、streamlitで可視化するアプリケーションを作成しようと思っています。
sharepoint上にExcelファイルを置き、それをinputとしてETLなどを行い、簡単な可視化を行った結果をユーザに提示するものとなります。

![イメージ説明](https://ddjkaamml8q8x.cloudfront.net/questions/2022-10-28/b16a7b56-5b01-4a8d-b55d-646473604c48.png)

### 実現したいこと

上記のようなシステムで、sharepointにあるデータを、自らのPC上にpandasのdataframeとして取り込みたいと考えています。
ただし、組織のルール変更の関係で、ローカルPC上にデータをExcelなどの容易に閲覧できる形で持っておくのはNGということになってしまったため、sharepoint上に格納してそこからアクセスすることを考えています。

### 発生している問題・エラーメッセージ
調べたところ、下記サイトに、上記が実現できそうな内容が掲載されていました。

https://stackoverflow.com/questions/48424045/how-to-read-sharepoint-online-office365-excel-files-in-python-with-work-or-sch

上記サイトのコードを適用してみましたところ、前半のctx.webというところまでは取得出来てそうなのですが、後半部分でエラーが出力されました。
（ですので、sharepoint自体にはアクセスできてそうなのですが…）

本筋としては、sharepoint上の何等かのデータフォーマットのデータを取得して、dataframeにしたいだけなので、何か良い方法などありましたら、上記方法に限らず、ご教示いただくことは可能でしょうか。

```
Value Error: Excel file format cannot be determined, you must specify an engine manually.
```

### 該当のソースコード

```ここに言語名を入力
url = 'https://yoursharepointsite.com/sites/documentsite'
username = 'yourusername'
password = 'yourpassword'
relative_url = '/sites/documentsite/Documents/filename.xlsx'

ctx_auth = AuthenticationContext(url)
if ctx_auth.acquire_token_for_user(username, password):
  ctx = ClientContext(url, ctx_auth)
  web = ctx.web
  ctx.load(web)
  ctx.execute_query()
  print "Web title: {0}".format(web.properties['Title'])
else:
  print ctx_auth.get_last_error()
  # ↑ここまでは正常に動いて、Titleも取得できた。


import io
import pandas as pd

response = File.open_binary(ctx, relative_url)

#save data to BytesIO stream
bytes_file_obj = io.BytesIO()
bytes_file_obj.write(response.content)
bytes_file_obj.seek(0) #set file object to start

#read file into pandas dataframe
df = pd.read_excel(bytes_file_obj)
↑ここで、上記のようなエラーが出た。

# 追記：ここで、read_csvを行うと、データが取得され、
{"error": code:"-2147024809", System.ArgumentException...｝
のようなデータが取得された。(respoinse.contentの中身をprintで確認しても実際上記のようなものが入っていた。）
```

### 試したこと
sharepoint上のExcelファイルからデータを取得するための方法を試してみた。

### 補足情報（FW/ツールのバージョンなど）
pandas 1.4.3
Office365-REST-Python-Client 2.3.14
python 3.10.5

sharepoint上のExcelファイルの中身をpythonで読み出してdataframeに入れたい

Data Frameのindex（添字）を消すことは可能でしょうか｡

```python
from pandas import DataFrame

df = DataFrame(['a','b','c'])
print(df)
   0
0  a
1  b
2  c

df=df.rename(columns={0:'str'})
print(df)
  str
0   a
1   b
2   c

df['num']=1,2,3
print(df)
  str  num
0   a    1
1   b    2
2   c    3

# 次に､indexを消してみたいです（0,1,2をなくす）
# やってみたこと
df.drop(index, axis=1)

#エラー
NameError: name 'index' is not defined
```

DataFrameのindexを消すには

Python3とPandasに関する質問です。
Pandasのデータフレームにある値があるかどうかはどうやって判定するんでしょうか？
たとえば次のようなデータフレームがあるとします。
 a b c
0 1 2 3
1 2 3 4
この中に１０があるかどうかはどうやって判定するのでしょうか？
if分などで使うのでtrueなどで返ってきてほしいです。

一応知っていることを動員して書いてみたらこんな感じでした。
```python
import pandas as pd

df = pd.DataFrame(data=[[1,2,3],[4,5,6]], columns=['a','b','c']).stack()

# ある場合
x = list(df[df == 1].index)
print(len(x))

# ない場合
x = list(df[df == 10].index)
print(len(x))
```
モジュールなどで簡単に出せないものなのでしょうか？

Pandasのデータフレームにある値があるかどうかの判定

pandasのdatetime型データの表記を年月のみで抽出する方法を教えていただけますか

2018-08-01
のようなデータを
2018-8
に直したいです

pandasのdatetime データ  年月のみ抽出したい

現在以下のようなデータフレームを持っています。

|日付(DatatimeIndex)|商品名|売上数|発注数|月売上平均|月売上標準偏差|
|:--|:--|:--|:--|:--|:--|
|2017-01-01|...|12|0|10.0|5.2|
|2017-01-02|...|22|0|10.0|5.2|
|2017-01-03|...|15|0|10.0|5.2|
|2017-01-04|...|18|50|10.0|5.2|
|2017-01-05|...|10|0|10.0|5.2|
|...|...|...|...|...|...|
|2017-02-01|...|21|41|11.0|3.2|
|2017-02-02|...|16|0|11.0|3.2|

このデータフレームにイメージとして以下のような関数で計算した値を列を加えたいです。

各行に対し、売上数・月売上平均・月売上標準偏差を引数にとる関数 function(['売上数', '月売上平均', '月売上標準偏差']) で計算した値

|日付(DatatimeIndex)|商品名|売上数|発注数|月売上平均|月売上標準偏差|関数で計算した列|
|:--|:--|:--|:--|:--|:--|:--|
|2017-01-01|...|12|0|10.0|5.2|...|
|2017-01-02|...|22|0|10.0|5.2|...|
|2017-01-03|...|15|0|10.0|5.2|...|
|2017-01-04|...|18|50|10.0|5.2|...|
|2017-01-05|...|10|0|10.0|5.2|...|
|...|...|...|...|...|...|...|
|2017-02-01|...|21|41|11.0|3.2|...|
|2017-02-02|...|16|0|11.0|3.2|...|

Pandasのapply()が調べたところSeriesのような単一の列にしか適用できないとのことだったので、皆様から知見をいただければと思います。

宜しくお願いします。

Pandasで複数の列の要素を引数に取った関数を適用させる

たとえば次のCSVをpandas.DataFrameとして読み込み、

```CSV
name, age
Hadiya Haines, 20
Ezekiel Hawes, 21
Bartlomiej Cano, 22
Yvie Mcfarlane, 23
Wyatt Robin, 24
Faris Hammond, 25
Esmee Easton, 26
Summer-Louise Oakley, 27
Sanjay Lin, 28
Elyse Fisher, 29
```

このPythonスクリプトを実行すると

```Python
import pandas as pd

path_csv = "test.csv"
df = pd.read_csv(path_csv)

df["sex"] = -1
for index in df.index:
    if (
        df["name"][index] == "Sanjay Lin"
        and df["age"][index] == 28 # ここでエラーになる。"age"という列はあるのになぜ？
        and df["sex"][index] == -1
    ):
        print(df.iloc[index, :])
```

このようなエラーがでてしまいます。

```bash
Traceback (most recent call last):
  File "/Users/ユーザー名/.pyenv/versions/anaconda3-5.3.1/lib/python3.6/site-packages/pandas/core/indexes/base.py", line 2897, in get_loc
    return self._engine.get_loc(key)
  File "pandas/_libs/index.pyx", line 107, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/index.pyx", line 131, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/hashtable_class_helper.pxi", line 1607, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas/_libs/hashtable_class_helper.pxi", line 1614, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 'age'

During handling of the above exception, another exception occurred:

Traceback (most recent call last):
  File "/Users/ユーザー名/test.py", line 11, in <module>
    and df["age"][index] == 28
  File "/Users/ユーザー名/.pyenv/versions/anaconda3-5.3.1/lib/python3.6/site-packages/pandas/core/frame.py", line 2995, in __getitem__
    indexer = self.columns.get_loc(key)
  File "/Users/ユーザー名/.pyenv/versions/anaconda3-5.3.1/lib/python3.6/site-packages/pandas/core/indexes/base.py", line 2899, in get_loc
    return self._engine.get_loc(self._maybe_cast_indexer(key))
  File "pandas/_libs/index.pyx", line 107, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/index.pyx", line 131, in pandas._libs.index.IndexEngine.get_loc
  File "pandas/_libs/hashtable_class_helper.pxi", line 1607, in pandas._libs.hashtable.PyObjectHashTable.get_item
  File "pandas/_libs/hashtable_class_helper.pxi", line 1614, in pandas._libs.hashtable.PyObjectHashTable.get_item
KeyError: 'age'
```

"age"という列はあるのに、なぜKeyErrorが出るのでしょうか？　何か間違っていることをしていると思いますか？
```Python
and df["age"][index] == 28 # ここでエラーになる。"age"という列はあるのになぜ？
```
この行をコメントアウトするとエラーは出ません。というより`if`の条件に`df["age"][index] == 28`が含まれるとエラーになることがわかりました。

よろしくお願いします。

なぜKeyErrorが出るのかがわからない

import japanize_matplotlib　
としたところ
ModuleNotFoundError: No module named 'japanize_matplotlib'
が出ました。
anaconda　を使っているので、
conda install japanaze_matplotlib
としましたが、
下記のように出てインストールできないです。
対処方法を教えていただきたいです。

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Collecting package metadata (repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.

PackagesNotFoundError: The following packages are not available from current channels:

  - japanize-matplotlib

Current channels:

  - https://repo.anaconda.com/pkgs/main/win-64
  - https://repo.anaconda.com/pkgs/main/noarch
  - https://repo.anaconda.com/pkgs/r/win-64
  - https://repo.anaconda.com/pkgs/r/noarch
  - https://repo.anaconda.com/pkgs/msys2/win-64
  - https://repo.anaconda.com/pkgs/msys2/noarch

To search for alternate channels that may provide the conda package you're
looking for, navigate to

    https://anaconda.org

and use the search bar at the top of the page.

conda 経由で japanaze-matplotlib　をインストールできない

### 実現したいこと

機械学習の勉強中です。
スッキリわかる機械学習の本の通りに学習を進めています。

実行環境
Jupiterラボ
Python　Version　3.11.3
性別のSex列には「make」または「female」といった値が入っています。
import pandas as pd
df = pd.read_csv('Survived.csv')

male = pd.get_dummies(df['Sex'], drop_first = True)
male

とすると
データフレームの表示を見るとmale列は0,1ではなく　TrueまたはFalseという値が表示されます。

何ででしょうか？
教科書通り実施しているのですが、新しくファイルを作り直しても同じでした。

Trueを1、Falseは0で表示させるにはどのようにしたらよいでしょうか？



### 前提

ここに質問の内容を詳しく書いてください。
（例）
TypeScriptで●●なシステムを作っています。
■■な機能を実装中に以下のエラーメッセージが発生しました。

### 発生している問題・エラーメッセージ

```
エラーメッセージ
```

### 該当のソースコード

```ここに言語名を入力
ソースコード
```

### 試したこと

ここに問題に対して試したことを記載してください。

### 補足情報（FW/ツールのバージョンなど）

ここにより詳細な情報を記載してください。