Python pandasで読み込んだcsvのある列から空白を基準に文字を抽出して新たな列に追加したい。

前提・実現したいこと

下記のcsvファイルをpandasで読み込んでいます。

タイトル	出席者数	書記
2021年10月1日　第8月度定例会議　A会議室	25	A
2021年9月6日　第7月度定例会議　B会議室	30	B
2021年8月5日　第8月度定例会議　C会議室	27	A
2021年7月5日　第8月度定例会議　B会議室	25	C
2021年6月6日　第8月度定例会議　B会議室	26	C

このファイルを下記に加工したいです。
|タイトル|出席者数|書記|日付
|:--|:--:|--:|
|2021年10月1日　第8月度定例会議　A会議室|25|A|2021年10月1日
|2021年9月6日　第7月度定例会議　B会議室|30|B|2021年9月6日
|2021年8月5日　第8月度定例会議　C会議室|27|A|2021年8月5日
|2021年7月5日　第8月度定例会議　B会議室|25|C|2021年7月5日
|2021年6月6日　第8月度定例会議　B会議室|26|C|2021年6月6日

「タイトル」の日付の後ろに空白が入っているので、その空白をfindで探して、スライスしたらよいかと思って試してみましたが、NaNになります。

発生している問題・エラーメッセージ

 	タイトル 	出席者数 	書記 	日付
0 	2021年10月1日　第8月度定例会議　A会議室 	25 	A 	NaN
1 	2021年9月6日　第7月度定例会議　B会議室 	30 	B 	NaN
2 	2021年8月5日　第8月度定例会議　C会議室 	27 	A 	NaN
3 	2021年7月5日　第8月度定例会議　B会議室 	25 	C 	NaN
4 	2021年6月6日　第8月度定例会議　B会議室 	26 	C 	NaN

該当のソースコード

python
1df = pd.read_csv('kaigi.csv')
2df['日付'] = df['タイトル'].str[0:df['タイトル'].str.find(' ')]

試したこと

スライスの数字をこのように指定するのがおかしいのだと思いますが、その他のやり方がわかりません。
また、df['日付'] = df['タイトル'].str.spilit(' ', 1)]で2分割にしてみましたが、一つの列に2分割したものが両方入ってしまうので、これもうまくいきませんでした…。

お力添えをお願いいたします。

補足情報（FW/ツールのバージョンなど）

windows10
python3.8.3

行動規範の内容に同意します

回答3件

こんばんは（＊＾＾＊）

JupyterNotebookでデータフレームを少しだけつくって、試してみました。

以下コードです
ーーーーーーーー
import pandas as pd

df3 = pd.DataFrame([['2021年10月　定例会議'], ['2021年9月　定例会議'], ['2021年8月　定例会議'], ['2021年7月　定例会議'], ['2021年6月　定例会議']],columns = ['タイトル'])

df3['日付'] = df3['タイトル'].str.split(pat='　', expand=True)[0]
df3
ーーーーーーーーーー
※df3は、簡単なデータフレームです。
※pat'　'のスペースは、半角か、全角かで異なると思います。

参考にさせていただいた記事です。　→　https://spcx8.hatenablog.com/entry/2018/09/08/091834

わたしのJupyterNotebook上では、sakurako-sanが実現したいような形で表示できました！

もし、お力になれてたら幸いです。

投稿2021/08/21 16:14

mmmmmm-.

総合スコア32

sakurako-san

2021/08/21 16:25

こんばんはありがとうございます！ mina-.さんのコードで私の環境でも再現できました！参考記事まで教えてくださって助かりますいろんなワードで検索したつもりですが、なかなか思うように記事がヒットせず…という状況だったので。大変参考になりました。ありがとうございました！

mmmmmm-.

2021/08/21 16:51

そういっていただき嬉しいです＿( ´∀｀ )/

行動規範の内容に同意します

やり方はいろいろありそうですが、str.split()で、expand=Trueを入れて結果がデータフレームの列に分割されるようにして、最初の列を取り出せばいいと思います。

python
1df['日付'] = df['タイトル'].str.split(' ', 1, expand=True)[0]

投稿2021/08/21 15:53

編集2021/08/21 15:54

bsdfan

総合スコア4794

sakurako-san

2021/08/21 16:19

ありがとうございます！ expand=True　が必要なんですね。 df['日付'] = df['タイトル'].str.split(' ', 1)[0] で試してみて上手く行かなかったので、こういうやり方はないのだろうと思ってました！勉強になりますみなさんの回答が参考になったのですが、一番はじめに回答していただいた方をベストアンサーとさせていただきました。ご教示ありがとうございました。

行動規範の内容に同意します

ベストアンサー

applyを使ってはどうでしょうか？

Python
1df['日付'] = df['タイトル'].apply(lambda x: x.split('　')[0])
2print(df)
3#	タイトル	出席者数	書記	日付
4#0	2021年10月1日　第8月度定例会議　A会議室	25	A	2021年10月1日
5#1	2021年9月6日　第7月度定例会議　B会議室	30	B	2021年9月6日
6#2	2021年8月5日　第8月度定例会議　C会議室	27	A	2021年8月5日
7#3	2021年7月5日　第8月度定例会議　B会議室	25	C	2021年7月5日
8#4	2021年6月6日　第8月度定例会議　B会議室	26	C	2021年6月6日