質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.35%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

解決済

3回答

1088閲覧

Python pandasで読み込んだcsvのある列から空白を基準に文字を抽出して新たな列に追加したい。

sakurako-san

総合スコア2

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/08/21 15:28

前提・実現したいこと

下記のcsvファイルをpandasで読み込んでいます。

タイトル出席者数書記
2021年10月1日 第8月度定例会議 A会議室25A
2021年9月6日 第7月度定例会議 B会議室30B
2021年8月5日 第8月度定例会議 C会議室27A
2021年7月5日 第8月度定例会議 B会議室25C
2021年6月6日 第8月度定例会議 B会議室26C

このファイルを下記に加工したいです。
|タイトル|出席者数|書記|日付
|:--|:--:|--:|
|2021年10月1日 第8月度定例会議 A会議室|25|A|2021年10月1日
|2021年9月6日 第7月度定例会議 B会議室|30|B|2021年9月6日
|2021年8月5日 第8月度定例会議 C会議室|27|A|2021年8月5日
|2021年7月5日 第8月度定例会議 B会議室|25|C|2021年7月5日
|2021年6月6日 第8月度定例会議 B会議室|26|C|2021年6月6日

「タイトル」の日付の後ろに空白が入っているので、その空白をfindで探して、スライスしたらよいかと思って試してみましたが、NaNになります。

発生している問題・エラーメッセージ

タイトル 出席者数 書記 日付 0 2021年10月1日 第8月度定例会議 A会議室 25 A NaN 1 2021年9月6日 第7月度定例会議 B会議室 30 B NaN 2 2021年8月5日 第8月度定例会議 C会議室 27 A NaN 3 2021年7月5日 第8月度定例会議 B会議室 25 C NaN 4 2021年6月6日 第8月度定例会議 B会議室 26 C NaN

該当のソースコード

python

1df = pd.read_csv('kaigi.csv') 2df['日付'] = df['タイトル'].str[0:df['タイトル'].str.find(' ')]

試したこと

スライスの数字をこのように指定するのがおかしいのだと思いますが、その他のやり方がわかりません。
また、df['日付'] = df['タイトル'].str.spilit(' ', 1)]で2分割にしてみましたが、一つの列に2分割したものが両方入ってしまうので、これもうまくいきませんでした…。

お力添えをお願いいたします。

補足情報(FW/ツールのバージョンなど)

windows10
python3.8.3

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答3

0

こんばんは(*^^*)

JupyterNotebookでデータフレームを少しだけつくって、試してみました。

以下コードです
ーーーーーーーー
import pandas as pd

df3 = pd.DataFrame([['2021年10月 定例会議'], ['2021年9月 定例会議'], ['2021年8月 定例会議'], ['2021年7月 定例会議'], ['2021年6月 定例会議']],columns = ['タイトル'])

df3['日付'] = df3['タイトル'].str.split(pat=' ', expand=True)[0]
df3
ーーーーーーーーーー
※df3は、簡単なデータフレームです。
※pat' 'のスペースは、半角か、全角かで異なると思います。

参考にさせていただいた記事です。 → https://spcx8.hatenablog.com/entry/2018/09/08/091834

わたしのJupyterNotebook上では、sakurako-sanが実現したいような形で表示できました!

もし、お力になれてたら幸いです。

投稿2021/08/21 16:14

mmmmmm-.

総合スコア32

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sakurako-san

2021/08/21 16:25

こんばんは ありがとうございます! mina-.さんのコードで私の環境でも再現できました! 参考記事まで教えてくださって助かります いろんなワードで検索したつもりですが、なかなか思うように記事がヒットせず…という状況だったので。 大変参考になりました。ありがとうございました!
mmmmmm-.

2021/08/21 16:51

そういっていただき嬉しいです_( ´∀` )/
guest

0

やり方はいろいろありそうですが、str.split()で、expand=Trueを入れて結果がデータフレームの列に分割されるようにして、最初の列を取り出せばいいと思います。

python

1df['日付'] = df['タイトル'].str.split(' ', 1, expand=True)[0]

投稿2021/08/21 15:53

編集2021/08/21 15:54
bsdfan

総合スコア4794

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sakurako-san

2021/08/21 16:19

ありがとうございます! expand=True が必要なんですね。 df['日付'] = df['タイトル'].str.split(' ', 1)[0] で試してみて上手く行かなかったので、こういうやり方はないのだろうと思ってました! 勉強になります みなさんの回答が参考になったのですが、一番はじめに回答していただいた方をベストアンサーとさせていただきました。 ご教示ありがとうございました。
guest

0

ベストアンサー

applyを使ってはどうでしょうか?

Python

1df['日付'] = df['タイトル'].apply(lambda x: x.split(' ')[0]) 2print(df) 3# タイトル 出席者数 書記 日付 4#0 2021年10月1日 第8月度定例会議 A会議室 25 A 2021年10月1日 5#1 2021年9月6日 第7月度定例会議 B会議室 30 B 2021年9月6日 6#2 2021年8月5日 第8月度定例会議 C会議室 27 A 2021年8月5日 7#3 2021年7月5日 第8月度定例会議 B会議室 25 C 2021年7月5日 8#4 2021年6月6日 第8月度定例会議 B会議室 26 C 2021年6月6日

投稿2021/08/21 15:50

meg_

総合スコア10760

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

sakurako-san

2021/08/21 16:17

ありがとうございます! まさに求めていた表です! 一番に回答していただいたので、ベストアンサーにさせていただきます
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.35%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問