質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.46%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

Q&A

1回答

1983閲覧

和暦を西暦表示に変換する。

pybh2

総合スコア1

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

pandas

Pandasは、PythonでRにおけるデータフレームに似た型を持たせることができるライブラリです。 行列計算の負担が大幅に軽減されるため、Rで行っていた集計作業をPythonでも比較的簡単に行えます。 データ構造を変更したりデータ分析したりするときにも便利です。

0グッド

0クリップ

投稿2021/04/05 02:54

csvの日付というカラムの値に"R 3/ 4/ 5"といった値が入っています。
これを20210405という表記に変換するためにコードを書いています。

pyhon

1import pandas as pd 2 3df = pd.read_csv("sample.csv", encoding = "CP932") 4tmp = df["日付"].str.split(" ", expand = True) 5tmp[4] = tmp[0].str.cat(tmp[1]) 6tmp = tmp.replace("R2/", "2020") 7tmp = tmp.replace("R3/", "2021") 8tmp[1] = tmp[1].str.split("/", expand = True) 9tmp[2] = tmp[2].str.spit("/", expand = True) 10

として日付の値を分割、結合などをしてしてこのような表ができました。
|列1|0|1|2|3|4
|:--|:--:|--:|
|0|R|3|4|5|2021|

この表で月と日にあたるカラム2,3の一桁の数字の前に0を挿入したいのですがよい方法は
ございませんか

最終的には結合させて日付というカラムに20210405という値に変換しようと
考えています。コードが冗長的ですがよろしくお願いいたします。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Orlofsky

2021/04/05 10:45

和暦は天皇陛下が亡くなられると翌日元号が変わることは覚えておいてください。それは明日かもしれません。 ちなみに、30年以上前ですが、元号は変わるものだということを理解しようとしない人たちはシステム部の助言を無視して和暦でデータの入出力をおこなうように強制して、その後の元号変更で何千万円か何億円かとんでもない費用と時間がかかったそうです。
guest

回答1

0

数字の表示を二桁にしても意味はないので、日付というカラムを作る時にやりましょう。

列1がindexのかどうかが読み取れませんが、indexでないなら以下です。

python

1>>> print(df) 21 0 1 2 3 4 30 0 R 3 4 5 2021 4>>> df['日付'] = df.apply(lambda row: f'{row[5]}{row[3]:02}{row[4]:02}', axis=1) 5>>> print(df) 61 0 1 2 3 4 日付 70 0 R 3 4 5 2021 20210405

列1がindexなら以下です。

python

1>>> print(df) 2 0 1 2 3 4 31 40 R 3 4 5 2021 5>>> df['日付'] = df.apply(lambda row: f'{row[4]}{row[2]:02}{row[3]:02}', axis=1) 6>>> print(df) 7 0 1 2 3 4 日付 81 90 R 3 4 5 2021 20210405

投稿2021/04/05 03:23

ppaul

総合スコア24666

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

pybh2

2021/04/05 08:19

教えていただいてありがとうございます。 西暦表示になりました。 ただ、はじめはフィールドの値が文字列型だった所為か{row[4]}{row[2]:02}{row[3]:02}がうまく働かなかったのですが整数型に直すと無事できました。
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

まだベストアンサーが選ばれていません

会員登録して回答してみよう

アカウントをお持ちの方は

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.46%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問