質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

解決済

癖のあるCSV[DATE, TIME, X]のDataFrameへの取込み | 3列(DATE, TIME, X) --> 2列(DATETIME, X)への変換

Higomon
Higomon

総合スコア0

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

1回答

0評価

1クリップ

3213閲覧

投稿2018/10/17 07:08

前提・実現したいこと

  • 最終目標
    Python, Pandasで時系列解析

  • 実現したいこと
    CSVファイルからDataFrameへ取り込んだ"DATE"列, "TIME"列を1つに統合して

 "YYYY-mm-dd HH:mm:ss"とするindex列としたいです。

  • 課  題
    "DATE"列のパースのやり方はGoogleで調べて分かりました。

  "TIME"列を"HH:mm:ss"とし、最終的に"YYYY-mm-dd HH:mm:ss"とする
スマートなやり方がわからないです。

質問者背景
・Python初学者 (専門 化学)
・開発経験 Excel VBAのみ

発生している問題・エラーメッセージ

解析したいCSVデータ構造、問題のある現状のDataFrame、および
理想とするDataFrameは補足情報にあるとおりです。

Pandas DataFrameへの取り込んだ"日付"列, "時間"列を1つに統合して
"YYYY-mm-dd HH:mm:ss"と表記したいです。

該当のソースコード

Python3

import pandas as pd #parser dateparse = lambda d: pd.datetime.strptime(d, '%Y%m%d') df = pd.read_csv(’data.csv’, index_col='DATE', date_parser = dateparse) #ここから先、"日付"列, "時間"列を1つに統合して #"YYYY-mm-dd HH:mm:ss"と表記したい

試したこと

最終的に、pd.to_datetime型にしたいので
DATE列から日付文字列を抽出し、次に、時間を...と考えました。
しかし、このやり方ではスマートではないので、
スマートなやり方がございましたら、教えて頂きたいです。

Python3

def left(text, n): return text[:n] #DATE(文字列として抽出) dates = left(str(df.index[0]),10) #....

補足情報(FW/ツールのバージョンなど)

CSV file(計3列)


DATETIMEX
201410010000015
201410010000025
201410010000035
...|...|...

20141001|005957|5
20141001|005958|5
20141001|005959|5
20141001|010000|5

(現状) DataFrame(計3列)


課題 TIME列の読込がおかしい

DATETIMEX
2014-10-0115
2014-10-0125
2014-10-0135
...|...|...

2014-10-01|5957|5
2014-10-01|5958|5
2014-10-01|5959|5
2014-10-01|10000|5

(理想) DataFrame[DATETIME, Value(計2列)]


DATE列とTIME列を結合し、index列としたい

DATETIMEX
2014-10-01 00:00:015
2014-10-01 00:00:025
2014-10-01 00:00:035
...|...

2014-10-01 00:59:57|5
2014-10-01 00:59:58|5
2014-10-01 00:59:59|5
2014-10-01 01:00:00|5

環境

  • Windows 7
  • Anaconda custom (64-bit)| (default, Jun 28 2018, 11:27:44) [MSC v.1900 64 bit (AMD64)]
  • Python: 3.6.6, Pandas: 0.23.4
  • Jupyter Notebook

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。