質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
85.48%
Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

Q&A

解決済

1回答

721閲覧

01:33:33(時間)のobject型データをint型にしてdescribe()し、四分位範囲を突き止めたい

Pablito

総合スコア71

Python 3.x

Python 3はPythonプログラミング言語の最新バージョンであり、2008年12月3日にリリースされました。

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

0グッド

0クリップ

投稿2019/10/29 05:37

前提・実現したいこと

dataframeの中にある、
5:36:00のような時間のデータを
int型にしてgroupby().describe()
で四分位範囲を出し、箱ひげ図を描画したいと考えています。

そこでpd.to_datetime型に変えようとしたり、
シンプルにint型にしようとastype(int)などをしてみましたが、

ValueError: invalid literal for int() with base 10: '5:36:00'

等が発生し、上手くいきません。
何かいい方法はありませんでしょうか?

該当のソースコード

Python

1import pandas as pd 2import numpy as np 3import datetime as dt 4 5with codecs.open("G:\Ebis 20190913~1023.csv", 6 "r", "Shift-JIS", "ignore") as file: 7 df = pd.read_table(file, delimiter=",", dtype={'ユーザー名': object}) 8df.head() 9 10df['wanna_know'].astype(int)

###データ
num  時間
0 5:36:00
1 0:00:00
2 0:00:00
3 2:57:00
4 0:00:00
...
1732 0:00:00
1733 0:00:00
1734 0:00:00
1735 0:00:00

何卒宜しくお願い致します。

気になる質問をクリップする

クリップした質問は、後からいつでもMYページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

guest

回答1

0

ベストアンサー

Python

1sec = pd.to_timedelta(df['時間']).dt.total_seconds()

にて秒(float型)に変換できるかと思います

投稿2019/10/29 09:50

magichan

総合スコア15898

バッドをするには、ログインかつ

こちらの条件を満たす必要があります。

Pablito

2019/11/07 11:03

magichan様 ご回答ありがとうございます! 助かりました!
guest

あなたの回答

tips

太字

斜体

打ち消し線

見出し

引用テキストの挿入

コードの挿入

リンクの挿入

リストの挿入

番号リストの挿入

表の挿入

水平線の挿入

プレビュー

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
85.48%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問