質問をすることでしか得られない、回答やアドバイスがある。

15分調べてもわからないことは、質問しよう!

新規登録して質問してみよう
ただいま回答率
87.20%
CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

多次元配列

1次元配列内にさらに配列を格納している配列を、多次元配列と呼びます。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

解決済

ある1要素に対する処理を全要素に対して行う方法

TKWTsan
TKWTsan

総合スコア0

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

多次元配列

1次元配列内にさらに配列を格納している配列を、多次元配列と呼びます。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。

1回答

0評価

0クリップ

1閲覧

投稿2019/10/31 09:22

編集2022/01/12 10:58

プログラミング初心者です.
現在,pythonを用いてcsv形式のデータの分析を行っております.
前提として,csv,numpy,pandasなどのモジュールを使用しないプログラムを組んでおります.

5分ごとに計測する機器が1か月間計測したデータがあり、そのデータの欠損している時刻(ランダムに欠損している)を補完する(時刻のデータのみが時刻通りに補完できていれば可)プログラムを自分なりに組んでみました。
このデータは、あらゆる地点のデータがまとめられたものであり、下のプログラムでは、ある一点のみのデータを抽出して欠損した時刻を補完しているのですが、全地点に関して同様の処理を行うことはできないでしょうか。
補足
・地点にはそれぞれ地点番号が振られています。
・i[0] =  時刻
・i[2] = 地点番号
・要素数は1データにつき10個
・流れとしては、#ある一点のみのデータを配列に格納 の部分を

PYTHON

data={} for i in data2: a=data.get(i[2],[]) a.append(i) data[i[2]]=a

に変え、地点番号をキーとして、データを辞書型に格納して処理を行いたいと考えています。
その他に、プログラムを簡潔に示す方法があればご指摘よろしくお願いします.

以下にプログラムを記します。

PYTHON

import datetime filepath = 'aaa.csv' start =(datetime.datetime.strptime('2018/09/01 00:00', '%Y/%m/%d %H:%M')) end = (datetime.datetime.strptime('2018/09/30 23:55', '%Y/%m/%d %H:%M')) with open(filepath,encoding="shift-jis") as f:#データ読み込み next(f) data2=[] for line in f: line = line.replace('\n','') data = line.split(',') data2.append(data) for i in data2:#時刻のデータ型変更 tmdata=(datetime.datetime.strptime(i[0], '%Y/%m/%d %H:%M')) i[0]=tmdata data3=[]#ある一点のみのデータを配列に格納 for i in data2: if i[2] =='1': data3.append(i) error=0 error1=0 error2=0 i=0 n=len(data3) if data3[0][0] != start:#1つ目のデータの時刻が00:00でない場合の欠損 sabun1 = data3[0][0] - start min1 = sabun1/ datetime.timedelta(minutes=5) data3.insert(0,[start,0,0,0,0,0,0,0,0,0]) if min1 != 1: error1=min1 a1=1 while a1<=min1-1: kesson1=start+datetime.timedelta(minutes=5)*a1 data3.insert(a1,[kesson1,0,0,0,0,0,0,0,0,0]) a1 +=1 else: error1=1 d=int(n+error1) if data3[d-1][0] != end:#最後のデータが23:55でない場合の欠損 data3.append([end,0,0,0,0,0,0,1,0,0]) error2=1 d=int(error1+error2) while i<8638: #欠損数を求める sabun=data3[i+1][0]-data3[i][0] min=sabun/ datetime.timedelta(minutes=5) if min != 1: error=error+(min-1) a=1 while a<=min-1: kesson=data3[i][0]+datetime.timedelta(minutes=5)*a data3.insert(i+a,[kesson,0,0,0,0,0,0,0,0,0]) a+=1 i += 1 print(len(data3))

良い質問の評価を上げる

以下のような質問は評価を上げましょう

  • 質問内容が明確
  • 自分も答えを知りたい
  • 質問者以外のユーザにも役立つ

評価が高い質問は、TOPページの「注目」タブのフィードに表示されやすくなります。

気になる質問をクリップする

クリップした質問は、後からいつでもマイページで確認できます。

またクリップした質問に回答があった際、通知やメールを受け取ることができます。

teratailでは下記のような質問を「具体的に困っていることがない質問」、「サイトポリシーに違反する質問」と定義し、推奨していません。

  • プログラミングに関係のない質問
  • やってほしいことだけを記載した丸投げの質問
  • 問題・課題が含まれていない質問
  • 意図的に内容が抹消された質問
  • 過去に投稿した質問と同じ内容の質問
  • 広告と受け取られるような投稿

評価を下げると、トップページの「アクティブ」「注目」タブのフィードに表示されにくくなります。

hayataka2049
hayataka2049

2019/10/31 09:31

>前提として,csv,numpy,pandasなどのモジュールを使用しないプログラムを組んでおります\. 練習目的ならそう明記してください(見る人は気になるので)。練習目的でないのであれば、その方針はおすすめしません。外部ライブラリが使えない条件でもcsvモジュールは役に立つことでしょう。
TKWTsan
TKWTsan

2019/10/31 09:43

pythonの基礎的なプログラムの組み方を練習するため、モジュールを使用しないようにしています。説明不足で申し訳ないです。
t_obara
t_obara

2019/10/31 10:27

でもdatetimeモジュールは利用するのですね。 基礎的なという意図であれば、numpyは十分基礎的な範囲かとは思いますが。
tiitoi
tiitoi

2019/10/31 17:16

numpy、pandas は準標準といってもいいぐらい有名なライブラリですし、実用上は numpy、pandas を使うことになるので、最初からそのライブラリを使ったやり方を覚えたほうがいいと思いますが

まだ回答がついていません

会員登録して回答してみよう

15分調べてもわからないことは
teratailで質問しよう!

ただいまの回答率
87.20%

質問をまとめることで
思考を整理して素早く解決

テンプレート機能で
簡単に質問をまとめる

質問する

関連した質問

同じタグがついた質問を見る

CSV

CSV(Comma-Separated Values)はコンマで区切られた明白なテキスト値のリストです。もしくは、そのフォーマットでひとつ以上のリストを含むファイルを指します。

多次元配列

1次元配列内にさらに配列を格納している配列を、多次元配列と呼びます。

データ構造

データ構造とは、データの集まりをコンピュータの中で効果的に扱うために、一定の形式に系統立てて格納する形式を指します。(配列/連想配列/木構造など)

Python

Pythonは、コードの読みやすさが特徴的なプログラミング言語の1つです。 強い型付け、動的型付けに対応しており、後方互換性がないバージョン2系とバージョン3系が使用されています。 商用製品の開発にも無料で使用でき、OSだけでなく仮想環境にも対応。Unicodeによる文字列操作をサポートしているため、日本語処理も標準で可能です。

配列

配列は、各データの要素(値または変数)が連続的に並べられたデータ構造です。各配列は添え字(INDEX)で識別されています。