------ステップ1---------
1235,0,32476454
5467,1615,161615
・
・
・
-------ステップ2------
1615,46,456464
・
・
・
というようなデータが500万行ほど続くデータがあり、ステップを検索することで数値データのみを取り出したいです。
read_csvで読み込んだところ、-----step---の部分と数値データ部分でデータサイズが異なるため(?)読み込めませんでした。
数値部分の「,」をpythonを使わずに適当な文字(kanma)等に置き換えてから読み込むことでなら1列500万行のデータとして読み込めました。
カンマで区切らないで読み込む方法はありますか?
データフレームを使わないでopenなどでなら読み込めますが、○行から○行を抜き出すという処理がわかりませんでした。。
長々と書いてしまいましたが、ステップがたくさん分かれているデータの数値データのみを抜き出すことがやりたいことです。
カンマで区切らない方法が有ればそれだけで十分です。
よろしくお願いします。
回答2件
あなたの回答
tips
プレビュー