<やりたいこと>
pandas.DataFrameのmeeting_noカラムの全長を計算した上で、
ミーティングごとに区分する数に基づいてテキストファイルを分割して書き出したいと考えております。
<想定されるインプットデータフレーム>
df = |meeting_no|start_second|text| |1|1.0|こんにちは |1|2.2|おはようございます |1|3.3|今日はいい天気ですね |1|4.4|ご飯を食べました |1|5.1|朝は気温が低いため、外出する際は防寒が必要であると思われます |1|8.0|ご飯を食べました |1|9.0|昼は気温が高いため、洗濯物日和です |1|10.0|眠いです |1|11.0|おやつの時間です |1|12.0|おやつを食べました |2|・・ |2|・・ :
<作成したいアウトプットテキストファイル>
meeting1_text1_0.0-2.4.txt:こんにちは\nおはようございます meeting1_text2_2.4-4.8.txt:今日はいい天気ですね\nご飯を食べました meeting1_text3_4.8-7.2.txt:朝は気温が低いため、外出する際は防寒が必要であると思われます meeting1_text4_7.2-9.6.txt:ご飯を食べました\n昼は気温が高いため、洗濯物日和です meeting1_text5_9.6-12.0.txt:眠いです\nおやつの時間です\nおやつを食べました入力
上記のように、time_lengthを求めた上でテキストデータを分割(結合)したいと考えております。
<考えたこと>
・meeting_idごとにgroupby
・time_length = start_secondの最大値をもとに12を自動算出
・split_num = splitしたい任意の数
・split_time = 2.4を自動算出
上記を計算した上で、start_secondのカラムに対してmeeting_id毎にsplit_timeに当てればよいと思いますが、
いまいち想定通りの結果を出力できず、textをうまく結合することができず困っております。
お手数を掛けしますが、上記をうまく実装する方法についてお知恵を拝借できますと幸いです。
何卒よろしくお願い申し上げます。
回答1件
あなたの回答
tips
プレビュー