前提・実現したいこと
現在、AWSのsageMaker GroundTruthにてラベリングジョブのカスタムプレートを作成しています。
ラベリングの対象データは音声データです。
目標としては、1度のラベリングページに2つの音声データを表示し、設問に対して適切なものを選択するという形を目標にしています。
発生している問題
発生している問題としては、同じ音声データが表示されてしまうことです。
該当プログラム
マニフェストファイルの方は、以下のような形にしております。
manifest
1{"source-ref": "s3://voice-data1.wav"} 2{"source-ref": "s3://voice-data2.wav"} 3{"source-ref": "s3://voice-data3.wav"} 4{"source-ref": "s3://voice-data4.wav"}
前注釈Lamdbaは以下のようなプログラムになっています。
python
1import json 2def lambda_handler(event, context): 3 return { 4 "taskInput": event['dataObject'] 5 }
プログラム本文で「task.input.source-ref」でLamdbaが呼び出されているとの認識なのですが、単純に{{task.input,source-ref|grand_read_access}}を2回書いてしまうと、同じものが表示されてしまうので、どうにかして音声データの区別をつけたいと考えています。
実際に試したこと
{{task.input.source-ref[0]}}のように指定できないかと試みたのですが、動作されませんでした。
source-refは値で指定されたAmazon S3オブジェクトがソースになり、バイナリオブジェクトの場合に使用するとあり、記載する必要があるとあったのですが、「source-ref」はどのような動きをしているのか、より詳しく知りたいと考えております。
なにかアドバイスなどありませんでしょうか?
あなたの回答
tips
プレビュー