前提・実現したいこと
教師データのクレンジング処理をどうしていますか?
(クレンジング処理に時間がかかるので、自動化させたく)
実例
自動車市場価格算出モデルの構築で、
各サイト(中古車情報サイト)から車情報を取得し、
DataRobotというMLツールでデータモデルを構築してます。
その際の車情報の車種名がバラバラで、現在はExcel VBAでルールを作って変換をかけていますが、次々とルールを更新させていかなければ対応できず、困っています。
(MLやAI業界でどのようにしているか教えていただきたく。。)
お願いします。
より具体例
実際の車種名データのクレンジングでいうと、、
正式名称 Alphard
誤りケース1 Alfard
→ AlfardをAlphardに変換する処理作成
その後、、
誤りケース2 Rphard
→ RphardをAlphardに変換する処理作成
現状
ExcelVBAで変換のルールを新しいものができる毎に作成しています。
結構時間がかかってしまっています。
回答1件
あなたの回答
tips
プレビュー