現在、kaggleの
https://www.kaggle.com/c/whats-cooking-kernels-only/overview
のコンペでpythonを練習しています。
そこで、データ列"ingredients"で材料の種類をまとめた配列を作成しようとしています。
"ingredients"にはさまざまな材料が配列の中に含まれています。
そこで、"ingredients"内のデータの種類を重複なしで取り出すことはどのようにすればよいでしょうか。
私の案としては
python
1 2 3#①配列要素をすべて足す。 4all = train["indredients].sum() 5#値をカウントすして、その列を取得する 6ingredients_array = all.value_counts().columns
です。できるとは思うのですが、データ数が多く、かなり時間がかかってしまいます。
そこで何かライブラリを使った方法やもっと時間短縮可能な方法を教えていただけたらと思います。
宜しくお願いします。
回答1件
あなたの回答
tips
プレビュー
バッドをするには、ログインかつ
こちらの条件を満たす必要があります。
2019/05/22 08:52