ドキュメントを丸写しして,レコメンデーションを作りたいと考えています.
mapを行なったときにRDD is emptyというエラーが出たため,mapを行なったときの中身を確認したいと考え,どのようにしたら出力できるかお教えいただきたく,質問しました.
よろしくお願いいたします.
環境 apache-spark 2.1.0
python
1# data = sc.textFile("/usr/local/Cellar/apache-spark/2.1.0/libexec/data/mllib/als/test.data") 2lines = spark.read.text("/usr/local/Cellar/apache-spark/2.1.0/libexec/data/mllib/als/sample_movielens_ratings.txt").rdd 3#######ここは出る 4# print(lines.collect()) 5parts = lines.map(lambda row: row.value.split("::")) 6#######ここで中身を見たい 7# print(parts.collect()) #エラー Py4JJavaError Traceback (most recent call last)
あなたの回答
tips
プレビュー