scala – 如何转换rdd对象到spark中的dataframe

如何将RDD(org.apache.spark.rdd.RDD [org.apache.spark.sql.Row])转换为Dataframe org.apache.spark.sql.DataFrame。我使用.rdd将数据帧转换为rdd。在处理之后,我想要它在数据帧。我如何做到这一点?
最佳答案
SqlContext有一些createDataFrame方法来创建给定RDD的DataFrame。我想象其中的一个将为您的上下文工作。

例如:

def createDataFrame(rowRDD: RDD[Row], schema: StructType): DataFrame

Creates a DataFrame from an RDD containing Rows using the given
schema.

转载注明原文:scala – 如何转换rdd对象到spark中的dataframe - 代码日志