例如,
val columns=Array("column1", "column2", "column3")
val df=sc.parallelize(Seq(
(1,"example1", Seq(0,2,5)),
(2,"example2", Seq(1,20,5)))).toDF(columns)
如何使用字符串数组设置列名?
是否可以在toDF()中提及数据类型?
最佳答案
toDF()接受String类型的重复参数,因此您可以使用_ *类型注释来传递序列:
val df=sc.parallelize(Seq(
(1,"example1", Seq(0,2,5)),
(2,"example2", Seq(1,20,5)))).toDF(columns: _*)
有关重复参数的更多信息,请参阅Scala Language Specification中的4.6.2节.
相关文章
- scala - Apache Spark如何将列/数组中的新列附加到Spark数据帧
- json - Scala - Spark - 如何将包含一个字符串列的数据帧转换为具有rigth类型的列的DF?
- scala - Spark数据帧将列值转换为字符串变量
- apache-spark - 在PySpark数据帧中修剪字符串列
- apache-spark - 如何将所有数据帧列转换为字符串
- python - 将逗号分隔的字符串转换为pyspark数据帧中的数组
- Scala Spark Dataframe - 计算数组列中每行的字符串数
- 简单随机抽样和数据帧SAMPLE函数如何在Apache Spark(Scala)中工作?