1、官方说明

df("columnName")            // On a specific DataFrame.

   col("columnName")           // A generic column no yet associated with a DataFrame.

   col("columnName.field")     // Extracting a struct field

   col("`a.column.with.dots`") // Escape `.` in column names.

   $"columnName"               // Scala short hand for a named column.

   expr("a + 1")               // A column that is constructed from a parsed SQL Expression.

   lit("abc")                  // A column that produces a literal (constant) value.

2、使用时涉及到的的包

   import spark.implicits._

   import org.apache.spark.sql.functions._

   import org.apache.spark.sql.Column

3、Demo

scala> val idCol = $"id"

idCol: org.apache.spark.sql.ColumnName = id

scala> val idCol = col("id")

idCol: org.apache.spark.sql.Column = id

scala> val idCol = column("id")

idCol: org.apache.spark.sql.Column = id

scala> val dataset = spark.range(5).toDF("text")

dataset: org.apache.spark.sql.DataFrame = [text: bigint]

scala> val textCol = dataset.col("text")

textCol: org.apache.spark.sql.Column = text

scala> val textCol = dataset.apply("text")

textCol: org.apache.spark.sql.Column = text

scala> val textCol = dataset("text")

textCol: org.apache.spark.sql.Column = text

Spark获取DataFrame中列的方式--col，$，column，apply的更多相关文章

Spark获取DataFrame中列的几种姿势--col，$，column，apply
1.doc上的解释(https://spark.apache.org/docs/2.1.0/api/java/org/apache/spark/sql/Column.html) df("c ...
sparkSQL获取DataFrame的几种方式
sparkSQL获取DataFrame的几种方式 1. on a specific DataFrame. import org.apache.spark.sql.Column df("col ...
[Spark][Python]DataFrame中取出有限个记录的例子
[Spark][Python]DataFrame中取出有限个记录的例子: sqlContext = HiveContext(sc) peopleDF = sqlContext.read.json(&q ...
Spring在代码中获取bean的几种方式
方法一:在初始化时保存ApplicationContext对象方法二:通过Spring提供的utils类获取ApplicationContext对象方法三:继承自抽象类ApplicationObj ...
Spring在代码中获取bean的几种方式（转：http://www.dexcoder.com/selfly/article/326）
方法一:在初始化时保存ApplicationContext对象方法二:通过Spring提供的utils类获取ApplicationContext对象方法三:继承自抽象类ApplicationObj ...
Spring在代码中获取bean的几种方式（转）
获取spring中bean的方式总结: 方法一:在初始化时保存ApplicationContext对象 ApplicationContext ac = new FileSystemXmlApplica ...
[Spark][Python]DataFrame where 操作例子
[Spark][Python]DataFrame中取出有限个记录的例子的继续 [15]: myDF=peopleDF.where("age>21") In [16]: m ...
[Spark][Python]DataFrame select 操作例子II
[Spark][Python]DataFrame中取出有限个记录的继续 In [4]: peopleDF.select("age","name") In ...
[Spark][Python]DataFrame select 操作例子
[Spark][Python]DataFrame中取出有限个记录的例子的继续 In [4]: peopleDF.select("age")Out[4]: DataFrame[a ...

随机推荐

ArrayListHashmap嵌套
package arrayListHashMap; import java.util.ArrayList; import java.util.HashMap; import java.util.Map ...
Dreamoon Likes Coloring 【CF 1329 A】
传送门思路:"Dreamoon will choose a number pipi from range [1,n−li+1](inclusive) and will paint all ...
Python & Matplotlib: Monte Carlos Method
Hey! 这里是Lindy:) Hope you guys are doing well! 今天想记录的概念叫做蒙特·卡罗方法,是今年在cs课上老师做的扩展延伸.其实我在初次接触这个概念时觉得很新 ...
大数据量查询容易OOM？试试MySQL流式查询
一.前言程序访问 MySQL 数据库时,当查询出来的数据量特别大时,数据库驱动把加载到的数据全部加载到内存里,就有可能会导致内存溢出(OOM). 其实在 MySQL 数据库中提供了流式查询,允许把符 ...
解决Github下载仓库慢的正确姿势
上个月刚安装了 Manjaro ,然后最近在Manjaro下载Github的项目竟然只有几十b/s,这能忍?对于下载Github上的代码是硬需求,没办法直接探索一下突破的方法了. 方法一:安装chro ...
洛谷 P4396 [AHOI2013]作业
题目描述题目传送门分析因为询问是关于区间的,并且没有强制在线,所以能用莫队解决但是还要支持查询区间内大于等于 $a$,小于等于 $b$ 的数的个数和数值的个数所以还要套一个数据结构 ...
scp传文件夹
scp -r /root/backupdb/2014-08-15(文件夹) root@192.168.1.98:/root(目录)
LeetCode589. N叉树的前序遍历
题目法一.递归 1 class Solution { 2 public: 3 vector<int>ans; 4 void dfs(Node* root){ 5 if(root!=NUL ...
bash5.0参考手册
Bash Reference Manual a.summary-letter { text-decoration: none } blockquote.indentedblock { margin-r ...
leetcode刷题录-1395
目录题目思考过程查看别人分享的思路总结题目题目地址:https://leetcode-cn.com/problems/count-number-of-teams/ n 名士兵站成一排.每个 ...

Spark获取DataFrame中列的方式--col，$，column，apply

Spark获取DataFrame中列的方式--col，$，column，apply

1、官方说明

2、使用时涉及到的的包

3、Demo

Spark获取DataFrame中列的方式--col，$，column，apply的更多相关文章

随机推荐

热门专题