英文: How to use a Spark UDF that takes an array of struct as an argument in order to build a new colu...
如何根据条件在Spark SQL中选择不同的行。
英文: How to select different rows base on conditions in Spark sql 问题 我创建了一个基于 num 列并按名称分组的排名列。我试图实现逻辑...
在Spark会话中设置 “table”。
英文: Set "table" in spark session 问题 You can set salaryData as a table in a SparkSession us...
Pyspark:检查列的连续值是否相同
英文: Pyspark: check if the consecutive values of a column are the same 问题 我有一个带有以下格式的pyspark datafram...
我需要计算给定股票数据集的盈亏,确保首先卖出首次购买的股票。
英文: I need to calculate profit/loss for given stock data set, ensuring that the first bought items a...
为什么sbt不编译代码,而且主要库甚至都没有被识别?
英文: why sbt doesn't compile the code and the main libraries aren't even recognised? 问题 This ...
根据行数拆分 Spark 数据集。
英文: Split spark dataset based on number of rows 问题 我正在从 DynamoDB 中读取数据,并将其存储在 Spark 的 Dataset 中,代码如下...
Databricks:SQL透视不起作用 – 但Python可以
英文: Databricks: SQL Pivot does not work - but Python does 问题 I am trying to pivot a SQL table in Dat...
Spark会话值未更新
英文: Spark session value not updating 问题 我正在使用以下代码设置Spark会话值: spark = (SparkSession .builder .appName...
表格在尝试从Databricks Spark覆盖其中的数据时被删除。
英文: Table gets deleted when trying to overwrite the data in it from databricks spark 问题 我正在尝试使用pyspa...
14