英文: Issue in Pyspark code when running Glue Script 问题 在填充 dnb_df 时出现的错误是因为查询字符串 var 包含了单引号('...
Spark SQL左连接与子查询中的比较
英文: spark sql left join with comparison in subquery 问题 更新于2022年2月20日的问题: 我有以下两个数据框: df_a: id date co...
pyspark – 在select语句内的if语句
英文: pyspark - if statement inside select 问题 以下代码找到数据框 df 中所有列的最大长度。 问题:在下面的代码中,如何检查仅字符串列的最大长度? from ...
Spark Combining Disparate rate Dataframes in Time
英文: Spark Combining Disparate rate Dataframes in Time 问题 使用Spark和Scala,我有两个包含数据值的DataFrame。 我试图完成一项任...
数据帧在经常使用的筛选列上重新分区如何在Spark中有所帮助?
英文: How Repartitioning of a data frame on frequently used filter column can be helpful in Spark? 问题 ...
从Azure事件中心使用Kafka驱动程序读取数据似乎没有收到任何数据。
英文: Reading from Azure Event hub with Kafka driver doesn't seem to get any data 问题 我在Azure Datab...
Spark应用程序无法读取自定义的log4j.properties。
英文: Spark application unable to read custom log4j.properties 问题 I have been at this for several days...
Spark Scala Dataframe中的`case when`类似函数
英文: Spark Scala Dataframe case when like function 问题 我正在使用Spark Scala的DataFrame API,尝试转换以下SQL逻辑: CAS...
收到来自Spark作业中bcp客户端的无效列长度。
英文: Received an invalid column length from the bcp client in spark job 问题 我正在使用Spark并想要将数据框存储到SQL数据库...
一个异常发生在 Spark 将 JSON 字符串转换为 HashMap 时。
英文: An exception occurs when spark converts a json string to a HashMap in spark 问题 本地环境没有问题,但在执行 Spa...
49