apache-spark - 第 31 | 开发者交流平台

How can we load a non delimited text file using spark scala and save it as a CSV file where column lengths are given dynamically?

英文: How can we load a non delimited text file using spark scala and save it as a CSV file where colu...

2023年2月14日153评论

英文: How to get usage statistics from Databricks or SQL Databricks? 问题我正在寻找一种从Databricks（数据科学与工程和SQL...

2023年2月14日135评论

英文: PySpark Create Relationship between DataFrame Columns 问题我正在尝试实现一些逻辑，以根据以下逻辑获取ID和链接之间的关系。逻辑 - 如...

2023年2月14日130评论

英文: Pyspark: Split and conditional statements 问题 # 我尝试创建一个名为"w"的列，如果我分割值，然后创建一个条件表，如果我找到一个带有...

2023年2月10日125评论

英文: spark number of executors when dynamic allocation is enabled 问题 I have a r5.8xlarge AWS cluster ...

2023年2月10日138评论

英文: Can I use Spark prebuilt without hadoop on Windows? 问题我正在生产环境的Unix服务器上使用不带Hadoop的预构建Spark 3.1.3...

2023年2月10日124评论

英文: FIRST_VALUE in Athena or Spark 问题以下是你要的翻译内容： select id ,id2 ,FIRST_VALUE(CASE WHEN app THEN dat...

2023年2月10日144评论

英文: Volume Mount in SparkApplication resource not working 问题我正在尝试在Kubernetes中使用Spark操作符，尝试创建一个具有以下清...

2023年2月9日129评论

英文: Merge rows in spark scala Dataframe and apply aggregate function 问题我有一个以下的数据框： | notification_i...

2023年2月9日137评论

英文: How to pivot 2 columns in PySpark 问题这是你需要的结果： id var3 var4 465 var1 1000 465 var2 200 455 var1 ...

2023年2月8日126评论