英文: Maximum JDK version supported for apache spark 2.4.5.1 问题 请问有人可以告诉我 Apache Spark 2.4.5.1 支持的最高 J...
将每一行字符串保存为文件在Spark中。
英文: save each line of string as a file in spark 问题 我正在处理一个用例,在这个用例中,我需要将RDD中的每一行文本保存为Google Cloud St...
如何在Spark中将一个文件上传到S3?
英文: How can I make only one file in spark to s3? 问题 我有很多CSV文件。在使用Spark SQL后,我想要生成一个CSV文件。 例如,我在S3中有n...
Spark分区数始终为1吗?
英文: Spark partition count is always 1? 问题 我正在本地模式下运行Spark,但在执行简单的groupBy操作时,我期望会有多个分区存在,但分区计数始终为1: v...
Pyspark使用动态列进行数据透视。
英文: Pyspark pivot with Dynamic columns 问题 我有一个Pyspark Dataframe,如下所示, 我正在基于月份和T列进行数据透视,需要生成以下输出。 T列中...
将Dataset<Row>转换为要添加到Kafka的键和值。
英文: Spark: Convert a Dataset<Row> to key and value to be added in Kafka 问题 我正在尝试将Spark连接到具有位置数...
如何使用Prometheus获取Spark Pod因OOMKilled而产生的度量指标。
英文: How to get metric for a spark pod OOMKilled using prometheus 问题 我有一个Spark执行器Pod,当它进入OOMKilled状态时...
在PySpark中对行进行透视而不进行聚合。
英文: pyspark pivot row without aggrefation 问题 I have a Pyspark Dataframe named df as shown below, 我有一...
PySpark:从现有数据框架中查询特定一组ID的最有效方法
英文: PySpark: Most efficient way to query from DB for a specific set of ids from an existing data fra...
Spark 如何处理分区和洗牌
英文: How does Spark Handles Partitions and Shuffles 问题 深入研究Spark(PySpark)是第一次,我已经充满了对底层机制的好奇心。 从文档中,我...
49