英文: How to read Parquet file from S3 without spark? Java 问题 目前,我正在使用 Apache ParquetReader 来读取本地 Parq...
附加输出模式在流DataFrame/DataSets上存在流聚合且没有水印时不受支持。
英文: Append output mode not supported when there are streaming aggregations on streaming DataFrames/D...
迭代Spark数据集的行并在Java API中应用操作
英文: Iterating rows of a Spark Dataset and applying operations in Java API 问题 // 导入必要的类 import org.ap...
Spark with kafka: NoSuchMethodError: org.apache.kafka.clients.consumer.KafkaConsumer.subscribe(Ljava/util/Collection;)
英文: Spark with kafka: NoSuchMethodError: org.apache.kafka.clients.consumer.KafkaConsumer.subscribe(L...
Java + Spark在EMR上的wordCount
英文: Java+Spark wordCount with EMR 问题 我一直在尝试在EMR中使用Java运行从https://spark.apache.org/examples.html 找到的P...
在Spark RDD中,case class的瞬态字段会变成null。
英文: transient fields of case class becomes null in Spark rdd 问题 我有一个接受 java 类 LinkedSparseMatrix(包 -...
尝试安装后打开 Spark,出现错误:无法找到任何与版本 “1.8” 匹配的 JVM。
英文: Trying to open spark after installation and getting an error: Unable to find any JVMs matching v...
Why (in "cluster" mode) is my UDF executed locally (in driver) instead on worker(s)
英文: Why (in "cluster" mode) is my UDF executed locally (in driver) instead on worker(s) 问题...
如何使用Java将Spark DataFrame 以制表符分隔的形式写入文本文件
英文: How to write a spark dataframe tab delimited as a text file using java 问题 我有一个包含许多列的Spark Datase...
获取Apache Spark中单列的值,以Java编写,作为一个扁平列表。
英文: Get a single column values as a flat list in Apache spark using java 问题 import org.apache.spark....
49