go

PySpark – avoid data on driver node?

英文: PySpark - avoid data on driver node? 问题 我是新手,正在尝试理解如何编写可以在分布式环境中执行的操作,而不是将大量数据集收集到驱动节点上。 我需要使用ht...