英文: Dask map_partition does no use all workers on client 问题 我有一个非常消耗CPU资源的进程,并希望在Dask中使用尽可能多的工作进程。 当...
Pandas/Dask 读取 Parquet 文件时不区分大小写的列名
英文: Pandas/Dask read_parquet columns case insensitive 问题 在pd.read_parquet()中是否可以使用一个columns参数来过滤列,但不...
Handling Large Datasets Efficiently in Python: Pandas vs. Dask
英文: Handling Large Datasets Efficiently in Python: Pandas vs. Dask 问题 我正在处理一个大型数据集(超过10GB),并且我目前使用Pa...
AttributeError: 导入Dask时,模块’pandas.core.strings’没有’StringMethods’属性。
英文: AttributeError: module 'pandas.core.strings' has no attribute 'StringMethods' wh...
无法在磁盘上创建/保存/加载非常大的数组
英文: Unable to create/save/load very large array on disk 问题 For learning purposes I want to create, s...
NVidia Rapids筛选器既不起作用,也不引发警告/错误。
英文: NVidia Rapids filter neither works nor raises warn/errors 问题 I am using Rapids 23.04 and trying ...
在Dask中的交叉合并/笛卡尔积
英文: cross merge/cartesian product in dask 问题 You can perform the equivalent of the cross merge in Da...
如何向Dask中的聚合函数传递参数。
英文: How to pass a parameter to an aggregation function in Dask 问题 我刚刚发现,在pandas和Dask中,一个包含大量NaN的列的总和...
在创建Dask中的子数据帧时减少任务完成数
英文: Reducing tasks to complete when creating child dataframes in Dask 问题 我正在尝试理解在创建 Dask 中的子数据框时的“最佳...
Dask/pandas应用函数并返回多行
英文: Dask/pandas apply function and return multiple rows 问题 在Dask的map_partitions函数中返回一个DataFrame是一个有挑...
3