英文: Cluster a stream of items with constraints 问题 我正在寻找一种将输入的项目序列(不可重复的流)进行分区的方法。我确定这是来自图论的某种标准k-部分算...
检测数据中多个线性趋势的最佳算法
英文: Best algorithm to detect multiple linear trends in data 问题 我正在尝试检测数据中的线性趋势,参见示例图: 数据可以是水平的,也可以是增...
Dtaidistance SSE 和 Silhouette 分数
英文: Dtaidistance SSE and Silhouette score 问题 我正在寻找一种在数据上训练后轻松打印Dtaidistance(https://dtaidistance.rea...
DAX – 计算表中连续值(组)的数量
英文: DAX - count the number of consecutive values (groups) in a table 问题 以下是您提供的代码的翻译部分: 我有一张表格,有两列,一...
You can use scikit-learn K-Means Clustering的时候,如何提取原始数据域中的质心?
英文: When using scikit-learn K-Means Clustering, how can you extract the centroids in original data d...
为什么k均值聚类的质心离数据远? Python
英文: Why are the kmeans centroids far from the data? Python 问题 I'm making a kmeans model with the dat...
更改集群标签以进行比较目的
英文: Changing cluster labels for comparison purposes 问题 我需要帮助重新定义两个聚类过程的索引,以便它们可以更直观地进行比较。 假设聚类过程 A 给...
ValueError: invalid literal for int() with base 10: '2020-12-22 00:00:00' date time to time stamp conversion
英文: ValueError: invalid literal for int() with base 10: '2020-12-22 00:00:00' date time to t...
如何加快这个距离矩阵的计算速度?
英文: How do I make the calculation for this distance matrix faster? 问题 我正在处理一个包含地理数据的聚类任务。我想计算结合地理和时间...
Lower DBCV Scores for Cluster Analysis using Sklearn’s GridSearchCV
英文: Lower DBCV Scores for Cluster Analysis using Sklearn's GridSearchCV 问题 I have translated the...