英文:
groupby() Col A, count Col C, and count unique column B
问题
我有一个包含多列的数据框。我想要按列A(这是一个人的名字)分组。然后,我想要按列A分组计算列C中的总行数。我还想要按列A分组计算列B中的唯一行数。
在Python中是否有一种方法可以做到这一点?
英文:
I have a dataframe with multiple columns. I want to groupby column A (which is a person's name). Then I want to count total number of rows in column C grouped by column A. I also want to count number of unique rows in Column B grouped by column A.
Is there a way to do this in Python?
答案1
得分: 1
这:
df.groupby('A').agg({'C':'size', 'B':'nunique'})
尽管实际上,C
中的行数应该与 B
中的行数相同。这也可以工作:
df.groupby('A')['B'].agg(['size','nunique'])
英文:
This:
df.groupby('A').agg({'C':'size', 'B':'nunique'})
although really, number of rows in C
should just be the same with number of rows in B
. This should also work
df.groupby('A')['B'].agg(['size','nunique'])
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论