如何使用Plotnine从数据创建带有geomean、mean、max和min的柱状图。

huangapple go评论123阅读模式
英文:

How to create bar chart with geomean, mean, max and min from data using Plotnine

问题

如何为每个类别创建包含gmean、mean、max和min统计数据的条形图。
对于以下数据,

X B Y
A1 b1 4
A1 b2 2
A1 b3 3
A1 b4 8
A2 b1 7
A2 c1 10
A2 c2 8
A2 b3 7
A3 b4 10
A3 b5 9
A3 b1 4
A3 b3 1

图表应该如下所示,
如何使用Plotnine从数据创建带有geomean、mean、max和min的柱状图。

英文:

How to create bar chart with gmean, mean, max and min stats for each category.
For the data below,

X B Y
A1 b1 4
A1 b2 2
A1 b3 3
A1 b4 8
A2 b1 7
A2 c1 10
A2 c2 8
A2 b3 7
A3 b4 10
A3 b5 9
A3 b1 4
A3 b3 1

The chart should look like,
如何使用Plotnine从数据创建带有geomean、mean、max和min的柱状图。

答案1

得分: 1

你需要准备(计算汇总)要可视化的数据。

  1. import pandas as pd
  2. from plotnine import ggplot, aes, geom_col
  3. from scipy.stats import gmean
  4. from pandas.api.types import CategoricalDtype
  5. # 原始数据
  6. df = pd.DataFrame({
  7. "X": sorted(("A1", "A2", "A3") * 4),
  8. "Y": [4, 2, 3, 8, 7, 10, 8, 7, 10, 9, 4, 1]
  9. })
  10. # 计算汇总
  11. df2 = (df.groupby("X")
  12. .agg({"Y": [gmean, "mean", "max", "min"]})
  13. .unstack()
  14. .reset_index()
  15. .rename(columns={0: "value", "level_1": "agg"})
  16. )
  17. # 排序汇总
  18. df2["agg"] = df2["agg"].astype(CategoricalDtype(["gmean", "mean", "max", "min"]))
  19. (ggplot(df2, aes("X", "value", fill="agg"))
  20. + geom_col(position="dodge")
  21. )

如何使用Plotnine从数据创建带有geomean、mean、max和min的柱状图。

英文:

You need to prepare(calculate the aggregates) the data you want to visualise.

  1. import pandas as pd
  2. from plotnine import ggplot, aes, geom_col
  3. from scipy.stats import gmean
  4. from pandas.api.types import CategoricalDtype
  5. # Original Data
  6. df = pd.DataFrame({
  7. "X": sorted(("A1", "A2", "A3") * 4),
  8. "Y": [4, 2, 3, 8, 7, 10, 8, 7, 10, 9, 4, 1]
  9. })
  10. # Calculate the aggregates
  11. df2 = (df.groupby("X")
  12. .agg({"Y": [gmean, "mean", "max", "min"]})
  13. .unstack()
  14. .reset_index()
  15. .rename(columns={0: "value", "level_1": "agg"})
  16. )
  17. # Order the aggregates
  18. df2["agg"] = df2["agg"].astype(CategoricalDtype(["gmean", "mean", "max", "min"]))
  19. (ggplot(df2, aes("X", "value", fill="agg"))
  20. + geom_col(position="dodge")
  21. )

如何使用Plotnine从数据创建带有geomean、mean、max和min的柱状图。

huangapple
  • 本文由 发表于 2023年6月27日 20:44:12
  • 转载请务必保留本文链接:https://go.coder-hub.com/76564995.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定