在Spark/Hive中,如何获取某列中正值的百分比?

huangapple go评论77阅读模式
英文:

Spark / Hive: how to get percent of positive values in a column?

问题

有没有SQL函数可以计算Spark / Hive表的列中正值比率?

附注:我正在使用PySpark 2.4。

英文:

Is there any SQL function that calculates the positive value rate in a column of Spark / Hive table?

P.S. I'm using PySpark 2.4

答案1

得分: 2

没有内置的SQL函数可以直接计算Spark或Hive表中列的正值率。但是,您可以使用SQL函数的组合来实现这一点。

result = spark.sql("""
SELECT 
    COUNT(CASE WHEN column_name > 0 THEN 1 END) / COUNT(*) as positive_rate
FROM table
""")
英文:

There isn't a built-in SQL function to directly calculate the positive value rate in a column of a Spark or Hive table. However, you can achieve this using a combination of SQL functions.

result = spark.sql("""
SELECT 
    COUNT(CASE WHEN column_name > 0 THEN 1 END) / COUNT(*) as positive_rate
FROM table
""")

huangapple
  • 本文由 发表于 2023年7月27日 19:17:20
  • 转载请务必保留本文链接:https://go.coder-hub.com/76779216.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

确定