英文:
Spark / Hive: how to get percent of positive values in a column?
问题
有没有SQL函数可以计算Spark / Hive表的列中正值比率?
附注:我正在使用PySpark 2.4。
英文:
Is there any SQL function that calculates the positive value rate in a column of Spark / Hive table?
P.S. I'm using PySpark 2.4
答案1
得分: 2
没有内置的SQL函数可以直接计算Spark或Hive表中列的正值率。但是,您可以使用SQL函数的组合来实现这一点。
result = spark.sql("""
SELECT
COUNT(CASE WHEN column_name > 0 THEN 1 END) / COUNT(*) as positive_rate
FROM table
""")
英文:
There isn't a built-in SQL function to directly calculate the positive value rate in a column of a Spark or Hive table. However, you can achieve this using a combination of SQL functions.
result = spark.sql("""
SELECT
COUNT(CASE WHEN column_name > 0 THEN 1 END) / COUNT(*) as positive_rate
FROM table
""")
通过集体智慧和协作来改善编程学习和解决问题的方式。致力于成为全球开发者共同参与的知识库,让每个人都能够通过互相帮助和分享经验来进步。
评论