python - 如何在通过DataFrame进行计数查询时获取整数值?

标签 python hive pyspark apache-spark-sql hivecontext

我正在编写此代码来获取指定表中 count 的整数值:

sc = SparkContext("local", "spar")
hive_context = HiveContext(sc)
hive_context.sql("use zs_trainings_trainings_db")
df = hive_context.sql("select count(*) from ldg_sales")

最佳答案

或者:

hive_context.table("sales").count

hive_context.sql("select count(*) from ldg_sales").first()[0]

关于python - 如何在通过DataFrame进行计数查询时获取整数值?,我们在Stack Overflow上找到一个类似的问题: https://stackoverflow.com/questions/43776574/

相关文章:

python - 在 GEKKO 中设置动态模拟的初始值和稳态结果

sql - 使用 Filter 参数创建 View

hive - 配置单元中的分区列

apache-spark - 如何在 PySpark 中用 NULL 替换字符串值?

php - Facebook 墙写应用程序

python - 在 pyspark 中将行转置为列

sql - 如何统计每小时平均使用Hive的人数?

apache-spark - 将数据存储到 PySpark(Azure - DataBricks)中的数据库非常慢

python - 查找 Pyspark 中两个日期之间的周末天数

python - 用Python的spyne修改soap webservice中的WSDL