R dplyr 查询在 PostgreSQL 中不使用表索引？

我想使用 R 笔记本通过 dplyr 包连接到远程 PostgreSQL 数据库。
问题是 R 函数很慢，当我查看执行计划时，我看到它没有使用表的索引，但是如果我在 PostgreSQL 中运行相同的查询，它会快得多，因为使用了索引。
在 R 中:

q <- tbl(con, "mytable")%>%
    filter(a==1000, b>500)%>%
    select(id) %>%
    explain()

#<SQL>
#SELECT "id"
#FROM "mytable"
#WHERE (("a" = 1000.0) AND ("b" > 500.0))
#
#<PLAN>
#Seq Scan on mytable
#  Filter: (((b)::numeric > 500.0) AND ((a)::numeric = 1000.0))

在同一个 R 笔记本中，但在 SQL 块中:

{sql connection=con}
EXPLAIN ANALYZE SELECT id FROM mytable WHERE a=1000 AND b>500;

#Bitmap Heap Scan on mytable 
#Recheck Cond: (a = 1000)
#Filter: (b > 500)
#Rows Removed by Filter: 44963
#Heap Blocks: exact=390
#-> Bitmap Index Scan on idx_mytable_a
#Index Cond: (a = 1000)

为什么使用相同的连接时计划不同？
更新
R 函数解释 1000如 1000.0这就是差异的原因:

{sql connection=con}
EXPLAIN ANALYZE SELECT id FROM mytable WHERE a=1000.0 AND b>500.0;

#Seq Scan on mytable
#  Filter: (((b)::numeric > 500.0) AND ((a)::numeric = 1000.0))

如何避免这种转换？

最佳答案

回答我自己的问题，但也很好奇看到更优雅的解决方案。
如果我明确说将数字解释为整数，它将使用索引:

q <- tbl(con, "mytable")%>%
    filter(a==as.integer(1000), b>500)%>%
    select(id) %>%
    explain()

#<SQL>
#SELECT "id"
#FROM "mytable"
#WHERE (("a" = CAST(1000.0 AS INTEGER)) AND ("b" > 500.0))
#
#<PLAN>
#Bitmap Heap Scan on mytable
#  Recheck Cond: (a = 1000)
#  Filter: ((b)::numeric > 500.0)
#  ->  Bitmap Index Scan on idx_mytable_a
#        Index Cond: (a = 1000)

关于R dplyr 查询在 PostgreSQL 中不使用表索引？，我们在Stack Overflow上找到一个类似的问题： https://stackoverflow.com/questions/67037583/

R dplyr 查询在 PostgreSQL 中不使用表索引？

上一篇：python - 如何在 lr_scheduler LambdaLR 中设置最小学习率？

下一篇：rabbitmq - 什么时候在微服务架构中不使用诸如 RabbitMQ 之类的消息代理？