首页 - 信息 - ES查询分页解决方案

ES查询分页解决方案

2023-10-01 04:21

在使用ES的过程中，无法避免分页查询的使用场景。 ES中提供了三种分页方案。这三种分页方案没有绝对的好坏之分。在使用的时候，我们需要根据自己的使用场景做出合理的选择。

尺寸

这是ES提供的最常见的寻呼功能。通过在搜索 API 中指定 from 和 size 来实现分页效果。比如现在我们对订单数据进行分页：

GET /order_v3/_search
{
“查询”：{
“match_all”：{}
}，
“来自”：0，
“大小”： 10
}

其中from表示起始位置，size表示页面大小。这种寻呼方式在寻呼深度浅的时候没有问题，但是这种方式不适合深度寻呼。例如上例中，如果将的值从改为1000000，ES将无法处理，并抛出以下错误内容。

结果窗口太大，from + size 必须小于或等于：[10000] 但为 [1000010]。请参阅滚动 api，了解请求大数据集的更有效方法。可以通过更改 [index.max_result_window] 索引级别设置来设置此限制。

从错误内容可以看出，不支持深度分页ES。虽然可以通过设置 index.max_result_window 修改来增加分页深度，但实际上并不推荐这样做。

那么为什么这种方法不适合深度分页呢？例如，这里的order_v3索引数量为3，副本分片数量为0。如果当前from为10000，尺寸 为 10，则该查询将执行如下：

客户端请求被发送到某个节点，暂且称之为A节点。
A节点将请求转发到各个分片（shard），然后每个分片根据需要获取10010（from+size）条记录，最后将这些记录发送到A节点。
A节点再次对30030（10010*3）条记录进行排序，得到10条符合条件的记录返回给客户端。

从上面可以发现，分页深度越深，需要从每个分片中取出的数据就越多，最终合并时节点需要的内存也会越来越多。所以from+size的方法不适合深度分页，只适合页数不深的时候使用。

搜索后

为了应对深度分页，ES推荐使用Search After来实现数据的深度分页。它的使用也非常简单。当您第一次使用Search API时，它带有一个排序参数，其中sort的值必须是唯一的排序值。比如前面的order_v3索引分页查询，我们按照订单创建时间倒序对查询代码进行排序，如下：

GET /order_v3/_search
{
 "查询": {
 "match_all": {}
 },
 "排序": [
 {"已创建 .key词": "desc"},
 {"_id":"desc"}
 ],
 "来自": 0,
 "大小": 10
}

前面我们说sort的值必须是唯一的排序值，也就是说，如果我们简单地使用created，即订单创建时间，作为排序值，显然创建不是独特的价值。所以我们在这里添加_id，形成一个唯一的值。

在上述查询结果中，每条记录都会附有以下内容：

？ ,
"mGA-QIQBiLbZg9L -vfT6"
]
}

如果我们需要获取该查询的下一页数据，那么我们使用Search After，可以这样写：

GET /order_v3/_search
{
 "查询": {
 "match_all": {}
 },
 "排序": [
 {"已创建 .key词": "desc"},
 {"_id":"desc"} 
 ],
 "大小": 10, 
 "search_after":["2022-02-27 23 :55 :39","mGA-QIQBiLbZg9L-vfT6"]
}

其中search_after是一个数组，其值为上一次查询的最后一条记录结果中sort中的值。

通过上面的使用示例，我们可以发现Search After查询的本质是使用上一页中的一组排序值来检索匹配的下一页页，但这种方式实现的局限性是使用Search After要求后续请求返回与第一个查询相同的查询条件和排序条件。

虽然Search After的性能和效率优于之前的from+szie解决方案，但它最大的缺点是不能直接跳转到页面，只能分页一页一页。向下滚动。其实这种使用场景在实际业务中也很常见，比如浏览微博或者新闻APP内容。用户总是向下滚动以获取新数据，而不是跳转到页面。

滚动

前面提到的Search After可以处理深度分页，但每次分页仍然需要经过一次查询过程。如果存在要求导出所有数据的场景，使用 Search After 需要多次查询才能导出所有数据。随着次数的增加，效率会变低。还有更好的解决办法吗？怎么处理呢？

ES提供的滚动非常适合这种场景。 Scroll就是将查询结果缓存一段时间，比如scroll=3m就是将查询结果缓存存3分钟，响应结果会增加Scroll_id返回。下一个查询使用 Scroll_id 检索数据。

比如现在需要导出所有订单数据，那么使用滚动首先查询所有数据。示例代码如下： GET /order_v3/_search?scroll=5m { “查询”：{ “match_all”：{} }， “大小”：20 } 响应结果会增加_scroll_id返回：？ cWFHT2dqNnBjWEEAAAAAAAAAORYwR1M3NkloUlM3T0xqY05sNlVfc2tBAAAAAAAAADoWMedTNzZJaFJTN09MamNObDZVX3NrQQ==" }
后续每个查询均按如下方式执行：
POST _搜索/滚动 { “滚动”：“5m”， “scroll_id”：“DnF1ZXJ5VGhlbkZldGNoAwAAAAAAAAAa1FmtWSnFHdDl3UkdDcWFHT2dqNnBj W EEAAAAAAAAAORYwR1M3NkloUlM3T0xqY05sNlVfc2tBAAAAAAAAADoWMedTNzZJaFJTN09MamNObDZVX3NrQQ==" }

这里的scroll_id是第一个查询返回的_scroll_id。接下来我们一直使用上面的查询条件来获取数据，直接获取到了所有的数据。

对于滚动，将返回第一次请求时的所有文档，并且不会查询文档的后续更改。

对于滚动方式，适用于导出大量数据或离线数据计算等常见情况，但不适合大并发情况。

总结

一般来说，ES深度分页的选择并不是绝对的，要看使用场景。

from+size适合常见的查询，比如需要支持页面跳转、实时查询的场景。但是当查询深度太深时，就会出现深度分页的问题。

Search After适合不需要分页的实时滚动查询，比如浏览微博。

滚动 与Search After类似，但更适合数据导出场景。

相关推荐

国家统计局：10月份，进口原油

国家统计局：2022年我国人口

GaeAEX/盖亚交易所靠谱吗

Filecoin网络的简单运行

“疯牛离场”，短线进出

Ubuntu邮件服务器：详细搭

2G免费主机空间，轻松打造个人

16路服务器价格表（16路服务

RTX2060显卡要来了？ N

MySQL索引与高效数据库操作

实用笔记：配置Linux服务器

MySQL Administr

农业在AI中变年轻

光刻机巨头ASML：2022年

光刻机巨头ASML CEO谈毛

AMD Wraith Pris

String.Join的实现

WPF的datagrid和wi

2021年开什么店成本低利润高

2021年元旦适合结婚吗

内部邮件曝光：苹果CEO库克被

stm32单片机控制继电器电路

vs2010 asp.net水

消费品牌拥抱即时零售美团买菜

最新资讯

头条
 Windows11系统哪个好用？2023
2023-09-27 21:29

头条
 划分探索Redis集群角色划分的新方法（
2023-09-27 21:32

头条
 Redis如何处理复杂对象存取（复杂对象
2023-09-27 21:32

头条
 摩托罗拉Edge 40 Pro渲染图出炉
2023-09-27 21:35

头条
 华为Watch 4将支持卫星通信：与P6
2023-09-27 21:35

头条
 RTX3060 8G显卡性能怎么样？RT
2023-09-27 21:35

头条
 异地城镇居民医保报销流程
2023-09-27 21:39

头条
 医保商业保险报销流程
2023-09-27 21:39

头条
 医保与商业险报销流程
2023-09-27 21:39

头条
 社保问题
2023-09-27 21:43

热门文章

 卢龙镇2023-08-05天气预报（河北
2023-09-27 21:46

黄泥镇2023-08-05天气预报（安徽
2023-09-27 21:46

萧江镇2023-08-05天气预报（浙江
2023-09-27 21:46

用Redis解决用户登录失败问题（red
2023-09-27 21:49

如何快速搭建Redis集群（怎么集成re
2023-09-27 21:49

电脑下载的软件桌面没有图标电脑桌面下载
2023-09-27 21:52

英雄联盟 a地板英雄联盟a点地板怎么设
2023-09-27 21:52

西晒阳台适合养什么盆栽
2023-09-27 21:52

Ai文案修改神器,解说文案秒变原创文案
2023-09-27 21:56

年度会员大礼包
2023-09-27 21:56

猜你喜欢

下班途中发生意外属于工伤吗？可以拿到工伤

上班第一天就受了工伤，可以申请工伤补偿吗

中国视频影视解说—掌握流量密码，自媒体运

新手如何做好电影解说和变现？

如何写文案的电影评论才能走红！

如何安装cad2004

本人沈阳沈鑫公交司机

您好我想咨询一下离

ios15白噪音在哪开启?ios15开启

safari怎样扩展添加?safari扩