[翻译]ElasticSearch官方文档-数据集操作

news/2024/7/3 10:27:44 标签: 大数据, json

本文翻译自:www.elastic.co/guide/en/el…

本文是Elasticsearch的入门文档,将会用实际的数据引出ElasticSearch中关于数据集的相关操作。

探索数据

简单数据集

现在我们已经看了一下基础知识,我们来试一下更逼真的数据集。我已经准备了客户银行帐户信息的虚构JSON文档示例。每个文档具有以下模式:

{
    "account_number": 0,
    "balance": 16623,
    "firstname": "Bradshaw",
    "lastname": "Mckenzie",
    "age": 29,
    "gender": "F",
    "address": "244 Columbus Place",
    "employer": "Euron",
    "email": "bradshawmckenzie@euron.com",
    "city": "Hobucken",
    "state": "CO"
}复制代码

对于好奇,我从www.json-generator.com/生成了这些数据,所以请忽略数据的实际值和语义,因为这些都是随机生成的。

加载简单数据集

你可以从这里下载示例数据集(accounts.json)。将其提取到我们当前的目录,并将其加载到我们的集群中,如下所示:

curl -H "Content-Type: application/json" -XPOST 'localhost:9200/bank/account/_bulk?pretty&refresh' --data-binary "@accounts.json"
curl 'localhost:9200/_cat/indices?v'复制代码

返回如下:

health status index uuid                   pri rep docs.count docs.deleted store.size pri.store.size
yellow open   bank  l7sSYV2cQXmu6_4rJWVIww   5   1       1000            0    128.6kb        128.6kb复制代码

这意味着我们刚刚成功地将1000个文档批量索引到银行索引(在帐户类型下)。

查询API

现在我们来开始一些简单的搜索。运行搜索有两种基本方法:一种是通过REST请求URI发送搜索参数,另一种是通过通过REST请求体发送参数。请求体方法允许你的想法更具表现力,并且还可以使用可读性的JSON格式进行搜索。我们将尝试一个请求URI方法的示例,但是在本教程的其余部分中,我们将专门使用请求体方法。

用于搜索的REST API可以从_search端点访问。此示例返回银行索引中的所有文档:

GET /bank/_search?q=*&sort=account_number:asc&pretty复制代码

我们首先剖析搜索请求。我们在银行索引中搜索(_search endpoint),而q = **参数指示Elasticsearch匹配索引中的所有文档。 sort = account_number:asc参数指示使用每个文档的account_number字段按升序对结果进行排序。pretty*参数再次告诉Elasticsearch返回优雅打印的JSON结果。

请求的相应如下(部分显示):

{
  "took" : 63,
  "timed_out" : false,
  "_shards" : {
    "total" : 5,
    "successful" : 5,
    "skipped" : 0,
    "failed" : 0
  },
  "hits" : {
    "total" : 1000,
    "max_score" : null,
    "hits" : [ {
      "_index" : "bank",
      "_type" : "account",
      "_id" : "0",
      "sort": [0],
      "_score" : null,
      "_source" : {"account_number":0,"balance":16623,"firstname":"Bradshaw","lastname":"Mckenzie","age":29,"gender":"F","address":"244 Columbus Place","employer":"Euron","email":"bradshawmckenzie@euron.com","city":"Hobucken","state":"CO"}
    }, {
      "_index" : "bank",
      "_type" : "account",
      "_id" : "1",
      "sort": [1],
      "_score" : null,
      "_source" : {"account_number":1,"balance":39225,"firstname":"Amber","lastname":"Duke","age":32,"gender":"M","address":"880 Holmes Lane","employer":"Pyrami","email":"amberduke@pyrami.com","city":"Brogan","state":"IL"}
    }, ...
    ]
  }
}复制代码

对于响应,我们看到以下部分:

  • took - Elasticsearch执行搜索的时间(毫秒)
  • timed_out - 告诉我们搜索是否超时
  • _shards - 告诉我们搜索了多少个分片,以及一个成功/失败的搜索碎片的总数
  • hits - 搜索结果
  • hits.total - 匹配我们的搜索条件的文档总数
  • hits.hits - 搜索结果的实际数组(默认为前10个文档)
  • hits.sort - 结果的排序键(如果按得分排序)
  • hits._score和max_score - 命中得分“目前暂时忽略这些字段”

现在以上是使用备用请求体方法相同的精确搜索:

GET /bank/_search
{
  "query": { "match_all": {} },
  "sort": [
    { "account_number": "asc" }
  ]
}复制代码

这里的不同之处在于,我们不会在URI中传递q = *,而是向_search API发布一个JSON样式的查询请求体。我们将在下一节讨论这个JSON查询。

重要的是要明白,一旦你获得了搜索结果,Elasticsearch就完成了该请求,并且不会保留任何类型的服务器端资源或在你的搜索结果中打开游标。这与许多其他平台(如SQL)形成鲜明对比,如果使用这种平台,你可能最初会先获取查询结果的部分子集,然后如果要获取(或浏览)其余部分,则必须不断返回到服务器的结果使用某种有状态的服务器端游标。


http://www.niftyadmin.cn/n/1776151.html

相关文章

Java SVN管理工具的使用

1.svn环境搭建 在应用myEclips 8.5做项目时,svn会成为团队项目的一个非常好的工具,苦苦在网上寻求了一下午,终于整合好了这个环境,在这里简单介绍下,希望能为刚开始用svn的朋友一点点帮助。 svn环境需要&#xff08…

两台linux服务器之间实现挂载

两台linux服务器之间实现挂载: 服务端: 1、首先需要在主机上设置允许挂载的目录 (1)修改 /etc/exports,增加共享目录 这里主机是指服务端(要共享的目录) /srv/www/app/wtcms/webroot/upload 10.10.10.*(ro,sync,no_root_squash) /…

采用模拟账号读取Exchange server未读邮件的注意事项(链接邮箱问题)【转】

最近做项目碰到Exchange中,用EWS API方法读取的未读邮箱(ConnectingIdType.PrincipalName设置该属性的方法)附带代码部分: 核心代码 using Microsoft.Exchange.WebServices.Data; using System; using System.Collections.Generic…

Jar文件 META-INF/MANIFEST.MF文件详解

打开Java的JAR文件我们经常可以看到文件中包含着一个META-INF目录, 这个目录下会有一些文件,其中必有一个MANIFEST.MF,这个文件描述了该Jar文件的很多信息,下面将详细介绍MANIFEST.MF文件的内 容,先来看struts.jar中包…

微服务架构适用场景分析

\核心要点\\微服务并不是什么灵丹妙言,在现代架构中,它有自己的位置,但并不适用于任何的地方;\\t在判断基于微服务的方案是否适合时,理解业务域是至关重要的;\\t单职责原则是划分微服务边界的关键&#xff…

Refactor java代码重构

重构是对软件内部结构的一种调整,目的是在不改变软件行为的前提下,提高其可理解性,降低其修改成本。开发人员可以使用一系列重构准则,在不改变软件行为的前提下,调整软件的结构。 有很多种原因,开发人员应该…

开发人员学Linux(13):CentOS7安装配置IT设备监控系统Zabbix

2019独角兽企业重金招聘Python工程师标准>>> 1.前言 在前一篇讲述了如何安装Memcached和Redis,在这一篇主要讲述如何安装企业级IT设备监控系统Zabbix。本人曾在某大型集团公司信息化部门工作,公司在多个城市以及一个城市的多个区有办公区&…

安装 vue-cli 报错 -4058

2019独角兽企业重金招聘Python工程师标准>>> 本人在安装vue脚手架时报如下 -4058 的错,貌似是网络代理的问题,换一个npm安装源就好了,具体方法如下: 1.通过config命令 npm config set registry https://registry.npm.t…