ES杂项

作者 : 松哥资源 本文共630个字,预计阅读时间需要2分钟 发布时间: 2018-05-5 共724人阅读




示例标题

倒排索引

  1. 倒排索引和mysql里面的fulltext索引,目前还不知道是不是一个原理

先看张图:单词-文档矩阵

一列一列看,就是正排索引
一行一行看,就是倒排索引

正排索引告诉你的是:这个文档中有哪些关键字,每个关键字出现了多少次,出现在哪些位置
倒排索引告诉你的是:这个关键词在哪些文档中出现了,出现了多少次,出现在哪些位置

如果有人问你什么事倒排索引,就画这个图给他看

为什么搜索引擎都是倒排索引?

通过上图可以知道,告诉我关键字,可以非常快速的知道这个关键字出现在了哪些文档,而通过正排索引就需要遍历文档才知道

前端时间看到美团技术公众号发得一篇文章提到,他们已经尝试用ClickHorse+filebeat替换ELK了

ES性能测试

写入性能测试

  1. 单条数据越大,性能越差
  2. 集群环境下0副本的情况比1副本的情况吞吐量大概多1w docs/s
  3. 增加client数量能提高吞吐量,但超过2个后对吞吐量提高不是很明显,所以不建议超过2到3个为宜
  4. 单节点环境下有无副本貌似影响不大


  • 随机毒鸡汤:别总想着跟对象讲道理,因为这样很容易发现,自己没有对象。


文章来源于justsoso.fun: ES杂项





发表回复