铭毅天下Elasticsearch

其他

Langchain 与 Elasticsearch:创新数据检索的融合实战

官方文档:https://python.langchain.com/docs/integrations/vectorstores/elasticsearch推荐阅读全网首发!从
1月13日 下午 5:48
其他

2023,做点事

Elasticsearch,期望辅助完成架构、整体设计等。一般类似项目的特点就是从业人员原来是传统的技术栈(如:MySQL、Oracle等关系型数据库)的开发,了解到
2023年1月4日
其他

全网首发!从 0 到 1 Elasticsearch 8.X 通关视频

应用场景。“知己知彼,百战百胜”。另一方面:形成技术人脉,可能对企业带来不一样的“影响力”或者“意外价值”。5、课程内容6、课程目标人群ElasticStack
2022年11月4日
其他

重磅 | 死磕 Elasticsearch 8.X 方法论认知清单(2022年国庆更新版)

——《此生未完成》读后感人生没有捷径,专注做好一件事就是捷径——《元智慧》读后此刻,我为新东方摇旗呐喊!一切技能的习得都是刻意练习的结果你“寒”你的,我“暖”我的更多干货,同步更新
2022年9月28日
其他

Elasticsearch 8.X 路径检索的企业级玩法

test-index-20220917/_bulk{"index":{"_id":1}}{"path":"hdfs://xx.xx.xx:8200/home/lht/aaa.doc"}通过
2022年9月19日
其他

Elasticsearch 8.X 集群无响应,怎么办?

集群扩展以适配给定的功能和性能指标,并没有什么“灵丹妙药“,需要大量的性能测试和试错彩才能给出适合自己业务场景的结论。本篇是系列文章第一篇,主要探讨:Elasticsearch
2022年9月14日
其他

Elasticsearch 8.X 新官方文档不好用,怎么办?

快捷键清理一下浏览器缓存,就可以搞定了!推荐阅读如何从0到1打磨一门
2022年9月5日
其他

Kibana 8.X 如何做出靠谱的词云图?

”中文释义为:“删除比指定字符长度更短或更长的标记”。接下来,我们实战一把。3、基于自定义分词实现靠谱词云效果如前方案二所述,在分词处做“手脚”,能实现自主、可控的分词粒度。3.1
2022年9月5日
其他

你“寒”你的,我“暖”我的

2022年8月23日,一个本该夏末秋初的高温天气,华为老大任正非老爷子的《整个公司的经营方针要从追求规模转向追求利润和现金流》的内部讲话如晴天霹雳,整个程序员圈子因此而沸腾起来。“把寒气传递给每个人”瞬间上了热搜。任总的内部讲话只仅给出了华为公司解决方案,无非是“开源节流”、“不讲故事、讲实现”、“裁掉边缘业务、边缘部门”。这是内部讲话,从实际效果看,引起了全国甚至全球的热议。“寒气”的杀伤力已经有目共睹。但,传给每个人之后呢?任正非没有说,因为
2022年8月31日
其他

怎么把Logstash 通过 Kibana 可视化监控起来?

https://www.elastic.co/guide/en/beats/metricbeat/master/metricbeat-module-logstash.html-
2022年8月24日
其他

JMeter 如何实现 Elasticsearch 8.X 性能测试?

官方压测工具。下载地址:https://github.com/elastic/rally文档地址:https://esrally.readthedocs.io/en/stable/2、
2022年8月18日
其他

Elasticsearch 8.X 如何动态的为正文添加摘要字段?

luo_index_002/_bulk{"index":{"_id":1}}{"cont":"罗永浩一路走来,...省略1000字+...汽车才能成为消费者的购车首选。"}POST
2022年8月16日
其他

Elasticsearch 为什么会产生文档版本冲突?如何避免?

race)不大、冲突较少的场景、比较适合读取操作比较频繁的场景,确保比其他并发控制方法(如悲观锁)更高的吞吐量。这里要强调的是,Elasticsearch
2022年8月6日
自由知乎 自由微博
其他

Elasticsearch 8.X 检索实战调优锦囊 001

theadpool(检索线程池),相比于不加这个参数,会减少了检索线程池的占用情况。“具体使用方式如下所示。相当于在原来检索的基础上加了:pre_filter_shard_size参数。POST
2022年7月27日
其他

说说 Elasticsearch filter 和 post_filter 的区别?

过滤条件对检索和聚合都产生影响。post_filter,应用于执行检索之后或者聚合之后,可以看做“后过滤器”,对检索或聚合之后的结果集再进行过滤,只检索结果受影响。推荐阅读如何从0到1打磨一门
2022年7月22日
其他

人生没有捷径,专注做好一件事就是捷径——《元智慧》读后

读书到底有没有意义?这个问题让我想到当代著名学者周国平在回答“人生到底有没有意义?”的答复——“人生本无意义,但寻找‘意义’的过程是有‘意义’的”。其实这个答案也适用于读书——“读书本无意义,但寻找读书意义的过程是有意义”的。读完一本书记不住怎么办?俞敏洪老师和董宇辉在东方甄选的直播间也讨论过这个问题,俞老师和董宇辉都坦言,他们也是记不住的。但,可以肯定的是,当书读得多了之后,你会发现某本书的某个观点就像“火种”,点燃我们渴望的心灵,我们的人生也会因此发生变化。哪怕变化只有一点点,都应该归功于读书的力量、知识的力量。这本书是讲什么的?这本书的核心观点是什么?罗振宇在新书《阅读的方法》完美的回答了这个问题,“很多优秀的书,我们是没有办法这么问的。它们的魅力在片段,在细节,在你用目光抚摸它们的过程”。《元智慧》读后近期读了吴军博士的新书《元智慧》,若有所思,将书中对我触动最大的片段和我的心得总结如下。之前文章我说过吴军博士的履历,他是家族三代都非常优秀,让人大呼“还有谁”的传奇人物。计算机领域科学家比他厉害的肯定大有人在,但那些大家几乎不写通识教育的书。写通识教育的大家也斗量车载,但能懂计算机、逻辑又非常清晰、博览古今且中外贯通的寥寥无几。所以,他的书本本都值得读、本本都长销(不止是畅销)。下班后的生活决定了一个人的职业发展速度“在谷歌,虽然一开始总是工作到深夜,但只要有时间,我依然会学新的东西。安排好下班后的生活,不仅是为了充分利用时间,更是为了养成一种好的生活习惯”。专注于自己的事情,不要操不该操的心这点,李笑来在《财富自由之路》总结得更为精辟:“世上有三个大坑:莫名其妙地凑热闹;心急火燎地随大流;操碎了别人的心肝。”
2022年7月20日
其他

直播:关于 Elastic 认证专家考试(8.1版本),你想知道的都在......

近期读完了吴军博士的新书《软能力》、《元智慧》,感触颇深。后面会写详细的读后笔记梳理心得。两本书都来自40万+用户付费订阅《硅谷来信》的专栏文章,专栏质量非常高(我自己听过一季)。学生时代读过他的《浪潮之巅》、《数学之美》,毕业后又读了《智能时代》、《见识》、《态度》等畅销书。吴军博士本硕都就读于清华大学,博士毕业于约翰霍普金斯大学,其父母也都是清华大学教授,弟弟吴子宁本科毕业于清华大学、硕博毕业于斯坦福大学,大女儿就读于麻省理工大学,二女儿貌似也是名校。这种人才辈出的家庭,让人直呼“还有谁”?图片来源于网络《元智慧》一书中提到“考试是获取反馈和动力的重要途径”,这点我是非常认同的。吴军博士强调了“为什么考试是必要的?因为它可以告诉我们自己是否掌握了某项基础知识,如果没有掌握好,欠缺又在哪里。如果没有考试,不仅大家会学得稀里糊涂,还会有很多人根本就不学习“。手机拍摄于凉席上长远去看,考试的目的——“除了检验自己是否掌握了知识,从小参加考试还能培养我们终身学习的习惯,以便于我们在将来没有考试时依然会自主学习”。“总的来说,对绝大部分人来讲,没有考试、不留作业其实未必是件好事。从表面上看,好像学校里不存在竞争了,但从教育的结果来看,人和人之间的差距一定会拉大。这不仅是因为没有了督促,人会缺乏努力的动力,也是因为没有了反馈,人会不知道自己的问题和弱点在哪里,即使想进步也无从入手”。近
2022年7月19日
其他

干货 | Elasticsearch 8.X 版本升级指南

的特点就是一个字快!速度快,PB级别数据全文检索秒级响应,这是用户群体大的根因,不展开论述。版本更新快,几乎每个月都更新一个小版本,大版本基本2年左右升级一次。所以,市面上的各家公司在使用
2022年7月15日
其他

Elasticsearch 删除重复文档实现方式,你知道几个?

是一个数组,里面存的是文档id。Step3:遍历字典的value部分大于1的值,就代表存在重复文档。Step4:删除重复文档。2、实现代码#!/usr/local/bin/python3from
2022年7月11日
其他

全网首发 | Elasticsearch 认证专家考试(ECE)8.1 版本最新考纲解读

铭毅天下考试建议1、对于已经缴费的同学尽快考试,7月底之前尽快拿下认证考试,别拖了。这样你没有新版本的方面的担心。2、对于尚未报名,且8月份之前不打算考试的,建议直接从
2022年7月7日
其他

重要!!Elasticsearch 安全加固指南

集群不要“裸奔””裸奔“就是将数据的”底ku“脱掉给别人看。对于普通技术人员,但凡懂一点网络扫描知识,就如“入无人之地”。更不用说黑客!3.3
2022年7月4日
其他

图解 | Elasticsearch 获取两个索引数据不同之处的四种方案

"sandrae"}}5、小结只要思想不滑坡,方案总比问题多。自己写程序能否实现呢?当然也是可以的。“index1是完整的可以作为参照物。以插入时间为主线(时间戳,应该每条记录都会有一条数据)拿
2022年6月27日
其他

Elasticsearch 如何实现时间差查询?

doc['starttime'].getValue().toInstant().toEpochMilli())/60000)"
2022年6月20日
其他

干货 | Elasticsearch Java 客户端演进历史和选型指南

客户端https://www.elastic.co/guide/en/elasticsearch/client/java-rest/5.0/index.html2.2.1
2022年6月17日
其他

Elasticsearch 有没有比 reindex 更轻量级的更换字段类型的方式?

别名零停机方案。特点:重新建模,重新迁移数据,用别名方式方案让用户无感知。这时候,我们会思考:有没有更为简洁的方式呢?本文会提供如下方案三的一种方式,
2022年6月14日
其他

一切技能的习得都是刻意练习的结果

it)。“将技能分解成一些组成部分,以便反复地练习,并且有效地分析、确定你的不足之处,然后想出各种方法来解决它们”。第一个
2022年6月9日
其他

干货 | 从B站爬虫到 Elastic 可视化视频合集

5.B站:https://space.bilibili.com/471049389
2022年6月5日
其他

写在带领 100 人通过 Elastic 认证后......

1、小事做起来,可能就是大事。2、一个人,可以走的很快,但一群人走的更远,且好玩。3、如何提高大家的获得感,我们一直在努力。4、经验是可以复制的,且是可以发扬光大的。5、从长远出发,2018年我想不到2022年的样子,2022年我也无法想象2026年的样子,但,坚持去做,可能就会有奇迹。6、坚持是很难的事,在坚持的路上何止自己想退缩和停下来,甚至你身边的人都劝你停下来了。咋办?唯有再坚持!很难,很累,但10年后、20年后价值会非常大。7、不止于认证,我着手致力于研究“职场提升技能的底层方法论”,我甚至买了近10本学习方法的书,我坚信后面会用得上。8、我们已经形成了社群、沉淀了技术、形成了细分领域的社交圈子、聚集了技术人脉、打破了地域限制、形成了绝佳的、技术氛围浓厚的学习圈子。这个圈子改变了我,从大家的反馈看也改变了很多人。9、有问题,必然有方法。有方法就有方法论。但是,大家都太忙,牛逼的人去搞更牛逼的事,很少有人喜欢总结。我写博客10年+,我发现,这些牛逼人不愿意干的是,其实就是我的机会。10、用点滴的积累形成坚不可摧的壁垒,10年作为一个周期,价值比1年更大。因为,我们看不了那么远,才可以充满幻想,甚至这些幻想不切实际。正如马老师所说,万一实现了呢?11、相信集体的力量、相信社群的力量!1+1+1+......+1
2022年5月28日
其他

用 Elasticsearch 造个“知网”难不难?

行。取名为:织网知识库检索系统。此“织网”非彼“知网”。“织”强调的“精耕细作、日积月累、功不唐捐、水滴石穿”。首页列表页详情页各位基础稳定数据统计如下:本系统涉及的文档数比较少,但要对
2022年5月24日
其他

干货 | Elasticsearch 8.X 节点角色划分深入详解

预处理节点、不是机器学习节点、不是XXX各种节点.....而节点角色的出现“革命性”的结局了这个问题,如下所示,只需要说明我是某某某,而不需要费劲巴拉的解释我不是某某某。node.roles:
2022年5月13日
其他

Elasticsearch 快照生命周期管理 (SLM) 实战指南

400}也可以从磁盘的角度考虑,周期时间越多,备份的次数越多,涉及重复备份数据越多,磁盘会扛不住。星期部分的“?”问号指代的是——当我们不关心是星期几的时候,都可以使用“?”问号代表。"name":
2022年5月5日
其他

干货 | Elasticsearch 数据建模指南

组合查询语句来实现。为了避免这种情况,最好的方式就是提前建模。每一类业务数据的相同或者相似字段,采取统一建模的方式。下面我们举一个实际的例子加以分析。微博、微信、Twitter、Facebook
2022年4月25日
其他

干货 | Elasticsearch 检索类型选型指南

Query应用场景:前缀匹配。先看一个社区实战问题:https://elasticsearch.cn/question/12595比如我有3个文档,采用ik_max_word分词。1.
2022年4月17日
其他

从一个线上问题看 Elasticsearch 数据清洗方式

如下问题来自真实场景,用对话方式模拟还原问题解答过程。小明同学提问:铭毅老湿,如下两个链接,我们底层的数据是带空格的,但是用户输入可能不带空格这种改怎么处理?http://192.168.1.1/sr/6mm/http://192.168.1.1/sr/6%20mm/铭毅老湿:上面两个链接是用户的行为?我们不能限制用户的输入是吧?小明同学:是哦,让用户输入字符加空格或者不加空格去适配写入的数据,这样会显得系统很不“智能”,用户体验会很差。铭毅老湿:你能关注用户体验,不错!这是程序员必备的思维方式。小明同学:那怎么解决类似问题呢?铭毅老湿:其实最简单、最常用的解决方式就是:写入前做好数据清洗,去掉“特殊字符”、“空格”等。图片来自互联网小明同学:这个我知道,不就是ETL嘛!包含数据的抽取、转换和加载。ETL着重体现在一些数据清洗转化功能,比如空值处理、规范化数据、数据替换、数据验证等等。。。咦,我的问题不就是“空值处理”嘛~~铭毅老湿:那你说说怎么弄?小明同学:“一脸的疑惑似乎舒缓了一些”,写入前去掉空格。java
2022年4月10日
其他

用 Elasticsearch 统计做了几次核酸检测?怎么破?

满足条件的人?这两个问题本质是一类问题,这类问题涉及技术选型、方案选型、实现细节等问题,本篇文章我们一并讨论一下。2、关于选型先看
2022年3月30日
其他

看着非常炫酷的Kibana可视化,你也可以搞定!

作为用户界面的核心,集成了丰富的可视化工具、界面交互开发工具和管理工具,帮助开发人员将数据轻松分享给任何人,甚至还能通过机器学习来监测数据中的隐藏异常并追溯其来源。以这四大核心产品为基础构建的
2022年3月28日
其他

Windows 部署 Elasticsearch + kibana 8.0 指南

264b58e0f92f1e7492cc4cd407aac886012b026af6a20d777a05cd0ddccb43b4}]三、更新了哪些认知?这和早期版本使用不太一样的。我习惯配置成本地
2022年3月23日
其他

云服务器 Centos7 部署 Elasticsearch 8.0 + Kibana 8.0 指南

1、昨晚上更新云服务器部署8.0视频Part1:https://t.zsxq.com/UJ6AY7yPart2:https://t.zsxq.com/YzVrZJq2、Elasticsearch
2022年3月23日
其他

Elasticsearch 集群状态变成黄色或者红色,怎么办?

_cat/shards?v=true&h=index,shard,prirep,state,node,unassigned.reason&s=state几个参数解释如下:v=true,
2022年3月13日
其他

干货 | Elasticsearch Nested 数组大小求解,一网打尽!

02:02:02","customerPersonId":103,"lossStatus":"ENABLE"}]}开搞,方案逐步展开讨论。3、问题拆解涉及三个核心知识点:其一:检索数据涉及
2022年3月7日
其他

Elasticsearch 出现 “429 rejected” 报错,怎么办?

负载的形式导致系统负载升高。如果在存在过多频繁的写入操作,集群可能会变得饱和。这可能会对其他操作产生不利影响,例如搜索、集群协调和后台处理。为了防止这些问题,Elasticsearch
2022年2月28日
其他

阿里云大佬叮嘱我务必要科普这个 Elasticsearch API

kibana_sample_data_logs_ext/_disk_usage?run_expensive_tasks=true官方并没有统计,我把结果数据梳理统计了一下,如下两张图所示:说明了啥?
2022年2月25日
其他

Elasticsearch JVM 堆内存使用率飙升,怎么办?

https://www.elastic.co/guide/en/elasticsearch/reference/current/fix-common-cluster-issues.html2.
其他

esrally 如何进行简单的自定义性能测试?

8)个请求。总的来说,所有客户端每秒将发出1000个请求。如果Rally报告的吞吐量小于指定的吞吐量,那么Elasticsearch就无法到达它。target-interval(可选):这仅仅是1
2022年2月14日
其他

Elasticsearch 断路器报错了,怎么办?

breaker),规定了所有断路器可以使用的内存总量。如果Elasticsearch估计某项操作会导致内存使用率超过断路器设置的上限,它会停止操作并返回错误。默认情况下,父级断路器在
其他

比快更快,Elasticsearch 8.0 正式发布!

端更多安全配置推荐阅读:https://www.elastic.co/guide/en/kibana/current/configuring-tls.html猜测
2022年2月12日
其他

如何从0到1打磨一门 Elasticsearch 线上直播课?

相关数据可视化效果图长津湖影评数据可视化效果图第二:将项目实战经验+认证内训经验充分融合进直播课。第三:现场边敲边演示。能现场敲代码、能现场部署演示的就不用准备好的资料。带领所有学员建立从
2022年2月10日
其他

MetricBeat + Elasticsearch + Kibana 实现监控指标可视化

版本要一致。安全需要建议做好最小化或者基础安全配置,也就是说,至少设置上用户名和密码。推荐更快下载地址:http://dl.elasticsearch.cn/3.2
2022年2月8日
其他

Elasitcsearch CPU 使用率突然飙升,怎么办?

https://www.elastic.co/guide/en/elasticsearch/reference/current/fix-common-cluster-issues.html
其他

Elasticsearch 磁盘使用率超过警戒水位线,怎么办?

null}}5、小结为避免磁盘使用率吃紧的问题,建议如下:第一:“不等下雨天之前就修好屋顶”,而不是“下了雨之后应急修补屋顶”。第二:做好磁盘使用率监控和预警操作。第三:提前规划设置