问题说明
某一天收到报警,线上的Elasticsearch集群中的一台节点CPU达到了99%,查看Elasticsearch的其他节点CPU都是正常的,唯独这台服务器CPU久满不下。
如下图:
Elasticsearch 集群说明
生产Elasticsearch 集群配置:
- 六台节点,其中数据节点为3台,两台master,1台client。
- 版本:5.6.4
出问题的节点为node-3。
由于资源有限将两个节点放到了一台机器上。
role | ip | host | port api | transport | hostname | cpu | mem | disk |
---|---|---|---|---|---|---|---|---|
es master-1 | 172.x.x.38 | da02 | 9221 | 9444 | da02 | 4C | 16G | 500G |
es master-2 | 172.x.x.221 | da03 | 9221 | 9444 | da03 | 4C | 16G | 500G |
es clinet | 172.x.x.37 | da01 | 9220 | 9333 | da01 | 4C | 16G | 500G |
es node-1 | 172.x.x.37 | da01 | 9221 | 9334 | da01 | 4C | 16G | 500G |
es node-2 | 172.x.x.38 | da02 | 9220 | 9333 | da02 | 4C | 16G | 500G |
es node-3 | 172.x.x.221 | da03 | 9222 | 9555 | da03 | 4C | 16G | 500G |