river
  代表es的一个数据源,也是其它存储方式(如:数据库)同步数据到es的一个方法。它是以插件方式存在的一个es服 务,通过读取river中的数据并把它索引到es中,官方的river有couchDB的,RabbitMQ的,Twitter的,Wikipedia 的。
  gateway
  代表es索引的持久化存储方式,es默认是先把索引存放到内存中,当内存满了时再持久化到硬盘。当这个es集群关闭再 重新启动时会从gateway中读取索引数据。es支持多种类型的gateway,有本地文件系统(默认),分布式文件系统,Hadoop的HDFS和 amazon的s3云存储服务。
  discovery.zen
  代表es的自动发现节点机制,es是一个基于p2p的系统,它先通过广播寻找存在的节点,再通过多播协议来进行节点之间的通信,同时也支持点对点的交互。
  Transport
  代表es内部节点或集群与客户端的交互方式,默认内部是使用tcp协议进行交互,同时它支持http协议(json格式)、thrift、servlet、memcached、zeroMQ等的传输协议(通过插件方式集成)。
  分布式搜索elasticsearch中文分词集成
  elasticsearch官方只提供smartcn这个中文分词插件,效果不是很好,好在国内有medcl大神(国内早研究es的人之一)写的两个中文分词插件,一个是ik的,一个是mmseg的,下面分别介绍下两者的用法,其实都差不多的,先安装插件,命令行:
  安装ik插件:
  plugin -install medcl/elasticsearch-analysis-ik/1.1.0
  下载ik相关配置词典文件到config目录
  cd config
  wget http://github.com/downloads/medcl/elasticsearch-analysis-ik/ik.zip --no-check-certificate
  unzip ik.zip
  rm ik.zip
  安装mmseg插件:
  bin/plugin -install medcl/elasticsearch-analysis-mmseg/1.1.0
  下载相关配置词典文件到config目录
  cd config
  wget http://github.com/downloads/medcl/elasticsearch-analysis-mmseg/mmseg.zip --no-check-certificate
  unzip mmseg.zip
  rm mmseg.zip
  分词配置
  ik分词配置,在elasticsearch.yml文件中加上
  index:
  analysis:
  analyzer:
  ik:
  alias: [ik_analyzer]
  type: org.elasticsearch.index.analysis.IkAnalyzerProvider
  或
  index.analysis.analyzer.ik.type : “ik”
  这两句的意义相同
  mmseg分词配置,也是在在elasticsearch.yml文件中
  index:
  analysis:
  analyzer:
  mmseg:
  alias: [news_analyzer, mmseg_analyzer]
  type: org.elasticsearch.index.analysis.MMsegAnalyzerProvider
  或
  index.analysis.analyzer.default.type : "mmseg"
  mmseg分词还有些更加个性化的参数设置如下
index:
analysis:
tokenizer:
mmseg_maxword:
type: mmseg
seg_type: "max_word"
mmseg_complex:
type: mmseg
seg_type: "complex"
mmseg_simple:
type: mmseg
seg_type: "simple"
  这样配置完后插件安装完成,启动es会加载插件。