ÔÚLinux¼¯ÈºÉÏ°²×°ºÍÅäÖÃSpark

×÷Õß£ºÍøÂç×ªÔØ ·¢²¼Ê±¼ä£º[ 2015/2/2 11:13:47 ] ÍÆ¼ö±êÇ©£ºLinux ²Ù×÷ÏµÍ³

¡¡¡¡5£©ÅäÖÃmapred-site.xmlÎÄ¼þ
<configuration>
/*hadoop¶Ômap-reduceÔËÐÐ¿ó½¨Ò»¹²Ìá¹©ÁË3ÖÖÊµÏÖ£¬ÔÚmapred-site.xmlÖÐÍ¨¹ý“mapreduce.framework.name”Õâ¸öÊôÐÔÀ´ÉèÖÃÎª"classic"."yarn"»òÕß“local”*/
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
/*MapReduce JobHistory ServerµØÖ·*/
<property>
<name>mapreduce.jobhistory.address</name>
<value>Master:10020</value>
</property>
/*MapReduce JobHistory Server web UI µØÖ·*/
<property>
<name>mapreduce.jobhistory.webapp.address</name>
<value>Master:19888</value>
</property>
</configuration>
¡¡¡¡£¨4£©´´½¨namenodeºÍdatanodeÄ¿Â¼£¬²¢ÅäÖÃÆäÏàÓ¦Â·¾¶
¡¡¡¡1£©´´½¨namenodeºÍdatanodeÄ¿Â¼£¬
¡¡¡¡mkdir /hdfs/namenode
¡¡¡¡mkdir /hdfs/datanode
¡¡¡¡2£©Ö´ÐÐÃüÁîºó£¬ÔÙ´Î»Øµ½Ä¿Â¼£¬ÅäÖÃhdfs-site.xmlÎÄ¼þ£¬ÔÚÎÄ¼þÖÐÌí¼ÓÈçÏÂÄÚÈÝ
<configuration>
/*ÅäÖÃÖ÷½ÚµãÃûºÍ¶Ë¿Ú*/
<property>
<name>dfs.namenode.secondary.http-address</name>
<value>Master:9001</value>
</property>
/*ÅäÖÃ´Ó½ÚµãºÍ¶Ë¿ÚºÅ*/
<property>
<name>dfs.namenode.name.dir</name>
<value>file:/hdfs/namenode</value>
</property>
/*ÅäÖÃdatanodeµÄÊý¾Ý´æ´¢Ä¿Â¼*/
<property>
<name>dfs.datanode.data.dir</name>
<value>file:/hdfs/datanode</value>
</property>
/*ÅäÖÃ¸±±¾Êý*/
<property>
<name>dfs.replication</name>
<value>3</value>
</property>
/*½«dfs.webhdfs.enabledÊôÐÔÉèÖÃÎªtrue£¬·ñÔò²»ÄÜÊ¹ÓÃwebhdfsµÄLISTSTATUS£¬LISTFILESTATUSµÈÐèÒªÁÐ³öÎÄ¼þ£¬ÎÄ¼þ¼Ð×´Ì¬µÄÃüÁî£¬ÒòÎªÕâÐ©ÐÅÏ¢¶¼ÊÇÓÉnamenode±£´æµÄ*/
<proeprty>
<name>dfs.webhdfs.enabled</name>
<value>true</value>
</property>
</configuration>
¡¡¡¡£¨5£©ÅäÖÃMasterºÍSlaveÎÄ¼þ
¡¡¡¡1£©MasterÎÄ¼þ¸ºÔðÅäÖÃÖ÷½ÚµãµÄÖ÷»úÃû
¡¡¡¡Master /*MasterÎªÖ÷½ÚµãÖ÷»úÃû*/
¡¡¡¡2£©ÅäÖÃSlavesÎÄ¼þÌí¼Ó´Ó½ÚµãÖ÷»úÃû
¡¡¡¡/*SlaveÎª´Ó½ÚµãÖ÷»úÃû*/
¡¡¡¡Slave1
¡¡¡¡Slave2
¡¡¡¡Slave3
¡¡¡¡Slave4
¡¡¡¡Slave5
¡¡¡¡£¨6£©½«HadoopËùÓÐÎÄ¼þÍ¨¹ýpssh·¢ËÍµ½¸÷¸ö½Úµã
¡¡¡¡./pssh -h hosts.txt -r /hadoop /
¡¡¡¡£¨7£©¸ñÊ½»¯Namenode£¨ÔÚHadoop¸ùÄ¿Â¼ÏÂ£©
¡¡¡¡./bin/hadoop namenode -format
¡¡¡¡£¨8£©Æô¶¯Hadoop
¡¡¡¡./sbin/start-all.sh
¡¡¡¡£¨9£©²é¿´ÊÇ·ñÅäÖÃºÍÆô¶¯³É¹¦
¡¡¡¡jps
¡¡¡¡DataNode
¡¡¡¡ResourceManager
¡¡¡¡Jps
¡¡¡¡NodeManager
¡¡¡¡NameNode
¡¡¡¡SecondaryNameNode
¡¡¡¡ps-aux|grep *DataNode* /*²é¿´DataNode½ø³Ì*/
¡¡¡¡5 °²×°Spark
¡¡¡¡1£©ÏÂÔØspark
¡¡¡¡2£©½âÑ¹
¡¡¡¡3£©ÅäÖÃ
¡¡¡¡±à¼conf/Spark-env.shÎÄ¼þ£¬¼ÓÈëÏÂÃæµÄÅäÖÃ²ÎÊý
¡¡¡¡export SCALA_HOME=/paht/to/scala-2.10.4
¡¡¡¡export SPARK_WORKER_MEMORY=7g
¡¡¡¡export SPARK_MASTER_IP=172.16.0.140
¡¡¡¡export MASTER=spark://172.16.0.140:7077
¡¡¡¡4£©ÅäÖÃslavesÎÄ¼þ
¡¡¡¡±à¼conf/slavesÎÄ¼þ£¬ÒÔ5¸öWorker½ÚµãÎªÀý£¬½«½ÚµãµÄÖ÷»úÃû¼ÓÈëslavesÎÄ¼þÖÐ
¡¡¡¡Slave1
¡¡¡¡Slave2
¡¡¡¡Slave3
¡¡¡¡Slave4
¡¡¡¡Slave5
¡¡¡¡6 Æô¶¯¼¯Èº
¡¡¡¡£¨1£©SparkÆô¶¯Óë¹Ø±Õ
¡¡¡¡1£©ÔÚSpark¸ùÄ¿Â¼Æô¶¯Spark
¡¡¡¡./sbin/start-all.sh
¡¡¡¡2£©¹Ø±ÕSpark
¡¡¡¡./sbin/stop-all.sh
¡¡¡¡£¨2£©HadoopµÄÆô¶¯Óë¹Ø±Õ
¡¡¡¡1£©ÔÚHadoop¸ùÄ¿Â¼Æô¶¯Hadoop
¡¡¡¡2£©¹Ø±ÕHadoop
¡¡¡¡£¨3£©¼ì²âÊÇ·ñ°²×°³É¹¦
¡¡¡¡1£©Õý³£×´Ì¬ÏÂµÄMaster½ÚµãÈçÏÂ¡£
¡¡¡¡2£©ÀûÓÃsshµÇÂ¼Worker½Úµã