spark (2)spark开发环境搭建

阅读更多

 

(1)初学者对于spark的几个疑问 http://aperise.iteye.com/blog/2302481
(2)spark开发环境搭建 http://aperise.iteye.com/blog/2302535
(3)Spark Standalone集群安装介绍 http://aperise.iteye.com/blog/2305905
(4)spark-shell 读写hdfs 读写redis 读写hbase http://aperise.iteye.com/blog/2324253

 

spark开发环境搭建

  • jdk下载安装
  • Scala下载安装
  • Scala IDE for Eclipse下载安装
  • IntelliJ IDEA for scala下载安装
  • IntelliJ IDEA Ultimate破解版安装
  • 在线安装SCALA插件
  • 离线安装SCALA插件
  • 创建maven scala工程
  • intellij IDEA 常用设置
  • intellij IDEA本地开发无法解析hadoop ha下虚拟的ha-cluster名称

       spark源代码开发语言是Scala,Scala是一个基于JVM的开发语言,所以后期开发最好是选择Scala,因为可以不断的练习你的Scala开发技能,从而更深入的去查看spark源代码,更深层次提高自己能力。

        spark支持的比较好的语言还有java和Python,这里只讲Scala开发环境搭建

 

1.JDK安装

    Oracle官网各种java版本下载地址:http://www.oracle.com/technetwork/java/archive-139210.html 

spark (2)spark开发环境搭建_第1张图片 

    (1)jdk下载

        jdk1.7下载 http://download.oracle.com/otn-pub/java/jdk/7u79-b15/jdk-7u79-linux-x64.tar.gz

spark (2)spark开发环境搭建_第2张图片
        jdk1.8下载 http://www.oracle.com/technetwork/java/javase/downloads/jdk8-downloads-2133151.html

spark (2)spark开发环境搭建_第3张图片
        jdk版本上选择看自己需求,然后自己去下载。

 

    (2)jdk环境变量配置

        我的jdk1.7所在位置为:D:\Java\jdk1.7.0_55

        设置环境变量JAVA_HOME如下:

        JAVA_HOME=D:\Java\jdk1.7.0_55

        设置环境变量CLASSPATH如下:

        CLASSPATH=.;%JAVA_HOME%\lib;%JAVA_HOME%\lib\tools.jar

        设置环境变量PATH,这里注意了,不要把PATH全部覆盖了,毕竟这里有windows环境下DOS命令配置,这里要做的是将;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;追加到PATH环境变量之后如下

        PATH=这里是之前已经存在的PATH变量值;%JAVA_HOME%\bin;%JAVA_HOME%\jre\bin;

        测试JDK是否安装成功,命令窗口输入java  -version查看java版本

spark (2)spark开发环境搭建_第4张图片
  

2.Scala安装

    (1)scala下载

        Scala 2.10.6下载http://www.scala-lang.org/download/2.10.6.html

spark (2)spark开发环境搭建_第5张图片

        Scala 2.11.8下载http://www.scala-lang.org/download/2.11.8.html

spark (2)spark开发环境搭建_第6张图片     (2)Scala环境变量配置

       官网关于Scala环境变量设置介绍地址http://www.scala-lang.org/documentation/getting-started.html

spark (2)spark开发环境搭建_第7张图片

        我的Scala的位置为:D:\scala\scala-2.10.6

        设置环境变量SCALA_HOME如下:

        SCALA_HOME=D:\scala\scala-2.10.6

        设置环境变量PATH,这里注意了,不要把PATH全部覆盖了,毕竟这里有windows环境下DOS命令配置,这里要做的是将;%SCALA_HOME%\bin追加到PATH环境变量之后如下

        PATH=这里是之前已经存在的PATH变量值;%SCALA_HOME%\bin

        设置完毕后,在命令窗口检测是否Scala安装成功

spark (2)spark开发环境搭建_第8张图片
 

 

3.IDE工具安装

    (1)Scala IDE for Eclipse

spark (2)spark开发环境搭建_第9张图片
 

        下载地址:http://scala-ide.org/download/sdk.html

spark (2)spark开发环境搭建_第10张图片
 

     (2)IntelliJ IDEA for free(java scala andorid)

        这里下载的是免费版本的IntelliJ IDEA,如下图

spark (2)spark开发环境搭建_第11张图片
         下载地址为:http://www.jetbrains.com/idea/download/download-thanks.html?code=IIC

spark (2)spark开发环境搭建_第12张图片
 

4.IntelliJ IDEA Ultimate破解版安装

    4.1 下载地址:https://www.jetbrains.com/idea/download/#section=windows

spark (2)spark开发环境搭建_第13张图片
 

    在官网下载最新idea Ultimate版(默认只能免费使用一个月,后面会讲破解),也就是任何功能不受限制的版本。

    

    4.2 下载IntelliJ IDEA破解文件

          百度云链接:http://pan.baidu.com/s/1geJ108z 密码:qdzi

spark (2)spark开发环境搭建_第14张图片
 

    4.3 安装IntelliJ IDEA

         这里我下载的是ideaIU-2016.2.4.exe,双击安装,步骤如下:

spark (2)spark开发环境搭建_第15张图片
spark (2)spark开发环境搭建_第16张图片
 
spark (2)spark开发环境搭建_第17张图片
 
spark (2)spark开发环境搭建_第18张图片
 
spark (2)spark开发环境搭建_第19张图片


     4.4 激活IntelliJ IDEA

           首先解压IntelliJ IDEA 16破解.rar,得到如下文件:

spark (2)spark开发环境搭建_第20张图片
     双击运行文件IntelliJIDEALicenseServer_windows_386.exe

spark (2)spark开发环境搭建_第21张图片
     运行已经安装的IntelliJ IDEA,首次运行会提示只有30天的使用期限,也可以输入购买的lisense,这里说下如何破解:


spark (2)spark开发环境搭建_第22张图片
     点击OK,然后选择Lisence Server并且输入激活服务器地址http://127.0.0.1:1017
spark (2)spark开发环境搭建_第23张图片
     激活成功后出现如下界面:
spark (2)spark开发环境搭建_第24张图片
    激活成功时候,原来的激活服务窗口提示如下:


spark (2)spark开发环境搭建_第25张图片
    

 

5.在线安装SCALA插件

    破解完Intellij IDEA后,首次打开时候,scala插件默认是没有安装的,这时候需要自己手动安装,这里讲解如何在线安装。


spark (2)spark开发环境搭建_第26张图片
 
spark (2)spark开发环境搭建_第27张图片
     如果你已经打开intellij IDEA,可以在如下菜单找到插件安装窗口
spark (2)spark开发环境搭建_第28张图片
     如下步骤继续:
spark (2)spark开发环境搭建_第29张图片
 
spark (2)spark开发环境搭建_第30张图片
 
spark (2)spark开发环境搭建_第31张图片
 
spark (2)spark开发环境搭建_第32张图片
 

 

6.离线安装SCALA插件

    下载的插件版本和地址在这里已经有提示了


spark (2)spark开发环境搭建_第33张图片
 
spark (2)spark开发环境搭建_第34张图片
 
spark (2)spark开发环境搭建_第35张图片
 
spark (2)spark开发环境搭建_第36张图片
 
spark (2)spark开发环境搭建_第37张图片
 

 

 7.创建maven scala工程

    7.1 File->New Project
spark (2)spark开发环境搭建_第38张图片

    7.2 set Project SDK
spark (2)spark开发环境搭建_第39张图片

    7.3 create from achetype

spark (2)spark开发环境搭建_第40张图片

    7.4 set Groupid and antifactid
spark (2)spark开发环境搭建_第41张图片

    7.5 set maven
spark (2)spark开发环境搭建_第42张图片

    7.6 set project name
spark (2)spark开发环境搭建_第43张图片
     7.7 change maven pom.xml


    4.0.0
    com.XXX
    spark-offline
    1.0-SNAPSHOT
    jar
    2008
    
        2.10.5
        1.6.0
        2.7.1
        2.9.0
        2.4.2
        1.2.1

        
        UTF-8
    

    
        
            scala-tools.org
            Scala-Tools Maven2 Repository
            http://scala-tools.org/repo-releases
        
    

    
        
            scala-tools.org
            Scala-Tools Maven2 Repository
            http://scala-tools.org/repo-releases
        
    

    
        
            org.scala-lang
            scala-library
            ${scala.version}
        
        
            junit
            junit
            4.4
            test
        
        
            org.specs
            specs
            1.2.5
            test
        

        
        
            org.apache.spark
            spark-core_2.10
            ${spark.version}
        
        
            org.apache.spark
            spark-sql_2.10
            ${spark.version}
        
        
        
            org.apache.hadoop
            hadoop-client
            ${hadoop.version}
        
        
        
            redis.clients
            jedis
            ${jedis.version}
        
        
            org.apache.commons
            commons-pool2
            ${commons-pool2.version}
        
        
        
            org.apache.hbase
            hbase-client
            ${hbase.version}
        
        
            org.apache.hbase
            hbase-common
            ${hbase.version}
        
        
            org.apache.hbase
            hbase-server
            ${hbase.version}
        
    

    
        src/main/scala
        src/test/scala
        
            
                org.scala-tools
                maven-scala-plugin
                
                    
                        
                            compile
                            testCompile
                        
                    
                
                
                    ${scala.version}
                    
                        -target:jvm-1.5
                    
                
            
            
                org.apache.maven.plugins
                maven-eclipse-plugin
                
                    true
                    
                        ch.epfl.lamp.sdt.core.scalabuilder
                    
                    
                        ch.epfl.lamp.sdt.core.scalanature
                    
                    
                        org.eclipse.jdt.launching.JRE_CONTAINER
                        ch.epfl.lamp.sdt.launching.SCALA_CONTAINER
                    
                
            
        
    
    
        
            
                org.scala-tools
                maven-scala-plugin
                
                    ${scala.version}
                
            
        
    

     

7.8 use maven plugin install scala project
spark (2)spark开发环境搭建_第44张图片
 

 8.intellij IDEA 常用设置

    8.1 set UI theme


spark (2)spark开发环境搭建_第45张图片
    设置完成后,效果如下:


spark (2)spark开发环境搭建_第46张图片
 

    8.2 set font and colors

    为了不破坏默认的配置,首先我们需要另存一个自己的配置文件,这里取名myself
spark (2)spark开发环境搭建_第47张图片
 

    这里我们将代码字体调大到16
spark (2)spark开发环境搭建_第48张图片
 

     8.3 set code template

/** 
 * Project Name:${PROJECT_NAME} 
 * File Name:${FILE_NAME} 
 * Package Name:${PACKAGE_NAME} 
 * Date:${DATE}${TIME}  
 * User:${USER} 
 * Description: TODO
 * Copyright (c) ${year}, [email protected] All Rights Reserved. 
 */

 
spark (2)spark开发环境搭建_第49张图片
 

    8.4 SET SCALA SDK
spark (2)spark开发环境搭建_第50张图片
 
spark (2)spark开发环境搭建_第51张图片
 
spark (2)spark开发环境搭建_第52张图片
 
spark (2)spark开发环境搭建_第53张图片
 

    8.4 export your own settings and import your own settings anlywhere

    在项目开发过成中,已经设置了很多代码模板、代码编程风格,这些个性化设置可以很方便的导出以便后续使用,这里导出步骤如下:


spark (2)spark开发环境搭建_第54张图片
     在任意地方,你可以导入之前已经保存的个性化设置文件settings.jar


spark (2)spark开发环境搭建_第55张图片
 

    8.5 keymap Refrence

     详见附件“Intellij IDEA default keymap.pdf”

 

9.intellij IDEA本地开发无法解析hadoop ha下虚拟的ha-cluster名称

    9.1.windows本地使用intellij IDEA开发spark

    hadoop安装的是采用HA的方式,现在本地开发环境开发spark时候,无法解析hadoop-ha方式下的cluster名称,原因是本地程序不知道加载的cluster ha对应的namenode名称和IP,解决办法是通过sparkconf追加参数,让spark 本地local模式知道hadoop ha配置,如下

val spark = SparkSession  
  .builder()  
  .master("local[2]")  
  .appName("HtSecApp UserEvent Processor")  
  .getOrCreate()  
  
val sc = spark.sparkContext  
val hadoopConf = sc.hadoopConfiguration  
  
hadoopConf.set("dfs.nameservices", "mycluster")  
hadoopConf.set("dfs.client.failover.proxy.provider.mycluster", "org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider")  
hadoopConf.set("dfs.ha.namenodes.mycluster", "nn1,nn2")  
hadoopConf.set("dfs.namenode.rpc-address.mycluster.nn1", "192.168.77.38:9000")  
hadoopConf.set("dfs.namenode.rpc-address.mycluster.nn2", "192.168.77.39:9000")  

    解决如下问题:
spark (2)spark开发环境搭建_第56张图片
 

    9.2.服务端spark无法解析hadoop ha解决办法

        首先spark-env.sh里添加参数让spark知道哪里加载hadoop ha配置文件:

xport HADOOP_HOME=/home/hadoop/hadoop-2.7.1
export HADOOP_CONF_DIR=${HADOOP_HOME}/etc/hadoop
export HADOOP_USER_CLASSPATH_FIRST=true

       其次采用spark-submit时候可以明确指定参数--files让spark读取额外的hadoop配置

./spark-submit \
    --master spark://hadoop31:7077,hadoop35:7077 \
    --class "com.xxx.offline.FridayReportAnalysis" \
    --files "/home/hadoop/hadoop-2.7.1/etc/hadoop/core-site.xml,/home/hadoop/hadoop-2.7.1/etc/hadoop/hdfs-site.xml" \
    /home/hadoop/sparkoffline/spark-offline-1.0-SNAPSHOT.jar \
    20170303

 

  • spark (2)spark开发环境搭建_第57张图片
  • 大小: 49.8 KB
  • spark (2)spark开发环境搭建_第58张图片
  • 大小: 44.3 KB
  • spark (2)spark开发环境搭建_第59张图片
  • 大小: 36.4 KB
  • spark (2)spark开发环境搭建_第60张图片
  • 大小: 54.1 KB
  • spark (2)spark开发环境搭建_第61张图片
  • 大小: 53 KB
  • spark (2)spark开发环境搭建_第62张图片
  • 大小: 25.5 KB
  • spark (2)spark开发环境搭建_第63张图片
  • 大小: 35.4 KB
  • spark (2)spark开发环境搭建_第64张图片
  • 大小: 63.3 KB
  • spark (2)spark开发环境搭建_第65张图片
  • 大小: 173.6 KB
  • spark (2)spark开发环境搭建_第66张图片
  • 大小: 77.6 KB
  • spark (2)spark开发环境搭建_第67张图片
  • 大小: 228.5 KB
  • spark (2)spark开发环境搭建_第68张图片
  • 大小: 15.2 KB
  • spark (2)spark开发环境搭建_第69张图片
  • 大小: 92.5 KB
  • spark (2)spark开发环境搭建_第70张图片
  • 大小: 28.2 KB
  • spark (2)spark开发环境搭建_第71张图片
  • 大小: 26 KB
  • spark (2)spark开发环境搭建_第72张图片
  • 大小: 31 KB
  • spark (2)spark开发环境搭建_第73张图片
  • 大小: 23.9 KB
  • spark (2)spark开发环境搭建_第74张图片
  • 大小: 54.5 KB
  • spark (2)spark开发环境搭建_第75张图片
  • 大小: 92.5 KB
  • spark (2)spark开发环境搭建_第76张图片
  • 大小: 73.7 KB
  • spark (2)spark开发环境搭建_第77张图片
  • 大小: 64.1 KB
  • spark (2)spark开发环境搭建_第78张图片
  • 大小: 36 KB
  • spark (2)spark开发环境搭建_第79张图片
  • 大小: 138.4 KB
  • spark (2)spark开发环境搭建_第80张图片
  • 大小: 95.2 KB
  • spark (2)spark开发环境搭建_第81张图片
  • 大小: 137 KB
  • spark (2)spark开发环境搭建_第82张图片
  • 大小: 74.9 KB
  • spark (2)spark开发环境搭建_第83张图片
  • 大小: 172 KB
  • spark (2)spark开发环境搭建_第84张图片
  • 大小: 96.3 KB
  • spark (2)spark开发环境搭建_第85张图片
  • 大小: 62.8 KB
  • spark (2)spark开发环境搭建_第86张图片
  • 大小: 63.6 KB
  • spark (2)spark开发环境搭建_第87张图片
  • 大小: 67.5 KB
  • spark (2)spark开发环境搭建_第88张图片
  • 大小: 66 KB
  • spark (2)spark开发环境搭建_第89张图片
  • 大小: 66.5 KB
  • spark (2)spark开发环境搭建_第90张图片
  • 大小: 31.8 KB
  • spark (2)spark开发环境搭建_第91张图片
  • 大小: 89.5 KB
  • spark (2)spark开发环境搭建_第92张图片
  • 大小: 99.8 KB
  • spark (2)spark开发环境搭建_第93张图片
  • 大小: 161.8 KB
  • spark (2)spark开发环境搭建_第94张图片
  • 大小: 134.2 KB
  • spark (2)spark开发环境搭建_第95张图片
  • 大小: 147.2 KB
  • spark (2)spark开发环境搭建_第96张图片
  • 大小: 36.5 KB
  • spark (2)spark开发环境搭建_第97张图片
  • 大小: 70.2 KB
  • spark (2)spark开发环境搭建_第98张图片
  • 大小: 39.8 KB
  • spark (2)spark开发环境搭建_第99张图片
  • 大小: 118.5 KB
  • spark (2)spark开发环境搭建_第100张图片
  • 大小: 178.4 KB
  • spark (2)spark开发环境搭建_第101张图片
  • 大小: 155.8 KB
  • spark (2)spark开发环境搭建_第102张图片
  • 大小: 177.2 KB
  • spark (2)spark开发环境搭建_第103张图片
  • 大小: 86.5 KB
  • spark (2)spark开发环境搭建_第104张图片
  • 大小: 193 KB
  • spark (2)spark开发环境搭建_第105张图片
  • 大小: 93.2 KB
  • spark (2)spark开发环境搭建_第106张图片
  • 大小: 65.1 KB
  • spark (2)spark开发环境搭建_第107张图片
  • 大小: 29.4 KB
  • spark (2)spark开发环境搭建_第108张图片
  • 大小: 43.8 KB
  • spark (2)spark开发环境搭建_第109张图片
  • 大小: 126.8 KB
  • spark (2)spark开发环境搭建_第110张图片
  • 大小: 148.1 KB
  • Intellij_IDEA_default_keymap.pdf (156.1 KB)
  • 下载次数: 4
  • spark (2)spark开发环境搭建_第111张图片
  • 大小: 18 KB
  • spark (2)spark开发环境搭建_第112张图片
  • 大小: 47.5 KB
  • 查看图片附件

你可能感兴趣的:(spark,开发,环境,搭建)