SparkÓëMysqlµÄ½»»¥

×÷Õß£ºÍøÂç×ªÔØ ·¢²¼Ê±¼ä£º[ 2016/9/28 10:07:03 ] ÍÆ¼ö±êÇ©£ºMySQL Êý¾Ý¿â

¡¡¡¡±³¾°
¡¡¡¡SparkÔÚ¶ÔÄ¿±êÊý¾Ý½øÐÐ¼ÆËãºó£¬RDD¸ñÊ½µÄÊý¾ÝÒ»°ã¶¼»á´æÔÚHDFS£¬Hive£¬HBaseÖÐ£¬ÁíÒ»·½Ãæ£¬¶ÔÓÚ·ÇRDD¸ñÊ½µÄÊý¾Ý£¬¿ÉÄÜ»á´æ·ÅÔÚÏñMysqlÖÐÕâÖÖ´«Í³µÄRDMSÖÐ.
¡¡¡¡µ«ÊÇÐ´Èë¹ý³ÌÖÐ¾³£³öÏÖ¸÷ÖÖ¸÷ÑùµÄÎÊÌâ£¬ stackoverflowÉÏÓÐºÜ¶àÌû×Ó:
¡¡¡¡Error writing spark dataframe to mysql table JDBC batch insert performance
¡¡¡¡»¹ÓÐÐ©ÆäËûµÄÌù
¡¡¡¡- Using Apache Spark and MySQL for Data Analysis
¡¡¡¡- spark 1.3.0 ½«dataframeÊý¾ÝÐ´ÈëHive·ÖÇø±í
¡¡¡¡- Spark¶ÁÈ¡Êý¾Ý¿â(Mysql)µÄËÄÖÖ·½Ê½Ïê½â
¡¡¡¡- ÍêÕûjava¿ª·¢ÖÐJDBCÁ¬½ÓÊý¾Ý¿â´úÂëºÍ²½Öè
¡¡¡¡- Spark²È¿Ó¼Ç——Êý¾Ý¿â£¨Hbase+Mysql£©
¡¡¡¡RDD
¡¡¡¡Spark SQLÍ¨¹ýJDBCÁ¬½ÓMySQL¶ÁÐ´Êý¾Ý
¡¡¡¡·ÇRDD
¡¡¡¡import java.sql.{Date£¬ DriverManager£¬ PreparedStatement£¬ Connection}
¡¡¡¡/*
¡¡¡¡tableName = "tempTableName"
¡¡¡¡columns = [key : String£¬ value : Int]
¡¡¡¡DBIP = 10.10.10.10
¡¡¡¡DBPort = 8888
¡¡¡¡DB = tempDB
¡¡¡¡*/
¡¡¡¡def connection2Mysql() = {
¡¡¡¡var conn : Connection = null
¡¡¡¡var ps : PreparedStatement = nulll
¡¡¡¡val userName = "admin"
¡¡¡¡val passwd = "admin"
¡¡¡¡val key = "Tom"
¡¡¡¡val value = 1024
¡¡¡¡val sql = "INSERT INTO tempTableName(key£¬value) values (?£¬?)"
¡¡¡¡try {
¡¡¡¡Class.forName("com.mysql.jdbc.Driver").newInstance
¡¡¡¡conn = DriverManager.getConnection("jdbc:mysql://10.10.10.10:8888/tempDB"£¬ userName£¬ passwd)
¡¡¡¡ps = conn.prepareStatement(sql)
¡¡¡¡ps.setDate(1£¬ key)
¡¡¡¡ps.setLong(2£¬ value)
¡¡¡¡ps.executeUpdate()
¡¡¡¡} catch {
¡¡¡¡case e: Exception => println("----> Exception! : " + e + "<-----")
¡¡¡¡} finally {
¡¡¡¡if (ps != null) ps.close()
¡¡¡¡if (conn != null) conn.close()
¡¡¡¡}
¡¡¡¡}
¡¡¡¡ÕâÀï»áÓöµ½µÄÒ»¸öÎÊÌâÊÇ£¬ÔÚ±¾µØÆô¶¯client½øÐÐ¹¦ÄÜ¼ì²é£¬·½·¨ÊÇ¿ÉÐÐµÄ£¬µ«ÊÇÍ¨¹ýsubmitÌá½»¸øYARNÖ®ºó£¬È´±»±¨´í
¡¡¡¡java.sql.SQLException: No suitable driver found for jdbc:mysql://10.10.10.10:8888/tempDB
¡¡¡¡»òÊÇ
¡¡¡¡Error:java.lang.ClassNotFoundException: com.mysql.jdbc.Driver
¡¡¡¡·¢ÉúÕâÖÖÇé¿öµÄÔÒòÊÇÒòÎªÔÚÉÏÊö´úÂëÖÐ£¬Ã»ÓÐÕÒµ½¶ÔÓ¦µÄÀà£¬¼´Class.forName("com.mysql.jdbc.Driver").newInstance ÕâÐÐ´úÂë³öÏÖÁËÎÊÌâ. ÕâÐÐ´úÂëµÄÄ¿µÄÊÇ¶Ôdriver½øÐÐ×¢²á£¬²é¿´DriverÔ´Âë£¬ÈçÏÂËùÊ¾:
¡¡¡¡/**
¡¡¡¡* The Java SQL framework allows for multiple database drivers. Each driver should supply a class that implements the Driver interface
¡¡¡¡*
¡¡¡¡* The DriverManager will try to load as many drivers as it can find and then for any given connection request£¬ it will ask each driver in turn to try to
¡¡¡¡* connect to the target URL.
¡¡¡¡*
¡¡¡¡* It is strongly recommended that each Driver class should be small and standalone so that the Driver class can be loaded and queried without bringing in vast
¡¡¡¡* quantities of supporting code.
¡¡¡¡*
¡¡¡¡* When a Driver class is loaded£¬ it should create an instance of itself and register it with the DriverManager. This means that a user can load and register a
¡¡¡¡* driver by doing Class.forName("foo.bah.Driver")
¡¡¡¡*/
¡¡¡¡public class Driver extends NonRegisteringDriver implements java.sql.Driver {
¡¡¡¡// Register ourselves with the DriverManager
¡¡¡¡static {
¡¡¡¡try {
¡¡¡¡java.sql.DriverManager.registerDriver(new Driver());
¡¡¡¡} catch (SQLException E) {
¡¡¡¡throw new RuntimeException("Can't register driver!");
¡¡¡¡}
¡¡¡¡}
¡¡¡¡/**
¡¡¡¡* Construct a new driver and register it with DriverManager
¡¡¡¡* @throws SQLException if a database error occurs.
¡¡¡¡*/
¡¡¡¡public Driver() throws SQLException {
¡¡¡¡// Required for Class.forName().newInstance()
¡¡¡¡}
¡¡¡¡}
¡¡¡¡³öÏÖÕâ¸öÎÊÌâÓÐ¶àÖÖ¿ÉÄÜ£¬
¡¡¡¡1. ÔÚ–jars²ÎÊýÀïÃæ¼ÓÈëMysql jar°üÒýÓÃÊÇÃ»ÓÐÓÃµÄ. ÐèÒªÍ¨¹ý¼ÓÈë–driver-class-path²ÎÊýÀ´ÉèÖÃdriverµÄclasspath.
¡¡¡¡$ bin/spark-submit --master local[2] --driver-class-path lib/mysql-connector-java-5.1.38.jar --class temp.jar
¡¡¡¡ÔÒòÊÇÁ½Õß·Ö·¢µÄnode²»Í¬£¬ link
¡¡¡¡–driver-class-path driverËùÒÀÀµµÄ°ü£¬¶à¸ö°üÖ®¼äÓÃÃ°ºÅ(:)·Ö¸î
¡¡¡¡–jars driverºÍexecutor¶¼ÐèÒªµÄ°ü£¬¶à¸ö°üÖ®¼äÓÃ¶ººÅ(£¬)·Ö¸î
¡¡¡¡2. Ê¹ÓÃÒÀÀµ½á¹û´ò°üµÄÊ±ºòÃ»ÓÐ½«¶ÔÓ¦jar°üµ¼Èë.
¡¡¡¡Ê¹ÓÃÒÀÀµµÄÊ±ºòÐèÒª½«¶ÔÓ¦jar°ü´òÈëÖÕµÄjar°üÖÐ£¬ÕâÑù²ÅÄÜÕýÈ·µÄÕÒµ½¶ÔÓ¦µÄÀàÃû²¢³É¹¦×¢²á.
¡¡¡¡ÀýÈç£¬ÔÚbuild.sbtÖÐÌí¼ÓÒÀÀµºó
¡¡¡¡// https://mvnrepository.com/artifact/mysql/mysql-connector-java
¡¡¡¡libraryDependencies += "mysql" % "mysql-connector-java" % "5.1.38"
¡¡¡¡ÐèÒªÔÚArtifactsÖÐÌí¼Ó¶ÔÓ¦µÄjar°ü.