夜古诚

Spark 之 SQL 学习笔记

概述

为什么学习Spark SQL：

Spark SQL的版本迭代

SparkSession

sparkSession概念解释：

特点

创建SparkSession

在spark-shell中创建

在IDEA中创建SparkSession

RDD，DataFrame 和 DataSet

RDD的局限性

什么是DataFrame

特点

DataFrame解释

DataFrame编程

DataSet

为什么产生DataSet

解释

为什么需要 DataFrame 和 DataSet

Spark SQL 程序编写步骤

创建DataFrame

DataFrame常用操作

DSL风格语法

SQL风格语法

DataFrame 支持的操作

以编程方式执行Spark SQL

编写 Spark SQL 查询程序

提交Spark任务

数据源

通用的load和save功能

Save Model

JDBC

从 MySQL 中加载数据（Spark Shell 方式）

将数据写入 MySQL 中（Spark Submit 方式）

JSON

Parquet Files

Spark On Yarn

Spark 整合 Hive

SparkSQL自定义聚合函数

SparkSQL 定义普通函数

定义 SparkSQL 的自定义聚集函数

SparkSQL 常用窗口分析函数

概述

（版本：Spark 2.3.2）

Spark SQL 是 Spark 用来处理结构化数据（结构化数据可以来自外部结构化数据源也可以通过 RDD 获取）的一个模块，它提供了一个编程抽象叫做 DataFrame 并且作为分布式 SQL 查询引擎的作用。

外部的结构化数据源包括 JSON、Parquet(默认)、RMDBS、Hive 等。当前 Spark SQL 使用 Catalyst优化器来对 SQL 进行优化，从而得到更加高效的执行方案。并且可以将结果存储到外部系统。

为什么学习Spark SQL：

首先

我们已经学习了 Hive，它是将 Hive SQL 转换成 MapReduce 然后提交到集群上执行，大大简化了编写 MapReduce 的程序的复杂性，由于 MapReduce 这种计算模型执行效率比较慢。所以 Spark SQL 就应运而生，它的工作机制是将 Spark SQL 的 SQL 查询转换成 Spark Core 的应用程序，然后提交到集群执行，执行效率非常快！

其次，SparkSQL的特点

容易整合
统一的数据访问格式
兼容Hive
标准的数据连接

Spark SQL的版本迭代

SparkSQL 的前身是 Shark。由于 Shark 自身的不完善，2014 年 6 月 1 日 Reynold Xin 宣布：停止对 Shark 的开发。SparkSQL 抛弃原有 Shark 的代码，汲取了 Shark 的一些优点，如内存列存储（In-Memory Columnar Storage）、Hive 兼容性等，重新开发 SparkSQL。
Spark-1.1：2014 年 9 月 11 日，发布 Spark1.1.0。Spark 从 1.0 开始引入 SparkSQL（Shark不再支持升级与维护）。Spark1.1.0 变化较大是 SparkSQL 和 MLlib
Spark-1.3：增加 DataFrame 新 API
Spark-1.4：增加窗口分析函数
Spark 1.5：钨丝计划。Hive 中有 UDF 与 UDAF，Spark 中对 UDF 支持较早UDAF：User Defined Aggregate Function 用户自定义聚合函数，直到 Spark 1.5.x 才引入的最新特性
spark-1.6：执行的 sql 中可以增加"--"注释，Spark-1.5/1.6 的新特性，引入 DataSet 的概念
Spark-2.x：SparkSQL+DataFrame+DataSet(正式版本)，Structured Streaming(DataSet)，引入SparkSession 统一了 RDD，DataFrame，DataSet 的编程入口

SparkSession

sparkSession概念解释：

SparkSession 是 Spark-2.0 引如的新概念。SparkSession 为用户提供了统一的切入点，来让用户学习 Spark 的各项功能。在 Spark 的早期版本中，SparkContext 是 Spark 的主要切入点，由于 RDD 是主要的 API，我们通过 sparkContext 来创建和操作 RDD。对于每个其他的 API，我们需要使用不同的 context。

例如：
对于 Spark Streaming，我们需要使用 StreamingContext
对于 Spark SQL，使用 SQLContext
对于 Hive，使用 HiveContext

但是随着 DataSet 和 DataFrame 的 API 逐渐成为标准的 API，就需要为他们建立接入点。所以在 Spark2.0 中，引入SparkSession 作为 DataSet 和 DataFrame API 的切入点，SparkSession封装了 SparkConf、SparkContext 和 SQLContext。为了向后兼容，SQLContext 和 HiveCont也被保存下来。SparkSession 实质上是 SQLContext 和 HiveContext 的组合，所以在 SQLContext 和 HiveContext上可用的 API 在 SparkSession 上同样是可以使用的。SparkSession 内部封装了 SparkContext，所以计算实际上是由 SparkContext 完成的。

特点

为用户提供一个统一的切入点使用 Spark 各项功能
允许用户通过它调用 DataFrame 和 Dataset 相关 API 来编写程序
减少了用户需要了解的一些概念，可以很容易的与 Spark 进行交互
与 Spark 交互之时不需要显示的创建 SparkConf、SparkContext 以及 SQlContext，这些对象已经封闭在 SparkSession 中
SparkSession 提供对 Hive 特征的内部支持：用 HiveQL 写 SQL 语句，访问 Hive UDFs，从Hive 表中读取数据。

创建SparkSession

在spark-shell中创建

[hadoop@hadoop02 ~]$ ~/apps/spark-2.3.1-bin-hadoop2.7/bin/spark-shell \
> --master spark://hadoop02:7077 \
> --executor-memory 512m \
> --total-executor-cores 1

SparkSession 会被自动初始化一个对象叫做 spark，为了向后兼容，Spark-Shell 还提供了一个sparkContext 的初始化对象，方便用户操作：

在IDEA中创建SparkSession

RDD，DataFrame 和 DataSet

RDD的局限性

RDD 仅表示数据集，RDD 没有元数据，也就是说没有字段语义定义。它需要用户自己优化程序，对程序员要求较高，从不同数据源读取数据相对困难，读取到不同格式的数据都必须用户自己定义转换方式合并多个数据源中的数据也较困难。

SparkCore的RDD编程

1）首先要找到程序入口（SparkContext）
2）通过程序入口构建一个 RDD（核心的抽象 RDD）
3）对写 RDD 进行 Transformation 或者 Action 的操作
4）对最后的结果进行处理（输出或者存入数据库等）

什么是DataFrame

由于 RDD 的局限性，Spark 产生了 DataFrame，其中 Schema 是就是元数据，是语义描述信息。在 Spark1.3 之前，DataFrame 被称为SchemaRDD。以行为单位构成的分布式数据集合，按照列赋予不同的名称。对 select、fileter、aggregation 和 sort 等操作符的抽象。

DataFrame = RDD+Schema = SchemaRDD

特点

内部数据无类型，统一为 Row
DataFrame 是一种特殊类型的 Dataset，DataSet[Row] = DataFrame
DataFrame 自带优化器 Catalyst，可以自动优化程序
DataFrame 提供了一整套的 Data Source API

与 RDD 类似，DataFrame 也是一个分布式数据容器。然而 DataFrame 更像传统数据库的二维表格，除了数据以外，还记录数据的结构信息，即 Schema。同时，与 Hive 类似，DataFrame也支持嵌套数据类型（struct、array 和 map）。从 API 易用性的角度上看，DataFrame API提供的是一套高层的关系操作，比函数式的 RDD API

DataFrame解释

A DataFrame is a Dataset organized into named columns. It is conceptually equivalent to a table in a relational database or a data frame in R/Python, but with richer optimizations under the hood. DataFrames can be constructed from a wide array of sources such as: structured data files, tables in Hive, external databases, or existing RDDs. The DataFrame API is available in Scala, Java, Python, and R. In Scala and Java, a DataFrame is represented by a Dataset of Rows. In the Scala API, DataFrameis simply a type alias of Dataset[Row]. While, in Java API, users need to use Dataset to represent a DataFrame.

翻译：

DataFrame 是按列名的方式去组织的一个分布式的数据集（RDD），就像关系型数据库里面的一张表，（或者说好比是 R/Python 语言里面的 DataFrame），不过 SparkSQL 这儿的方法比 R/Python 语言里面的 DataFrame 提供的操作方法更丰富，DataFrame 的数据源有如下：结构化的文件，Hive 里面的表，外部的数据库（MySQL 等），已经存在的 RDD。DataFrame 提供了 Scala，Java，Python，R 的编程 API，在 Scala 或者 Java 编程中，一个 DataFrame 表示以行组织的 Rows 的数据集合，在 Scala 的 API 中，DataFrame 就可以看做是 Dataset[Row]的另一种称呼，但是，在 Java 的 API 中，开发者必须使用 Dataset去表示一个 DataFrame。

DataFrame编程

Spark SQL 编程：

首先要找到程序入口（SQLContext），新版本 Spark-2.x 之后寻找 SparkSession
通过程序入口构建一个 DataFrame(核心的抽象 DataFrame)
对 DataFrame 做各种操作。最重要就是编写 SQL 语句
对得到的结果数据进行处理（打印输出或者存入数据库等）

DataSet

为什么产生DataSet

由于 DataFrame 的数据类型统一是 Row，所以 DataFrame 也是有缺点的。Row 运行时类型检查，比如 salary 是字符串类型，下面语句也只有运行时才进行类型检查。所以，Spark SQL 引入了 Dataset，扩展了 DataFrame API，提供了编译时类型检查，面向对象风格的 API。但是Dataset 可以和 DataFrame、RDD 相互转换。DataFrame=Dataset[Row]，可见 DataFrame 是一种特殊的 Dataset。

dataframe.filter("salary>1000").show()

解释

A Dataset is a distributed collection of data. Dataset is a new interface added in Spark 1.6 that provides the benefits of RDDs (strong typing, ability to use powerful lambda functions) with the benefits of Spark SQL’s optimized execution engine. A Dataset can be constructed from JVM objects and then manipulated using functional transformations (map, flatMap, filter, etc.). The Dataset API is available in Scala and Java. Python does not have the support for the Dataset API. But due to Python’s dynamic nature, many of the benefits of the Dataset API are already available (i.e. you can access the field of a row by name naturally row.columnName). The case for R is similar.

翻译：

一个 Dataset 是一个分布式的数据集合 Dataset 是在 Spark 1.6 中被添加的新接口，它提供了RDD 的优点（强类型化，能够使用强大的 lambda 函数）与 Spark SQL 执行引擎的优点。一个 Dataset 可以从 JVM 对象来构造并且使用转换功能（map, flatMap, filter,等等）。Dataset API 在 Scala 和 Java 是可用的。Python 不支持 Dataset API。但是由于 Python 的动态特性，许多Dataset API 的优点已经可用了 (也就是说，你可能通过 name 天生的 row.columnName 属性访问一行中的字段)。这种情况和 R 相似。

为什么需要 DataFrame 和 DataSet

Spark SQL提供了两种方式读取操作数据：1. SQL 查询 2. DataFrame 和 Dataset API。但是，SQL 语句虽然简单，但是 SQL 的表达能力却是有限的，DataFrame 和 Dataset 可以采用更加通用的语言（Scala 或 Python）来表达用户的查询请求。此外，Dataset 可以更快捕捉错误，因为 SQL 是运行时捕获异常，而 Dataset 是编译时检查错误。

Spark SQL 程序编写步骤

创建 SparkSession 对象
创建 DataFrame 或 Dataset
在 DataFrame 或 Dataset 之上进行转换和 Action
返回结果（保存结果到 HDFS 中，或直接打印出来）

创建DataFrame

数据文件：

在本地创建一个文件，有五列，分别是 id、name、sex、age、department，用逗号分隔，然后上传到 HDFS 上：hdfs dfs -put student.txt /student
在 spark shell 执行下面命令，读取数据，将每一行的数据使用列分隔符分割：val lineRDD = sc.textFile("hdfs://myha01/student/student.txt").map(_.split(","))
定义 case class（相当于表的 schema）：case class Student(id:Int, name:String, sex:String, age:Int, department:String)
将 RDD 和 case class 关联：val studentRDD = lineRDD.map(x => Student(x(0).toInt, x(1), x(2), x(3).toInt, x(4)))
将 RDD 转换成 DataFrame：Spark-2.3 : val studentDF = spark.createDataFrame(studentRDD) 或者 Spark-1.6 : val studentDF = studentRDD.toDF
对 DataFrame 进行处理：studentDF.show 或者 studentDF.printSchema

DataFrame常用操作

DSL风格语法

//打印 DataFrame 的 Schema 信息
studentDF.printSchema

DSL风格语法示例：

//查看 DataFrame 部分列中的内容
studentDF.select("name", "age").show
studentDF.select(col("name"), col("age")).show
studentDF.select(studentDF.col("name"), studentDF.col("age")).show

//查询所有的 name 和 age，并将 age+1
studentDF.select(col("id"), col("name"), col("age") + 1).show
studentDF.select(studentDF ("id"), studentDF ("name"), studentDF ("age") + 1).show


// 按年龄进行分组并统计相同年龄的人数
studentDF.groupBy("age").count().show()

SQL风格语法

注：如果想使用 SQL 风格的语法，需要将 DataFrame 注册成表

老版本写法：

studentDF.registerTempTable("t_student")

新版本写法：

Session 范围内的临时表：studentDF.createOrReplaceTempView(“t_student”)只在Session范围内有效，Session 结束临时表自动销毁
全局范围内的临时表：studentDF.createGlobalTempView(“t_student”)所有 Session 共享

SQL风格语法示例：

// 查询年龄最大的前五名
sqlContext.sql("select * from t_student order by age desc limit 5").show

// 显示表的 Schema 信息
sqlContext.sql("desc t_student ").show

// 统计学生数超过 6 个的部门和该部门的学生人数。并且按照学生的个数降序排序
sqlContext.sql("select department, count(*) as total from t_student group by department having total > 6 order by total desc").show

DataFrame 支持的操作

以编程方式执行Spark SQL

编写 Spark SQL 查询程序

package com.mazh.spark.sql
import org.apache.spark.sql.{SQLContext, SparkSession}
import org.apache.spark.{SparkConf, SparkContext}

//case class 一定要事先放到外面定义好
case class Student(id: Int, name: String, sex: String, age: Int, department: String)
object StudentSparkSQL {
     def main(args: Array[String]) {
         //创建 SparkConf()并设置 App 名称
         val conf = new SparkConf().setAppName("FirstSparkSQLAPP--Student")
         //SQLContext 要依赖 SparkContext
         val sc = new SparkContext(conf)
         //创建 SQLContext
         val sqlContext = new SQLContext(sc)
         //从指定的地址创建 RDD
         val lineRDD = sc.textFile(args(0)).map(_.split(","))
         //创建 case class
         //将 RDD 和 case class 关联
         val studentRDD = lineRDD.map(x => Student(x(0).toInt, x(1), x(2), x(3).toInt,x(4)))
         //导入隐式转换，如果不导入无法将 RDD 转换成 DataFrame
         //将 RDD 转换成 DataFrame
         import sqlContext.implicits._
         val studentDF = studentRDD.toDF
         //注册表
         studentDF.registerTempTable("t_student")
         //传入 SQL
         val df = sqlContext.sql("select department, count(*) as total from t_student group by department having total > 6 order by total desc")
         //将结果以 JSON 的方式存储到指定位置
         df.write.json(args(1))
         //停止 Spark Context
         sc.stop()
    }
}

提交Spark任务

$SPARK_HOME/bin/spark-submit \
--class com.mazh.spark.sql.StudentSparkSQL \
--master spark://hadoop02:7077,hadoop04:7077 \
/home/hadoop/Spark_SQL-1.0-SNAPSHOT.jar \
hdfs://myha01/student/student.txt \
hdfs://myha01/student/output_sparksql

数据源

通用的load和save功能

编写普通的 load 和 save 功能

spark.read.load("hdfs://myha01/spark/sql/input/users.parquet").select("name","favorite_color").write.save("hdfs://myha01/spark/sql/output")

指定 load 和 save 的特定文件格式

spark.read.format("json").load("hdfs://myha01/spark/sql/input/people.json").select("name", "age").write.format("csv").save("hdfs://myha01/spark/sql/csv")

Save Model

JDBC

Spark SQL 可以通过 JDBC 从关系型数据库中读取数据的方式创建 DataFrame，通过对 DataFrame 一系列的计算后，还可以将数据再写回关系型数据库中。

从 MySQL 中加载数据（Spark Shell 方式）

启动 Spark Shell，必须指定 mysql 连接驱动 jar 包

启动本机的单进程 Shell:
$SPARK_HOME/bin/spark-shell \
--jars $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar \
--driver-class-path $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar 

启动连接 Spark 集群的 Shell:
$SPARK_HOME/bin/spark-shell \
--master spark://hadoop02:7077,hadoop04:7077 \
--jars $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar \
--driver-class-path $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar

从 mysql 中加载数据

val jdbcDF = sqlContext.read.format("jdbc").options(Map("url" -> "jdbc:mysql://hadoop02:3306/spider", "driver" -> "com.mysql.jdbc.Driver", "dbtable" -> "lagou", "user" -> "root", "password" -> "root")).load()

将数据写入 MySQL 中（Spark Submit 方式）

package com.mazh.spark.sql

import java.util.Properties
import org.apache.spark.sql.types.{IntegerType, StringType, StructField,StructType}
import org.apache.spark.sql.{Row, SQLContext}
import org.apache.spark.{SparkConf, SparkContext}

object SparkSQL_JDBC {
    def main(args: Array[String]) {
        val conf = new SparkConf().setAppName("SparkSQL_JDBC")
        val sc = new SparkContext(conf)
        val sqlContext = new SQLContext(sc)
        //通过并行化创建 RDD
        // val studentRDD = sc.parallelize(Array("1 huangbo 33", "2 xuzheng 44", "3 wangbaoqiang 55")).map(_.split(" "))
        //通过读取文件创建 RDD
        val studentRDD = sc.textFile(args(0)).map(_.split(","))
        //通过 StructType 直接指定每个字段的 schema
        val schema = StructType(
            List(
                 StructField("id", IntegerType, true),
                 StructField("name", StringType, true),
                 StructField("sex", StringType, true),
                 StructField("age", IntegerType, true),
                 StructField("department", StringType, true)
            )
        )
        //将 RDD 映射到 rowRDD
        val rowRDD = studentRDD.map(p => Row(p(0).toInt, p(1).trim, p(2).trim,p(3).toInt,p(4).trim))
        //将 schema 信息应用到 rowRDD 上
        val studentDataFrame = sqlContext.createDataFrame(rowRDD, schema)
        //创建 Properties 存储数据库相关属性
        val prop = new Properties()
        prop.put("user", "root")
        prop.put("password", "root")
        //将数据追加到数据库
        studentDataFrame.write.mode("append").jdbc("jdbc:mysql://hadoop02:3306/spider","student", prop)
        //停止 SparkContext
        sc.stop()
    }
}

准备数据：student.txt 存储在 HDFS 上的/student 目录中
给项目打成 jar 包，上传到客户端
提交任务给 Spark 集群：

$SPARK_HOME/bin/spark-submit \
--class com.mazh.spark.sql.SparkSQL_JDBC \
--master spark://hadoop02:7077,hadoop04:7077 \
--jars $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar \
--driver-class-path $SPARK_HOME/mysql-connector-java-5.1.40-bin.jar \
/home/hadoop/Spark_WordCount-1.0-SNAPSHOT.jar \
hdfs://myha01/student/student.txt

结果展示：

JSON

代码：

object TestSparkSQL_ReadJSON {
    def main(args: Array[String]): Unit = {
        // 构建 SparkSQL 程序的编程入口对象 SparkSession
        val sparkSession:SparkSession = SparkSession.builder()
          .appName("MyFirstSparkSQL")
          .config("someKey", "someValue")
          .master("local")
          .getOrCreate()

         // 方式 1
         val df1 = sparkSession.read.json("D:\\bigdata\\json\\people.json")

         // 方式 2
         val df2 = sparkSession.read.format("json").load("D:\\bigdata\\json\\people.json")
    }
}

Parquet Files

代码：

object TestSparkSQL_ReadParquet {
    def main(args: Array[String]): Unit = {
        // 构建 SparkSQL 程序的编程入口对象 SparkSession
        val sparkSession:SparkSession = SparkSession.builder()
          .appName("MyFirstSparkSQL")
          .config("someKey", "someValue")
          .master("local")
          .getOrCreate()

          // 方式 1
          val df1 = sparkSession.read.parquet("D:\\bigdata\\parquet\\people.parquet")

          // 方式 2
          val df2 = sparkSession.read.format("parquet").load("D:\\bigdata\\json\\people.json")
    }
}

Spark On Yarn

参照博客：https://blog.csdn.net/Jerry_991/article/details/85042305

Spark 整合 Hive

参照博客：https://blog.csdn.net/Jerry_991/article/details/84000097

SparkSQL自定义聚合函数

SparkSQL 定义普通函数

要点：spark.udf.register(“function_name”, function)

 /*
  *    第一步：获取程序入口
  */
    val sparkConf = new SparkConf()
    sparkConf.setAppName("SparkSQL_UAF_Length").setMaster("local")
    val sparkContext = new SparkContext(sparkConf)
    val sqlContext = new SQLContext(sparkContext)

 /*
  *    第二步：获取到一个DataFrame，然后注册为一张表
  *    
  *    JDBC：三个参数
  *    url：String
  *    table：String
  *    properties：Properties
  */ 
    val url = "jdbc:mysql://hadoop02:3306/bigdata"
    val table = "student"
    val properties = new Properties()
    properties.put("user","root")
    properties.put("password","root")
    val studentDF:DataFrame = sqlContext.read.jdbc(url,table,properties)
    
  /*
   *    第三步：把这个dataFrame注册为一张临时表
   */
    studentDF.createTempView("student")

  /*
   *    第四步：定义一个函数
   */  
    sqlContext.udf.register("strLength",(x:String) => x.length)

  /*
   *    第五步：使用这个函数做一个操作，求出某个字段的长度
   */
    sqlContext.sql("select strLength(name) as name_len from student").show()
    
  /*
   *    第六步：程序完结，关闭资源
   */
    sparkContext.stop()

定义 SparkSQL 的自定义聚集函数

要点：Class MyUDAF extends UserDefinedAggregationFunction，spark.udf.register("function_name", function)

object SparkSQL_UDAF_AvgAge extends UserDefinedAggregateFunction{
    /**
     * 定义输入的数据的类型
     */
     override def inputSchema: StructType = StructType(
         StructField("age", DoubleType, true) :: Nil
     )

    /**
     * 定义辅助字段：
     *
     * 1、辅助字段 1：用来记录所有年龄之和 total
     * 2、辅助字段 2：用来总记录所有学生的个数 count
     */
     override def bufferSchema: StructType = StructType(
         StructField("total", DoubleType, true)::
         StructField("count", IntegerType, true)::
         Nil
     )

     /**
     * 计算学生的平均年龄 计算公式： 学生年龄的总和 / 学生总数
     *
     * 所以要初始化要两个辅助字段：
     * total : 0.0
     * count : 0
     */
     override def initialize(buffer: MutableAggregationBuffer): Unit = {
         buffer.update(0, 0.0)
         buffer.update(1, 0)
     }

    /**
     * 每次给一条记录， 然后进行累加。进行累加变量 buffer 的状态更新
     * 这是一个局部操作。
     */
     override def update(buffer: MutableAggregationBuffer, input: Row): Unit = {
         val lastTotal = buffer.getDouble(0)
         val lastCount = buffer.getInt(1)
         val currentSalary = input.getDouble(0)
         buffer.update(0,lastTotal + currentSalary)
         buffer.update(1,lastCount+1)
     }

    /**
     * 当局部操作完成，最后需要一个全局合并的操作
     * 就相当于是 reducer 阶段的最终合并
     */
     override def merge(buffer1: MutableAggregationBuffer, buffer2: Row): Unit = {
         val total1 = buffer1.getDouble(0)
         val count1 = buffer1.getInt(1)
         val total2 = buffer2.getDouble(0)
         val count2 = buffer2.getInt(1)
         buffer1.update(0, total1 + total2)
         buffer1.update(1, count1 + count2)
     }

    /**
     * 计算平均年龄
     */
     override def evaluate(buffer: Row): Any = {
         val total = buffer.getDouble(0)
         val count = buffer.getInt(1)
         total / count
     }

     /**
      * 返回结果数据类型
      */
     override def dataType: DataType = DoubleType

    /**
     * 输入和输出的字段类型是否匹配。也即是否一致
     */
     override def deterministic: Boolean = true
}

使用测试：

SparkSQL 常用窗口分析函数

（待整理）

你可能感兴趣的:(Spark,SQL,spark)

实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
在线人数统计业务设计（场景八股文）
业务问题在当经的网站中，在线人数的实时统计已经是一个必不可少的模块了，并且该统计功能最好能够按不同的时间间隔做的统计，现在需要你设计一个在线人数统计的模块，你应该怎么进行设计的呢？背景一个网校下会有多个学员。目前平台大概有十个，平台对应的网校大概五十几个，平均一个网校会有5w个用户，预计总人数为200w，最该学员的在线人数在10w左右。设计思路最开始的时候，想到的就是使用mysql直接实现，但是明
Aop +反射实现方法版本动态切换
需求分析在做技术选型的时候一直存在着两个声音，mongo作为数据库比较mysql好，mysql做为该数据比mongo好。当然不同数据库都有有着自己的优势，我们在做技术选型的时候无非就是做到对数据库的扬长避短。mysql最大的优势就是支持事务，事务的五大特性保证的业务可靠性，随之而来的就是事务会产生的问题：脏读、幻读、不可重复度，当然我们也会使用不同的隔离级别来解决。（最典型的业务问题：银行存取钱）
mysql复习立夏的李子 mysql 数据库 database
mysqlselect语法selectfromjoinwheregroupbyhavingorderbylimit联合查询innerjoin（）leftjoin（以左表为基准，匹配右表，不匹配的返回左表，右表以null值填充）rightjoind··(去除列重复的数据)索引类型主键索引(PrimaryKey)唯一索引(Unique)常规索引(Index)全文索引(FullText)索引准则索引不是
MySQL复习题
一.填空题1.关系数据库的标准语言是SQL。2.数据库发展的3个阶段中，数据独立性最高的是阶段数据库系统。3.概念模型中的3种基本联系分别是一对一、一对多和多对多。4.MySQL配置文件的文件名是my.ini或my.cnf。5.在MySQL配置文件中，datadir用于指定数据库文件的保存目录。6.添加IFNOTEXISTS可在创建的数据库已存在时防止程序报错。7.MySQL提供的SHOWCREA
Spark SQL架构及高级用法 Aurora_NeAr spark sql 架构
SparkSQL架构概述架构核心组件API层（用户接口）输入方式：SQL查询；DataFrame/DatasetAPI。统一性：所有接口最终转换为逻辑计划树（LogicalPlan），进入优化流程。编译器层（Catalyst优化器）核心引擎：基于规则的优化器（Rule-BasedOptimizer,RBO）与成本优化器（Cost-BasedOptimizer,CBO）。处理流程：阶段输入输出关键动
Mac OSX 下的mysql数据库文件存放位置 Bruuuces mysql mac osx 位置存放
之前我的mysql的系统数据库里的表被我玩坏了，万般无奈之下只得删除所有mysql的东西重新构建数据库。按照网上搜到的内容删除后重装发现数据库没有什么变化。于是自己在每个可能存放数据库文件的目录查找，最终确认目录位置如下:使用HomeBrew安装为/usr/local/var/mysql使用官方下载的dmg镜像安装为/usr/local/mysql删除这个目录再重新安装mysql就会重新生成系统数
mac os 10.9 mysql_MAC OSX 10.9 apache php mysql 环境配置 AY05 mac os 10.9 mysql
＃终端内运行sudoapachectlstart#启动Apachesudoapachectlrestart#重启Apachesudoapachectlstop#停止Apache＃配置Apachesudovi/private/etc/apache2/httpd.conf#将里面的这一行去掉前面的##LoadModulephp5_modulelibexec/apache2/libphp5.so＃配置P
mac升级mysql_Mac OSX下的MySQL数据库升级 weixin_39801714 mac升级mysql
MacOSX下的数据库升级最麻烦的不过权限的问题.本文的MySQL的安装方式为OSX下DMG磁盘镜像的安装方式,MacPorts/Homebrew的方式大同小异.从5.6.17升级到5.7.18安装目录信息ls-al/usr/local|grepmysqllrwxr-xr-x1rootwheel30B52100:39mysql@->mysql-5.6.17-osx10.7-x86_64drwxr-
【MySQL】MySQL数据库如何改名武昌库里写JAVA 面试题汇总与解析 spring boot vue.js sql java 学习
MySQL建库授权语句https://www.jianshu.com/p/2237a9649ceeMySQL数据库改名的三种方法https://www.cnblogs.com/gomysql/p/3584881.htmlMySQL安全修改数据库名几种方法https://blog.csdn.net/haiross/article/details/51282417MySQL重命名数据库https://
大学社团管理系统（11831） codercode2022 java spring boot spring echarts spring cloud sentinel java-rocketmq
有需要的同学，源代码和配套文档领取，加文章最下方的名片哦一、项目演示项目演示视频二、资料介绍完整源代码（前后端源代码+SQL脚本）配套文档（LW+PPT+开题报告）远程调试控屏包运行三、技术介绍Java语言SSM框架SpringBoot框架Vue框架JSP页面Mysql数据库IDEA/Eclipse开发四、项目截图有需要的同学，源代码和配套文档领取，加文章最下方的名片哦!
修改gitlab默认的语言 Victor刘 gitlab
文章目录网上的方法1.采用数据库触发器的方法2.登录pg库2.1查看表2.2创建function2.3创建触发器2.4修改历史数据网上的方法网上修改/opt/gitlab/embedded/service/gitlab-rails/config/application.rb的方法，我试了，没生效，没进一步研究1.采用数据库触发器的方法2.登录pg库su-gitlab-psqlpsql-h/var/
如何在 Ubuntu 24.04 或 22.04 Linux 上安装和运行 Redis 服务器山岚的运维笔记 Linux 运维及使用 linux 服务器 ubuntu redis 数据库
Redis（RemoteDictionaryServer，远程字典服务器）是一种内存数据结构存储，通常用作NoSQL数据库、缓存和消息代理。它是开源的，因此用户可以免费安装，无需支付任何费用。Redis旨在为需要快速数据访问和低延迟的应用程序提供速度和效率。Redis支持多种数据类型，包括字符串（Strings）、列表（Lists）、集合（Sets）、哈希（Hashes）、有序集合（SortedS
数据库基础概念梳理 22:30Plane-Moon 数据库
1.数据存储类型表(Table):存储结构化数据的标准方式，数据以行和列的形式组织，具有固定的格式。非结构化数据(UnstructuredData):如音频、视频、图片、文本文档等，其格式不固定，不易直接用表存储。2.SQL的核心优势SQL尤其擅长处理和操作存储在表中的结构化数据。2.1数据类型约束(DataTypeConstraints):定义列可存储的数据种类。整数类型:TINYINT(1字节
SQL笔记纯干货 AI入门修炼 oracle 数据库 sql
软件：DataGrip2023.2.3，phpstudy_pro,MySQL8.0.12目录1.DDL语句（数据定义语句）1.1数据库操作语言1.2数据表操作语言2.DML语句（数据操作语言）2.1增删改2.2题2.3备份表3.DQL语句（数据查询语言）3.1查询操作3.2题一3.3题二4.多表详解4.1一对多4.2多对多5.多表查询6.窗口函数7.拓展:upsert8.sql注入攻击演示9.拆表
Ubuntu24安装MariaDB/MySQL后不知道root密码如何解决
Ubuntu24.04安装MariaDB后root密码未知？解决方案在此在Ubuntu24.04上新安装MariaDB后，许多用户会发现自己不知道root用户的密码，甚至在安装过程中也没有提示设置密码。这是因为在较新的MariaDB版本中，默认情况下root用户采用了unix_socket身份验证插件。这意味着您可以使用操作系统的root用户权限直接登录MariaDB，而无需输入密码。本文将为您详
mysql创建线程处理链接请求斜不靠谱
mysqld通过RUN_HOOK(server_state,before_handle_connection,(NULL));调用/**Threadhandlerforaconnection@paramargConnectionobject(Channel_info)Thisfunction(normally)doesthefollowing:-Initializethread//初始化线程-In
【Druid】学习笔记 fixAllenSun 学习笔记 oracle
【Druid】学习笔记【一】简介【1】简介【2】数据库连接池（1）能解决的问题（2）使用数据库连接池的好处【3】监控（1）监控信息采集的StatFilter（2）监控不影响性能（3）SQL参数化合并监控（4）执行次数、返回行数、更新行数和并发监控（5）慢查监控（6）Exception监控（7）区间分布（8）内置监控DEMO【4】Druid基本配置参数介绍【5】Druid相比于其他数据库连接池的优点
Java朴实无华按天计划从入门到实战（强化速战版-66天）岫珩 Java 后端 java 开发语言学习 Java 时间安排学习计划
致敬读者感谢阅读笑口常开生日快乐⬛早点睡觉博主相关博主信息博客首页专栏推荐活动信息文章目录Java朴实无华按天计划从入门到实战（强化速战版-66天）1.基础（18）1.1JavaSE核心（5天）1.2数据库与SQL（5天）1.3前端基础（8天）2.进阶（17天）2.1JavaWeb核心（5天）2.2Mybatis与Spring全家桶（6天）2.3中间件入门（4天）2.4实践项目（2天）3.高阶（1
Navicat练习与实操（第九节课内容总结见下篇）咩? android 前端 sql
MySQL练习练习题目现在有以下四张表Student学生ID学生名字学生生日学生性别s_ids_names_births_sexCourse课程ID课程名字教师IDc_idc_namet_idTeacher教师ID教师名字t_idt_nameScore学生ID课程ID学生分数s_idc_ids_score1.对以上表格分别建表(要求：id为各个表的主键、其他字段非空设置默认值为、给表以及表中字段设
小白学习mysql 阿什么名字不会重复呢 mysql 数据库大数据人工智能
推荐自学网站不用下载本地环境带自测头歌https://www.educoder.net✅适合基础小白的MySQL简单实用学习计划总学习时间建议：10~14天，每天1小时左右即可最终目标：掌握基础SQL操作，能完成简单项目需求第1阶段：认识数据库与环境搭建（1~2天）你需要学会：•数据库是什么？SQL是什么？•安装MySQLServer+Navicat（推荐用Navicat可视化工具）✅推荐学习内容
MySql基础：事务无敌摆烂仔 mysql 数据库
1.事务的简介1.1什么是事务事务就是一组DML语句组成，这些语句在逻辑上存在相关性，这一组DML语句要么全部成功，要么全部失败，是一个整体。MySQL提供一种机制，保证我们达到这样的效果。事务还规定不同的客户端看到的数据是不相同的。事务就是要做的或所做的事情，主要用于处理操作量大，复杂度高的数据。假设一种场景：你毕业了，学校的教务系统后台MySQL中，不在需要你的数据，要删除你的所有信息(一般不
MYSQL：MySQL 事务隔离级别详解奋斗的狍子007 MySQL核心知识点 mysql 数据库 java spring 架构 spring boot ide
一、MySQL事务是什么？ MySQL事务是一组在数据库中执行的操作，这些操作要么全部成功执行，要么全部不执行，以确保数据库的完整性和一致性。事务的ACID 事务具有四个特征：原子性（Atomicity）、一致性（Consistency）、隔离性（Isolation）和持续性（Durability）。这四个特性简称为ACID特性。原子性：事务是数据库的逻辑工作单位，事务中包含的各操作要么都做，
分布式事务Seata的4种模式详解「已注销」分布式 wpf
Seata是一个开源的分布式事务解决方案，它在微服务架构下提供了高性能和简单易用的分布式事务服务。Seata的设计基于AT、TCC、Saga和XA事务模式，以满足不同场景下的分布式事务处理需求，今天的内容针对Seata来详细介绍一下。1、四种事务模式介绍1.AT模式：这是一种无侵入的分布式事务解决方案。用户只需关注自己的业务SQL，Seata框架会自动生成事务的二阶段提交和回滚操作。在一阶段，Se
java知识点分享篇（一）微笑的小小刀
java分享篇一大家好，我是小小刀，我们又见面啦，本文是一个新的系列->java分享系列，现在有三个系列，java学习系列：一篇系统的讲一个知识点，java故事系列：散文随笔，有知识点也有生活。本篇是java分享系列第一篇：收集大家在学习交流群中的分享，并做简单的发散进学习交流群可加小刀微信：best396975802公众号:java技术大本营sql分页（小小刀）原分享sqlserver中的分页语
Ubuntu lamp 会飞的灰大狼 linux ubuntu
Ubuntulamp前言在Ubuntu安装lamp架构我们了解到lamp是完整的架构我们前面了解到了集合了Linux系统apacheMySQL和PHP语言的完整架构我们前面说了Centos7中编译安装lamp那么我们去说一下在Ubuntu中安装‍‍安装apache2‍apt直接安装apache2apt-yinstallapache2‍启动apache2systemctlstartapache2#测
SQL97 验证刷题效果，输出题目真实通过率折翼的恶魔 MYSQL 数据库
牛客刷题记录表`done_questions_record`，为验证重复刷题率，输出题目通过率（哪些题目被通过了，这个人你一共刷题的题目）question_pass_rate60%的用户的提交正确率pass_rate与每题目平均提交次数question_per_cnt。result_info'是否通过，1：通过；0：不通过'，查询返回结果名称和顺序user_idquestion_pass_rate
免费版 Navicat Premium Lite 17 下载和使用曼巴不黑数据库 navicat navicat免费
>>>>>>下载地址以后不需要再为使用Navicat大费周章了，官网已经提供免费版供个人和初创企业使用，认准NavicatPremiumLite。NavicatPremiumLite是Navicat的精简版，它包含了用户执行主要的基本数据库操作所需的核心功能。它允许你同时连接到各种数据库平台，包括MySQL、PostgreSQL、SQLServer、Oracle、MariaDB、Snowflake
TiDB - 分布式数据库的架构与特性爽新全效瓷兔膏
本文还有配套的精品资源，点击获取简介：TiDB是一个开源的分布式NewSQL数据库，受到了Google的Spanner/F1系统的启发。它提供水平扩展和强一致性事务，适用于需要高可用性和大规模数据处理的场景。TiDB的核心特点包括其分布式架构，由TiDBServer（SQL层）、PDServer（调度器）和TiKVServer（存储引擎）组成；支持无缝的水平扩展和ACID事务；与MySQL高度兼容
MySQL 数据类型详解 yimeixiaolangzai MySQL mysql 数据库
在数据库设计和开发中，选择合适的数据类型对于存储和操作数据至关重要。MySQL提供了丰富的数据类型来满足不同的数据存储需求，这些数据类型可以分为数值类型、字符串类型、日期和时间类型，以及二进制类型。本文将详细介绍MySQL中的各类数据类型及其应用场景，帮助你更好地进行数据库设计。1.数值类型数值类型用于存储整数和浮点数，在处理数值运算时，这些数据类型扮演着关键角色。MySQL提供了多种数值类型，以
解线性方程组 qiuwanchi
package gaodai.matrix; import java.util.ArrayList; import java.util.List; import java.util.Scanner; public class Test { public static void main(String[] args) { Scanner scanner = new Sc
在mysql内部存储代码 annan211 性能 mysql 存储过程触发器
在mysql内部存储代码在mysql内部存储代码，既有优点也有缺点，而且有人倡导有人反对。先看优点： 1 她在服务器内部执行，离数据最近，另外在服务器上执行还可以节省带宽和网络延迟。 2 这是一种代码重用。可以方便的统一业务规则，保证某些行为的一致性，所以也可以提供一定的安全性。 3 可以简化代码的维护和版本更新。 4 可以帮助提升安全，比如提供更细
Android使用Asynchronous Http Client完成登录保存cookie的问题 hotsunshine android
Asynchronous Http Client是android中非常好的异步请求工具除了异步之外还有很多封装比如json的处理，cookie的处理引用 Persistent Cookie Storage with PersistentCookieStore This library also includes a PersistentCookieStore whi
java面试题 Array_06 java 面试
java面试题第一，谈谈final, finally, finalize的区别。 final-修饰符（关键字）如果一个类被声明为final，意味着它不能再派生出新的子类，不能作为父类被继承。因此一个类不能既被声明为 abstract的，又被声明为final的。将变量或方法声明为final，可以保证它们在使用中不被改变。被声明为final的变量必须在声明时给定初值，而在以后的引用中只能
网站加速 oloz 网站加速
前序:本人菜鸟，此文研究总结来源于互联网上的资料，大牛请勿喷！本人虚心学习，多指教. 1、减小网页体积的大小，尽量采用div+css模式，尽量避免复杂的页面结构，能简约就简约。 2、采用Gzip对网页进行压缩； GZIP最早由Jean-loup Gailly和Mark Adler创建，用于UNⅨ系统的文件压缩。我们在Linux中经常会用到后缀为.gz
正确书写单例模式随意而生 java 设计模式单例
　　单例模式算是设计模式中最容易理解，也是最容易手写代码的模式了吧。但是其中的坑却不少，所以也常作为面试题来考。本文主要对几种单例写法的整理，并分析其优缺点。很多都是一些老生常谈的问题，但如果你不知道如何创建一个线程安全的单例，不知道什么是双检锁，那这篇文章可能会帮助到你。　　懒汉式，线程不安全　　当被问到要实现一个单例模式时，很多人的第一反应是写出如下的代码，包括教科书上也是这样
单例模式香水浓 java
懒汉调用getInstance方法时实例化 public class Singleton { private static Singleton instance; private Singleton() {} public static synchronized Singleton getInstance() { if(null == ins
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" AdyZhang apache http server
安装Apache问题：系统找不到指定的文件 No installed service named "Apache2" 每次到这一步都很小心防它的端口冲突问题，结果，特意留出来的80端口就是不能用，烦。解决方法确保几处： 1、停止IIS启动 2、把端口80改成其它（譬如90，800，，，什么数字都好） 3、防火墙(关掉试试) 在运行处输入 cmd 回车，转到apa
如何在android 文件选择器中选择多个图片或者视频？ aijuans android
我的android app有这样的需求，在进行照片和视频上传的时候，需要一次性的从照片/视频库选择多条进行上传但是android原生态的sdk中，只能一个一个的进行选择和上传。我想知道是否有其他的android上传库可以解决这个问题，提供一个多选的功能，可以使checkbox之类的，一次选择多个处理方法官方的图片选择器(但是不支持所有版本的androi，只支持API Level
mysql中查询生日提醒的日期相关的sql baalwolf mysql
SELECT sysid,user_name,birthday,listid,userhead_50,CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')),CURDATE(), dayofyear( CONCAT(YEAR(CURDATE()),DATE_FORMAT(birthday,'-%m-%d')))-dayofyear(
MongoDB索引文件破坏后导致查询错误的问题 BigBird2012 mongodb
问题描述： MongoDB在非正常情况下关闭时，可能会导致索引文件破坏，造成数据在更新时没有反映到索引上。解决方案：使用脚本，重建MongoDB所有表的索引。 var names = db.getCollectionNames(); for( var i in names ){ var name = names[i]; print(name);
Javascript Promise bijian1013 JavaScript Promise
Parse JavaScript SDK现在提供了支持大多数异步方法的兼容jquery的Promises模式，那么这意味着什么呢，读完下文你就了解了。一.认识Promises “Promises”代表着在javascript程序里下一个伟大的范式，但是理解他们为什么如此伟大不是件简
[Zookeeper学习笔记九]Zookeeper源代码分析之Zookeeper构造过程 bit1129 zookeeper
Zookeeper重载了几个构造函数，其中构造者可以提供参数最多，可定制性最多的构造函数是 public ZooKeeper(String connectString, int sessionTimeout, Watcher watcher, long sessionId, byte[] sessionPasswd, boolea
【Java命令三】jstack bit1129 jstack
jstack是用于获得当前运行的Java程序所有的线程的运行情况(thread dump），不同于jmap用于获得memory dump [hadoop@hadoop sbin]$ jstack Usage: jstack [-l] <pid> (to connect to running process) jstack -F
jboss 5.1启停脚本　动静分离部署 ronin47
以前启动jboss，往各种xml配置文件，现只要运行一句脚本即可。start nohup sh /**/run.sh -c servicename -b ip -g clustername -u broatcast jboss.messaging.ServerPeerID=int -Djboss.service.binding.set=p
UI之如何打磨设计能力? brotherlamp UI ui教程 ui自学 ui资料 ui视频
在越来越拥挤的初创企业世界里，视觉设计的重要性往往可以与杀手级用户体验比肩。在许多情况下，尤其对于 Web 初创企业而言，这两者都是不可或缺的。前不久我们在《右脑革命：别学编程了，学艺术吧》中也曾发出过重视设计的呼吁。如何才能提高初创企业的设计能力呢?以下是 9 位创始人的体会。 1.找到自己的方式如果你是设计师，要想提高技能可以去设计博客和展示好设计的网站如D-lists或
三色旗算法 bylijinnan java 算法
import java.util.Arrays; /** 问题：假设有一条绳子，上面有红、白、蓝三种颜色的旗子，起初绳子上的旗子颜色并没有顺序，您希望将之分类，并排列为蓝、白、红的顺序，要如何移动次数才会最少，注意您只能在绳子上进行这个动作，而且一次只能调换两个旗子。网上的解法大多类似：在一条绳子上移动，在程式中也就意味只能使用一个阵列，而不使用其它的阵列来
警告:No configuration found for the specified action: \'s chiangfai configuration
1.index.jsp页面form标签未指定namespace属性。  <%@taglib prefix="s" uri="/struts-tags"%> ... <s:form action="submit" method="post"&g
redis -- hash_max_zipmap_entries设置过大有问题 chenchao051 redis hash
使用redis时为了使用hash追求更高的内存使用率，我们一般都用hash结构，并且有时候会把hash_max_zipmap_entries这个值设置的很大，很多资料也推荐设置到1000，默认设置为了512，但是这里有个坑 #define ZIPMAP_BIGLEN 254 #define ZIPMAP_END 255 /* Return th
select into outfile access deny问题 daizj mysql txt 导出数据到文件
本文转自：http://hatemysql.com/2010/06/29/select-into-outfile-access-deny%E9%97%AE%E9%A2%98/ 为应用建立了rnd的帐号，专门为他们查询线上数据库用的，当然，只有他们上了生产网络以后才能连上数据库，安全方面我们还是很注意的，呵呵。授权的语句如下： grant select on armory.* to rn
phpexcel导出excel表简单入门示例 dcj3sjt126com PHP Excel phpexcel
<?php error_reporting(E_ALL); ini_set('display_errors', TRUE); ini_set('display_startup_errors', TRUE); if (PHP_SAPI == 'cli') die('This example should only be run from a Web Brows
美国电影超短200句 dcj3sjt126com 电影
1. I see．我明白了。2. I quit! 我不干了!3. Let go! 放手!4. Me too．我也是。5. My god! 天哪!6. No way! 不行!7. Come on．来吧(赶快)8. Hold on．等一等。9. I agree。我同意。10. Not bad．还不错。11. Not yet．还没。12. See you．再见。13. Shut up!
Java访问远程服务 dyy_gusi httpclient webservice get post
随着webService的崛起，我们开始中会越来越多的使用到访问远程webService服务。当然对于不同的webService框架一般都有自己的client包供使用，但是如果使用webService框架自己的client包，那么必然需要在自己的代码中引入它的包，如果同时调运了多个不同框架的webService，那么就需要同时引入多个不同的clien
Maven的settings.xml配置 geeksun settings.xml
settings.xml是Maven的配置文件，下面解释一下其中的配置含义： settings.xml存在于两个地方： 1.安装的地方：$M2_HOME/conf/settings.xml 2.用户的目录：${user.home}/.m2/settings.xml 前者又被叫做全局配置，后者被称为用户配置。如果两者都存在，它们的内容将被合并，并且用户范围的settings.xml优先。
ubuntu的init与系统服务设置 hongtoushizi ubuntu
转载自： http://iysm.net/?p=178 init Init是位于/sbin/init的一个程序，它是在linux下，在系统启动过程中，初始化所有的设备驱动程序和数据结构等之后，由内核启动的一个用户级程序，并由此init程序进而完成系统的启动过程。 ubuntu与传统的linux略有不同，使用upstart完成系统的启动，但表面上仍维持init程序的形式。运行
跟我学Nginx+Lua开发目录贴 jinnianshilongnian nginx lua
使用Nginx+Lua开发近一年的时间，学习和实践了一些Nginx+Lua开发的架构，为了让更多人使用Nginx+Lua架构开发，利用春节期间总结了一份基本的学习教程，希望对大家有用。也欢迎谈探讨学习一些经验。目录第一章安装Nginx+Lua开发环境第二章 Nginx+Lua开发入门第三章 Redis/SSDB+Twemproxy安装与使用第四章 L
php位运算符注意事项 home198979 位运算 PHP &
$a = $b = $c = 0; $a & $b = 1; $b | $c = 1 问a,b,c最终为多少? 当看到这题时，我犯了一个低级错误，误以为位运算符会改变变量的值。所以得出结果是1 1 0 但是位运算符是不会改变变量的值的，例如： $a=1;$b=2; $a&$b; 这样a,b的值不会有任何改变
Linux shell数组建立和使用技巧 pda158 linux
1.数组定义　　[chengmo@centos5 ~]$ a=(1 2 3 4 5) 　　[chengmo@centos5 ~]$ echo $a 　　1 　　一对括号表示是数组，数组元素用“空格”符号分割开。　　 2.数组读取与赋值　　得到长度：　　[chengmo@centos5 ~]$ echo ${#a[@]} 　　5 　　用${#数组名[@或
hotspot源码(JDK7) ol_beta java HotSpot jvm
源码结构图，方便理解： ├─agent Serviceab
Oracle基本事务和ForAll执行批量DML练习 vipbooks oracle sql
基本事务的使用：从账户一的余额中转100到账户二的余额中去，如果账户二不存在或账户一中的余额不足100则整笔交易回滚 select * from account; -- 创建一张账户表 create table account( -- 账户ID id number(3) not null, -- 账户名称 nam