feiweihy

大数据学习：Scala模式匹配和类型系统

前言：

为啥Scala没有JAVA火爆？

1、JAVA94年出现，占领了网络的先机，有各种框架，可以在对应的各个领域处理，占据了IT世界的方方面面；Scala00年后出现；

其实谈JAVA时候的，可以更多谈论JVM，而Scala也是运行在JVM

2、JAVA易学，Scala学习有点难度；大数据首选语言是Scala，天生有出色的函数式编程的支持；

预测：未来十年之内，没有哪门语言可以撼动JAVA的地位

运用模式匹配，精简实现；类型系统可以健壮应对各种变化。Spark源码中到处可见。

――Scala水平的分水岭！！！

模式匹配和JAVA switch case差不多，JAVA是对值判断

Scala模式匹配除了对值还可以类型、集合等匹配

==========按照值匹配============

scala> def bigData(data:String){

| data match{

| case "Spark" => println("Wow!!!")

| case "Hadoop" => println("Ok")

| case _ => println("Something others") //default

| }

bigData: (data: String)Unit

scala> bigData("d")

Something others

scala> bigData("Spark")

Wow!!!

scala> def bigData(data:String){

| data match{

| case "Spark" => println("Wow!!!")

| case "Hadoop" => println("Ok")

| case _ if data == "Flink" => println("Cool")

| case _ => println("Something others")

| }

bigData: (data: String)Unit

scala> bigData("Spark")

Wow!!!

scala> bigData("Flink")

Cool

==========按照值匹配，用变量名接受传入的模式匹配的============

scala> def bigData(data:String){

| data match{

| case "Spark" => println("Wow!!!")

| case "Hadoop" => println("Ok")

| case data_ if data_ == "Flink" => println("Cool")

| case _ => println("Something others")

| }

bigData: (data: String)Unit

scala> bigData("Flink")

Cool

==========按照类型匹配============

scala> import java.io._

import java.io._

scala> def exception(e:Exception){

| e match{

| case e:FileNotFoundException =>println("File not found:"+e)

| case _:Exception=>println("Hahaha")

| }

exception: (e: Exception)Unit

scala> exception(new FileNotFoundException("OOP hahah"))

File not found:java.io.FileNotFoundException: OOP hahah

==========按照Array匹配============

scala> def data(array:Array[String]){

| array match{

| case Array("Scala")=>println("Scala")

| case Array(spark,hadoop,flink) => println(spark+":"+hadoop+":"+flink) //三个元素分别赋值

| case Array("Spark",_*)=>println("Spark...") //Spark开头的数组

| case _=>println("Unkown")

| }

data: (array: Array[String])Unit

scala> data(Array("Spark"))

Spark...

scala> data(Array("Scala"))

Scala

scala> data(Array("Scala","Spark","Kafka"))

Scala:Spark:Kafka

==========case class(样例类)============

相当于JAVABEAN，里面一般都只读成员，一般用于并发编程通信作为消息通信体

val默认对外只有getter

实例化方面，会自动生成case class的伴生对象，而且里面会自定义若干apply方法

scala> case class Person(name:String)

defined class Person

scala> Person("Spark")

res35: Person = Person(Spark) //Scala自动生成了对象Person的伴生对象，且有apply方法

//进化匹配class

scala> class Person

defined class Person

scala> case class Worker(name:String,salary:Double) extends Person

defined class Worker

scala> case class Student(name:String,score:Double) extends Person

defined class Student

scala> def sayHi(person:Person){

| person match{

| case Student(name,score)=>println("name:"+name+";score:"+score)

| case Worker(name,salary)=>println("name:"+name+";salary:"+salary)

| case _=>println("Something others")

| }

sayHi: (person: Person)Unit

scala> sayHi(Worker("Spark",30))

name:Spark;salary:30.0

scala> sayHi(Student("Tom",100))

name:Tom;score:100.0

模式匹配中必须用：

Option：用来判断变量有没有值

Some：

case class每次工作时都会生成实例

case object全局的值，本身就是实例

类型参数，最大难点！！！Scala的核心，太有用了，所有的Spark源码中到处都有类型参数

==========泛型类、泛型方法：其实就是类型参数的概念============

scala> class Person[T](val content:T)

defined class Person

scala> class Person[T](val content:T){

| def getContent(id:T) = id+" _ "+content

| }

defined class Person

scala> val p = new Person[String]("Spark")

p: Person[String] = Person@815e0c

scala> p.getContent(100) //因为Person中定义就是String，所以传入Int就错了

<console>:10: error: type mismatch;

found : Int(100)

required: String

p.getContent(100)

scala> val p = new Person[String](2.3) //说了是String，想用Double，当然不行

<console>:8: error: type mismatch;

found : Double(2.3)

required: String

val p = new Person[String](2.3)

泛型用到这个的时候，就一定是这个

==========上边界============

比如公司要招聘大数据工程师，例如限制工程师必须至少要掌握Spark，就是边界

泛型是任意类型，如果我们指定类型的上边界或者下边界

那么所有的类型必须是上边界本身或者上边界的子类

//就是类必须是XXXX或者它的子类,那么condc可以调用XXXX的一切方法

def fuc1(path:String,condc:Class[_ <: XXXX])

==========下边界============

用的不是很多 >:

执行类型必须是下边界的父类

==========View Bounds!!!（视图界定）============

实际上用某个类，既不是属于上边界也不属于下边界，用隐式转换到错误的类型运行，看隐式转换之后是不是在判定的边界，就可以把和上下界没任何关系的东西传进去工作，再回到正确的运行，隐式转换下节课再讲

View Bounds 语法 <% 对类型进行隐式转换

SparkContext里面的

private implicit def arrayToArrayWritable[ T <% Writable: ClassTag]( arr: Traversable[T ])

: ArrayWritable = {

def anyToWritable[ U <% Writable]( u: U): Writable = u

new ArrayWritable( classTag[ T]. runtimeClass.asInstanceOf [Class[Writable]],

arr. map( x => anyToWritable(x )).toArray )

}

T必须是Writeble的子类型或者可以转换成Wirteble

T:类型类型[T] 隐式值在上下文中注入隐式值，而且注入隐式值的过程是自动的

Context Bounds：

scala> class Compare[T:Ordering](val n1:T,val n2:T)

defined class Compare

scala> class Compare[T:Ordering](val n1:T,val n2:T){

| def bigger(implicit ordered:Ordering[T]) = if(ordered.compare(n1,n2)>0)n1

else n2}

defined class Compare

scala> new Compare[Int](8,3).bigger

res5: Int = 8

scala> new Compare[String]("Spark","Hadoop").bigger

res6: String = Spark

scala> Ordering[String]

res7: scala.math.Ordering[String] = scala.math.Ordering$String$@1e0e8e5

scala> Ordering[Int]

res8: scala.math.Ordering[Int] = scala.math.Ordering$Int$@19cdef7

==========协变/逆变============

父类和子类的继承关系 +协变 -逆变

scala> class Person[+T]

defined class Person

这是协变情况。这种情况下，当类型S是类型A的子类型，则Queue[S]也可以认为是Queue[A}的子类型，即Queue[S]可以泛化为Queue[A]。也就是被参数化类型的泛化方向与参数类型的方向是一致的，所以称为协变。

这是逆变情况。这种情况下，当类型S是类型A的子类型，则Queue[A]反过来可以认为是Queue[S}的子类型。也就是被参数化类型的泛化方向与参数类型的方向是相反的，所以称为逆变。

Depency[_]这种写法相当于Depency[T]，语法看上去更加简洁

==========T:ClassTag ============

T:ClassTag 指的是泛型，但是编译时我们不知道是类型，只是在运行的时候runtime时候才确定类型，有些延迟执行等等开始不知道类型

* scala> def mkArray[T : ClassTag](elems: T*) = Array[T](elems: _*)

* mkArray: [T](elems: T*)(implicit evidence$1: scala.reflect.ClassTag[T])Array[T]

* scala> mkArray(42, 13)

* res0: Array[Int] = Array(42, 13)

* scala> mkArray("Japan","Brazil","Germany")

* res1: Array[String] = Array(Japan, Brazil, Germany)

老师的机器：

作业：

阅读Spark源码的RDD和HadoopRDD、SparkContext、Master、Worker的源码。并分析里面使用的所有模式匹配和类型参数。

***********RDD*************

~~~1、模式匹配~~~

/**

* Zips this RDD with another one, returning key-value pairs with the first element in each RDD,

* second element in each RDD, etc. Assumes that the two RDDs have the *same number of

* partitions* and the *same number of elements in each partition* (e.g. one was made through

* a map on the other).

def zip[U: ClassTag](other: RDD[U]): RDD[( T, U)] = withScope {

zipPartitions( other, preservesPartitioning = false) { ( thisIter, otherIter ) =>

new Iterator[( T, U)] {

def hasNext : Boolean = (thisIter.hasNext, otherIter.hasNext) match {

case (true , true) => true

case (false , false) => false

case _ => throw new SparkException("Can only zip RDDs with " +

"same number of elements in each partition" )

}

def next (): (T, U) = ( thisIter. next(), otherIter.next ())

}

zip函数，把需要打包的两个数组分别next，如果数量不一样就报错

val mergeResult = (index : Int, taskResult : Option[T]) => {

if (taskResult.isDefined) {

jobResult = jobResult match {

case Some (value ) => Some(f(value, taskResult.get))

case None => taskResult

}

融合

/**

* Return whether this RDD is marked for local checkpointing.

* Exposed for testing.

private[rdd] def isLocallyCheckpointed : Boolean = {

checkpointData match {

case Some(_: LocalRDDCheckpointData[T]) => true

case _ => false

}

~~~2、类型系统~~~

abstract class RDD[ T : ClassTag ](

类的泛化

@ DeveloperApi

def compute( split: Partition, context: TaskContext): Iterator [T ]

方法的泛化

/** An Option holding our checkpoint RDD, if we are checkpointed */

private def checkpointRDD : Option[CheckpointRDD[ T]] = checkpointData .flatMap (_.checkpointRDD )

参数的泛化

/**

* Save this RDD as a compressed text file, using string representations of elements.

def saveAsTextFile( path: String , codec : Class[_ <: CompressionCodec]): Unit = withScope {

// https://issues.apache.org/jira/browse/SPARK-2075

val nullWritableClassTag = implicitly [ClassTag [NullWritable]]

val textClassTag = implicitly [ClassTag [Text]]

val r = this. mapPartitions { iter =>

val text = new Text()

iter. map { x =>

text. set( x. toString)

(NullWritable. get(), text)

}

RDD. rddToPairRDDFunctions( r)( nullWritableClassTag , textClassTag , null)

. saveAsHadoopFile[TextOutputFormat[NullWritable, Text]]( path, codec)

}

***********HadoopRDD *************

~~~1、模式匹配~~~

protected def getInputFormat (conf : JobConf): InputFormat[ K, V] = {

val newInputFormat = ReflectionUtils.newInstance (inputFormatClass .asInstanceOf [ Class[_]], conf)

. asInstanceOf[ InputFormat [K , V]]

newInputFormat match {

case c: Configurable => c .setConf (conf )

case _ =>

}

newInputFormat

}

匹配类型，设置配置

// Sets the thread local variable for the file's name

split. inputSplit. value match {

case fs : FileSplit => SqlNewHadoopRDDState .setInputFileName (fs .getPath .toString )

case _ => SqlNewHadoopRDDState .unsetInputFileName ()

}

val locs: Option[Seq[String]] = HadoopRDD.SPLIT_INFO_REFLECTIONS match {

case Some(c) =>

try {

val lsplit = c.inputSplitWithLocationInfo.cast(hsplit)

val infos = c.getLocationInfo.invoke(lsplit).asInstanceOf[Array[AnyRef]]

Some(HadoopRDD.convertSplitLocationInfo(infos))

} catch {

case e: Exception =>

logDebug("Failed to use InputSplitWithLocations.", e)

None

}

case None => None

}

~~~2、类型系统~~~

@ DeveloperApi

class HadoopRDD[ K, V](

sc: SparkContext,

broadcastedConf: Broadcast[SerializableConfiguration],

initLocalJobConfFuncOpt: Option[JobConf => Unit],

inputFormatClass: Class [_ <: InputFormat[K, V]],

keyClass: Class[ K],

valueClass: Class [V ],

minPartitions: Int)

extends RDD[( K, V)]( sc, Nil ) with Logging {

上边界

***********SparkContext *************

~~~1、模式匹配~~~

/**

* The number of driver cores to use for execution in local mode, 0 otherwise.

private[spark] def numDriverCores (master : String): Int = {

def convertToInt( threads: String ): Int = {

if ( threads == "*") Runtime. getRuntime .availableProcessors () else threads .toInt

}

master match {

case "local" => 1

case SparkMasterRegex .LOCAL_N_REGEX (threads ) => convertToInt (threads )

case SparkMasterRegex .LOCAL_N_FAILURES_REGEX (threads , _) => convertToInt (threads )

case _ => 0 // driver is not used for execution

}

多少个驱动内核的匹配

val schemeCorrectedPath = uri .getScheme match {

case null | "local" => new File( path). getCanonicalFile. toURI. toString

case _ => path

}

val schemeCorrectedPath = uri. getScheme match {

case null | "local" => new File( path). getCanonicalFile. toURI. toString

case _ => path

}

~~~2、类型系统~~~

val constructors = {

val listenerClass = Utils .classForName (className )

listenerClass .getConstructors .asInstanceOf [Array[Constructor[_ <: SparkListener]]]

}

上边界

private [spark] def clean [ F <: AnyRef]( f: F, checkSerializable : Boolean = true): F = {

ClosureCleaner. clean( f, checkSerializable )

}

上边界

private implicit def arrayToArrayWritable[T <% Writable: ClassTag](arr: Traversable[T])

: ArrayWritable = {

def anyToWritable[U <% Writable](u: U): Writable = u

new ArrayWritable(classTag[T].runtimeClass.asInstanceOf[Class[Writable]],

arr.map(x => anyToWritable(x)).toArray)

}

隐式转换，还不是很明白，等第5课之后再回头来看

***********Master*************

~~~1、模式匹配~~~

private def removeDriver (

driverId: String,

finalState: DriverState ,

exception: Option[ Exception ]) {

drivers. find( d => d. id == driverId) match {

case Some (driver ) =>

logInfo( s"Removing driver: $ driverId ")

drivers -= driver

if (completedDrivers .size >= RETAINED_DRIVERS ) {

val toRemove = math.max (RETAINED_DRIVERS / 10 , 1 )

completedDrivers .trimStart (toRemove )

}

completedDrivers += driver

persistenceEngine .removeDriver (driver )

driver. state = finalState

driver. exception = exception

driver. worker. foreach( w => w. removeDriver (driver ))

schedule()

case None =>

logWarning (s "Asked to remove unknown driver: $ driverId ")

}

case ExecutorStateChanged (appId , execId , state , message , exitStatus ) => {

val execOption = idToApp. get( appId). flatMap( app => app .executors .get (execId ))

execOption match {

case Some (exec ) => {

val appInfo = idToApp (appId )

val oldState = exec .state

exec. state = state

case DriverStateChanged (driverId , state , exception ) => {

state match {

case DriverState .ERROR | DriverState .FINISHED | DriverState .KILLED | DriverState .FAILED =>

removeDriver (driverId , state , exception )

case _ =>

throw new Exception(s "Received unexpected state update for driver $driverId : $state ")

}

case Heartbeat (workerId , worker ) => {

idToWorker. get( workerId) match {

case Some (workerInfo ) =>

workerInfo .lastHeartbeat = System. currentTimeMillis()

case None =>

if (workers .map (_.id ).contains (workerId )) {

logWarning (s "Got heartbeat from unregistered worker $ workerId ." +

" Asking it to re-register." )

worker. send( ReconnectWorker (masterUrl ))

} else {

logWarning (s "Got heartbeat from unregistered worker $ workerId ." +

" This worker was never registered, so ignoring the heartbeat." )

}

***********Worker*************

~~~1、模式匹配~~~

master match {

case Some (masterRef ) =>

// registered == false && master != None means we lost the connection to master, so

// masterRef cannot be used and we need to recreate it again. Note: we must not set

// master to None due to the above comments.

if (registerMasterFutures != null) {

registerMasterFutures .foreach (_.cancel ( true))

}

val masterAddress = masterRef .address

registerMasterFutures = Array (registerMasterThreadPool .submit ( new Runnable {

override def run (): Unit = {

private def registerWithMaster () {

// onDisconnected may be triggered multiple times, so don't attempt registration

// if there are outstanding registration attempts scheduled.

registrationRetryTimer match {

case None =>

registered = false

registerMasterFutures = tryRegisterAllMasters ()

connectionAttemptCount = 0

registrationRetryTimer = Some (forwordMessageScheduler .scheduleAtFixedRate (

new Runnable {

override def run (): Unit = Utils. tryLogNonFatalError {

Option (self ). foreach(_. send ( ReregisterWithMaster))

}

INITIAL_REGISTRATION_RETRY_INTERVAL_SECONDS ,

TimeUnit. SECONDS))

case Some (_) =>

logInfo( "Not spawning another attempt to register with the master, since there is an" +

" attempt scheduled already." )

}

本文出自 “一枝花傲寒” 博客，谢绝转载！

你可能感兴趣的:(Scala模式匹配和类型系统)

x86-64汇编语言训练程序与实战十除以十等于一
本文还有配套的精品资源，点击获取简介：汇编语言是一种低级语言，与机器代码紧密相关，特别适用于编写系统级代码及性能要求高的应用。nasm编译器是针对x86和x86-64架构的汇编语言编译器，支持多种语法风格和指令集。项目Euler提供数学和计算机科学问题，鼓励编程技巧应用，前100个问题的答案可共享。x86-64架构扩展了寄存器数量并引入新指令，提升了数据处理效率。学习汇编语言能够深入理解计算机底层
三菱PLC全套学习资料及应用手册 good2know
本文还有配套的精品资源，点击获取简介：三菱PLC作为工业自动化领域的核心设备，其系列产品的学习和应用需要全面深入的知识。本次资料包为学习者提供从基础到进阶的全方位学习资源，包括各种型号PLC的操作手册、编程指南、软件操作教程以及实际案例分析，旨在帮助用户系统掌握PLC的编程语言、指令系统及在各类工业应用中的实施。1.三菱PLC基础知识入门1.1PLC的基本概念可编程逻辑控制器（PLC）是工业自动化
移动端城市区县二级联动选择功能实现包 good2know
本文还有配套的精品资源，点击获取简介：本项目是一套为移动端设计的jQuery实现方案，用于简化用户在选择城市和区县时的流程。它包括所有必需文件：HTML、JavaScript、CSS及图片资源。通过动态更新下拉菜单选项，实现城市到区县的联动效果，支持数据异步加载。开发者可以轻松集成此功能到移动网站或应用，并可基于需求进行扩展和优化。1.jQuery移动端解决方案概述jQuery技术简介jQuery
15个小技巧，让我的Windows电脑更好用了！曹元_
01.桌面及文档处理第一部分的技巧，主要是围绕桌面的一些基本操作，包括主题设置、常用文档文件快捷打开的多种方式等等。主题换色默认情况下，我们的Win界面可能就是白色的文档界面，天蓝色的图表背景，说不出哪里不好看，但是就是觉得不够高级。imageimage说到高级感，本能第一反应就会和暗色模式联想起来，如果我们将整个界面换成黑夜模式的话，它会是这样的。imageimage更改主题颜色及暗色模式，我们
（二）SAP Group Reporting (GR) 核心子模块功能及数据流向架构解析
数据如何从子公司流转到合并报表的全过程，即数据采集→合并引擎→报表输出，特别是HANA内存计算如何优化传统ETL瓶颈。SAPGroupReporting(GR)核心模块功能及数据流向的架构解析，涵盖核心组件、数据处理流程和关键集成点，适用于S/4HANA1809+版本：一、核心功能模块概览模块功能关键事务码/FioriApp数据采集(DataCollection)整合子公司财务数据（SAP/非SA
9、汇编语言编程入门：从环境搭建到简单程序实现神经网络酱汇编语言 MEPIS GNU工具链
汇编语言编程入门：从环境搭建到简单程序实现1.数据存储介质问题解决在处理数据存储时，若要使用MEPIS系统，需确保有其可访问的存储介质。目前，MEPIS无法向采用NTFS格式（常用于Windows2000和XP工作站）的硬盘写入数据。不过，若硬盘采用FAT32格式，MEPIS就能进行写入操作。此外，MEPIS还能将文件写入软盘和大多数USB闪存驱动器。若工作站连接到局域网，还可通过FTP协议或挂载
月光下的罪恶（5）允歌玖沐
5.被孤立顾纨是转校过来的，进入学校后，回头率很高“诶诶诶，你看那女生，哪个系的？”“不知道没见过。”“看那样，一看就是个胆小的货。”顾纨当做没听到，更狠的话她都听过，更何况女生们耍心眼？“他爸爸是做黑生意的，估计女儿也不是什么好的，你以后离他一家子远点。”她走向自己要上课的教室，一进门，所有人的目光看向她，顾纨若无其事的走进教室，开始上课。下课，一群人站起来，但是很显然，她周围的一圈人都不愿意和
day15｜前端框架学习和算法 universe_01 前端算法笔记
T22括号生成先把所有情况都画出来，然后（在满足什么情况下）把不符合条件的删除。T78子集要画树状图，把思路清晰。可以用暴力法、回溯法和DFS做这个题DFS深度搜索：每个边都走完，再回溯应用：二叉树搜索，图搜索回溯算法=DFS+剪枝T200岛屿数量（非常经典BFS宽度把树状转化成队列形式，lambda匿名函数“一次性的小函数，没有名字”setup语法糖：让代码更简洁好写的语法ref创建：基本类型的
三件事—小白猫·雨天·八段锦咸鱼月亮
1.最近楼下出现一只非常漂亮的粘人小白猫，看着不像是流浪猫，非常亲人。眼睛比蓝球的还大，而且是绿色的，很漂亮。第一次遇到它，它就跟我到电梯口，如果我稍微招招手，肯定就跟我进电梯了。后来我喂过它几次，好可惜不能养它，一只蓝球就是我的极限了。2.下雨天就心烦，好奇怪。明明以前我超爱看窗外的雨和听雨声，看来近来的心情不够宁静了。3.最近在练八段锦，从第一次就爱上了这个运动，很轻松缓慢，但是却出汗。感觉可
我不懂什么是爱，但我给你全部我拥有的香尧
因为怕黑，所以愿意陪伴在夜中行走的人，给他一点点的安全感。因为渴望温柔与爱，所以愿意为别的孩子付出爱与温柔。因为曾遭受侮辱和伤害，所以不以同样的方式施于其他人。如果你向别人出之以利刃，对方还了你爱与包容，真的不要感激他，真的不要赞美他。每一个被人伤害过的人心里都留下了一颗仇恨的种子，他也会想要有一天以眼还眼，以牙还牙。但他未让那颗种子生根发芽，他用一把心剑又一次刺向他自己，用他血荐仇恨，开出一朵温
C++ 计数排序、归并排序、快速排序每天搬一点点砖 c++数据结构算法
计数排序：是一种基于哈希的排序算法。他的基本思想是通过统计每个元素的出现次数，然后根据统计结果将元素依次放入排序后的序列中。这种排序算法适用于范围较小的情况，例如整数范围在0到k之间计数排序步骤：1初始化一个长度为最大元素值加1的计数数组，所有元素初始化为02遍历原始数组，将每个元素值作为索引，在计数数组中对应位置加13将数组清空4遍历计数器数组，按照数组中的元素个数放回到元数组中计数排序的优点和
2023-11-02 一帆f
发现浸润心田的感觉：今天一个机缘之下突然想分享我的婆媳关系，我一边分享一边回忆我之前和儿媳妇关系的微妙变化，特别是分享到我能感受到儿媳妇的各种美好，现在也能心平气和的和老公平等对话，看到自己看到老公，以己推人以人推己自然而然的换位思考，心中有一种美好的能量在涌动，一种浸润心田的感觉从心胸向全身扩散，美好极了……我很想记住这种感觉，赶紧把它写下来以留纪念，也就是当我看见他人的美好，美好的美妙的浸润心
贫穷家庭的孩子考上985以后会怎样？ Mellisa蜜思言
我出生在一个贫穷的农村家庭，据我妈说，我出生的时候才4斤多，而她生完我以后月子里就瘦到70斤。家里一直很穷，父母都是在菜市场卖菜的，家里还有几亩地种庄稼的。我很小开始就要去帮忙，暑假的生活就是帮忙去卖菜和割稻谷，那时候自己对于割稻谷这种事情有着莫名的恐惧，生怕自己长大以后还是每年都要过着割稻谷这种日子。父母因为忙于生计无暇顾及我的学习，幸好我因为看到他们这样子的生活，内心里有深深的恐惧感，驱使着我
实时数据流计算引擎Flink和Spark剖析程小舰 flink spark 数据库 kafka hadoop
在过去几年，业界的主流流计算引擎大多采用SparkStreaming，随着近两年Flink的快速发展，Flink的使用也越来越广泛。与此同时，Spark针对SparkStreaming的不足，也继而推出了新的流计算组件。本文旨在深入分析不同的流计算引擎的内在机制和功能特点，为流处理场景的选型提供参考。（DLab数据实验室w.x.公众号出品）一.SparkStreamingSparkStreamin
日更50天有什么收益？星湾二宝
坚持在平台上日更50天了，平台也为我生成了日更50天徽章，小开心一下这份坚持。日更50天徽章那坚持50天都有哪些收益呢？收益一，就是最直观的那些钻和贝，我这边确实不太高，但是这些贝足够支撑我保持会员的资格，能够在发文的时候帮助友友们去除广告，方便阅读。钻和贝收益二，文章的收获，日更50天，坚持写作3.7万文字，书写的文字也从开始的流水账/碎碎念逐渐加入自己的思考和观点。以前，一个念头会一晃而过，如
Git 与 GitHub 的对比与使用指南一念& 其它 git github
Git与GitHub的对比与使用指南在软件开发中，Git和GitHub是两个密切相关但本质不同的工具。下面我将逐步解释它们的定义、区别、核心概念以及如何协同使用，确保内容真实可靠，基于广泛的技术实践。1.什么是Git？Git是一个分布式版本控制系统，由LinusTorvalds于2005年创建。它的核心功能是跟踪代码文件的变化，帮助开发者管理项目历史记录、协作和回滚错误。Git是开源的，可以在本地
深入解析JVM工作原理：从字节码到机器指令的全过程
一、JVM概述Java虚拟机(JVM)是Java平台的核心组件，它实现了Java"一次编写，到处运行"的理念。JVM是一个抽象的计算机器，它有自己的指令集和运行时内存管理机制。JVM的主要职责：加载：读取.class文件并验证其正确性存储：管理内存分配和垃圾回收执行：解释或编译字节码为机器指令安全：提供沙箱环境限制恶意代码二、JVM架构详解JVM由三个主要子系统组成：1.类加载子系统类加载过程分为
Spring进阶 - SpringMVC实现原理之DispatcherServlet处理请求的过程倾听铃的声后端 spring java mvc 开发语言分布式
前文我们有了IOC的源码基础以及SpringMVC的基础，我们便可以进一步深入理解SpringMVC主要实现原理，包含DispatcherServlet的初始化过程和DispatcherServlet处理请求的过程的源码解析。本文是第二篇：DispatcherServlet处理请求的过程的源码解析。@pdaiSpring进阶-SpringMVC实现原理之DispatcherServlet处理请求的
ARM 和 AMD 架构的区别 m0_69576880 arm开发 windows 架构
ARM架构和AMD架构是两种不同的计算机处理器架构，它们有以下几个主要区别：设计出发点、兼容性、性能特点、市场定价。设计出发点：①ARM构架：ARM架构最初是为嵌入式系统设计的，旨在提供低功耗和高效能的解决方案。它主要应用于移动设备、嵌入式系统和物联网设备②AMD架构：AMD架构是基于x86架构的扩展，旨在提供与Intel架构兼容的处理器。它主要用于台式机、服务器和工作站等计算机系统。兼容性：AR
Linux系统配置（应用程序） 1风天云月 Linux linux 应用程序编译安装 rpm http
目录前言一、应用程序概述1、命令与程序的关系2、程序的组成3、软件包封装类型二、RPM1、RPM概述2、RPM用法三、编译安装1、解包2、配置3、编译4、安装5、启用httpd服务结语前言在Linux中的应用程序被视为将软件包安装到系统中后产生的各种文档，其中包括可执行文件、配置文件、用户手册等内容，这些文档被组织为一个有机的整体，为用户提供特定的功能，因此对于“安装软件包”与“安装应用程序”这两
第28章汇编语言--- 异常处理 hummhumm 汇编算法开发语言程序设计高级语言异常处理汇编语言
在汇编语言中，异常处理是一个重要的概念，它涉及到处理器如何响应和处理程序运行时发生的非正常情况。异常可以是硬件错误（例如除零错误、非法指令）或者软件触发的中断（例如系统调用）。当发生异常时，处理器会暂停当前正在执行的程序，并转移到一个预先定义好的位置来处理这个异常。为了详细阐述第28章关于汇编语言中的异常处理，我们可以考虑一个简化的例子，展示异常处理的基本结构。请注意，实际的代码将取决于具体的处理
【C++算法】76.优先级队列_前 K 个高频单词流星白龙优选算法C++c++算法开发语言
文章目录题目链接：题目描述：解法C++算法代码：题目链接：692.前K个高频单词题目描述：解法利用堆来解决TopK问题预处理一下原始的字符串数组，用一个哈希表统计一下每一个单词出现的频次。创建一个大小为k的堆频次：小根堆字典序（频次相同的时候）：大根堆循环让元素依次进堆判断提取结果C++算法代码：classSolution{//定义类型别名，PSI表示对typedefpairPSI;//自定义比较
关于流媒体播放器EasyPlayer和EasyPlayerPro的介绍以及其区别 EasyDarwin EasyDarwin 音视频 ffmpeg 人工智能大数据 ar
EasyPlayer是一款流媒体播放器系列项目，它支持多种流媒体协议的播放，包括但不限于RTSP、RTMP、HTTP、HLS、UDP、RTP、File等。除此之外，EasyPlayer还支持本地文件播放和多种功能特性，包括本地抓拍、本地录像、播放旋转、多屏播放、倍数播放等。EasyPlayer核心基于ffmpeg，稳定、高效、可靠、可控。随着多年的不断发展和迭代，EasyPlayer基于成功的实践
JVM 内存模型深度解析：原子性、可见性与有序性的实现练习时长两年半的程序员小胡 JVM 深度剖析：从面试考点到生产实践 jvm java 内存模型
在了解了JVM的基础架构和类加载机制后，我们需要进一步探索Java程序在多线程环境下的内存交互规则。JVM内存模型（JavaMemoryModel，JMM）定义了线程和主内存之间的抽象关系，它通过规范共享变量的访问方式，解决了多线程并发时的数据一致性问题。本文将从内存模型的核心目标出发，详解原子性、可见性、有序性的实现机制，以及volatile、synchronized等关键字在其中的作用。一、J
Flowable 实战落地核心：选型决策与坑点破解练习时长两年半的程序员小胡 Flowable 流程引擎实战指南低代码 BPMN 流程引擎 flowable 后端 java
在企业级流程引擎的落地过程中，选型的准确性和坑点的预见性直接决定项目成败。本文聚焦Flowable实战中最关键的“选型决策”与“常见坑点”，结合真实项目经验，提供可落地的解决方案。一、流程引擎选型：从业务本质出发1.1选型的三大核心维度企业在选择流程引擎时，需避免陷入“技术崇拜”，应回归业务本质。评估Flowable是否适用，可从三个维度判断：业务复杂度若流程涉及动态审批链（如按金额自动升级审批）
Flowable 高级扩展：自定义元素与性能优化实战练习时长两年半的程序员小胡 Flowable 流程引擎实战指南流程图 flowable BPMN 流程引擎 java
在前五篇文章中，我们从基础概念、流程设计、API实战、SpringBoot集成，到外部系统协同，逐步构建了Flowable的应用体系。但企业级复杂场景中，原生功能往往难以满足定制化需求——比如需要特殊的审批规则网关、与决策引擎联动实现动态路由，或是在高并发场景下优化流程引擎性能。本文将聚焦Flowable的高级扩展能力，详解如何自定义流程元素、集成规则引擎，并掌握大型系统中的性能调优策略。一、自定
2022-04-07 上善若水1979527
昨天苏阿姨来给我送普门品！和她一块来的还有另外一个阿姨！我下去拿时！那阿姨说你不是干房产的小赵！帮我租房的！我说你认识我？对啊！你帮我租的房子！我没印象了！我和保红一块！我说我想起来了阿姨！你这运动服一换！小电车一骑！一下年轻十岁我早记不得了！我只记得一九年五一带看了河滨美航还有德胜的好多套房子！你都不当意！你告诉我你每晚拜观音菩萨说快让小赵普萨帮我找套合适的房子吧！我把本子上记得半年内的德胜房源
互信息：理论框架、跨学科应用与前沿进展大千AI助手人工智能 Python #OTHER 人工智能深度学习算法互信息香农通信随机变量
1.起源与核心定义互信息（MutualInformation,MI）由克劳德·香农（ClaudeShannon）在1948年开创性论文《AMathematicalTheoryofCommunication》中首次提出，该论文奠定了现代信息论的基础。互信息用于量化两个随机变量之间的统计依赖关系，定义为：若已知一个随机变量的取值，能为另一个随机变量提供的信息量。数学上，对于离散随机变量XXX和YYY，
《实际生活是我们的指南针》——教育中寻找曙光托克托126何芳
陶行知先生的文章相对《致青年教师》比较难理解，但是他热爱学生,在书中处处能感受到。在《实际生活是我们的指南针》文中他说道:“我虽觉得我有好多地方可以帮助诸位,但指志针确是有些不敢当。我和诸位同是在乡村里摸路的人。我们的真正指南针只是实际生活。”这些话不仅使人感到他非常谦虛,既不夸大自己的作用也不轻视自己的作用。图片发自App我们的真正指南针只是实际生活。实际生活向我们供给无穷的问题,要求不断的解决
Java | 多线程经典问题 - 售票 Ada54
一、售票需求1）同一个票池2）多个窗口卖票，不能出售同一张票二、售票问题代码实现（线程与进程小总结，请戳：Java|线程和进程，创建线程）step1：定义SaleWindow类实现Runnable接口，覆盖run方法step2：实例化SaleWindow对象，创建Thread对象，将SaleWindow作为参数传给Thread类的构造函数，然后通过Thread.start()方法启动线程step3
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后