周润发的弟弟

【SparkML实践4】Pipeline实战scala版

Pipeline中的主要概念

MLlib标准化了机器学习算法的API，使得将多个算法组合成单一的管道或工作流程变得更加容易。本节介绍了Pipelines API引入的关键概念，其中管道的概念主要受到scikit-learn项目的启发。

DataFrame：这个机器学习API使用来自Spark SQL的DataFrame作为机器学习数据集，它可以包含多种数据类型。例如，一个DataFrame可以有不同的列存储文本、特征向量、真实标签和预测值。
Transformer：Transformer是一种算法，可以将一个DataFrame转换成另一个DataFrame。例如，一个机器学习模型是一个Transformer，它将带有特征的DataFrame转换成带有预测的DataFrame。
Estimator：Estimator是一种算法，可以在DataFrame上进行拟合以产生一个Transformer。例如，一个学习算法是一个Estimator，它在DataFrame上训练并产生一个模型。
Pipeline：Pipeline将多个Transformers和Estimators链接在一起，以指定一个机器学习工作流程。
Parameter：所有的Transformers和Estimators现在共享一个用于指定参数的通用API。

DataFrame

机器学习可以应用于多种数据类型，如向量、文本、图像和结构化数据。这个API采用了Spark SQL中的DataFrame以支持多种数据类型。

DataFrame支持许多基本和结构类型；有关支持类型的列表，请参阅Spark SQL数据类型参考。除了Spark SQL指南中列出的类型，DataFrame还可以使用ML Vector类型。

DataFrame可以从常规RDD隐式或显式创建。请参阅下面的代码示例和Spark SQL编程指南中的示例。

DataFrame中的列是有名称的。下面的代码示例使用了如“text”、“features”和“label”这样的名称。

pipeline components（管道组件）

Transformers

Transformer是一个包括特征转换器和学习模型的抽象概念。技术上，Transformer实现了一个transform()方法，它可以将一个DataFrame转换成另一个DataFrame，通常是通过添加一个或多个列。例如：

一个特征转换器可能会取一个DataFrame，读取一个列（例如，文本），将其映射到一个新列（例如，特征向量），并输出一个附加了映射列的新DataFrame。
一个学习模型可能会取一个DataFrame，读取包含特征向量的列，预测每个特征向量的标签，并输出一个附加了预测标签列的新DataFrame。

Estimators

Estimator抽象了学习算法或任何在数据上拟合或训练的算法的概念。技术上，Estimator实现了一个fit()方法，该方法接受一个DataFrame并产生一个模型，而模型是一个Transformer。例如，一个学习算法如LogisticRegression是一个Estimator，调用fit()训练了一个LogisticRegressionModel，这是一个模型，因此也是一个Transformer。

Properties of pipeline components（管道组件的属性）

Transformer.transform()和Estimator.fit()都是无状态的。将来，有状态的算法可能通过替代概念得到支持。

Transformer或Estimator的每个实例都有一个唯一的ID，这在指定参数时非常有用（下面将讨论）。

Pipeline

在机器学习中，通常会运行一系列算法来处理和学习数据。例如，一个简单的文本文档处理工作流可能包括几个阶段：

将每个文档的文本分割成单词。
将每个文档的单词转换成数值特征向量。
使用特征向量和标签学习预测模型。
MLlib将这样的工作流表示为Pipeline，它由一系列要按特定顺序运行的PipelineStages（Transformers和Estimators）组成。我们将在本节中使用这个简单的工作流作为一个运行示例。

How it works

Pipeline 被指定为一系列的阶段，每个阶段要么是 Transformer，要么是 Estimator。这些阶段按顺序运行，输入的 DataFrame 在通过每个阶段时被转换。对于 Transformer 阶段，会在 DataFrame 上调用 transform() 方法。对于 Estimator 阶段，则调用 fit() 方法来产生一个 Transformer（它成为 PipelineModel 或已拟合 Pipeline 的一部分），然后在 DataFrame 上调用该 Transformer 的 transform() 方法。

我们以简单的文本文档工作流为例来说明这一点。下面的图是在训练时使用 Pipeline 的情况。

上面，顶部的行代表一个有三个阶段的 Pipeline。前两个（Tokenizer 和 HashingTF）是 Transformers（蓝色），第三个（LogisticRegression）是一个 Estimator（红色）。底部的行代表数据流经管道，其中圆柱体表示 DataFrames。Pipeline.fit() 方法被调用在原始 DataFrame 上，该 DataFrame 包含原始文本文档和标签。Tokenizer.transform() 方法将原始文本文档分割成单词，向 DataFrame 添加一个包含单词的新列。HashingTF.transform() 方法将单词列转换成特征向量，向 DataFrame 添加一个包含这些向量的新列。现在，由于 LogisticRegression 是一个 Estimator，Pipeline 首先调用 LogisticRegression.fit() 来产生一个 LogisticRegressionModel。如果 Pipeline 有更多的 Estimators，它会在将 DataFrame 传递到下一个阶段之前，调用 LogisticRegressionModel 的 transform() 方法在 DataFrame 上。

Pipeline 是一个 Estimator。因此，在 Pipeline 的 fit() 方法运行之后，它产生一个 PipelineModel，这是一个 Transformer。这个 PipelineModel 在测试时被使用；下面的图说明了这种用法。

在上图中，PipelineModel 与原始 Pipeline 拥有相同数量的阶段，但原始 Pipeline 中的所有 Estimators 都已变成 Transformers。当在测试数据集上调用 PipelineModel 的 transform() 方法时，数据按顺序通过已拟合的 pipeline。每个阶段的 transform() 方法更新数据集并将其传递到下一个阶段。

Pipelines 和 PipelineModels 帮助确保训练数据和测试数据经过相同的特征处理步骤。

Details

DAG管道：管道的阶段被指定为一个有序数组。这里给出的例子都是线性管道，即，每个阶段使用前一个阶段产生的数据的管道。只要数据流图形成一个有向无环图（DAG），就有可能创建非线性管道。这个图目前是基于每个阶段的输入和输出列名隐式指定的（通常作为参数指定）。如果管道形成了一个DAG，那么阶段必须按拓扑顺序指定。

运行时检查：由于管道可以操作具有不同类型的DataFrames，它们不能使用编译时类型检查。管道和PipelineModels相反，在实际运行管道之前进行运行时检查。这种类型检查是使用DataFrame模式完成的，DataFrame模式是对DataFrame中列的数据类型的描述。

独特的管道阶段：管道的阶段应该是独特的实例。例如，相同的实例myHashingTF不应该被插入到管道中两次，因为管道阶段必须有唯一的ID。然而，不同的实例myHashingTF1和myHashingTF2（都是HashingTF类型的）可以放入同一个管道，因为不同的实例将会创建具有不同ID的。

Parameters（参数）

MLlib中的估计器（Estimators）和转换器（Transformers）使用统一的API来指定参数。

Param是一个具有自包含文档的命名参数。ParamMap是一组（参数，值）对。

有两种主要的方法来向算法传递参数：

为实例设置参数。例如，如果lr是LogisticRegression的一个实例，可以调用lr.setMaxIter(10)使lr.fit()使用最多10次迭代。这个API类似于在spark.mllib包中使用的API。
向fit()或transform()传递一个ParamMap。ParamMap中的任何参数将覆盖之前通过设置方法指定的参数。
参数属于估计器和转换器的特定实例。例如，如果我们有两个LogisticRegression实例lr1和lr2，那么我们可以构建一个ParamMap，其中指定了两个maxIter参数：ParamMap(lr1.maxIter -> 10, lr2.maxIter -> 20)。如果在一个Pipeline中有两个算法都有maxIter参数，这就非常有用。

ML persistence: Saving and Loading Pipelines（ML持久化：保存和加载管道）

ML持久性：保存和加载管道
很多时候，将模型或管道保存到磁盘以供以后使用是值得的。在Spark 1.6中，模型导入/导出功能被添加到Pipeline API中。截至Spark 2.3，基于DataFrame的API在spark.ml和pyspark.ml中已经完全覆盖。

ML持久性在Scala、Java和Python之间是通用的。然而，R目前使用了一种修改过的格式，所以在R中保存的模型只能在R中加载；这个问题应该在将来得到解决，并在SPARK-15572中跟踪。

ML持久性的向后兼容性
一般来说，MLlib保持了对ML持久性的向后兼容性。也就是说，如果你在一个版本的Spark中保存了一个ML模型或管道，那么你应该能够在未来的Spark版本中加载并使用它。然而，有少数例外

###Code examples（代码示例）
本节提供了代码示例，说明了上述功能。更多信息，请参考API文档。

Example: Estimator, Transformer, and Param


import org.apache.spark.ml.{Pipeline, PipelineModel}
import org.apache.spark.ml.classification.LogisticRegression
import org.apache.spark.ml.feature.{HashingTF, Tokenizer}
import org.apache.spark.sql.{Row, SparkSession}
/**
 * @description Pipeline 示例
 * @date 2024/1/31 17:48
 */
object Pipeline {

  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder
      .master("local[*]")
      .appName("Pipeline")
      .getOrCreate()
    // 训练文档，一个三元组
    val training = spark.createDataFrame(Seq(
      (0L, "a b c d e spark", 1.0),
      (1L, "b d", 0.0),
      (2L, "spark f g h", 1.0),
      (3L, "hadoop mapreduce", 0.0)
    )).toDF("id", "text", "label")

    // 定义一个ML Pipeline，包含三个步骤：tokenizer, hashingTF, and lr
    val tokenizer = new Tokenizer().setInputCol("text").setOutputCol("words")
    val hashingTF = new HashingTF().setNumFeatures(1000).setInputCol(tokenizer.getOutputCol).setOutputCol("features")
    val lr = new LogisticRegression().setMaxIter(10).setRegParam(0.01)

    val pipeline = new Pipeline().setStages(Array(tokenizer, hashingTF, lr))
    // 用测试数据训练模型
    val model:PipelineModel = pipeline.fit(training)

    //将训练好的模型保存在磁盘上
    model.write.overwrite().save("tmp/spark-logistic-regression-model")

    // 也可以将未训练的模型保存
    pipeline.write.overwrite().save("tmp/unfit-lr-model")

    // 加载已经训练好的模型
    val sameModel:PipelineModel = PipelineModel.load("tmp/spark-logistic-regression-model")
    //准备未打标签的测试文档
    val test = spark.createDataFrame(Seq(
      (4L, "spark i j k"),
      (5L, "l m n"),
      (6L, "spark hadoop spark"),
      (7L, "apache hadoop")
    )).toDF("id", "text")

    sameModel.transform(test).select("id", "text", "probability", "prediction").show()

  }
}

你可能感兴趣的:(Spark机器学习,spark-ml,scala,开发语言)

native.js设置可缩放的webview并隐藏缩放控件 Nanayai
需求明确:webview页面可以手指缩放,并且不要那个原生控件;实现思路:1.使用h5+封装好的方法:设置scalable属性,并在html中设置meta标签:user-scalable=yes或不设置,minimum-scale和maximum-scale需要注意不要都设为1:mui.openWindow({url:"someThing",id:"someThing",styles:{scala
Flink window 源码分析4：WindowState 北_鱼 Flink flink 大数据 big data
Flinkwindow源码分析1：窗口整体执行流程Flinkwindow源码分析2：Window的主要组件Flinkwindow源码分析3：WindowOperatorFlinkwindow源码分析4：WindowState本文分析的源码为flink1.18.0_scala2.12版本。reduce、aggregate等函数中怎么使用WindowState？主要考虑reduce、aggregate
SSM+Vue共享充电宝管理系统充电宝投放管理系统共享充电宝维护管理系统Java 计算机程序老哥
作者主页：计算机毕业设计老哥有问题可以主页问我一、开发介绍1.1开发环境开发语言：Java数据库：MySQL系统架构：B/S后端：SSM(Spring+SpringMVC+Mybatis)前端：Vue工具：IDEA或者Eclipse，JDK1.8，Maven二、系统介绍2.1图片展示注册登录页面：登陆前端页面功能：首页、合作商户、充电宝投放、公告栏、个人中心、后台管理首页.png充电宝投放.png
深入详解K近邻算法（KNN）：基本概念、原理及在医学影像领域的应用与实现猿享天开近邻算法算法医学影像人工智能机器学习大模型
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
机器学习模型评估：交叉验证、混淆矩阵、ROC曲线及其在医学影像领域的应用猿享天开机器学习矩阵人工智能 DICOM医学影像模型评估
博主简介：CSDN博客专家、CSDN平台优质创作者，高级开发工程师，数学专业，10年以上C/C++,C#,Java等多种编程语言开发经验，拥有高级工程师证书；擅长C/C++、C#等开发语言，熟悉Java常用开发技术，能熟练应用常用数据库SQLserver,Oracle,mysql,postgresql等进行开发应用，熟悉DICOM医学影像及DICOM协议,业余时间自学JavaScript,Vue,
synchronized锁升级过程【AI笔记,仅供自己参考】
在Java中，synchronized是一种内置的同步机制，用于保证多线程环境下代码的原子性、可见性和有序性。从JDK1.6开始，为了减少锁带来的性能开销，Java对synchronized做了大量优化，引入了锁升级机制（LockEscalation）。一、什么是锁升级？锁升级是指JVM在运行时根据对象的使用情况，对对象的锁状态进行动态优化的过程。它不是“升级为更重的锁”，而是从轻量级锁逐步升级到
java计算机毕业设计基于Ssm学生信息管理系统源程序+mysql+系统+lw文档+远程调试岗子科技 mysql java 数据库
java计算机毕业设计基于Ssm学生信息管理系统源程序+mysql+系统+lw文档+远程调试java计算机毕业设计基于Ssm学生信息管理系统源程序+mysql+系统+lw文档+远程调试本源码技术栈：项目架构：B/S架构开发语言：Java语言开发软件：ideaeclipse前端技术：Layui、HTML、CSS、JS、JQuery等技术后端技术：JAVA运行环境：Win10、JDK1.8数据库：My
Nacos - 阿里开源配置中心文振熙
配置中心相信大家都有听过，zookeeper、apollo等等都是配置中心的代表，但大部分都是JAVA系为主的，笔者主要开发语言使用的是Golang当然也有类似于ETCD这样的组件，但是并不方便管理也无法可视化，在无意之间发现了阿里爸爸开源了nacos这个服务发现+配置中心组件，也经过了一段时间的时候在这里分享给大家附上:喵了个咪的博客:w-blog.cnNacos官方Git地址:https://
Mat的构造函数 LQTGO Opencv
然后我们看看Mat常用的构造函数：1、Mat::Mat()无参数构造方法；2、Mat::Mat(introws,intcols,inttype)创建行数为rows，列数为col，类型为type的图像；3、Mat::Mat(Sizesize,inttype)创建大小为size，类型为type的图像；4、Mat::Mat(introws,intcols,inttype,constScalar&s)创建
全面的Spark学习资料合集：从基础到高级应用
本文还有配套的精品资源，点击获取简介：Spark是一个受到数据科学界青睐的大数据处理框架，以其高效、易用和可扩展性著称。本资料合集包括了Spark的基础学习材料、实战案例分析和高级应用实践，内容覆盖从Scala编程语言基础到Spark核心功能使用，再到大数据领域的实际应用。适合不同层次的学习者深入学习Spark，无论是初学者还是有经验的开发者，都能从中找到有价值的学习资源，帮助理解和掌握Spark
基于SSM的医院血库管理系统的设计与实现 JAVA编码选手计算机毕业设计实战案例 django spring boot maven java intellij-idea eclipse java-ee
开发环境开发语言：Java框架：springbootJDK版本：JDK1.8服务器：tomcat7数据库：mysql5.7（一定要5.7版本）数据库工具：Navicat11开发软件：eclipse/myeclipse/ideaMaven包：Maven3.3.9浏览器：谷歌浏览器后台路径地址：localhost:8080/项目名称/admin/dist/index.html前台路径地址：localh
uni-app跨平台开发知识点总结
uni-app简介uni-app概述：uni-app是一个使用Vue.js开发所有前端应用的框架，开发者编写一套代码，可发布到iOS、Android、Web（响应式）、以及各种小程序（微信/支付宝/百度/头条/飞书/QQ/快手/钉钉/淘宝）、快应用等多个平台。uni-app由来：是为了解决跨平台开发的问题。在移动应用开发中，不同平台（如iOS、Android）有不同的开发语言和技术栈，这导致开发者
C#实现24种数据校验算法的综合指南及工具包.zip 语嫣凝冰
本文还有配套的精品资源，点击获取简介：在数据通信和网络编程中，数据的完整性和准确性是至关重要的。C#作为一种流行的开发语言，提供了强大的工具来实现各类数据校验算法。本压缩包包含了一个名为“WindowsFormsApp”的C#应用程序，用于展示和实验24种数据校验方法，涵盖从简单到复杂的各种算法。这包括CRC校验、MD5、SHA系列、Adler32、Checksum、ParityBit、LRC、H
Flink：处理有界流数据的wordcount 小易学编程 flink 大数据
数据源：helloworldhelloflinkhelloscala有界流：packagechapter02importorg.apache.flink.streaming.api.scala._/***ClassName:BoundedStreamWordCount*Package:chapter02*Description:**@Author小易日拱一卒*@Create2025-06-272:
Grafana Loki Helm Chart从2.x升级到3.0的完整指南芮川琨Jack
GrafanaLokiHelmChart从2.x升级到3.0的完整指南前言GrafanaLoki3.0版本的HelmChart是一个重要的里程碑版本，它整合了之前两个独立的Chart（loki和loki-simple-scalable）为一个统一的解决方案。本文将详细介绍如何从2.x版本平滑升级到3.0版本，帮助用户理解升级过程中的关键变化和注意事项。升级前的准备工作在进行任何升级操作前，请务必：
RDS Proxy提高数据库可扩展性可用性GenAI taibaili2023 AWS
亚马逊云科技-RDSProxy改善数据库可扩展性GenAI关键字:[yt,AmazonRDSProxy,DatabaseScalability,RdsProxy,ConnectionPooling,SeamlessFailover,IamAuthentication]本文字数:400,阅读完需:2分钟导读演讲者介绍了”亚马逊云科技-RDSProxy改善数据库可扩展性GenAI”。在演讲中,他阐释了
自己开发FT4222上位机软件 - USB转SPI EE工程师嵌入式系统 python 单片机模块测试
写作背景最近公司有个项目，让开发一个能够同时进行千兆网接收和SPI配置的上位机软件，开发语言不限，所以作者选择Python+PyQt作开发，做嵌入式固件开发的读者可能知道还需要一块USB转SPI的模块才能进行上下位机正常SPI读写，项目团队成员建议模块从淘宝网购买就好，作者经过调研对比，感觉从芯片质量到开发配套上来讲，FTDI的FT4222模块是最优选择。但令作者感到不快的是淘宝商家不提供模块
Visual Autoregressive Modeling: Scalable Image Generation via Next-Scale Prediction zzfive 生成模型论文阅读 kotlin 开发语言 android
论文链接：VisualAutoregressiveModeling:ScalableImageGenerationviaNext-ScalePrediction文章目录简介预测下一个token自回归模型范式分析VAR详解分词实现细节幂律缩放定律零样本泛化能力结论简介本文提出的视觉自回归建模/VAR这种新范式，其将图像的自回归学习重新定义为从粗到细的“下一个尺度预测”或“下一个分辨率预测”，与常规的
Saprk中RDD詳解文子轩
一.常用的transfromRDD算子通過並行化scala創建RDDvalrdd1=sc.parallelize(Array(1,2,3,4,5,6,7,8))查看該RDD的分區數量rdd1.partitions.lengthres23:Int=4使用filter算子valrdd2=sc.parallelize(List(5,6,4,7,3,8,2,9,1,10)).map(*2).sortBy(
Github 2024-06-07开源项目日报 Top10
根据GithubTrendings的统计，今日(2024-06-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目3C++项目3JavaScript项目2JupyterNotebook项目1TypeScript项目1Vue项目1比特币核心：开源比特币软件创建周期：4919天开发语言：C++协议类型：MITLicenseStar数量：76760个F
Python+Selenium自动化
1，什么是seleniumselenium是一个开源的自动化测试框架，主要适用WEB测试，可以支持多种语言(Java,C#,Python,php等)，既然支持多语言开发，那跨平台自然就不用多说啦，selenium有几个版本，一个是seleniumIDE(是一个安装在火狐浏览器上的一个插件，可以用来录制脚本，然后导出自动生成对应的开发语言文件)，seleniumGrid(自动化辅助工具，楼主还没深入
大前端几种开发语言对比 Fighting Horse 开发语言 flutter swift kotlin
项目概述语言特性备注基本类型BasicOperators整数、浮点数C++整数类型宽度不固定，如int，自动数值类型转换Java没有无符号整数，存在装箱Box类型C#Swift基本tuple类型KotlinT?是Box的支持原生类型数组IntArray等无符号整数是Beta的，通过内联类实现Dart运算符BasicOperators赋值、流程、算术、位、逻辑、关系运算符下标、后缀、前缀运算符三元条
感受大师的代码风格_opencv源代码结构分析一
最近在调用opencv的时候,我总是去看看opencv的原代码.在那些烦琐的宏定义里面感觉自己还是很有意思的.cvGet2D(constCvArr*arr,inty,intx);//第一个坐标是y坐标,第二个是x坐标CV_IMPLCvScalarcvGet2D(constCvArr*arr,inty,intx)//CV_IMPL宏定义extern"C"{CvScalarscalar={{0,0,0
Opencv学习_2 （opencv结构&显示图像）
opencv结构：1：主要包含：cxcorecvmachinelearninghighguicvcamcvaux2：cxcore:基础结构:CvPoint,CvSize,CvScalar等数组结构:cvCreateImage,cvCreateMat等动态结构:CvMemStorage,CvMemBlock等绘图函数:cvLine,cvRectangle等数据保存和运行时类型信息：CvFileSto
FlinkSQL 自定义函数详解 Tit先生基础 flink sql 大数据 java
FlinkSQL函数详解自定义函数除了内置函数之外，FlinkSQL还支持自定义函数，我们可以通过自定义函数来扩展函数的使用FlinkSQL当中自定义函数主要分为四大类:1.ScalarFunction:标量函数特点:每次只接收一行的数据，输出结果也是1行1列典型的标量函数如:upper(str),lower(str),abs(salary)2.TableFunction:表生成函数特点:运行时每
国产替代Spring Boot框架的最佳之选——Solon 遇码开发工具 spring boot 后端 java solon
Java很好。SpringBoot也很好。有没有可以与SpringBoot对标的国产框架？请你记住，它叫Solon。本文推荐Solon，是因为我自己的一段经历。我主要使用的开发语言是Python，本着技多不压身的伟大指导思想，很早就想要征服SpringBoot，无奈尝试多次始终不得其要领，也就草草收场。前段时间因为项目需要，偶然了解到Solon，不仅可以平替SpringBoot，还是国产，还有我喜
Github 2025-01-07Python开源项目日报 Top10 老孙正经胡说 github 开源 Github趋势分析开源项目 Python Golang
根据GithubTrendings的统计，今日(2025-01-07统计)共有10个项目上榜。根据开发语言中项目的数量，汇总情况如下：开发语言项目数量Python项目10TypeScript项目1C++项目1OpenHands:人工智能驱动的软件开发代理平台创建周期：195天开发语言：Python协议类型：MITLicenseStar数量：31753个Fork数量：3660次关注人数：31753人
HTB academy -- Linux Privilege Escalation --Service-based Privilege Escalation 网络安全小吗喽 linux 服务器网络安全测试工具
VulnerableServices#!/bin/bash#screenroot.sh#setuidscreenv4.5.0localrootexploit#abusesld.so.preloadoverwritingtogetroot.#bug:https://lists.gnu.org/archive/html/screen-devel/2017-01/msg00025.html#HACKTH
网络安全核心技术解析：权限提升（Privilege Escalation）攻防全景
引言在网络安全攻防对抗中，权限提升（PrivilegeEscalation）是攻击链条中关键的「破局点」。攻击者通过突破系统权限壁垒，往往能以有限权限为跳板，最终掌控整个系统控制权。本文将从攻击原理、技术路径、实战案例到防御体系，全方位解析这一网络空间的「钥匙窃取」艺术。一、权限提升的本质与分类1.1核心定义权限提升指攻击者通过技术手段，将当前运行进程或用户的权限等级突破系统预设的访问控制机制，获
Embabel：下一代企业级JVM AI智能体框架的革命引言：AI时代的Java生态新机遇 DZSpace 软件开发 jvm 人工智能 java
在生成式AI（如ChatGPT、Claude、Gemini）席卷全球的背景下，Python凭借其丰富的AI工具链（如PyTorch、LangChain）成为主流开发语言。然而，在企业级软件开发领域，Java和JVM生态（如Kotlin、Scala）长期以来占据主导地位，尤其是在金融、电信、电商等对稳定性、可扩展性、事务管理要求极高的场景。RodJohnson（Spring框架创始人）敏锐地发现了这
对股票分析时要注意哪些主要因素？会飞的奇葩猪股票分析云掌股吧
　　众所周知，对散户投资者来说，股票技术分析是应战股市的核心武器，想学好股票的技术分析一定要知道哪些是重点学习的，其实非常简单，我们只要记住三个要素：成交量、价格趋势、振荡指标。一、成交量　　大盘的成交量状态。成交量大说明市场的获利机会较多，成交量小说明市场的获利机会较少。当沪市的成交量超过150亿时是强市市场状态，运用技术找综合买点较准；
【Scala十八】视图界定与上下文界定 bit1129 scala
Context Bound，上下文界定，是Scala为隐式参数引入的一种语法糖，使得隐式转换的编码更加简洁。隐式参数首先引入一个泛型函数max，用于取a和b的最大值 def max[T](a: T, b: T) = { if (a > b) a else b } 因为T是未知类型，只有运行时才会代入真正的类型，因此调用a >
C语言的分支——Object-C程序设计阅读有感 darkblue086 apple c 框架 cocoa
自从1972年贝尔实验室Dennis Ritchie开发了C语言，C语言已经有了很多版本和实现，从Borland到microsoft还是GNU、Apple都提供了不同时代的多种选择，我们知道C语言是基于Thompson开发的B语言的，Object-C是以SmallTalk-80为基础的。和C++不同的是，Object C并不是C的超集，因为有很多特性与C是不同的。 Object-C程序设计这本书
去除浏览器对表单值的记忆周凡杨 html 记忆 autocomplete form 浏览
&n
java的树形通讯录 g21121 java
最近用到企业通讯录，虽然以前也开发过，但是用的是jsf，拼成的树形，及其笨重和难维护。后来就想到直接生成json格式字符串，页面上也好展现。 // 首先取出每个部门的联系人 for (int i = 0; i < depList.size(); i++) { List<Contacts> list = getContactList(depList.get(i
Nginx安装部署 510888780 nginx linux
Nginx ("engine x") 是一个高性能的 HTTP 和反向代理服务器，也是一个 IMAP/POP3/SMTP 代理服务器。 Nginx 是由 Igor Sysoev 为俄罗斯访问量第二的 Rambler.ru 站点开发的，第一个公开版本0.1.0发布于2004年10月4日。其将源代码以类BSD许可证的形式发布，因它的稳定性、丰富的功能集、示例配置文件和低系统资源
java servelet异步处理请求墙头上一根草ｊａｖａ异步返回ｓｅｒｖｌｅｔ
servlet3.0以后支持异步处理请求，具体是使用AsyncContext ，包装httpservletRequest以及httpservletResponse具有异步的功能， final AsyncContext ac = request.startAsync(request, response); ac.s
我的spring学习笔记8-Spring中Bean的实例化 aijuans Spring 3
在Spring中要实例化一个Bean有几种方法： 1、最常用的（普通方法） <bean id="myBean" class="www.6e6.org.MyBean" /> 使用这样方法，按Spring就会使用Bean的默认构造方法，也就是把没有参数的构造方法来建立Bean实例。（有构造方法的下个文细说） 2、还
为Mysql创建最优的索引 annan211 mysql 索引
索引对于良好的性能非常关键，尤其是当数据规模越来越大的时候，索引的对性能的影响越发重要。索引经常会被误解甚至忽略，而且经常被糟糕的设计。索引优化应该是对查询性能优化最有效的手段了，索引能够轻易将查询性能提高几个数量级，最优的索引会比较好的索引性能要好2个数量级。 1 索引的类型 (1) B-Tree 不出意外，这里提到的索引都是指 B-
日期函数百合不是茶 oracle sql 日期函数查询
ORACLE日期时间函数大全 TO_DATE格式(以时间:2007-11-02 13:45:25为例) Year: yy two digits 两位年显示值:07 yyy three digits 三位年显示值:007
线程优先级 bijian1013 java thread 多线程 java多线程
多线程运行时需要定义线程运行的先后顺序。线程优先级是用数字表示，数字越大线程优先级越高，取值在1到10，默认优先级为5。实例： package com.bijian.study; /** * 因为在代码段当中把线程B的优先级设置高于线程A,所以运行结果先执行线程B的run()方法后再执行线程A的run()方法 * 但在实际中，JAVA的优先级不准，强烈不建议用此方法来控制执
适配器模式和代理模式的区别 bijian1013 java 设计模式
一.简介适配器模式：适配器模式（英语：adapter pattern）有时候也称包装样式或者包装。将一个类的接口转接成用户所期待的。一个适配使得因接口不兼容而不能在一起工作的类工作在一起，做法是将类别自己的接口包裹在一个已存在的类中。 &nbs
【持久化框架MyBatis3三】MyBatis3 SQL映射配置文件 bit1129 Mybatis3
SQL映射配置文件一方面类似于Hibernate的映射配置文件，通过定义实体与关系表的列之间的对应关系。另一方面使用<select>,<insert>,<delete>，<update>元素定义增删改查的SQL语句，这些元素包含三方面内容 1. 要执行的SQL语句 2. SQL语句的入参，比如查询条件 3. SQL语句的返回结果
oracle大数据表复制备份个人经验 bitcarter oracle 大表备份大表数据复制
前提：数据库仓库A（就拿oracle11g为例）中有两个用户user1和user2,现在有user1中有表ldm_table1,且表ldm_table1有数据5千万以上，ldm_table1中的数据是从其他库B（数据源）中抽取过来的，前期业务理解不够或者需求有变，数据有变动需要重新从B中抽取数据到A库表ldm_table1中。
HTTP加速器varnish安装小记 ronin47 http varnish 加速
上午共享的那个varnish安装手册，个人看了下，有点不知所云，好吧~看来还是先安装玩玩！苦逼公司服务器没法连外网，不能用什么wget或yum命令直接下载安装，每每看到别人博客贴出的在线安装代码时，总有一股羡慕嫉妒“恨”冒了出来。。。好吧，既然没法上外网，那只能麻烦点通过下载源码来编译安装了！ Varnish 3.0.4下载地址： http://repo.varnish-cache.org/
java-73-输入一个字符串，输出该字符串中对称的子字符串的最大长度 bylijinnan java
public class LongestSymmtricalLength { /* * Q75题目：输入一个字符串，输出该字符串中对称的子字符串的最大长度。 * 比如输入字符串“google”，由于该字符串里最长的对称子字符串是“goog”，因此输出4。 */ public static void main(String[] args) { Str
学习编程的一点感想 Cb123456 编程感想 Gis
写点感想，总结一些，也顺便激励一些自己.现在就是复习阶段，也做做项目. 本专业是GIS专业，当初觉得本专业太水，靠这个会活不下去的，所以就报了培训班。学习的时候，进入状态很慢，而且当初进去的时候，已经上到Java高级阶段了，所以.....，呵呵，之后有点感觉了，不过，还是不好好写代码，还眼高手低的，有
[能源与安全]美国与中国 comsci 能源
现在有一个局面：地球上的石油只剩下N桶，这些油只够让中国和美国这两个国家中的一个顺利过渡到宇宙时代，但是如果这两个国家为争夺这些石油而发生战争，其结果是两个国家都无法平稳过渡到宇宙时代。。。。而且在战争中，剩下的石油也会被快速消耗在战争中，结果是两败俱伤。。。在这个大
SEMI-JOIN执行计划突然变成HASH JOIN了的原因分析 cwqcwqmax9 oracle
甲说： A B两个表总数据量都很大，在百万以上。 idx1 idx2字段表示是索引字段 A B 两表上都有 col1字段表示普通字段 select xxx from A where A.idx1 between mmm and nnn and exists (select 1 from B where B.idx2 =
SpringMVC-ajax返回值乱码解决方案 dashuaifu Ajax springMVC response 中文乱码
SpringMVC-ajax返回值乱码解决方案一：（自己总结，测试过可行） ajax返回如果含有中文汉字，则使用：（如下例：） @RequestMapping(value="/xxx.do") public @ResponseBody void getPunishReasonB
Linux系统中查看日志的常用命令 dcj3sjt126com OS
因为在日常的工作中，出问题的时候查看日志是每个管理员的习惯，作为初学者，为了以后的需要，我今天将下面这些查看命令共享给各位 cat tail -f 日志文件说明 /var/log/message 系统启动后的信息和错误日志，是Red Hat Linux中最常用的日志之一 /var/log/secure 与安全相关的日志信息 /var/log/maillog 与邮件相关的日志信
[应用结构]应用 dcj3sjt126com PHP yii2
应用主体应用主体是管理 Yii 应用系统整体结构和生命周期的对象。每个Yii应用系统只能包含一个应用主体，应用主体在入口脚本中创建并能通过表达式 \Yii::$app 全局范围内访问。补充: 当我们说"一个应用"，它可能是一个应用主体对象，也可能是一个应用系统，是根据上下文来决定[译：中文为避免歧义，Application翻译为应
assertThat用法 eksliang JUnit assertThat
junit4.0 assertThat用法一般匹配符1、assertThat( testedNumber, allOf( greaterThan(8), lessThan(16) ) ); 注释： allOf匹配符表明如果接下来的所有条件必须都成立测试才通过，相当于“与”（&&） 2、assertThat( testedNumber, anyOf( g
android点滴2 gundumw100 应用服务器 android 网络应用 OS HTC
如何让Drawable绕着中心旋转？ Animation a = new RotateAnimation(0.0f, 360.0f, Animation.RELATIVE_TO_SELF, 0.5f, Animation.RELATIVE_TO_SELF,0.5f); a.setRepeatCount(-1); a.setDuration(1000); 如何控制Andro
超简洁的CSS下拉菜单 ini html Web 工作 html5 css
效果体验：http://hovertree.com/texiao/css/3.htmHTML文件： <!DOCTYPE html> <html xmlns="http://www.w3.org/1999/xhtml"> <head> <title>简洁的HTML+CSS下拉菜单-HoverTree</title>
kafka consumer防止数据丢失 kane_xie kafka offset commit
kafka最初是被LinkedIn设计用来处理log的分布式消息系统，因此它的着眼点不在数据的安全性（log偶尔丢几条无所谓），换句话说kafka并不能完全保证数据不丢失。尽管kafka官网声称能够保证at-least-once，但如果consumer进程数小于partition_num，这个结论不一定成立。考虑这样一个case，partiton_num=2
@Repository、@Service、@Controller 和 @Component mhtbbx DAO spring bean prototype
@Repository、@Service、@Controller 和 @Component 将类标识为Bean Spring 自 2.0 版本开始，陆续引入了一些注解用于简化 Spring 的开发。@Repository注解便属于最先引入的一批，它用于将数据访问层 (DAO 层 ) 的类标识为 Spring Bean。具体只需将该注解标注在 DAO类上即可。同时，为了让 Spring 能够扫描类
java 多线程高并发读写控制误区 qifeifei java thread
先看一下下面的错误代码，对写加了synchronized控制，保证了写的安全，但是问题在哪里呢？ public class testTh7 { private String data; public String read(){ System.out.println(Thread.currentThread().getName() + "read data "
mongodb replica set(副本集)设置步骤 tcrct java mongodb
网上已经有一大堆的设置步骤的了，根据我遇到的问题，整理一下，如下：首先先去下载一个mongodb最新版，目前最新版应该是2.6 cd /usr/local/bin wget http://fastdl.mongodb.org/linux/mongodb-linux-x86_64-2.6.0.tgz tar -zxvf mongodb-linux-x86_64-2.6.0.t
rust学习笔记 wudixiaotie 学习笔记
1.rust里绑定变量是let，默认绑定了的变量是不可更改的，所以如果想让变量可变就要加上mut。 let x = 1; let mut y = 2; 2.match 相当于erlang中的case，但是case的每一项后都是分号，但是rust的match却是逗号。 3.match 的每一项最后都要加逗号，但是最后一项不加也不会报错，所有结尾加逗号的用法都是类似。 4.每个语句结尾都要加分

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他