牛肉胡辣汤

【详解】使用原生Python编写HadoopMapReduce程序

目录

使用原生Python编写Hadoop MapReduce程序

Hadoop Streaming简介

Python环境准备

示例：单词计数

1. Mapper脚本

2. Reducer脚本

3. 运行MapReduce作业

1. 环境准备

2. 编写Mapper脚本

3. 编写Reducer脚本

4. 准备输入数据

5. 运行MapReduce作业

6. 查看结果

Hadoop Streaming 原理

Python 编写的MapReduce示例

1. Mapper 脚本 (mapper.py)

2. Reducer 脚本 (reducer.py)

3. 运行MapReduce作业

注意事项

使用原生Python编写Hadoop MapReduce程序

在大数据处理领域，Hadoop MapReduce是一个广泛使用的框架，用于处理和生成大规模数据集。它通过将任务分解成多个小任务（映射和归约），并行地运行在集群上，从而实现高效的数据处理。尽管Hadoop主要支持Java编程语言，但通过Hadoop Streaming功能，我们可以使用其他语言如Python来编写MapReduce程序。

本文将详细介绍如何使用原生Python编写Hadoop MapReduce程序，并通过一个简单的例子来说明其具体应用。

Hadoop Streaming简介

Hadoop Streaming是Hadoop提供的一种工具，允许用户使用任何可执行的脚本或程序作为Mapper和Reducer。这使得非Java程序员也能利用Hadoop的强大功能进行数据处理。Hadoop Streaming通过标准输入（stdin）和标准输出（stdout）与外部程序通信，因此任何能够读取stdin并写入stdout的语言都可以被用来编写MapReduce程序。

Python环境准备

确保你的环境中已安装了Python。此外，如果你的Hadoop集群没有预装Python，需要确保所有节点上都安装了Python环境。

示例：单词计数

我们将通过一个经典的“单词计数”示例来演示如何使用Python编写Hadoop MapReduce程序。这个程序的功能是从给定的文本文件中统计每个单词出现的次数。

1. Mapper脚本

创建一个名为mapper.py的文件，内容如下：

#!/usr/bin/env python
import sys

# 从标准输入读取每一行
for line in sys.stdin:
    # 移除行尾的换行符
    line = line.strip()
    # 将行分割成单词
    words = line.split()
    # 输出 (word, 1) 对
    for word in words:
        print(f'{word}\t1')

2. Reducer脚本

创建一个名为reducer.py的文件，内容如下：

#!/usr/bin/env python
import sys

current_word = None
current_count = 0
word = None

# 从标准输入读取每一行
for line in sys.stdin:
    # 移除行尾的换行符
    line = line.strip()
    # 解析输入对
    word, count = line.split('\t', 1)
    try:
        count = int(count)
    except ValueError:
        # 如果count不是数字，则忽略此行
        continue

    if current_word == word:
        current_count += count
    else:
        if current_word:
            # 输出 (word, count) 对
            print(f'{current_word}\t{current_count}')
        current_count = count
        current_word = word

# 输出最后一个单词（如果存在）
if current_word == word:
    print(f'{current_word}\t{current_count}')

3. 运行MapReduce作业

假设你已经有一个文本文件input.txt，你可以通过以下命令运行MapReduce作业：

hadoop jar /path/to/hadoop-streaming.jar \
    -file ./mapper.py -mapper ./mapper.py \
    -file ./reducer.py -reducer ./reducer.py \
    -input /path/to/input.txt -output /path/to/output

这里，/path/to/hadoop-streaming.jar是Hadoop Streaming JAR文件的路径，你需要根据实际情况进行替换。-input和-output参数分别指定了输入和输出目录。

通过Hadoop Streaming，我们可以在不编写Java代码的情况下，利用Python等脚本语言编写Hadoop MapReduce程序。这种方法不仅降低了开发门槛，还提高了开发效率。希望本文能帮助你更好地理解和使用Hadoop Streaming进行大数据处理。

在Hadoop生态系统中，MapReduce是一种用于处理和生成大数据集的编程模型。虽然Hadoop主要支持Java语言来编写MapReduce程序，但也可以使用其他语言，包括Python，通过Hadoop Streaming实现。Hadoop Streaming是一个允许用户创建和运行MapReduce作业的工具，这些作业可以通过标准输入和输出流来读写数据。

下面将展示如何使用原生Python编写一个简单的MapReduce程序，该程序用于统计文本文件中每个单词出现的次数。

1. 环境准备

确保你的环境中已经安装了Hadoop，并且配置正确可以运行Hadoop命令。此外，还需要确保Python环境可用。

2. 编写Mapper脚本

Mapper脚本负责处理输入数据并产生键值对。在这个例子中，我们将每个单词作为键，数字1作为值输出。

#!/usr/bin/env python
import sys

def read_input(file):
    for line in file:
        yield line.strip().split()

def main():
    data = read_input(sys.stdin)
    for words in data:
        for word in words:
            print(f"{word}\t1")

if __name__ == "__main__":
    main()

保存上述代码为 mapper.py。

3. 编写Reducer脚本

Reducer脚本接收来自Mapper的键值对，对相同键的值进行汇总计算。这里我们将统计每个单词出现的总次数。

#!/usr/bin/env python
import sys

def read_input(file):
    for line in file:
        yield line.strip().split('\t')

def main():
    current_word = None
    current_count = 0
    word = None

    for line in sys.stdin:
        word, count = next(read_input([line]))
        try:
            count = int(count)
        except ValueError:
            continue

        if current_word == word:
            current_count += count
        else:
            if current_word:
                print(f"{current_word}\t{current_count}")
            current_count = count
            current_word = word

    if current_word == word:
        print(f"{current_word}\t{current_count}")

if __name__ == "__main__":
    main()

保存上述代码为 reducer.py。

4. 准备输入数据

假设我们有一个名为 input.txt 的文本文件，内容如下：

hello world
hello hadoop
mapreduce is fun
fun with hadoop

5. 运行MapReduce作业

使用Hadoop Streaming命令来运行这个MapReduce作业。首先，确保你的Hadoop集群中有相应的输入文件。然后执行以下命令：

hadoop jar /path/to/hadoop-streaming.jar \
    -file ./mapper.py    -mapper "python mapper.py" \
    -file ./reducer.py   -reducer "python reducer.py" \
    -input /path/to/input.txt \
    -output /path/to/output

这里，/path/to/hadoop-streaming.jar 是Hadoop Streaming JAR文件的路径，你需要根据实际情况替换它。同样地，/path/to/input.txt 和 /path/to/output 也需要替换为你实际的HDFS路径。

6. 查看结果

作业完成后，可以在指定的输出目录下查看结果。例如，使用以下命令查看输出：

hadoop fs -cat /path/to/output/part-00000

这将显示每个单词及其出现次数的列表。

以上就是使用原生Python编写Hadoop MapReduce程序的一个基本示例。通过这种方式，你可以利用Python的简洁性和强大的库支持来处理大数据任务。在Hadoop生态系统中，MapReduce是一种编程模型，用于处理和生成大型数据集。虽然Hadoop主要支持Java作为其主要编程语言，但也可以通过其他语言来编写MapReduce程序，包括Python。使用Python编写Hadoop MapReduce程序通常通过一个叫做Hadoop Streaming的工具实现。Hadoop Streaming允许用户创建并运行MapReduce作业，其中的Mapper和Reducer是用任何可执行文件或脚本（如Python、Perl等）编写的。

Hadoop Streaming 原理

Hadoop Streaming工作原理是通过标准输入（stdin）将数据传递给Mapper脚本，并通过标准输出（stdout）从Mapper脚本接收输出。同样地，Reducer脚本也通过标准输入接收来自Mapper的输出，并通过标准输出发送最终结果。

Python 编写的MapReduce示例

假设我们要统计一个文本文件中每个单词出现的次数。下面是如何使用Python编写这样的MapReduce程序：

1. Mapper 脚本 (mapper.py)

#!/usr/bin/env python
import sys

# 读取标准输入
for line in sys.stdin:
    # 移除行尾的换行符
    line = line.strip()
    # 分割行成单词
    words = line.split()
    # 输出 (word, 1) 对
    for word in words:
        print(f"{word}\t1")

2. Reducer 脚本 (reducer.py)

#!/usr/bin/env python
import sys

current_word = None
current_count = 0
word = None

# 从标准输入读取数据
for line in sys.stdin:
    line = line.strip()
    # 解析从mapper来的输入对
    word, count = line.split('\t', 1)
    try:
        count = int(count)
    except ValueError:
        # 如果count不是数字，则忽略此行
        continue
    
    if current_word == word:
        current_count += count
    else:
        if current_word:
            # 输出 (word, count) 对
            print(f"{current_word}\t{current_count}")
        current_count = count
        current_word = word

# 输出最后一个单词（如果需要）
if current_word == word:
    print(f"{current_word}\t{current_count}")

3. 运行MapReduce作业

要运行这个MapReduce作业，你需要确保你的Hadoop集群已经设置好，并且你有权限提交作业。你可以使用以下命令来提交作业：

hadoop jar /path/to/hadoop-streaming.jar \
    -file ./mapper.py    -mapper ./mapper.py \
    -file ./reducer.py   -reducer ./reducer.py \
    -input /path/to/input/files \
    -output /path/to/output

这里，/path/to/hadoop-streaming.jar 是Hadoop Streaming JAR文件的路径，-file 参数指定了需要上传到Hadoop集群的本地文件，-mapper 和 -reducer 参数分别指定了Mapper和Reducer脚本，-input 和 -output 参数指定了输入和输出目录。

注意事项

确保你的Python脚本具有可执行权限，可以通过 chmod +x script.py 来设置。
在处理大量数据时，考虑数据倾斜问题，合理设计键值对以避免某些Reducer负担过重。
测试Mapper和Reducer脚本时，可以先在本地环境中使用小规模数据进行调试。

以上就是使用原生Python编写Hadoop MapReduce程序的基本步骤。希望这对你有所帮助！

你可能感兴趣的:(c#,开发语言)

Unity学习笔记1 zy_777
通过一个星期的简单学习，初步了解了下unity，unity的使用，以及场景的布局，UI，以及用C#做一些简单的逻辑。好记性不如烂笔头，一些关键帧还是记起来比较好，哈哈，不然可能转瞬即逝了，（PS:纯小白观点，unity大神可以直接忽略了）一：MonoBehaviour类的初始化1，Instantiate()创建GameObject2，通过Awake()和Start()来做初始化3，Update、L
C#中的设计模式：构建更加优雅的代码 Envyᥫᩣᩚ c#开发语言
C#在面向对象编程（OOP）方面的强大支持，我们可以探讨“C#中的设计模式”。这不仅有助于理解如何更好地组织代码，还能提高代码的可维护性和可扩展性。引言设计模式是软件工程中经过实践验证的解决方案模板，它们提供了一种标准化的方法来解决常见的开发问题。对于使用C#进行开发的程序员来说，理解和应用这些模式可以帮助创建结构良好、易于维护和扩展的应用程序。本文将介绍几种常用的设计模式，并展示如何用C#实现它
探索高效文档转换新路径：Aspose.Words v18.7助力Word无缝变PDF 邴卉露Robust
探索高效文档转换新路径：Aspose.Wordsv18.7助力Word无缝变PDF【下载地址】Aspose.Wordsv18.7C示例源码Word转PDF无需安装Office本仓库提供了一个使用Aspose.Wordsv18.7将Word文档转换为PDF文档的C#示例源码。Aspose.Words是一个强大的.NET控件，允许开发者在不安装MicrosoftOffice的情况下读写Word文档，并
.net平台的跨平台桌面应用开发的技术方案总结对比 yuanpan .net
目前，.NET平台提供了多种跨平台桌面应用开发的技术方案，主要包括.NETMAUI、AvaloniaUI、UnoPlatform、Eto.Forms等。以下是它们的核心特点及优缺点对比：1..NETMAUI（.NETMulti-platformAppUI）支持平台：Windows、macOS、iOS、Android核心特点：微软官方维护，继承自Xamarin.Forms，支持XAML和C#开发。提
C# 探秘：枚举器(IEnumerator)与可枚举类型(IEnumerable) - 揭秘 foreach 的幕后英雄钢铁男儿 C#图解教程 c#java 算法
在C#开发中，foreach循环是我们遍历集合（如数组、列表）的得力助手。它简洁优雅地为我们取出集合中的每一个元素。但你是否思考过，foreach是如何知道如何遍历这些集合的？其背后的核心机制就是枚举器(Enumerator)和可枚举类型(Enumerable)。本文将深入探讨这两个接口(IEnumerator和IEnumerable)，揭开foreach循环的神秘面纱。foreach的魔法背后让
c#分层设计介绍努力吧_少年 C#java c#asp.net
领域驱动分层介绍UI（表示层）最容易理解，这一层负责显示信息给用户，并解释用户的命令。有时，用户不是人，而是另一个系统。应用层用于协调领域模型对象的动作。不建议这一层包含业务规则或领域知识，即使是维护状态也不行——这是领域模型做的事情。应用层对于协调任务和把动作委托给领域模型非常有用。虽然不用于维护业务实体的状态，单应用层可以维护跟踪用户或者系统所执行的当前任务的状态。应用层不干涉阻碍领域模型，这
构建高效的物流车辆定位管理系统体制教科书
本文还有配套的精品资源，点击获取简介：物流车辆定位管理系统利用信息技术提高物流效率和安全性。通过集成GPS技术进行实时车辆追踪和监控，它提供及时的货物运送和异常处理。系统的关键技术包括GPS车辆定位、C#编程语言、数据库管理、车辆管理、在途情况监控、预警与通知、数据分析与报告、用户界面设计、安全性与隐私保护以及系统集成。这些要素共同保障物流流程的高效、安全和智能化。1.物流车辆定位管理系统的应用与
使用 C# 实现 FTP 上传的方法，包括详细的代码示例和测试代码 zhxup606 李工篇 C#实战教程 c#开发语言
以下是使用C#实现FTP上传的方法，包括详细的代码示例和测试代码。以下代码使用System.Net.FtpWebRequest实现文件上传，并附带一个简单的测试用例。C#FTP上传方法csharpusingSystem;usingSystem.IO;usingSystem.Net;publicclassFtpClient{//////上传文件到FTP服务器//////FTP服务器地址，例如ftp:
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版）
Baumer工业相机堡盟工业相机如何通过YoloV8深度学习模型实现不同水果的检测识别（C#代码，UI界面版））工业相机使用YoloV8模型实现不同水果的检测识别工业相机通过YoloV8模型实现不同水果的检测识别的技术背景在相机SDK中获取图像转换图像的代码分析工业相机图像转换Bitmap图像格式和Mat图像重要核心代码本地文件图像转换Bitmap图像格式和Mat图像重要核心代码Mat图像导入Yo
C#返回两个数组或多个数组，函数方法的一种写法 zhannghong2003 C#c#
public(float[]x,float[]y)GetPolygonCollider2DPoints(PolygonCollider2Dobjects){Vector2[]points=objects.points;float[]x=newfloat[points.Length];float[]y=newfloat[points.Length];for(inti=0;i
C# 单问号 ? 与双问号 ?? 三分明月墨 C#
https://www.runoob.com/csharp/csharp-nullable.html
C#?和??的作用 simpleshao C#C#???
1.可空类型修饰符（？）：引用类型可以使用空引用表示一个不存在的值，而值类型通常不能表示为空。例如：stringstr=null;是正确的，inti=null;编译器就会报错。为了使值类型也可为空，就可以使用可空类型，即用可空类型修饰符"？"来表示，表现形式为"T？"例如：int?表示可空的整形，DateTime?表示可为空的时间。T?其实是System.Nullable(泛型结构）的缩写形式，也
C#:类型定义中使用‌问号（?）曹牧 CSharp c#
在C#中，类型定义中的‌问号（?）‌主要用于控制类型的可空性，但具体行为因类型（值类型或引用类型）和C#版本而异。以下是清晰分类的说明：一、可空值类型（T?，适用于所有C#版本）‌用途‌：允许值类型（如int、DateTime等）存储null值。‌语法‌：在值类型后加?，底层由System.Nullable结构实现。‌示例‌：int?age=null;//声明可空整型DateTime?date=n
c# winform 五子棋人机对战（详细）
目录1.前言2.人机对战主要功能实现3.其他功能修改4.完整代码1.前言c#winform简单五子棋，支持连续悔棋。-CSDN博客基础版跳链接。建议先阅读。在基础版的界面上增加两个groupBox，并各自放两个radioButton。在基础版上form1.cs中增加变量privateboolisAIThinking=false;//判断是否该ai走privateTimeraiDelayTimer;
C#中的委托,匿名方法和Lambda表达式 wcqlwyt delegate c#方法 lambda Anonymous Methods 表达式委托
原文地址为：C#中的委托,匿名方法和Lambda表达式简介在.NET中，委托，匿名方法和Lambda表达式很容易发生混淆。我想下面的代码能证实这点。下面哪一个First会被编译？哪一个会返回我们需要的结果？即Customer.ID=5.答案是6个First不仅被编译，并都获得正确答案，且他们的结果一样。如果你对此感到困惑，那么请继续看这篇文章。classCustomer{publicintID{g
C#的lambda表达式与Linq hccee c#linq
C#的lambda表达式、Linq、以及常用方法Lambda：简单来讲就是匿名函数，我们不声明方法名，只写一个方法体，这个方法体就是lambda表达式Linq：Linq是LanguageIntergratedQuery（语言集成查询）的缩写，可以对本地对象**集合**或者远程数据源进行结构化的查询操作。lambda表达式如何写一个lambda表达式首先，在写lambda表达式之前，需要先了解两个特
APP开发入门：了解主流的编程语言 agi大模型 Python 职业与职场程序员开发语言数据分析编程语言
前言在过去的几年里，有许多程序员开始学习和使用编程语言。这其中包括C、C++、Java和Python。尽管有许多语言可供选择，但大多数程序员都会选择最容易学习的编程语言。如今，有很多编程语言供选择。程序员们在学习这些语言时可以自由地选择他们喜欢的方式，因为他们的目标是构建任何软件，而不仅仅是创建一个应用程序。你可以在Linux上学习C/C++、Java、Python、C#或JavaScript，你
C# EventHandler观察者模式
C#和java比较：java中使用的是接口。C#使用委托机制，可以用时+运算符进行注册，直接多播。而java中是一般是使用一个集合来保存观察者。发布者（Publisher）=被观察者（Observable）=事件源（java中的EventObject，C#中的sender）订阅者（Subscriber）=观察者（Observer）=接收者（java中继承EventLister,接口，或Observ
C#实现观察者模式（附完整源码）源代码大师 C#实战教程 c#观察者模式开发语言
C#实现观察者模式以下是C#实现观察者模式的完整源码：Subject.cs：usingSystem;usingSystem.Collections.Generic;publicclassSubject{privateListobser
.NET 9 优化，抢先体验 C# 13 新特性 Rodney@Tiger C#c#.net
前言微软即将在2024年11月12日发布.NET9的最终版本，而08月09日发布的.NET9Preview7是最终发布前的最后一个预览版。这个版本将与.NETConf2024一同亮相，并已与VisualStudio202217.12预览版1一同发布，可以直接通过VisualStudio安装。同时VisualStudioCode和C#DevKit扩展也支持.NET9。C#13作为.NET9的一部分，
C#与halcon联合（3）文本写入可以改变字体大小类型及绘画直线图形十字叉箭头轮廓
这里写目录标题1.操作demo2.绘画直线及显示①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下3.绘画圆形及显示其轮廓（XLD）①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下4.绘画普通矩形及轮廓显示（XLD）①在halcon中的操作代码如下②转换成C#代码并将其封装成函数如下5.绘画角度可调矩形及其轮廓显示（XLD）①在halcon中的操作代码如下②转
SSM+Vue共享充电宝管理系统充电宝投放管理系统共享充电宝维护管理系统Java 计算机程序老哥
作者主页：计算机毕业设计老哥有问题可以主页问我一、开发介绍1.1开发环境开发语言：Java数据库：MySQL系统架构：B/S后端：SSM(Spring+SpringMVC+Mybatis)前端：Vue工具：IDEA或者Eclipse，JDK1.8，Maven二、系统介绍2.1图片展示注册登录页面：登陆前端页面功能：首页、合作商户、充电宝投放、公告栏、个人中心、后台管理首页.png充电宝投放.png
c#第10--1次作业八度_八度
要求：/***作业2：购物金额结算*步骤：1.创建一个长度为5的double类型数组，存储购物金额。2.循环输入五笔购物金额，并累加总金额。3.利用循环输出五笔购物金额，最后输出总金额。**/代码：namespace作业2{classProgram{staticvoidMain(string[]args){/***作业2：购物金额结算*步骤：1.创建一个长度为5的double类型数组，存储购物金额
C#结构体与异常处理实战
结构体（Struct）的使用结构体用于将一组相关的变量整合成一个新的数据类型，便于管理和使用。例如，学生信息可以包含姓名、年龄、身高和学号等字段。结构体的定义使用struct关键字定义结构体，并在内部声明字段和方法。privatestructStudent{publicstringname;publicintage;publicdoubleheight;publicintid;publicvoid
C#开发效率革命：ReSharper插件让你的代码“一键优化” 墨夶 C#学习资料 c#服务器开发语言
一、ReSharper：C#开发者的“外挂级”效率神器1.1什么是ReSharper？ReSharper是JetBrains公司为VisualStudio开发的终极扩展插件，专为.NET开发者设计。它通过实时代码分析、智能重构、超快导航等功能，将C#开发效率提升到全新高度。核心能力代码质量监控：实时检测潜在错误（如空引用、冗余代码）。智能重构：一键优化代码结构（重命名、提取方法、内联变量）。闪电导
ImageGlass：图像查看器的“瑞士军刀”，C#打造的轻量级视觉盛宴墨夶 C#学习资料 c#开发语言
**当“轻量级”遇上“多功能”，ImageGlass如何做到“鱼与熊掌兼得”？**你是否厌倦了那些“动辄几十MB”的图像查看器？有的工具只支持JPG/PNG，遇到PSD/TIFF就摔跤？有的工具功能强大，但启动时像加载Windows系统？有的工具界面丑得像1998年的网页？ImageGlass，这个基于C#开发的开源图像查看器，用不足2MB的体积，实现了：✅支持50+种图像格式（包括PSD、TIF
C# ML.NET回归模型：用代码预测未来的“魔法”！墨夶 C#学习资料 c#.net 回归
**预测未来？不，是让数据替你说话！**想象一下：你坐在办公室里，老板突然问：“下个月的销售额能到多少？”你盯着Excel表格，头大如斗，公式写了一行又一行，结果还是不准！客户问：“我们产品价格怎么定最合适？”你却只能靠“感觉”回答！ML.NET回归模型就是你的“神兵利器”！它能：✅预测数值型目标：销售额、房价、车费……统统拿下！✅自动调优模型：不用手动调参，AI帮你选最优方案！✅无缝集成C#：不
Blazor应用开发与实践：构建交互式Web应用偏偏无理取闹
本文还有配套的精品资源，点击获取简介：BlazorApp使用WebAssembly构建交互式Web应用程序，允许开发者用C#和Razor语法编写前端，实现.NET全栈开发体验。应用由可复用的组件构成，支持状态管理、路由导航和客户端-服务器通信。Blazor提供BlazorWebAssembly和BlazorServer两种模式，拥有高效的部署、优化和测试机制。开发者可以集成各种前端库并利用丰富的学
【C#工业上位机高级应用】3. C#与西门子PLC高级通信 - S7CommPlus协议深度优化：TPL Dataflow构建流水线
摘要：在工业自动化领域，尤其是汽车制造等大规模生产场景中，西门子PLC的高效通信是保证生产效率的关键。本文针对传统S7通信方式在200+台S7-1500PLC同时监控时存在的串行阻塞、CPU利用率不均和突发流量处理能力差等问题，提出了基于TPLDataflow的四阶流水线架构解决方案。该方案通过报文组装、协议加密、网络发送和响应解析四个并行处理阶段，结合硬件加速加密、智能连接池和动态负载均衡等技术
VS-Visual Studio2015 QT-Qt5.7.0 siliang_0 qt visual studio 开发语言
windows下常用的开发工具VS&QTVS是一个IDE，适用于多种语言的开发（C++，VB，C#,java,.net等）。在开发C++时，VS相当于VC++（其中vs2008的vc部分是叫vc9），使用的是VC++的编译器即cl.exe（MSVC编译器指的也是它）.QT是一个类似于MFC的类库，是跨平台C++图形用户界面应用程序开发框架。为了方便使用QT，引入了QtCreator。QTCreat
Spring4.1新特性——Spring MVC增强 jinnianshilongnian spring 4.1
目录 Spring4.1新特性——综述 Spring4.1新特性——Spring核心部分及其他 Spring4.1新特性——Spring缓存框架增强 Spring4.1新特性——异步调用和事件机制的异常处理 Spring4.1新特性——数据库集成测试脚本初始化 Spring4.1新特性——Spring MVC增强 Spring4.1新特性——页面自动化测试框架Spring MVC T
mysql 性能查询优化 annan211 java sql 优化 mysql 应用服务器
1 时间到底花在哪了？ mysql在执行查询的时候需要执行一系列的子任务，这些子任务包含了整个查询周期最重要的阶段，这其中包含了大量为了检索数据列到存储引擎的调用以及调用后的数据处理，包括排序、分组等。在完成这些任务的时候，查询需要在不同的地方花费时间，包括网络、cpu计算、生成统计信息和执行计划、锁等待等。尤其是向底层存储引擎检索数据的调用操作。这些调用需要在内存操
windows系统配置 cherishLC windows
删除Hiberfil.sys ：使用命令powercfg -h off 关闭休眠功能即可： http://jingyan.baidu.com/article/f3ad7d0fc0992e09c2345b51.html 类似的还有pagefile.sys msconfig 配置启动项 shutdown 定时关机 ipconfig 查看网络配置 ipconfig /flushdns
人体的排毒时间 Array_06 工作
======================== || 人体的排毒时间是什么时候？|| ======================== 转载于： http://zhidao.baidu.com/link?url=ibaGlicVslAQhVdWWVevU4TMjhiKaNBWCpZ1NS6igCQ78EkNJZFsEjCjl3T5EdXU9SaPg04bh8MbY1bR
ZooKeeper cugfy zookeeper
Zookeeper是一个高性能，分布式的，开源分布式应用协调服务。它提供了简单原始的功能，分布式应用可以基于它实现更高级的服务，比如同步，配置管理，集群管理，名空间。它被设计为易于编程，使用文件系统目录树作为数据模型。服务端跑在java上，提供java和C的客户端API。 Zookeeper是Google的Chubby一个开源的实现，是高有效和可靠的协同工作系统，Zookeeper能够用来lea
网络爬虫的乱码处理随意而生爬虫网络
下边简单总结下关于网络爬虫的乱码处理。注意，这里不仅是中文乱码，还包括一些如日文、韩文、俄文、藏文之类的乱码处理，因为他们的解决方式是一致的，故在此统一说明。网络爬虫，有两种选择，一是选择nutch、hetriex，二是自写爬虫，两者在处理乱码时，原理是一致的，但前者处理乱码时，要看懂源码后进行修改才可以，所以要废劲一些；而后者更自由方便，可以在编码处理
Xcode常用快捷键张亚雄 xcode
一、总结的常用命令：隐藏xcode command+h 退出xcode command+q 关闭窗口 command+w 关闭所有窗口 command+option+w 关闭当前
mongoDB索引操作 adminjun mongodb 索引
一、索引基础： MongoDB的索引几乎与传统的关系型数据库一模一样，这其中也包括一些基本的优化技巧。下面是创建索引的命令： > db.test.ensureIndex({"username":1}) 可以通过下面的名称查看索引是否已经成功建立： &nbs
成都软件园实习那些话 aijuans 成都软件园实习
无聊之中，翻了一下日志，发现上一篇经历是很久以前的事了，悔过~~ 　　断断续续离开了学校快一年了，习惯了那里一天天的幼稚、成长的环境，到这里有点与世隔绝的感觉。不过还好，那是刚到这里时的想法，现在感觉在这挺好，不管怎么样，最要感谢的还是老师能给这么好的一次催化成长的机会，在这里确实看到了好多好多能想到或想不到的东西。　　都说在外面和学校相比最明显的差距就是与人相处比较困难，因为在外面每个人都
Linux下FTP服务器安装及配置 ayaoxinchao linux FTP服务器 vsftp
检测是否安装了FTP [root@localhost ~]# rpm -q vsftpd 如果未安装：package vsftpd is not installed 安装了则显示：vsftpd-2.0.5-28.el5累死的版本信息安装FTP 运行yum install vsftpd命令，如[root@localhost ~]# yum install vsf
使用mongo-java-driver获取文档id和查找文档 BigBird2012 driver
注：本文所有代码都使用的mongo-java-driver实现。在MongoDB中，一个集合（collection）在概念上就类似我们SQL数据库中的表（Table），这个集合包含了一系列文档（document）。一个DBObject对象表示我们想添加到集合（collection）中的一个文档（document），MongoDB会自动为我们创建的每个文档添加一个id，这个id在
JSONObject以及json串 bijian1013 json JSONObject
一.JAR包简介要使程序可以运行必须引入JSON-lib包，JSON-lib包同时依赖于以下的JAR包： 1.commons-lang-2.0.jar 2.commons-beanutils-1.7.0.jar 3.commons-collections-3.1.jar &n
[Zookeeper学习笔记之三]Zookeeper实例创建和会话建立的异步特性 bit1129 zookeeper
为了说明问题，看个简单的代码， import org.apache.zookeeper.*; import java.io.IOException; import java.util.concurrent.CountDownLatch; import java.util.concurrent.ThreadLocal
【Scala十二】Scala核心六：Trait bit1129 scala
Traits are a fundamental unit of code reuse in Scala. A trait encapsulates method and field definitions, which can then be reused by mixing them into classes. Unlike class inheritance, in which each c
weblogic version 10.3破解 ronin47 weblogic
版本：WebLogic Server 10.3 说明：%DOMAIN_HOME%：指WebLogic Server 域(Domain）目录例如我的做测试的域的根目录 DOMAIN_HOME=D:/Weblogic/Middleware/user_projects/domains/base_domain 1.为了保证操作安全，备份%DOMAIN_HOME%/security/Defa
求第n个斐波那契数 BrokenDreams
今天看到群友发的一个问题：写一个小程序打印第n个斐波那契数。自己试了下，搞了好久。。。基础要加强了。 &nbs
读《研磨设计模式》-代码笔记-访问者模式-Visitor bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ import java.util.ArrayList; import java.util.List; interface IVisitor { //第二次分派，Visitor调用Element void visitConcret
MatConvNet的excise 3改为网络配置文件形式 cherishLC matlab
MatConvNet为vlFeat作者写的matlab下的卷积神经网络工具包，可以使用GPU。主页： http://www.vlfeat.org/matconvnet/ 教程： http://www.robots.ox.ac.uk/~vgg/practicals/cnn/index.html 注意：需要下载新版的MatConvNet替换掉教程中工具包中的matconvnet： http
ZK Timeout再讨论 chenchao051 zookeeper timeout hbase
http://crazyjvm.iteye.com/blog/1693757 文中提到相关超时问题，但是又出现了一个问题，我把min和max都设置成了180000，但是仍然出现了以下的异常信息： Client session timed out, have not heard from server in 154339ms for sessionid 0x13a3f7732340003
CASE WHEN 用法介绍 daizj sql group by case when
CASE WHEN 用法介绍 1. CASE WHEN 表达式有两种形式 --简单Case函数 CASE sex WHEN '1' THEN '男' WHEN '2' THEN '女' ELSE '其他' END --Case搜索函数 CASE WHEN sex = '1' THEN
PHP技巧汇总:提高PHP性能的53个技巧 dcj3sjt126com PHP
PHP技巧汇总:提高PHP性能的53个技巧　　用单引号代替双引号来包含字符串，这样做会更快一些。因为PHP会在双引号包围的字符串中搜寻变量，　　单引号则不会，注意：只有echo能这么做，它是一种可以把多个字符串当作参数的函数译注：　　PHP手册中说echo是语言结构，不是真正的函数，故把函数加上了双引号)。　　1、如果能将类的方法定义成static，就尽量定义成static，它的速度会提升将近4倍
Yii框架中CGridView的使用方法以及详细示例 dcj3sjt126com yii
CGridView显示一个数据项的列表中的一个表。表中的每一行代表一个数据项的数据,和一个列通常代表一个属性的物品(一些列可能对应于复杂的表达式的属性或静态文本)。　　CGridView既支持排序和分页的数据项。排序和分页可以在AJAX模式或正常的页面请求。使用CGridView的一个好处是,当用户浏览器禁用JavaScript,排序和分页自动退化普通页面请求和仍然正常运行。实例代码如下：
Maven项目打包成可执行Jar文件 dyy_gusi assembly
Maven项目打包成可执行Jar文件在使用Maven完成项目以后，如果是需要打包成可执行的Jar文件，我们通过eclipse的导出很麻烦，还得指定入口文件的位置，还得说明依赖的jar包，既然都使用Maven了，很重要的一个目的就是让这些繁琐的操作简单。我们可以通过插件完成这项工作，使用assembly插件。具体使用方式如下： 1、在项目中加入插件的依赖： <plugin>
php常见错误 geeksun PHP
1. kevent() reported that connect() failed (61: Connection refused) while connecting to upstream, client: 127.0.0.1, server: localhost, request: "GET / HTTP/1.1", upstream: "fastc
修改linux的用户名 hongtoushizi linux change password
Change Linux Username 更改Linux用户名，需要修改4个系统的文件： /etc/passwd /etc/shadow /etc/group /etc/gshadow 古老/传统的方法是使用vi去直接修改，但是这有安全隐患（具体可自己搜一下），所以后来改成使用这些命令去代替： vipw vipw -s vigr vigr -s 具体的操作顺
第五章常用Lua开发库1-redis、mysql、http客户端 jinnianshilongnian nginx lua
对于开发来说需要有好的生态开发库来辅助我们快速开发，而Lua中也有大多数我们需要的第三方开发库如Redis、Memcached、Mysql、Http客户端、JSON、模板引擎等。一些常见的Lua库可以在github上搜索，https://github.com/search?utf8=%E2%9C%93&q=lua+resty。 Redis客户端 lua-resty-r
zkClient 监控机制实现 liyonghui160com zkClient 监控机制实现
直接使用zk的api实现业务功能比较繁琐。因为要处理session loss，session expire等异常，在发生这些异常后进行重连。又因为ZK的watcher是一次性的，如果要基于wather实现发布/订阅模式，还要自己包装一下，将一次性订阅包装成持久订阅。另外如果要使用抽象级别更高的功能，比如分布式锁，leader选举
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句 pda158 mysql
在Mysql 众多表中查找一个表名或者字段名的 SQL 语句：　　方法一：SELECT table_name, column_name from information_schema.columns WHERE column_name LIKE 'Name'; 　　方法二：SELECT column_name from information_schema.colum
程序员对英语的依赖 Smile.zeng 英语程序猿
1、程序员最基本的技能，至少要能写得出代码，当我们还在为建立类的时候思考用什么单词发牢骚的时候，英语与别人的差距就直接表现出来咯。 2、程序员最起码能认识开发工具里的英语单词，不然怎么知道使用这些开发工具。 3、进阶一点，就是能读懂别人的代码，有利于我们学习人家的思路和技术。 4、写的程序至少能有一定的可读性，至少要人别人能懂吧... 以上一些问题，充分说明了英语对程序猿的重要性。骚年
Oracle学习笔记(8) 使用PLSQL编写触发器 vipbooks oracle sql 编程活动 Access
时间过得真快啊，转眼就到了Oracle学习笔记的最后个章节了，通过前面七章的学习大家应该对Oracle编程有了一定了了解了吧，这东东如果一段时间不用很快就会忘记了，所以我会把自己学习过的东西做好详细的笔记，用到的时候可以随时查找，马上上手！希望这些笔记能对大家有些帮助！这是第八章的学习笔记，学习完第七章的子程序和包之后

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他