MusicDancing

pandas 多进程并发与python加速

1. 背景

在大规模数据之间完成一些操作，往往会浪费大量的时间，为了充分利用软硬件资源，演化出了2种主流的优化方式，即“向量化” 和“并行化” 。

2. swifter

swifter 是一款用于给使用在 pandas DataFrame 或者 Series 上的 function 进行加速的包，它综合使用了“向量化” 和“并行化”方式。
安装：

pip install -U pandas # upgrade pandas
pip install swifter # first time installation
pip install -U swifter # upgrade to latest version if already installed
或 conda 安装
conda install -c conda-forge swifter

2.1 一个demo

import pandas as pd
import swifter

df = pd.DataFrame({'x': [1, 2, 3, 4], 'y': [5, 6, 7, 8]})
# runs on single core
df['x2'] = df['x'].apply(lambda x: x**2)
# runs on multiple cores
df['x2'] = df['x'].swifter.apply(lambda x: x**2)
# use swifter apply on whole dataframe
df['agg'] = df.swifter.apply(lambda x: x.sum() - x.min())

# use swifter apply on specific columns
df['outCol'] = df[['col1', 'col2']].swifter.apply(my_func)
df['outCol'] = df[['col1', 'col2', 'col3']].swifter.apply(my_func,
             positional_arg, keyword_arg=keyword_argval)

2.2 `swifter` 提效原理

1、它会判断apply中的函数是否能被向量化vectorization，如果可以，那么他就会自动选择向量化后函数的进行应用(此时是效果最好的)；

2、如果apply的函数无法向量化，则自动选择使用 dask parallel processing 和 simple pandas apply 中较快的一种；

3、在分组apply的场景下，swifter也能达到更好的效果。

注意：并行化在小规模的数据集上可能达不到预期的效果，所以并行化操作是根据应用场景酌情使用的，而向量化不管数据集规模的大小都能带一些性能的提升。

可以看到Swifter的个特点，即无论数据大小如何，使用向量化效果几乎总是更好；如果数据量较小，那么普通 Pandas 操作有最佳速度，直到数据足够大为止；一旦超过阈值，并行处理就会是处理更快。

3. 多进程 pandarallel

pandarallel 和 pandas 无缝衔接，是实现多线程的一个非常友好的工具。
安装：pip3 install pandarallel

#!/usr/bin/env python
# -*- coding: utf-8 -*-
import pandas as pd
import numpy as np
from pandarallel import pandarallel
# shm_size_mb  分配的内存空间大小
# nb_workers  调用的核数
pandarallel.initialize(nb_workers=10, use_memory_fs=False, progress_bar=True)

def func(x):
    return x**3
df = pd.DataFrame(np.random.rand(1000,1000))

调用

# 处理一行
df.parallel_apply(func, axis=1)  
# 按列处理
df['col1'].parallel_apply(func)

下面的这些pandas原来的方法都有对应的pandarallel的并行的实现。

参考：pandas apply 并行处理的几种方法_parallel_apply-CSDN博客

4. joblib

from math import sqrt
from joblib import Parallel, delayed
def test():
    start = time.time()
    result = Parallel(n_jobs=8)(delayed(sqrt)(i**2) for i in range(10000))
    # results = Parallel(n_jobs=8)(delayed(key_func)(group) for name, group in tqdm(data_grouped))    
    end = time.time()
    print(end-end)

11

5. multiprocessing

import multiprocessing as mp
with mp.Pool(mp.cpu_count()) as pool:
    df['newcol'] = pool.map(fun, df['col'])

multiprocessing.cpu_count() # 返回系统的CPU数量。

该数量不同于当前进程可以使用的CPU数量。可用的CPU数量可以由 len(os.sched_getaffinity(0)) 方法获得。

6. modin

Modin后端使用dask(dask类似pandas库，可以实现并行读取运行)或者ray，是个支持分布式运行的类pandas库。它通过更改一行代码 import modin.pandas as pd 就可以优化 pandas，常用的内置的read_csv、concat、apply都有不错的加速。

注：并行处理的开销会使小数据集的处理速度变慢。

!pip install modin
import modin.pandas as pd

my_dict = {'a': np.random.randn(10000000),
           'b': np.random.randn(10000000),
           'N': np.random.randint(100, 10000, (10000000)),
           'x':  np.random.randint(1, 1000, (10000000))}
df = pd.DataFrame(my_dict)
df_new = pd.concat([df for _ in range(25)])

耗时0.6s，普通pandas 耗时3s，提速5倍！

7. python加速

7.1 numexpr

numexpr 是一个对NumPy计算式进行的性能优化。其使用简单，只需要将原来的numpy语句使用双引号框起来，并使用evaluate方法调用即可。经验上看，数据有上万条+ 使用numexpr才比较优效果，对于简单运算使用numexpr可能会更慢。

import numexpr as ne
a = np.linspace(0,1000,1000) 
ne.evaluate('a**10')

相比numpy能提速5倍。

7.2 numba

numba 使用行业标准的LLVM编译器库在运行时将 Python 函数转换为优化的机器代码。Python 中 numba 编译的数值算法可以接近 C 或 FORTRAN 的速度。numba很简单，其内置的函数本身是个装饰器，只需在自己定义好的函数前面加个@nb.方法就行，简单快捷！

numba 引擎在处理百万+大量数据点时表现出色。

# pip install numba
import numba as nb
import numpy as np

# 用numba加速的求和函数
@nb.jit()
def nb_sum(a):
    Sum = 0
    for i in range(len(a)):
        Sum += a[i]
    return Sum

a = np.linspace(0, 1000, 1000) # 创建一个长度为1000的数组
nb_sum(a)

numba 甚至比号称最接近C语言速度运行的numpy还要快5倍+，对于python求和速度快了几百倍。

此外，numba还支持GPU加速、矢量化加速方法，可以进一步达到更高的性能。

from numba import cuda
cuda.select_device(1)

@cuda.jit
def CudaSquare(x):
    i, j = cuda.grid(2)
    x[i][j] *= x[i][j]

# numba的矢量化加速
from math import sin
@nb.vectorize()
def nb_vec_sin(a):
    return sin(a)

7.3 cupy

CuPy 是一个借助 CUDA GPU 库在英伟达 GPU 上实现 Numpy 数组的库。基于 Numpy 数组的实现，GPU 自身具有的多个 CUDA 核心可以促成更好的并行加速。

# pip install cupy
import numpy as np
import cupy as cp
x_gpu = cp.ones((1000,1000,1000))

CuPy 实现了 10.5 倍的加速，随着数据量的猛增，CuPy的性能提升会更为明显。

7.4 Cython优化

Cython是一个基于C语言的Python 编译器，在一些计算量大的程序中，可以Cython来实现相当大的加速。通过在Ipython加入 Cython 魔术函数%load_ext Cython，如下示例就可以加速了一倍。进一步再借助更高级的cython语句，还是可以比Python快个几十上百倍。

%%cython
def f_plain(x):
    return x * (x - 1)

def integrate_f_plain(a, b, N):
    s = 0
    dx = (b - a) / N
    for i in range(N):
        s += f_plain(a + i * dx)
    return s * dx

8. pandas其他使用技巧

参考：https://pandas.pydata.org/pandas-docs/stable/user_guide/enhancingperf.html

8.1 按行迭代优化

在新版的pandas中，使用itertuples函数按行对dataframe进行迭代，而不是iterrows函数，可提速几十倍。

res = []
for row in df.itertuples():
    temp = getattr(row, 'a')
    res.append(temp*temp)
df['a2'] = res

for index,row in df.iterrows():
    temp = row['a']
    a2.append(temp*temp)
df['a2'] = res

8.2 apply、applymap优化

当对于每行执行类似的操作时，用循环逐行处理效率很低。这时可以用apply或applymap搭配函数操作，其中apply是可用于逐行计算，而applymap可以做更细粒度的逐个元素的计算。

# 列a、列b逐行进行某一函数计算
df['a3']=df.apply( lambda row: row['a']*row['b'],axis=1)
# 逐个元素保留两位小数
df.applymap(lambda x: "%.2f" % x)

8.3 聚合函数agg优化

对于某列将进行聚合后，使用内置的函数比自定义函数效率更高，如下示例速度加速3倍。

df.groupby("x")['a'].agg(lambda x:x.sum())
df.groupby("x")['a'].agg(sum)
df.groupby("x")['a'].agg(np.sum)

8.4 文件操作

pandas读取文件，pkl格式的数据的读取速度最快，其次是hdf格式的数据，再次是读取csv格式数据，而xlsx的读取是比较慢的。但是存取csv有个好处是，这个数据格式通用性更好，占用内存硬盘资源也比较少。此外，对于大文件，csv还可以对文件分块、选定某几列、指定数据类型做读取。

8.5 pandas.eval

pandas.eval 基于numexpr，使用eval表达式的一个经验是数据超过 1W 行的情况下使用会有明显优化效果。

import pandas as pd 
nrows, ncols = 20000, 100
df1, df2, df3, df4 = [pd.DataFrame(np.random.randn(nrows, ncols)) for _ in range(4)]
pd.eval("df1 + df2 + df3 + df4")

你可能感兴趣的:(pandas,pandas)

Numpy、Pandas库的使用貮叁量化投资分析 python python 数据分析
目录Numpy1、概述2、基础操作2.1生成一个numpy的array数组：2.2自定义一个新的数据类型：np.dtype()3、并行化思想4、量化分析应用4.1索引选取和切片选择4.2数据转换与规整4.3逻辑条件进行数据筛选4.4通用序列函数4.5文件保存与读取Pandas1、简介2、Series和DataFrame的使用2.1Series2.2DataFrame3、量化分析应用3.1形成一个p
使用Python读取Excel文件并计算平均分嘻嘻爱编码 Python从入门到放弃 python excel 开发语言
在这篇博客中，我们将探讨如何使用Python的pandas库来读取Excel文件，并计算其中数据的平均分。pandas是一个强大的数据分析工具，它允许我们以简单直观的方式处理表格数据。安装必要的库在开始之前，确保你的环境中安装了pandas和openpyxl库。可以使用以下命令进行安装：pipinstallpandasopenpyxl读取Excel文件首先，我们需要读取Excel文件。假设我们有一
【划分数据集】stratifiedShuffleSplit分层抽样芜湖xin python
importpandasaspdfromsklearn.model_selectionimportStratifiedShuffleSplit#分出10%作为独立测试集ss=StratifiedShuffleSplit(n_splits=1,test_size=0.1,random_state=42)data=pd.read_csv("F:\\PaperCode\\Mypaper_python_c
Pandas教程15：多个DataFrame数据（保存+追加）为Excel表格数据我的Python教程我的Python教程 #Pandas pandas excel Python教程
---------------pandas数据分析集合---------------Python教程71：学习Pandas中一维数组SeriesPython教程74：Pandas中DataFrame数据创建方法及缺失值与重复值处理Pandas数据化分析，DataFrame行列索引数据的选取，增加，修改和删除操作Pandas教程05：DataFrame数据常用属性和方法汇总Pandas教程06：Da
数据对比与处理利器——Pandas 实战黑夜照亮前行的路数据挖掘
Pandas作为数据处理利器，在数据对比与处理方面发挥着重要作用。下面我们将通过实战案例来展示Pandas的强大功能。一、数据导入与清洗首先，我们需要从数据源导入数据，并进行必要的清洗。Pandas支持多种数据格式，如CSV、Excel、SQL等。以CSV文件为例，我们可以使用Pandas的read_csv函数来读取数据：python复制代码importpandasaspd#读取CSV文件data
数据科学中的Python：NumPy和Pandas入门指南【第121篇—NumPy和Pandas】一键难忘 python numpy pandas 开发语言
数据科学中的Python：NumPy和Pandas入门指南数据科学是当今数字时代中的一个重要领域，而Python是数据科学家们最喜爱的编程语言之一。在这篇博客中，我们将介绍Python中两个强大的库——NumPy和Pandas，它们在数据处理和分析中发挥着重要作用。NumPy简介NumPy是用于科学计算的基础包，提供了高性能的多维数组对象（numpy.ndarray）和用于处理这些数组的工具。让我
KGCN---pytorch代码（1）---data_loader sweet_Mary 推荐算法 python 推荐算法 pytorch 人工智能机器学习深度学习
代码：importpandasaspdimportnumpyasnpfromsklearn.preprocessingimportLabelEncoderfromsklearn.model_selectionimporttrain_test_splitimportrandomclassDataLoader:'''DataLoaderclasswhichmakesdatasetfortraining
Python 导入Excel三维坐标数据生成三维曲面地形图(面) 4-1、线条平滑曲面(原始图形) fyhs Python python matplotlib
环境和包:环境python:python-3.12.0-amd64包:matplotlib3.8.2pandas2.1.4openpyxl3.1.2scipy1.12.0代码:importpandasaspdimportmatplotlib.pyplotaspltfrommpl_toolkits.mplot3dimportAxes3Dfromscipy.interpolateimportgridd
用pandas的DataFrame类型对CSV文件增加新列顾西景
问题描述：1.有两个.csv文件，分别是df_val.csv和df_classes.scv。df_val.csv为2列36500行，df_classes.scv为3列365行。2.两个csv文件的关系：其实是共365个文件夹，每个文件夹下有100个图片。df_val.csv为所有图片的路径，df_classes.scv为365个文件夹的名字和标签。3.想要做什么：想要将df_classes.scv
数据分析Pandas专栏---第十一章＜Pandas数据聚合与分组(1)＞晦涩男董先生数据分析pandas 数据分析 pandas 数据挖掘
前言:数据聚合和分组操作是数据处理过程中不可或缺的一部分。它们允许我们根据特定的条件对数据进行分组，并对每个组进行聚合计算。这对于统计分析、汇总数据以及生成报告和可视化非常有用。无论是市场营销数据分析、销售业绩评估还是金融数据建模，数据聚合和分组操作都起着关键的作用。正文:数据聚合操作定义数据聚合在数据分析中，聚合是指将多个数据元素合并为更高级别的结果表示。数据聚合可以通过对数据集应用统计函数来实
python如何读写excel Dxy1239310216 Python python excel 开发语言
在数据分析和数据科学中，Excel文件是最常见的数据源之一。Python提供了多种库，如pandas、openpyxl、xlrd/xlwt等，可以帮助我们轻松地读写Excel文件。本文将介绍如何使用这些库来读写Excel文件。一、安装库首先，需要安装pandas和openpyxl库。可以使用pip命令来安装：pipinstallpandasopenpyxl二、读取Excel文件使用pandas库可
mac笔记本检查是否安装成功pandas 勤于奋 macos pandas
要检查pandas是否成功安装，你可以打开Python解释器并尝试导入pandas模块。以下是在Python中检查pandas安装情况的步骤：打开终端（Terminal）。输入python进入Python解释器。python在Python解释器中，尝试导入pandas模块。importpandas如果没有出现任何错误提示，说明pandas成功安装并且可以正常导入。你可以进一步验证pandas版本信
数据分析-Pandas数据探查初步：离散点图 Alex_StarSky 金融风控数据分析 pandas python Visualization
数据分析-Pandas数据探查初步：离散点图数据分析和处理中，难免会遇到各种数据，那么数据呈现怎样的规律呢？不管金融数据，风控数据，营销数据等等，莫不如此。如何通过图示展示数据的规律？数据表，时间序列数据在数据分析建模中很常见，例如天气预报，空气状态监测，股票交易等金融场景。数据分析过程中重新调整，重塑数据表是很重要的技巧，此处选择Titanic数据，以及巴黎、伦敦欧洲城市空气质量监测NO2NO_
关于MediaEval数据集的Dataset构建（Text部分-使用PLM BERT） Coisíní℘ 多模态虚假新闻检测 bert 人工智能深度学习
importrandomimportnumpyasnpimportpandasaspdimporttorchfromtransformersimportBertModel,BertTokenizerfromtqdm.autoimporttqdmfromtorch.utils.dataimportDatasetimportre"""参考Game-On论文""""""util.py"""defset_
Matplotlib matplotlib
Matplotlib1.什么是MatplotlibMatplotlib是一个强大的Python绘图库，主要用于数据可视化。2.Matplotlib功能图表类型丰富：支持线图、散点图、条形图、直方图、饼图、柱状图、误差线图、箱线图等多种图表类型。高度自定义：用户可以自定义图表的样式，包括颜色、线型、标记、标题、坐标轴标签等。良好的兼容性：与NumPy、Pandas等Python科学计算库兼容，方便处
LightGBM高级教程：时间序列建模 Echo_Wish Python算法 Python 笔记人工智能深度学习机器学习数据挖掘
导言时间序列数据在许多领域中都非常常见，如金融、气象、交通等。LightGBM作为一种高效的梯度提升决策树算法，可以用于时间序列建模。本教程将详细介绍如何在Python中使用LightGBM进行时间序列建模，并提供相应的代码示例。数据准备首先，我们需要加载时间序列数据并准备数据用于模型训练。以下是一个简单的示例：importpandasaspd#加载时间序列数据data=pd.read_csv('
【主流开发语言和开发环境介绍】程序员不想YY啊开发语言
主流开发语言和开发环境介绍1.介绍2.开发语言3.开发环境1.介绍下面是一些广泛使用的主流开发语言及其相关的开发环境。2.开发语言Python用途：通用编程、科学计算、数据分析、机器学习、Web开发等。流行库：NumPy,Pandas,TensorFlow,PyTorch,Flask,Django。开发环境：PyCharm,VisualStudioCode,JupyterNotebooks。Jav
Python合并多Excel文件 hkmaike python excel 开发语言
Python合并多Excel文件具体方法代码如下具体方法下载安装好pandas并importpandasaspd代码如下importpandasaspdfile1='C:/e1.xlsx'file2='C:/e2.xlsx'file3='C:/e3.xlsx'file=[file1,file2,file3]li=[]foriinfile:li.append(pd.read_excel(i))wri
如何用爬虫软件导出抖店商家的联系方式 qq1143561141 爬虫
介绍：抖店是一款电商平台，许多商家在抖店上开设店铺进行销售。如果你想与抖店商家取得联系，可以通过爬虫软件来导出商家的联系方式。本文将介绍如何使用Python编写爬虫代码来实现这个功能。步骤：环境准备：安装Python和相关依赖库：在电脑上安装Python，并安装requests、beautifulsoup4、pandas等库。获取商家页面的URL：在抖店中打开一个商家的店铺页面，复制地址栏中的UR
Python Pandas处理字符串（方法详解） Lowe-小码 python pandas 开发语言
在Python的Pandas库中，处理字符串是常见的操作。Pandas提供了许多内置的方法和函数来处理DataFrame和Series中的字符串。以下是一些常用的字符串处理方法及其详解：1.字符串访问你可以使用.str属性来访问Series中的字符串方法。importpandasaspds=pd.Series(['apple','banana','cherry'])print(s.str[0])#
【Python编程+数据清洗+Pandas库+数据分析】 723z python pandas python 数据分析
数据分析的第一步往往是数据清洗，这个过程关键在于理解、整理和清洗原始数据，为进一步分析做好准备。Python语言通过Pandas库提供了一系列高效的数据清洗工具。接下来，该文章将通过一个简单的案例演示如何利用Pandas进行数据清洗，并准备数据分析。Pandas库：简介Pandas是为Python编程语言创建的一款用于数据操作和分析的库。Pandas通过两种主要的数据结构——Series和Data
Big Three 大傻羊 c++
前言提示：这里可以添加本文要记录的大概内容：例如：随着人工智能的不断发展，机器学习这门技术也越来越重要，很多人都开启了学习机器学习，本文就介绍了机器学习的基础内容。提示：以下是本篇文章正文内容，下面案例可供参考一、pandas是什么？示例：pandas是基于NumPy的一种工具，该工具是为了解决数据分析任务而创建的。二、使用步骤1.引入库代码如下（示例）：classString{public:St
Python将csv数据导入neo4j 静听山水 Neo4J python neo4j 开发语言
参考链接：https://github.com/SongX64/movie_recommend_knowleagegraphimportpandasaspdfromneo4jimportGraphDatabase#连接数据库驱动uri="bolt://localhost:7687"driver=GraphDatabase.driver(uri,auth=("neo4j","neo4j"))#参数设
python将csv数据导入neo4j 静听山水 Neo4J python neo4j
参考链接：https://github.com/jm199504/Financial-Knowledge-Graphs/tree/masterfrompandasimportDataFramefrompy2neoimportGraph,Node,Relationship,NodeMatcherimportpandasaspdimportnumpyasnpimportos#连接Neo4j数据库fro
如何使用Python绘制常见的几种激活函数? 神笔馬良 python 开发语言
问题描述：如何使用Python绘制常见的几种激活函数？（sigmoid、Tanh、Relu、LeakyRelu、ELU、Softplus、Softmax、Smish）解答：这里八种不同的激活函数，使用了不同的颜色进行了绘制。#importpandasaspd#fromscipyimportstatsimportmathimportmatplotlib.pyplotaspltimportnumpya
Python实现Excel拆分与合并算法channel python excel 大数据人工智能开发语言
在实际工作中，我们经常会遇到各种表格的拆分与合并的情况。如果只是少量表，手动操作还算可行，但是如果是几十上百张表，最好使用Python编程进行自动化处理。下面介绍两种拆分案例场景，如何用Pandas实现Excel文件的拆分。按条件将Excel文件拆分到不同的工作簿假设现在有一个汇总表，内部存储了整个年级的成绩数据。现在需要按照班级分类，将不同班级的数据拆分到不同的工作簿中，最终实现"三年级总成绩单
Python 安装和使用的IDE 草明 Python python 开发语言
安装安装Anaconda(包较大),包含了一些库安装Miniconda(包较小)只和python打包,没有其他的包,用的时候需要自己安装condainstallpandaspythonpythonipython有更多的功能ipythonjupyterjupyternotebookjupyterlab可以去github查看condainstall-cconda-forgejupyterlabjupy
Python - Pandas 基础草明 Python python pandas 开发语言
Pandas基础https://pandas.pydata.org/docs/reference/index.html1.加载一个数据集课程代码:githubchendaniely/pandas_for_everyoneimportpandasaspddf=pd.read_csv('../data/xxxx.tsv',sep='\t')#头5行数据,可以设置参数决定多少行print(df.head
pandas 数据载入、存储及文件格式(文本格式数据的读写—XML 和 HTML：网络抓取) 诗雨时 python
文本格式数据的读写—XML和HTML：网络抓取pandas拥有很多可以对HTML和XML格式进行读取、写入数据的库，例如lxml（http://lxml.de）、BeautifulSoup和html5lib。尽管lxml是相对更快的库，但其他库可以更好地处理异常的HTML或XML文件。一、pandas.read_html解析HTMLpandas的内建函数read_html可以使用lxml和Beau
python 处理xml pandas_Python：将XML数据存储到Pandas DataFrame中 weixin_39885803 python 处理xml pandas
可扩展标记语言(XML)是一种标记语言，它以人类和机器可读的格式对数据进行编码。XML在各种程序中用于构造、存储和传输数据。在这篇文章中，我们将讨论如何使用pythonxml库中的“ElementTree”模块来解析xml数据并将数据存储在pandaDataFrame中。首先，让导入Python库：现在，让我们看一下'books.xml'文件中的标签：我们可以通过将文件名传递给'parse()'方
java的(PO,VO,TO,BO,DAO,POJO) Cb123456 VO TO BO POJO DAO
转: http://www.cnblogs.com/yxnchinahlj/archive/2012/02/24/2366110.html ------------------------------------------------------------------- O/R Mapping 是 Object Relational Mapping（对象关系映
spring ioc原理（看完后大家可以自己写一个spring） aijuans spring
最近，买了本Spring入门书：spring In Action 。大致浏览了下感觉还不错。就是入门了点。Manning的书还是不错的，我虽然不像哪些只看Manning书的人那样专注于Manning,但怀着崇敬的心情和激情通览了一遍。又一次接受了IOC 、DI、AOP等Spring核心概念。先就IOC和DI谈一点我的看法。IO
MyEclipse 2014中Customize Persperctive设置无效的解决方法 Kai_Ge MyEclipse2014
高高兴兴下载个MyEclipse2014，发现工具条上多了个手机开发的按钮，心生不爽就想弄掉他！结果发现Customize Persperctive失效！！有说更新下就好了，可是国内Myeclipse访问不了，何谈更新... so~这里提供了更新后的一下jar包，给大家使用！ 1、将9个jar复制到myeclipse安装目录\plugins中 2、删除和这9个jar同包名但是版本号较
SpringMvc上传 120153216 springMVC
@RequestMapping(value = WebUrlConstant.UPLOADFILE) @ResponseBody public Map<String, Object> uploadFile(HttpServletRequest request,HttpServletResponse httpresponse) { try { //
Javascript----HTML DOM 事件何必如此 JavaScript html Web
HTML DOM 事件允许Javascript在HTML文档元素中注册不同事件处理程序。事件通常与函数结合使用，函数不会在事件发生前被执行！注：DOM：指明使用的 DOM 属性级别。 1.鼠标事件属性
动态绑定和删除onclick事件 357029540 JavaScript jquery
因为对JQUERY和JS的动态绑定事件的不熟悉，今天花了好久的时间才把动态绑定和删除onclick事件搞定!现在分享下我的过程。在我的查询页面，我将我的onclick事件绑定到了tr标签上同时传入当前行(this值)参数，这样可以在点击行上的任意地方时可以选中checkbox，但是在我的某一列上也有一个onclick事件是用于下载附件的，当
HttpClient|HttpClient请求详解 7454103 apache 应用服务器网络协议网络应用 Security
HttpClient 是 Apache Jakarta Common 下的子项目，可以用来提供高效的、最新的、功能丰富的支持 HTTP 协议的客户端编程工具包，并且它支持 HTTP 协议最新的版本和建议。本文首先介绍 HTTPClient，然后根据作者实际工作经验给出了一些常见问题的解决方法。HTTP 协议可能是现在 Internet 上使用得最多、最重要的协议了，越来越多的 Java 应用程序需
递归逐层统计树形结构数据 darkranger 数据结构
将集合递归获取树形结构: /** * * 递归获取数据 * @param alist:所有分类 * @param subjname:对应统计的项目名称 * @param pk:对应项目主键 * @param reportList: 最后统计的结果集 * @param count:项目级别 */ public void getReportVO(Arr
访问WEB-INF下使用frameset标签页面出错的原因 aijuans struts2
<frameset rows="61,*,24" cols="*" framespacing="0" frameborder="no" border="0">
MAVEN常用命令 avords
Maven库： http://repo2.maven.org/maven2/ Maven依赖查询： http://mvnrepository.com/ Maven常用命令： 1. 创建Maven的普通java项目： mvn archetype:create -DgroupId=packageName
PHP如果自带一个小型的web服务器就好了 houxinyou apache 应用服务器 Web PHP 脚本
最近单位用PHP做网站，感觉PHP挺好的，不过有一些地方不太习惯，比如，环境搭建。PHP本身就是一个网站后台脚本，但用PHP做程序时还要下载apache，配置起来也不太很方便，虽然有好多配置好的apache+php+mysq的环境，但用起来总是心里不太舒服，因为我要的只是一个开发环境，如果是真实的运行环境，下个apahe也无所谓，但只是一个开发环境，总有一种杀鸡用牛刀的感觉。如果php自己的程序中
NoSQL数据库之Redis数据库管理(list类型) bijian1013 redis 数据库 NoSQL
3.list类型及操作 List是一个链表结构，主要功能是push、pop、获取一个范围的所有值等等，操作key理解为链表的名字。Redis的list类型其实就是一个每个子元素都是string类型的双向链表。我们可以通过push、pop操作从链表的头部或者尾部添加删除元素，这样list既可以作为栈，又可以作为队列。 &nbs
谁在用Hadoop？ bingyingao hadoop 数据挖掘公司应用场景
Hadoop技术的应用已经十分广泛了，而我是最近才开始对它有所了解，它在大数据领域的出色表现也让我产生了兴趣。浏览了他的官网，其中有一个页面专门介绍目前世界上有哪些公司在用Hadoop，这些公司涵盖各行各业，不乏一些大公司如alibaba,ebay,amazon,google,facebook,adobe等，主要用于日志分析、数据挖掘、机器学习、构建索引、业务报表等场景,这更加激发了学习它的热情。
【Spark七十六】Spark计算结果存到MySQL bit1129 mysql
package spark.examples.db import java.sql.{PreparedStatement, Connection, DriverManager} import com.mysql.jdbc.Driver import org.apache.spark.{SparkContext, SparkConf} object SparkMySQLInteg
Scala: JVM上的函数编程 bookjovi scala erlang haskell
说Scala是JVM上的函数编程一点也不为过，Scala把面向对象和函数型编程这两种主流编程范式结合了起来，对于熟悉各种编程范式的人而言Scala并没有带来太多革新的编程思想，scala主要的有点在于Java庞大的package优势，这样也就弥补了JVM平台上函数型编程的缺失，MS家.net上已经有了F#，JVM怎么能不跟上呢？对本人而言
jar打成exe bro_feng java jar exe
今天要把jar包打成exe，jsmooth和exe4j都用了。遇见几个问题。记录一下。两个软件都很好使，网上都有图片教程，都挺不错。首先肯定是要用自己的jre的，不然不能通用，其次别忘了把需要的lib放到classPath中。困扰我很久的一个问题是，我自己打包成功后，在一个同事的没有装jdk的电脑上运行，就是不行，报错jvm.dll为无效的windows映像，如截图最后发现
读《研磨设计模式》-代码笔记-策略模式-Strategy bylijinnan java 设计模式
声明：本文只为方便我个人查阅和理解，详细的分析以及源代码请移步原作者的博客http://chjavach.iteye.com/ /* 策略模式定义了一系列的算法，并将每一个算法封装起来，而且使它们还可以相互替换。策略模式让算法独立于使用它的客户而独立变化简单理解： 1、将不同的策略提炼出一个共同接口。这是容易的，因为不同的策略，只是算法不同，需要传递的参数
cmd命令值cvfM命令 chenyu19891124 cmd
cmd命令还真是强大啊。今天发现jar -cvfM aa.rar @aaalist 就这行命令可以根据aaalist取出相应的文件例如：在d：\workspace\prpall\test.java 有这样一个文件，现在想要将这个文件打成一个包。运行如下命令即可比如在d：\wor
OpenJWeb(1.8) Java Web应用快速开发平台 comsci java 框架 Web 项目管理企业应用
OpenJWeb(1.8) Java Web应用快速开发平台的作者是我们技术联盟的成员，他最近推出了新版本的快速应用开发平台 OpenJWeb(1.8)，我帮他做做宣传 OpenJWeb快速开发平台以快速开发为核心，整合先进的java 开源框架，本着自主开发+应用集成相结合的原则，旨在为政府、企事业单位、软件公司等平台用户提供一个架构透
Python 报错：IndentationError: unexpected indent daizj python tab 空格缩进
IndentationError: unexpected indent 是缩进的问题，也有可能是tab和空格混用啦 Python开发者有意让违反了缩进规则的程序不能通过编译，以此来强制程序员养成良好的编程习惯。并且在Python语言里，缩进而非花括号或者某种关键字，被用于表示语句块的开始和退出。增加缩进表示语句块的开
HttpClient 超时设置 dongwei_6688 httpclient
HttpClient中的超时设置包含两个部分： 1. 建立连接超时，是指在httpclient客户端和服务器端建立连接过程中允许的最大等待时间 2. 读取数据超时，是指在建立连接后，等待读取服务器端的响应数据时允许的最大等待时间在HttpClient 4.x中如下设置： HttpClient httpclient = new DefaultHttpC
小鱼与波浪 dcj3sjt126com
一条小鱼游出水面看蓝天，偶然间遇到了波浪。　　小鱼便与波浪在海面上游戏，随着波浪上下起伏、汹涌前进。　　小鱼在波浪里兴奋得大叫：“你每天都过着这么刺激的生活吗？简直太棒了。”　　波浪说：“岂只每天过这样的生活，几乎每一刻都这么刺激！还有更刺激的，要有潮汐变化，或者狂风暴雨，那才是兴奋得心脏都会跳出来。”　　小鱼说：“真希望我也能变成一个波浪，每天随着风雨、潮汐流动，不知道有多么好！”　　很快，小鱼
Error Code: 1175 You are using safe update mode and you tried to update a table dcj3sjt126com mysql
快速高效用：SET SQL_SAFE_UPDATES = 0；下面的就不要看了！今日用MySQL Workbench进行数据库的管理更新时，执行一个更新的语句碰到以下错误提示： Error Code: 1175 You are using safe update mode and you tried to update a table without a WHERE that
枚举类型详细介绍及方法定义 gaomysion enum javaee
转发 http://developer.51cto.com/art/201107/275031.htm 枚举其实就是一种类型，跟int, char 这种差不多，就是定义变量时限制输入的，你只能够赋enum里面规定的值。建议大家可以看看，这两篇文章，《java枚举类型入门》和《C++的中的结构体和枚举》，供大家参考。枚举类型是JDK5.0的新特征。Sun引进了一个全新的关键字enum
Merge Sorted Array hcx2013 array
Given two sorted integer arrays nums1 and nums2, merge nums2 into nums1 as one sorted array. Note:You may assume that nums1 has enough space (size that is
Expression Language 3.0新特性 jinnianshilongnian el 3.0
Expression Language 3.0表达式语言规范最终版从2013-4-29发布到现在已经非常久的时间了；目前如Tomcat 8、Jetty 9、GlasshFish 4已经支持EL 3.0。新特性包括：如字符串拼接操作符、赋值、分号操作符、对象方法调用、Lambda表达式、静态字段/方法调用、构造器调用、Java8集合操作。目前Glassfish 4/Jetty实现最好，对大多数新特性
超越算法来看待个性化推荐 liyonghui160com 超越算法来看待个性化推荐
一提到个性化推荐，大家一般会想到协同过滤、文本相似等推荐算法，或是更高阶的模型推荐算法，百度的张栋说过，推荐40%取决于UI、30%取决于数据、20%取决于背景知识，虽然本人不是很认同这种比例，但推荐系统中，推荐算法起的作用起的作用是非常有限的。就像任何
写给Javascript初学者的小小建议 pda158 JavaScript
　　一般初学JavaScript的时候最头痛的就是浏览器兼容问题。在Firefox下面好好的代码放到IE就不能显示了，又或者是在IE能正常显示的代码在firefox又报错了。　　如果你正初学JavaScript并有着一样的处境的话建议你：初学JavaScript的时候无视DOM和BOM的兼容性，将更多的时间花在了解语言本身（ECMAScript）。只在特定浏览器编写代码（Chrome/Fi
Java 枚举 ShihLei java enum 枚举
注：文章内容大量借鉴使用网上的资料，可惜没有记录参考地址，只能再传对作者说声抱歉并表示感谢！一基础 1）语法枚举类型只能有私有构造器（这样做可以保证客户代码没有办法新建一个enum的实例）枚举实例必须最先定义 2）特性 &nb
Java SE 6 HotSpot虚拟机的垃圾回收机制 uuhorse java HotSpot GC 垃圾回收 VM
官方资料，关于Java SE 6 HotSpot虚拟机的garbage Collection，非常全，英文。 http://www.oracle.com/technetwork/java/javase/gc-tuning-6-140523.html Java SE 6 HotSpot[tm] Virtual Machine Garbage Collection Tuning &

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他