RuDing

数据预处理

一、初始工具

1.anaconda: IPython、spyder

2.数据处理工具：pandas、numpy、Excel、sql

3.建模工具：sklearn

3.1 内容

3.2 API

数据预处理：
- Pandas:强大、灵活的数据分析和探索工具
- Numpy:数组支持，以及相应的高校处理函数
- Scipy:矩阵支持，以及对应的矩阵数值计算模块
- Matplotlib:强大的数据可视化工具，作图库
- ……
建模：
- Scikit-Learn：支持回归、分类、聚类等的强大机器学习库
- StatsModels：统计建模和计量经济学，包括描述统计、统计模型估计和推断
- Keras：深度学习库，用于建立神经网络以及深度学习模型
- Gensim：文本主题模型的库，文本挖掘用
- TensorFlow、Theano：深度学习
- ……

from sklearn import datasets
import pandas as pd
import numpy as np
from sklearn import preprocessing

#数据举例
iris = datasets.load_iris()
X, y = iris.data, iris.target
testData = pd.read_csv('C:\\Users\\Load_model\\all_model\\traindata_v2.csv')
testData = testData[:10000]
testData.describe().T
# 有时候需要对数据进行合并， pd.merge  pd.concat

#自己生成数据玩一下
playData = pd.DataFrame({
    'fillNan1' : [0,1]*10 + [2]*20 + [np.nan]*10,
    'date' : pd.date_range('20130101', periods=50),
    'continue1' : pd.Series(3,index=list(range(50)),dtype='float32'),
    'continue2' : np.array([3,4,5,6,7] * 10,dtype='int32'),
    'categorial1' : ["test","train"]*25,
    'cateorial2' : ['male','female',np.nan]*15 + ['male','female','female','feamel','male'],
    'fillNan2' : list(range(0,45)) + ([np.nan]*5),
    'outlier':[-100] + list(range(0,48)) + [200],
    'y' :[0,1]*25
}
)
#查看数据类型：
playData.dtypes
#查看分类变量
playData.categorial1.value_counts()
playData.cateorial2.value_counts()
#查看数值型变量
playData.describe()

二、数据预处理

2.1数据预处理的主要任务

数据清洗：填写空缺值，平滑噪声数据，识别、删除孤立点，解决不一致性
数据集成：集成多个数据库，数据立方体，文件
数据变换：规范化（消除冗余属性）和聚集（数据汇总），将数据从一个较大的子空间投影到一个较小的子空间
数据归约：得到数据集的压缩表示，量小，但可以得到相近或相同的结果
数据离散化：数据规约的一部分，通过概念分层和数据的离散化来规约数据，对数字型数据比较重要。

2.2数据预处理的方法

0.读取数据

1.缺失值&重复值&数值转化&替换值处理

忽略元组
人工填写空缺值
使用一个全局变量填充空缺值
使用属性的平均值填充空缺值
使用与给定元组属同一类的所有样本的平均值
使用最可能的值填充空缺值，使用像Bayesian公式或判定树这样的基于推理的方法

2.异常值处理

分箱（binning）
首先排序数据，并将他们分到等深的箱中
然后可以按箱的平均值平滑，按箱中值平滑，按箱的边界值平滑
聚类：检测并且去除孤立点
计算机和人工检查结合：计算机检测可疑数据，然后对他们进行人工判断
回归：通过让数据适应回归函数来平滑数据，对连续的数字型数据较好

3.数据变换

平滑：去除数据中的噪声
聚集：数据汇总
规范化：将数据按比例缩放，使这些数据落入到一个较小的特定的区间之内。方法有：
- 最小—最大规范化
- Z-score规范化
- 小数定标规范化
属性的构造：通过现有属性构造新的属性，并添加到属性集中
数据归约
- 数据立方体聚集：数据立方体是根据不同的维度对数据进行汇总，立方体的越顶层，其汇总程度就越高，数据量就越少；
- 维归约：用来检测或删除不相关的或基本不相关的属性或冗余属性或维，来减少数据量；
- 数值归约：使用较小的，替代的数据来估计，替换，表示原数据（用参数模型）：通过选择替代的，较小的数据表示形式来减少数据量；
- 离散化：将连续属性的范围划分为区间，以减少所必需处理的数据的量。（分箱、直方图、聚类分析、聚类分析、）

4.不平衡数据处理

很多算法都有一个基本假设，那就是数据分布是均匀的
+ 采样：上采样（Oversampling）和下采样（Undersampling）
+ 数据合成：利用已有样本生成更多样本，这类方法在小数据场景下有很多成功案例（SMOTE）
+ 加权：对不同类别分错的代价基于不同的权重
+ 一分类：对于正负样本极不平衡的场景，我们可以换一个完全不同的角度来看待问题：把它看做一分类（One Class Learning）或异常检测（Novelty Detection）问题。这类方法的重点不在于捕捉类间的差别，而是为其中一类进行建模，经典的工作包括One-class SVM等

5.查看数据分布

#二值化
# binarizer = preprocessing.Binarizer(copy=True, threshold=0.0).fit(playData['outlier']) #does nothing 
# binarizer.transform(playData['outlier'])

#离散化
# ages = [20, 22, 25, 27, 21, 23, 37, 31, 61, 45, 41, 32]  
# bins = [18, 25, 35, 60, 100]  
# cats = pd.cut(ages, bins)  
# pd.DataFrame([ages,list(cats)]).T

#分类变量数值化
playData['categorial1'] = playData['categorial1'].replace('test',1).replace('train',0)
playData['cateorial2'] = playData['cateorial2'].replace('male',0).replace('feamel','female').replace('female',1)
#分类变量变成新特征值
pd.get_dummies(playData['categorial1'])
pd.get_dummies(playData['cateorial2'])
#上面的变换后与原始值加以区分
dummies = pd.get_dummies(playData['categorial1'], prefix='categorial1') 
df_with_dummy = playData[['categorial1']].join(dummies)  
df_with_dummy


#缺失值处理

playData['fillNan1'].fillna(playData.fillNan1.mean())
# playData['fillNan1'].fillna(-1)
playData['fillNan2'].fillna(playData.fillNan1.median())
playData = playData.fillna(0)

#异常值处理
# step1：看一下异常值

# import matplotlib.pyplot as plt
# playData['outlier'].hist()
# plt.show()

# step2: 异常值处理  + 数据标准化
# playData.loc[0,'outlier'] = playData.loc[1,'outlier'] 
# playData.loc[50,'outlier'] =  playData.outlier.max()

#数据变换
## 扩充维度
playData = playData.drop('date',axis=1)
ploy = preprocessing.PolynomialFeatures(degree=2, interaction_only=False, include_bias=True).fit(playData)
add_fea_data = pd.DataFrame(ploy.transform(playData))

## 异常值+ 标准化
from sklearn import preprocessing
scale = preprocessing.robust_scale(add_fea_data,quantile_range=(25.0, 75.0))
pd.DataFrame(scale)

#异常值处理举例
#异常值举例

'''
1  生成0～1之间的随机数据；
2  加入一些异常值；
3  用is_outlier()方法检测异常值；
4  绘制出两个数据的集合(x和filtered)的图表，观察他们的区别。
'''
import numpy as np
import matplotlib.pyplot as plt

def is_outlier(points, threshold=3.5):
    """
    返回一个布尔型的数组，如果数据点是异常值返回True，反之，返回False。

    数据点的值不在阈值范围内将被定义为异常值
    阈值默认为3.5
    """
    # 转化为向量
    if len(points.shape) == 1:
        points = points[:,None]

    # 数组的中位数
    median = np.median(points, axis=0)

    # 计算方差
    diff = np.sum((points - median)**2, axis=-1)
    #标准差
    diff = np.sqrt(diff)
    # 中位数绝对偏差
    med_abs_deviation = np.median(diff)

    # compute modified Z-score
    # http://www.itl.nist.gov/div898/handbook/eda/section4/eda43.htm#Iglewicz
    modified_z_score = 0.6745 * diff / med_abs_deviation

    # return a mask for each outlier
    return modified_z_score > threshold

# 随机数据(100个在0～1之间的浮点数)
x = np.random.random(100)

# 直方图桶数量
buckets = 50

# 加入一些异常值
x = np.r_[x, -49, 95, 100, -100]

# Keep inlier data points
# "~"操作符被重载为一个逻辑操作符，作用在布尔数组上时为取非操作
filtered = x[~is_outlier(x)]

# 画一个直方图
plt.figure()

plt.subplot(211)
plt.hist(x, buckets)


plt.subplot(212)
plt.hist(filtered, buckets)
plt.xlabel('Cleaned')

plt.show()

大多数的数据预处理 preprocessing能满足需求

from sklearn import preprocessing

小进阶

#map函数：是一种实现元素级转换以及其他数据清理工作的便捷方式。
playData['cateorial2'].fillna('male').map(str.upper)
# l = [random.randint(0,100) for i in range(10)]
# def sub50(a):
#     return a-50
# map(sub50,l)

#apply函数
playData['fillNan2'].apply(lambda x: x/100)

#group by
playData.groupby(['categorial1','cateorial2']).count()

#pd.pivot_table
pd.pivot_table(playData,index=['cateorial2'],columns=['categorial1'],values=['continue2'],aggfunc=np.sum)

你可能感兴趣的:(数据预处理)

基于RSS与KNN的室内定位技术实现火箭统
本文还有配套的精品资源，点击获取简介：室内定位技术对于智能建筑和物联网至关重要，在没有GPS信号的环境中尤其重要。RSS位置指纹法利用特定位置的无线信号强度来确定设备位置，而KNN算法能够基于信号强度找到最近的已知位置进行预测。本教程详细讲解了如何在MATLAB中通过”positioning_simulation.m”代码实现RSS位置指纹法与KNN算法的结合，涵盖数据预处理、算法实现、位置预测、
如何用Python才能进行数据分析？_运用pycharm做数据分析的步骤 2401_84254530 python 数据分析 pycharm
数据分析流程Python是数据分析利器，掌握了Python的编程基础后，就可以逐渐进入数据分析。一个完整的数据分析项目大致可分为以下五个流程：数据获取→数据存储→数据预处理→建模与分析→可视化分析1)数据获取一般有数据分析师岗位需求的公司都会有自己的数据库，数据分析师可以通过SQL查询语句来获取数据库中想要数据。Python已经具有连接sqlserver、mysql、orcale等主流数据库的接口
使用 PyTorch 和 Pandas 进行 Kaggle 房价预测 Clang's Blog AI pytorch pandas 人工智能
文章目录1、环境设置2、数据下载3、数据预处理4、模型构建5、训练和验证6、训练模型并生成预测结果7、完整代码在本篇博文中，我们将探索如何使用PyTorch和Pandas库，构建一个用于Kaggle房价预测的模型。我们将详细讨论数据加载、预处理、模型构建、训练、验证及最终预测的全过程。1、环境设置我们首先需要导入所需的库，包括用于数据处理的pandas和numpy，以及用于深度学习的torch。i
Python Pandas.cut函数解析与实战教程皓月照山川 pandas python pandas 开发语言
PythonPandas.cut函数解析与实战教程摘要pandas.cut是数据分析工具库Pandas中一个极其强大且常用的函数。它的核心功能是将连续的数值型数据根据指定的间断点（bins）进行分割，转换成离散化的区间类别（categoricaldata）。这种操作在数据预处理、特征工程和数据可视化中至关重要，例如，将用户的年龄分段、将考试分数评级、或将销售额划分为不同的等级。本文章将从基础用法到
【科研绘图系列】R语言绘制边际云雨图散点图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制边际云雨图散点图加载R包library(tidyverse)library(ggplot2)library(ggpubr)library(ggpmisc)library(gghalves)library(aplot
机器学习概述炀水机器学习人工智能
一、机器学习算法与流程（一）、机器学习的主要流程：1.明确分析目标，2.数据收集，3.数据预处理，4.建模分析，5.结果评估，6.部署使用以及学习更新。1.明确分析目标：客观反映用户需求，通过对各类人群的深入分析，为相关部门制订资费、服务、市场策略提供基础。2.数据收集：收集相关的数据，充足、全面的高质量数据是机器学习的基础。3.数据预处理：数据可能存在着噪声、不一致、异常、个人隐私保护等各类问题
数据空间技术在智慧水库管理平台中的赋能小赖同学啊 test Technology Precious 物联网
数据空间技术在智慧水库管理平台中的赋能：设备到应用的数据传输优化数据空间技术为智慧水库管理平台提供了革命性的数据传输、处理和安全保障能力。以下是数据空间技术在设备到应用数据传输过程中的全面赋能方案：数据空间赋能架构设计中心层区域层设备层数据预处理边缘计算本地决策协议转换数据聚合安全传输元数据管理数据治理访问控制数据服务长期存储业务应用系统数据分析平台数据仓库区域数据空间网关中心数据空间平台边缘数据
搜索引擎简介
搜索流程架构设计需兼顾海量数据处理能力、低延迟查询响应和结果相关性等。数据采集爬虫系统：从种子URL递归抓取，遵循robots协议（网站通过robots.txt声明哪些内容可抓取），避免违规抓取。数据预处理将原始数据（如HTML网页）转化为结构化、可索引的内容，提升后续索引和检索效率。网页解析与清洗：提取有效内容：从HTML中剥离标签（如），保留文本、标题、摘要、关键词等；排除广告、导航栏等冗余信
数据分析领域如何借助AI人工智能升级 AI天才研究院 ChatGPT 计算 AI大模型应用入门实战与进阶数据分析人工智能数据挖掘 ai
数据分析领域如何借助AI人工智能升级关键词：数据分析、人工智能、机器学习、自动化分析、智能决策、数据预处理、预测分析摘要：本文系统阐述数据分析领域如何通过人工智能实现技术升级。从传统数据分析的瓶颈出发，解析AI驱动的核心技术架构，包括自动化数据预处理、智能特征工程、预测分析模型、自然语言处理在数据分析中的应用。通过具体算法实现、数学模型推导和项目实战案例，展示AI如何提升数据分析效率、挖掘数据深度
阿里云代理商：云计算如何推动人工智能与大数据的结合 v_junsouyun06 阿里云代理商阿里云服务器阿里云优惠券云计算阿里云人工智能
目录一、云计算为人工智能提供强大的计算资源1.海量计算能力2.多层次的数据处理能力二、云计算促进大数据与人工智能的融合1.数据存储与访问的灵活性2.大数据分析与AI模型训练的协同三、云计算的可扩展性推动AI与大数据的深度融合1.按需资源扩展与高效利用2.跨云平台协同工作四、云计算的AI服务简化大数据分析流程1.自动化机器学习平台2.智能化数据预处理与分析工具五、云计算与AI推动行业应用创新1.智能
想进大厂？LLMs 10道面试题提前看，有问有答，图文详解！ AI大模型-大飞人工智能大模型 chatgpt 产品经理 AI 程序员大模型面试题
一、微调与优化21、LLM的微调流程是什么?微调（Fine-tuning）LLMs指的是在特定任务或数据上对预训练好的模型进行进一步训练，使其能更好地适应目标场景的过程，其主要流程如下：数据准备：数据收集：根据目标任务收集高质量、有代表性的数据；数据预处理：对原始数据进行清洗，如去除噪声、重复项、不相关内容等。根据模型输入要求对数据进行格式化；数据划分：将数据分为训练集、验证集和测试集，为后续模型
第N8周：使用Word2vec实现文本分类 weixin_42245644 word2vec 人工智能自然语言处理
本文为365天深度学习训练营中的学习记录博客原作者：K同学啊一、数据预处理1.加载数据importtorchimporttorch.nnasnnimporttorchvisionfromtorchvisionimporttransforms,datasetsimportos,PIL,pathlib,warningswarnings.filterwarnings("ignore")#忽略警告信息#w
数模国赛冲刺 | 数据预处理方法合集（数据清洗、数据变换与数据编码） Easy数模深度学习数学建模数据分析
数据预处理方法合集（数据清洗、数据变换与数据编码）数据预处理是数据科学和机器学习项目成功的基础步骤。通过适当的数据预处理，可以确保数据的质量、提升模型的性能，并为后续的建模和分析打下坚实的基础。忽视数据预处理可能导致模型训练失败或性能不佳，甚至得出错误的结论。因此，数据预处理在数据驱动的项目中是不可或缺的步骤，接下来我们将详细地介绍具体的方法，文末可获得全文PDF！目录数据清洗缺失值处理异常值处理
2025年第十五届APMCM亚太地区大学生数学建模竞赛（中文赛项）B题（完整建模过程附python代码）空脑小白数学建模数学建模
问题一：数据预处理与基础统计分析（以stroke.csv为例）一、建模目标对stroke.csv数据进行预处理、特征统计和可视化分析；找出影响中风的关键因素，为后续建模提供数据依据。二、建模过程（1）数据理解stroke.csv包含如下字段（常见字段如下，实际以文件为准）：gender:性别age:年龄hypertension:是否患高血压（0：否，1：是）heart_disease:是否患心脏病
（11）机器学习小白入门YOLOv：YOLOv8-cls epochs与数据量的关系
YOLOv8-clsepochs与数据量的关系(1)机器学习小白入门YOLOv：从概念到实践(2)机器学习小白入门YOLOv：从模块优化到工程部署(3)机器学习小白入门YOLOv：解锁图片分类新技能(4)机器学习小白入门YOLOv：图片标注实操手册(5)机器学习小白入门YOLOv：数据需求与图像不足应对策略(6)机器学习小白入门YOLOv:图片的数据预处理(7)机器学习小白入门YOLOv：模型训练
数据处理和分析之分类算法：XGBoost：机器学习基础理论 kkchenkx 数据挖掘机器学习分类数据挖掘
数据处理和分析之分类算法：XGBoost：机器学习基础理论数据预处理与特征工程数据清洗数据清洗是数据预处理的第一步，旨在去除数据集中的噪声、不一致性和缺失值，确保数据的质量。这包括处理空值、异常值、重复数据和不一致的数据格式。示例：处理缺失值假设我们有一个包含用户年龄、性别和收入的数据集，其中年龄和收入字段存在缺失值。importpandasaspdimportnumpyasnp#创建示例数据集d
30天打牢数模基础-支持向量回归SVR讲解您好啊数模君 30天打牢数模基础回归支持向量回归 SVR 数学建模 2025数学建模国赛
案例代码实现一、代码说明本代码模拟了城市夏季10天的电力负荷数据（240条），使用支持向量回归（SVR）解决非线性回归+抗异常值问题。核心步骤包括：模拟符合非线性关系（温度U型曲线、小时高峰）和异常值的数据；数据预处理（特征标准化）；网格搜索调参（优化C、gamma、epsilon参数）；模型训练与评估（对比SVR与线性回归的性能）；结果可视化（真实值vs预测值、误差分布）。二、完整代码impor
使用PyTorch进行猫狗图像分类实战指南 op3721
本文还有配套的精品资源，点击获取简介：本文详细介绍了如何利用PyTorch框架来执行一个猫狗分类任务。从数据预处理、构建全连接网络模型、训练过程到评估指标等方面进行了全面阐释。内容涵盖了图像数据的收集、标准化处理，以及如何使用DataLoader类来提高数据加载效率。接着，本文讲解了如何构建和定义网络结构，选用交叉熵损失函数，并利用SGD或Adam优化器进行权重更新。在训练模型时，我们会进行多个e
图像分类实战：基于ResNet实现猫狗识别风亦辰739 从零开始掌握深度学习：理论 +实战分类数据挖掘人工智能
图像分类实战：基于ResNet实现猫狗识别（含完整PyTorch代码）图像分类是计算机视觉中最基础也是最经典的任务之一。今天我们将带你实战体验如何使用PyTorch和ResNet构建一个猫狗识别系统。从数据预处理、模型构建、训练调优到模型保存和预测，每一步都细致讲解，带你快速上手！一、任务目标使用Kaggle猫狗数据集进行图像分类；构建基于ResNet18的分类模型；实现完整训练与验证流程；进行单
SAP Word 模板与 XML 数据流合并过程深度剖析——以表格结构为例汪子熙 ABAP 百科全书 word xml CRM ABAP NetWeaver SAP
在CRMWebClientUI的Office集成功能里，Word模板与XML数据流的动态合并，是合同、报价单等文档自动生成的技术核心。本文结合SAP官方示例代码与OpenXML规范，从模板绑定、数据预处理、运行时递归填充到实际排错技巧，全景展示表格结构合并的幕后细节，并给出一段源自真实项目的实战案例，帮助读者迅速掌握这一看似神秘的“魔术”。(document567.rssing.com,docum
基于SVm和随机森林算法模型的中国黄金价格预测分析与研究 python编程狮支持向量机算法随机森林 python 机器学习人工智能
摘要本研究基于回归模型，运用支持向量机（SVM）、决策树和随机森林算法，对中国黄金价格进行预测分析。通过历史黄金价格数据的分析和特征工程，建立了相应的预测模型，并利用SVM、决策树和随机森林算法进行训练和预测。首先，通过对黄金价格时间序列数据的探索性分析，发现黄金价格存在一定的趋势和季节性变化。随后，进行了数据预处理和特征选择，为建立准确的预测模型奠定了基础。分别使用SVM、决策树和随机森林算法建
Python训练 + Go优化 + C#部署：端到端AI模型的跨语言实践威哥说编程人工智能学习资料库 python golang c#
在现代AI应用中，如何高效地训练、优化、并最终部署AI模型是一项复杂且具有挑战性的任务。在这一过程中，选择合适的编程语言和工具可以显著提高效率和系统的性能。Python作为AI领域的主流语言，具有丰富的深度学习框架（如PyTorch和TensorFlow），在模型训练方面处于领先地位。然而，针对计算密集型任务（如数据预处理、加密等），Go语言因其高效的并发处理和出色的性能，成为优化计算的理想选择。
机器学习数据预处理阶段为什么需要——归一化处理
参考：https://www.cnblogs.com/bjwu/p/8977141.html通常，在DataScience中，预处理数据有一个很关键的步骤就是数据的标准化。这里主要引用sklearn文档中的一些东西来说明，主要把各个标准化方法的应用场景以及优缺点总结概括，以来充当笔记。提升模型精度在机器学习算法的目标函数(例如SVM的RBF内核或线性模型的l1和l2正则化)，许多学习算法中目标函数
【科研绘图系列】R语言绘制堆积图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制堆积图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(reshape)library(ggalluvial)library(ggprism
横幅检测数据集-1500张图片智慧城市管理活动现场管理商业广告分析
横幅检测数据集-1500张图片已发布目标检测数据集合集（持续更新）️横幅检测数据集介绍数据集概览检测目标类型应用场景数据样本展示使用建议1.数据预处理优化2.模型训练策略3.实际部署考虑4.应用场景适配5.性能优化建议数据集特色商业价值技术实现路径模型选择建议特殊技术考虑集成方案建议应用效果评估性能指标建议业务价值指标YOLOv8训练实战1.环境配置安装YOLOv8官方库ultralytics2.
综合智能监测系统设计：有害气体实时检测与管理黑泡尖子
本文还有配套的精品资源，点击获取简介：在工业化进程中，有害气体的排放对人类健康和环境构成威胁。设计一种智能监测系统，利用传感器技术、物联网和数据分析等，实时监控环境中有害气体的浓度，确保生产安全和环保。该系统涵盖硬件构建、软件开发和数据处理等环节，并提供高效准确的监测能力。系统集成了无线通信模块进行数据传输，具备数据预处理和分析能力，能够进行阈值设定与预警响应。用户界面友好，系统具有良好的集成性、
机器学习中的数据预处理：从入门到实践耐思nice～机器学习由浅入深-吴恩达机器学习人工智能
在当今的智能时代，机器学习已经渗透到我们生活的方方面面。比如我们常用的推荐系统，它能根据我们的浏览记录精准推送喜欢的商品或视频，这背后就离不开机器学习的支撑。而一个优秀的机器学习模型，离不开高质量的数据，数据预处理正是保证数据质量的关键环节，它就像烹饪前的食材处理，直接影响着最终“菜品”的口感，也就是模型的性能。今天，我们就来全面学习机器学习中数据预处理的关键步骤。一、数据预处理的重要性数据预处理
【科研绘图系列】R语言绘制配对散点图连线柱状图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制配对散点图连线柱状图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
【科研绘图系列】R语言绘制柱状散点连线图生信学习者1 SCI科研绘图系列 (2024版)r语言数据可视化
文章目录介绍加载R包数据下载导入数据数据预处理画图系统信息参考介绍【科研绘图系列】R语言绘制柱状散点连线图加载R包library(tidyverse)library(ggplot2)library(ggsignif)library(ggpubr)library(patchwork)library(ggprism
机器学习专栏（62）：手把手实现工业级ResNet-34及调优全攻略
目录一、ResNet革命性突破解析1.1残差学习核心思想1.2ResNet-34结构详解二、工业级Keras实现详解2.1数据预处理流水线2.2完整模型实现三、模型训练调优策略3.1学习率动态调整3.2混合精度训练四、性能优化技巧4.1分布式训练配置4.2TensorRT推理加速五、实战应用案例5.1医疗影像分类5.2工业质检系统六、模型可视化分析6.1特征热力图6.2参数量分析七、常见问题解决方
C/C++Win32编程基础详解视频下载择善Zach 编程 C++Win32
课题视频：C/C++Win32编程基础详解视频知识：win32窗口的创建 windows事件机制主讲：择善Uncle老师学习交流群：386620625 验证码：625 --
Guava Cache使用笔记 bylijinnan java guava cache
1.Guava Cache的get/getIfPresent方法当参数为null时会抛空指针异常我刚开始使用时还以为Guava Cache跟HashMap一样，get(null)返回null。实际上Guava整体设计思想就是拒绝null的，很多地方都会执行com.google.common.base.Preconditions.checkNotNull的检查。 2.Guava
解决ora-01652无法通过128（在temp表空间中） 0624chenhong oracle
解决ora-01652无法通过128（在temp表空间中）扩展temp段的过程一个sql语句后，大约花了10分钟，好不容易有一个结果，但是报了一个ora-01652错误，查阅了oracle的错误代码说明：意思是指temp表空间无法自动扩展temp段。这种问题一般有两种原因：一是临时表空间空间太小，二是不能自动扩展。分析过程：既然是temp表空间有问题，那当
Struct在jsp标签不懂事的小屁孩 struct
非UI标签介绍：控制类标签： 1：程序流程控制标签 if elseif else <s:if test="isUsed"> <span class="label label-success">True</span> </
按对象属性排序换个号韩国红果果 JavaScript 对象排序
利用JavaScript进行对象排序，根据用户的年龄排序展示 <script> var bob={ name;bob, age:30 } var peter={ name;peter, age:30 } var amy={ name;amy, age:24 } var mike={ name;mike, age:29 } var john={
大数据分析让个性化的客户体验不再遥远蓝儿唯美数据分析
顾客通过多种渠道制造大量数据，企业则热衷于利用这些信息来实现更为个性化的体验。分析公司Gartner表示，高级分析会成为客户服务的关键，但是大数据分析的采用目前仅局限于不到一成的企业。挑战在于企业还在努力适应结构化数据，疲于根据自身的客户关系管理（CRM）系统部署有效的分析框架，以及集成不同的内外部信息源。然而，面对顾客通过数字技术参与而产生的快速变化的信息，企业需要及时作出反应。要想实
java笔记4 a-john java
操作符 1，使用java操作符操作符接受一个或多个参数，并生成一个新值。参数的形式与普通的方法调用不用，但是效果是相同的。加号和一元的正号（+）、减号和一元的负号（-）、乘号（*）、除号（/）以及赋值号（=）的用法与其他编程语言类似。操作符作用于操作数，生成一个新值。另外，有些操作符可能会改变操作数自身的
从裸机编程到嵌入式Linux编程思想的转变------分而治之：驱动和应用程序 aijuans 嵌入式学习
笔者学习嵌入式Linux也有一段时间了，很奇怪的是很多书讲驱动编程方面的知识，也有很多书将ARM9方面的知识，但是从以前51形式的（对寄存器直接操作，初始化芯片的功能模块）编程方法，和思维模式，变换为基于Linux操作系统编程，讲这个思想转变的书几乎没有，让初学者走了很多弯路，撞了很多难墙。笔者因此写上自己的学习心得，希望能给和我一样转变
在springmvc中解决FastJson循环引用的问题 asialee 循环引用 fastjson
我们先来看一个例子： package com.elong.bms; import java.io.OutputStream; import java.util.HashMap; import java.util.Map; import co
ArrayAdapter和SimpleAdapter技术总结百合不是茶 android SimpleAdapter ArrayAdapter 高级组件基础
ArrayAdapter比较简单，但它只能用于显示文字。而SimpleAdapter则有很强的扩展性，可以自定义出各种效果 ArrayAdapter;的数据可以是数组或者是队列 // 获得下拉框对象 AutoCompleteTextView textview = (AutoCompleteTextView) this
九封信 bijian1013 人生励志
有时候，莫名的心情不好，不想和任何人说话，只想一个人静静的发呆。有时候，想一个人躲起来脆弱，不愿别人看到自己的伤口。有时候，走过熟悉的街角，看到熟悉的背影，突然想起一个人的脸。有时候，发现自己一夜之间就长大了。 2014，写给人
Linux下安装MySQL Web 管理工具phpMyAdmin sunjing PHP Install phpMyAdmin
PHP http://php.net/ phpMyAdmin http://www.phpmyadmin.net Error compiling PHP on CentOS x64 一、安装Apache 请参阅http://billben.iteye.com/admin/blogs/1985244 二、安装依赖包 sudo yum install gd
分布式系统理论 bit1129 分布式
FLP One famous theory in distributed computing, known as FLP after the authors Fischer, Lynch, and Patterson, proved that in a distributed system with asynchronous communication and process crashes,
ssh2整合(spring+struts2+hibernate)-附源码白糖_ eclipse spring Hibernate mysql 项目管理
最近抽空又整理了一套ssh2框架，主要使用的技术如下： spring做容器，管理了三层(dao,service,actioin)的对象 struts2实现与页面交互(MVC)，自己做了一个异常拦截器，能拦截Action层抛出的异常 hibernate与数据库交互 BoneCp数据库连接池，据说比其它数据库连接池快20倍，仅仅是据说 MySql数据库项目用eclipse
treetable bug记录 braveCS table
// 插入子节点删除再插入时不能正常显示。修改： //不知改后有没有错，先做个备忘 Tree.prototype.removeNode = function(node) { // Recursively remove all descendants of +node+ this.unloadBranch(node); // Remove
编程之美-电话号码对应英语单词 bylijinnan java 算法编程之美
import java.util.Arrays; public class NumberToWord { /** * 编程之美电话号码对应英语单词 * 题目： * 手机上的拨号盘，每个数字都对应一些字母，比如2对应ABC，3对应DEF.........，8对应TUV，9对应WXYZ， * 要求对一段数字，输出其代表的所有可能的字母组合
jquery ajax读书笔记 chengxuyuancsdn jQuery ajax
1、jsp页面 <%@ page language="java" import="java.util.*" pageEncoding="GBK"%> <% String path = request.getContextPath(); String basePath = request.getScheme()
JWFD工作流拓扑结构解析伪码描述算法 comsci 数据结构算法工作活动 J#
对工作流拓扑结构解析感兴趣的朋友可以下载附件，或者下载JWFD的全部代码进行分析 /* 流程图拓扑结构解析伪码描述算法 public java.util.ArrayList DFS(String graphid, String stepid, int j)
oracle I/O 从属进程 daizj oracle
I/O 从属进程　　I/O从属进程用于为不支持异步I/O的系统或设备模拟异步I/O.例如，磁带设备(相当慢)就不支持异步I/O.通过使用I/O 从属进程，可以让磁带机模仿通常只为磁盘驱动器提供的功能。就好像支持真正的异步I/O 一样，写设备的进程(调用者)会收集大量数据，并交由写入器写出。数据成功地写出时，写入器(此时写入器是I/O 从属进程，而不是操作系统)会通知原来的调用者，调用者则会
高级排序:希尔排序 dieslrae 希尔排序
public void shellSort(int[] array){ int limit = 1; int temp; int index; while(limit <= array.length/3){ limit = limit * 3 + 1;
初二下学期难记忆单词 dcj3sjt126com english word
kitchen 厨房 cupboard 厨柜 salt 盐 sugar 糖 oil 油 fork 叉；餐叉 spoon 匙；调羹 chopsticks 筷子 cabbage 卷心菜；洋白菜 soup 汤 Italian 意大利的 Indian 印度的 workplace 工作场所 even 甚至；更 Italy 意大利 laugh 笑 m
Go语言使用MySQL数据库进行增删改查 dcj3sjt126com mysql
目前Internet上流行的网站构架方式是LAMP，其中的M即MySQL, 作为数据库，MySQL以免费、开源、使用方便为优势成为了很多Web开发的后端数据库存储引擎。MySQL驱动Go中支持MySQL的驱动目前比较多，有如下几种，有些是支持database/sql标准，而有些是采用了自己的实现接口,常用的有如下几种: http://code.google.c...o-mysql-dri
git命令 shuizhaosi888 git
---------------设置全局用户名： git config --global user.name "HanShuliang" //设置用户名 git config --global user.email "[email protected]" //设置邮箱 ---------------查看环境配置 git config --li
qemu-kvm 网络 nat模式 (四) haoningabc kvm qemu
qemu-ifup-NAT #!/bin/bash BRIDGE=virbr0 NETWORK=192.168.122.0 GATEWAY=192.168.122.1 NETMASK=255.255.255.0 DHCPRANGE=192.168.122.2,192.168.122.254 TFTPROOT= BOOTP= function check_bridge()
不要让未来的你，讨厌现在的自己 jingjing0907 生活奋斗工作梦想
故事one 　23岁，他大学毕业，放弃了父母安排的稳定工作，独闯京城，在家小公司混个小职位，工作还算顺手，月薪三千，混了混，混走了一年的光阴。　　　　24岁，有了女朋友，从二环12人的集体宿舍搬到香山民居，一间平房，二人世界，爱爱爱。偶然约三朋四友，打扑克搓麻将，日子快乐似神仙；　　　　25岁，出了几次差，调了两次岗，薪水涨了不过百，生猛狂飙的物价让现实血淋淋，无力为心爱银儿购件大牌
枚举类型详解一路欢笑一路走 enum 枚举详解 enumset enumMap
枚举类型详解一.Enum详解 1.1枚举类型的介绍 JDK1.5加入了一个全新的类型的”类”—枚举类型，为此JDK1.5引入了一个新的关键字enum,我们可以这样定义一个枚举类型。 Demo:一个最简单的枚举类 public enum ColorType { RED
第11章动画效果（上） onestopweb 动画
index.html <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd"> <html xmlns="http://www.w3.org/
Eclipse中jsp、js文件编辑时，卡死现象解决汇总 ljf_home eclipse jsp卡死 js卡死
使用Eclipse编辑jsp、js文件时，经常出现卡死现象，在网上百度了N次，经过N次优化调整后，卡死现象逐步好转，具体那个方法起到作用，不太好讲。将所有用过的方法罗列如下： 1、取消验证 windows–>perferences–>validation 把除了manual 下面的全部点掉，build下只留 classpath dependency Valida
MySQL编程中的6个重要的实用技巧 tomcat_oracle mysql
每一行命令都是用分号(;)作为结束对于MySQL，第一件你必须牢记的是它的每一行命令都是用分号(;)作为结束的，但当一行MySQL被插入在PHP代码中时，最好把后面的分号省略掉，例如： mysql_query("INSERT INTO tablename(first_name,last_name)VALUES('$first_name',$last_name')");
zoj 3820 Building Fire Stations(二分+bfs) 阿尔萨斯 Build
题目链接：zoj 3820 Building Fire Stations 题目大意：给定一棵树，选取两个建立加油站，问说所有点距离加油站距离的最大值的最小值是多少，并且任意输出一种建立加油站的方式。解题思路：二分距离判断，判断函数的复杂度是o(n)，这样的复杂度应该是o(nlogn)，即使常数系数偏大，但是居然跑了4.5s，也是醉了。判断函数里面做了3次bfs，但是每次bfs节点最多

按字母分类： A B C D E F G H I J K L M N O P Q R S T U V W X Y Z 其他