E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python数据挖掘
Python办公自动化|批量合并PDF,拿来就用
Python数据挖掘
与文本分析&Stata应用能力提升与实证前沿云特训大家好,今天分享一个实用的办公脚本:将多个PDF合并为一个PDF,例如我手上现在有如下3个PDF分册,需要整合成一个完整的PDF如果换成你操作的话
邓旭东HIT
·
2020-08-01 05:04
Python 数据挖掘之中医证型关联规则挖掘
Python数据挖掘
之中医证型关联规则挖掘综述部分数据展示数据聚类离散化Apriori关联规则分析结果综述对中医证型数据进行挖掘分析,运用的算法有K-Means,MeanShift,apriori。
你的大数据学长
·
2020-07-31 23:15
Python
python
数据挖掘
聚类
算法
机器学习
Python 数据挖掘之电力窃漏电用户自动识别
Python数据挖掘
之电力窃漏电用户自动识别综述拉格朗日插值决策树模型LM神经网络模型结果决策树模型结果图LM神经网络模型结果图综述对电力公司数据进行挖掘分析,首先使用拉格朗日插值法进行缺失值处理,然后分别使用决策树模型与
你的大数据学长
·
2020-07-31 23:15
Python
Python 数据挖掘之航空公司客户价值分析
Python数据挖掘
之航空公司客户价值分析综述数据探索分析数据清洗标准差标准化K-Means聚类分析DBSCAN聚类分析结果K-Means聚类分析结果图DBSCAN聚类分析结果图综述对航空公司客户数据进行挖掘分析
你的大数据学长
·
2020-07-31 23:15
Python
特征工程——用转换器抽取特征
前言:《
python数据挖掘
入门与实践》第五章。学习构造自己的转换器,和特征工程的一些技巧。代码及每一部分的输出如下。
baoFeng_Li
·
2020-07-31 13:22
数据挖掘
Python数据挖掘
入门与实践一:计算支持度和置信度
importnumpyasnpfromcollectionsimportdefaultdict#First,howmanyrowscontainourpremise:thatapersonisbuyingapples'''num_apple_purchases=0forsampleinX:ifsample[3]==1:#thispersonboughtapplesnum_apple_purchas
ANNending
·
2020-07-30 14:40
机器学习
python
Python数据挖掘
实战-唐宇迪-专题视频课程
Python数据挖掘
实战—1691人已学习课程介绍
Python数据挖掘
系列课程基于真实数据集进行案例实战,使用Python数据科学库从数据预处理开始一步步进行数据建模。
迪哥有点愁了
·
2020-07-29 11:18
视频教程
【转】Scikit-learn技巧(拓展)总结
最近看了《
Python数据挖掘
入门与实战》,网上有说翻译地不好的,但是说实话,我觉得这本书还是相当不错的。
weixin_30471561
·
2020-07-29 06:09
sklearn(scikit-learn) 使用技巧
《
Python数据挖掘
入门与实战》,作者
求知者_123
·
2020-07-29 05:31
Python学习
python数据挖掘
---数据清洗篇(附代码)
在数据挖掘路上点点滴滴,遇到的数据清洗的一些常用技巧和方法,记录下来,并持续更新。1.01读取数据不要索引,去掉字段前后空格train=pd.read_csv('train.csv',skipinitialspace=True,index_col=0)1.02缺失值处理按列统计缺失值比例,决定去除或者填充all_missing=all_dummies.isnull().sum()#按列查看缺失值a
睡醒了的小码媛
·
2020-07-28 21:14
机器学习
python数据分析
文本分析在经管领域中的应用概述
Python数据挖掘
与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注在大数据的今天,通过互联网超文本链接,无数的个人、团体、公司、政府等不同组织形态的主体均深深嵌入到互联网世界
邓旭东HIT
·
2020-07-28 20:30
Python语法快速入门视频课程
插播一条广告
Python数据挖掘
与文本分析&Stata应用能力提升与实证前沿云特训Python部分上课时间为6月29日-7月2日,感兴趣的童鞋欢迎关注《Python语法快速入门》已经在B站更新,为了让大家更方便的学习和观看
邓旭东HIT
·
2020-07-28 20:30
视频教程-Python数据分析零基础入门-Python
Python数据分析零基础入门马哥教育Python金牌讲师,国内知名Python技术专家,在Python全栈、Python运维开发、
Python数据挖掘
、爬虫、人工智能等领域有深入研究,有15年Python
weixin_33650624
·
2020-07-28 17:20
python数据挖掘
:概念_大数据:概念,安全性和用例
python数据挖掘
:概念Introduction介绍BigDatareferstodatacollectionsthataresolargeandcomplexthattheyaredifficultfortraditionaldatabasetoolstomanage.BigDataisconsideredasthebaseofthefutureinthefieldofInformationT
cunchi8090
·
2020-07-23 13:57
数据库
大数据
编程语言
python
人工智能
python数据挖掘
03——Pandas
pandas集合了numpy与matplotlib,在数据处理能力上更具有便捷性,读取数据文件较方便。DataFrame:pandas中的结构,可以看作带有行索引和列索引的二维表结构。行对应index,列对应columns。importpandasaspdimportnumpyasnpstock_change=np.random.normal(0,1,size=(10,5))#创建名称索引name
Ayrton1031
·
2020-07-16 03:27
机器学习
python基础系列教程——数据结构(列表、元组、字典、集合、链表)
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程基本顺序存储结构——列表与元组Python中的基本顺序存储结构是列表与元组,在操作的复杂度上和数组完全相同,其中列表是可变数据类型,元组是不可变数据类型
数据架构师
·
2020-07-16 02:14
python系列课程
快速学习实战应用
python数据挖掘
需要学的内容
在本篇文章中我们给大家整理了关于
python数据挖掘
需要学什么的知识点指南,有兴趣的朋友们跟着参考下。
jb_1352461
·
2020-07-16 00:53
数据挖掘——numpy基础
前言:
python数据挖掘
numpy的基础知识,参考网上资料和博客进行简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——
39.5℃的风
·
2020-07-15 16:59
数据挖掘专栏
numpy
数据挖掘——pandas基础
前言:
python数据挖掘
pandas的基础知识,简单总结,主要是为了方便自己写的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘—
39.5℃的风
·
2020-07-15 16:27
数据挖掘专栏
数据挖掘——python基础
前言:
python数据挖掘
的基础知识,参考网上很多文章和博客进行总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充数据挖掘专栏数据挖掘——python基础数据挖掘——numpy基础数据挖掘
39.5℃的风
·
2020-07-15 16:27
数据挖掘专栏
python数据挖掘
实战 -数据预处理篇(数据可视化-空值填充-哑变量编码)
数据预处理包含:数据盘点-数据可视化分析-空值填充-数据编码importmatplotlib.pyplotaspltimportseabornassnsfromsklearn.neighborsimportKNeighborsClassifierfromsklearn.linear_modelimportLogisticRegressionfromsklearn.treeimportDecisio
AI深度学习算法实战代码解读
·
2020-07-15 16:03
数据建模
BI
人工智能技术
数据挖掘——pandas+matplotlib+seaborn数据可视化
前言:
python数据挖掘
pandas+matplotlib+seaborn数据可视化(画图)的基础知识,简单总结,主要是为了方便自己写代码的时候查看,发现有用的方法,随时补充,欢迎指正数据挖掘专栏数据挖掘
39.5℃的风
·
2020-07-15 13:42
数据挖掘专栏
Python数据挖掘
02-MySQLdb的使用
MySQLdb是在Python中使用MySQL数据库的桥梁,有了这个桥梁,得以实现Python与MySQL的数据交换。由于Python与MySQL使用的编码可能不同,以及不同操作系统文字编码的区别,所以对于中文的处理需要特别注意。读取中文数据库#coding=utf-8importMySQLdbtry:conn=MySQLdb.connect(host='localhost',user='root
千山万水
·
2020-07-15 09:51
python机器学习库sklearn——数据预处理
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程主要操作内容标准化,也称去均值和方差按比例缩放将特征缩放至特定范围内缩放稀疏(矩阵)数据缩放有离群值的数据核矩阵的中心化非线性转换归一化二值化特征二值化标称特征编码缺失值插补生成多项式特征直接上代码
数据架构师
·
2020-07-14 14:26
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python机器学习库sklearn——K最近邻、K最近邻分类、K最近邻回归
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程KNN即K最近邻,相关的知识内容可以参考http://blog.csdn.net/luanpeng825485697/article/details
数据架构师
·
2020-07-14 14:26
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
Python数据挖掘
—电力窃漏电用户自动识别
实验有两个部分:1.利用拉格朗日差值法进行缺失值的补充2.构建分类模型对窃电用户进行识别(一)用户的用电数据存在缺失值,数据见“test/data/missing_data.xls”,利用拉格朗日插值法补全数据。(二)对所有窃电用户及正常的用电的电量,警告及线损数据和该用户在当天是否窃电漏电的标识,按窃电漏电评价标准进行处理样本数据,得到专家样本,数据见“test/data/model.xls”,
可行的code
·
2020-07-14 11:46
python
Python数据挖掘
与机器学习,快速掌握聚类算法和关联分析
云栖君导读:前文数据挖掘与机器学习技术入门实战与大家分享了分类算法,在本文中将为大家介绍聚类算法和关联分析问题。分类算法与聚类到底有何区别?聚类方法应在怎样的场景下使用?如何使用关联分析算法解决个性化推荐问题?本文就为大家揭晓答案。本次直播视频精彩回顾:http://click.aliyun.com/m/45918/演讲嘉宾简介:韦玮,企业家,资深IT领域专家/讲师/作家,畅销书《精通Python
云栖社区v
·
2020-07-14 10:29
Python数据挖掘
与机器学习_通信信用风险评估实战(2)——数据预处理
系列目录:
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据数据说明通过对读取数据的实践,下面是数据集文件对应读取后的DataFrame说明。
padluo
·
2020-07-12 09:04
python机器学习库sklearn——线性回归
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程线性回归的相关的知识内容可以参考http://blog.csdn.net/luanpeng825485697/article/details/
数据架构师
·
2020-07-11 12:42
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python机器学习案例系列教程——K最近邻算法(KNN)、kd树
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程K最近邻简介K最近邻属于一种估值或分类算法,他的解释很容易。
数据架构师
·
2020-07-11 12:42
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python数据挖掘
和分析(二)
这一章我们讲如何将数据导入到Python中以便我们进行处理。数据导入的方式有很多,经常用的就是从数据库直连得到数据,从csv文件读取数据,从Excel文件读数据,从HTML中读数据,从TXT中读数据。我们挨个讲解一下:从csv中导入数据,数据使用mysql5.7的sakila库里的actor表内数据:a=pda.read_csv("C:/Users/yuexiao.liu/Desktop/2.cs
liuyuexiaofirstBK
·
2020-07-11 11:31
数据分析
python
机器学习之模型建立及评估
常见的模型评价和在Python中的实现
python数据挖掘
建模中,第一个步骤是建立一个对象,这个对象是空白的,需要进一步训练的;然后,设置模型的参数;接着,通过fit()方法对模型进行训练;最后,通过predict
今晨er
·
2020-07-11 08:42
【
python数据挖掘
课程】二十.KNN最近邻分类算法分析详解及平衡秤TXT数据集读取
这是《
Python数据挖掘
课程》系列文章,也是我这学期上课的部分内容及书籍的一个案例。本文主要讲述KNN最近邻分类算法、简单实现分析平衡秤数据集,希望这篇文章对大家有所帮助,同时提供些思路。
Eastmount
·
2020-07-10 21:08
Python数据挖掘课程
机器学习
知识图谱
web数据挖掘及NLP
Python数据挖掘
——烟火图像分类:传统机器学习建模方法与卷积神经网络性能比较
文章目录背景介绍导入相关库数据探索数据预处理暗通道去雾算法数据建模预先定义模型评估方法使用传统机器学习模型:支持向量机、随机森林、神经网络、集成学习Adaboost进行训练使用CNN进行建模训练模型性能评估,以及不同模型性能比较数据集+源码背景介绍假设开发一款基于户外监控摄像头的山火/非法焚烧秸秆的预防系统。希望能够在最短的时间内基于监控画面确定是否有烟火发生,然后人工快速介入,确定是否是山火/非
Demonslzh
·
2020-07-10 21:04
数据挖掘
Python数据挖掘
之逻辑回归算法
逻辑回归算法逻辑回归算法:虽然名字中带有回归两个字,但它却不是回归算法,它是一个经典的二分类算法。目录逻辑回归算法Logistic函数Logistic回归建模步骤Logistic函数Logistic回归模型中的因变量只有1和0(发生于不发生)两种。假设在p个独立自变量x1,x2…xp作用下,y取1的概率是p=P(y=1|X)取0的概率是1-p,取1和取0的概率之比为p1−p\frac{p}{1-p
高羊羊羊羊羊杨
·
2020-07-10 10:13
Python
6月书讯:Di li li li di li li li...
互联网与人工智能》、《iOS开发指南:从HelloWorld到AppStore上架(第4版)》、《ReactNative开发指南》、《图解密码技术(第3版)》、《R语言入门与实践》【含社区电子版】、《
Python
turingbooks
·
2020-07-10 03:57
图灵书讯
Python实现初阶决策树
《
Python数据挖掘
入门与实践》这本书中关于决策树部分的讲解,代码部分相对简要,但坑爹的是,他给的数据下载网站,人家改版了,根本找不到数据,进行测试,于是我又用“鸢尾花”数据测试了一下决策树算法。
一行数师
·
2020-07-10 00:20
python数据挖掘
入门与实践---作者归属问题
问题:通过对文本中的信息分析,找到文章对应的作者用到的算法模型:SVM,支持向量机。SVM可以简单看着一种二类分类器(画一条线,使两边类别的点到线的距离最大化),扩展后可以是多类分类器,但实际也是A类和非A类的二类分类,只是进行多次,将ABCD....类分别分出来。解决问题两种思路:1、功能词。功能词(如the,which,that...)是指本身含义很少,但却是组成句子必不可少的成分。一般认为功
ypgsh
·
2020-07-09 04:57
Python数据挖掘
基础(三):Pandas基础
目录1.介绍1.1为什么使用Pandas?1.2DataFrame(对比二维数组)1.2.1DataFrame的属性1.2.2DatatFrame索引的设置1.3MultiIndex(对比三维数组)1.4Series结构(对比一维数组)1.4.1创建series2.基本数据操作2.1索引操作2.1.1直接使用行列索引(先列后行)2.1.2结合loc或者iloc使用索引2.1.3组合索引2.2赋值操
Amo Xiang
·
2020-07-09 02:14
Python
python数据挖掘
实战笔记——文本挖掘(10):自动摘要
概念:摘要:全面准确地反映某一文献中心内容的简单连贯的短文。自动摘要:利用计算机自动地从原始文件中提取摘要。算法原理:余弦相似定理算法步骤:获取需要摘要的文章对该文章进行词频统计对该文章进行分句,一般采用“,"、"."、?"进行分句。计算分句与文章之间的余弦相似度。取相似度最高的分句,作为文章的摘要。下面是具体代码实现:首先导入包:#导入需要的包importreimportosimportjieb
小柴~
·
2020-07-08 20:17
python
python数据挖掘
实战笔记——文本挖掘(9):相似文章推荐
概念:相似文本推荐:在用户阅读某篇文章的时候,为用户推荐更多与在读文章内容类似的文章。**推荐:**指介绍好的人或事物,希望被任用或接受。数据挖掘领域,推荐包括相似推荐及协同过滤推荐。**相似推荐:**指当用户表现出对某人或某物的兴趣时,为他推荐与之类似的人,或者物。核心定理:物以类聚,人以群分。**协同过滤推荐:**是指利用已有用户群过去的行为或意见,预测当前用户最有可能喜欢哪些东西或对哪些东西
小柴~
·
2020-07-08 20:47
python
python数据挖掘
笔记——相关分析
相关性分析:对两个或多个具备相关性的元素变量进行分析,从而衡量两个变量之间的密切相关程度,相关性的元素之间要存在一定的联系或概率才可以进行相关性分析。相关性分析的几个方法:图示初判(散点图,基本呈一条直线分布)Pearson相关系数(皮尔逊相关系数)Sperman秩相关系数(斯皮尔曼相关系数)相关系数:相关系数是变量间关联程度的最基本的测度之一。基本特征:方向:正相关,两个变量变化方向相同。负相关
小柴~
·
2020-07-08 20:47
python
python数据挖掘
-文本挖掘(词频统计)
一,使用pycharm创建项目 我创建的项目下只有两个文件,一个停分词文件,一个脚本代码文件 停分词文件(stopwords.txt):作用:在用jieba分词库对文件进行分词处理时,有些无用却频繁出现的分词,像“的”、“得”、“地”、“是”等,我们并不希望这些分词也被进行词频统计,因为统计这些分词没有什么意义,所以事先建立一个停分词文件,等会代码中利用这些停分词进行数据清洗 注意
augus_q
·
2020-07-08 19:32
python
11.用深度学习方法为图像中的物体进行分类
CreatedonSunOct1409:09:582018@author:asus"""#11用深度学习方法为图像中的物体进行分类importosbatch1_filename=os.path.join("E:\\books\
Python
北有鸣鹿
·
2020-07-08 00:08
python数据挖掘入门与实践
python数据挖掘
商品推荐算法
利用亲和性分析进行商品推荐importnumpyasnpdataset_filename=("affinity_dataset.txt")X=np.loadtxt(dataset_filename)print(X[:5])#面包、牛奶、奶酪、苹果和香蕉#计算数据集中有多少个人买了苹果num_apple_purchases=0forsampleinX:ifsample[3]==1:num_apple
fnc1012382501
·
2020-07-07 12:29
python数据挖掘
Python数据挖掘
学习笔记(6)频繁模式挖掘算法----Apriori
一、相关原理Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。该算法的基本思想是:首先找出所有的频集,这些项集出现的频繁性至少和预定义的最小支持度一样。然后由频集产生强关联规则,这些规则必须满足最小支持度和最小可信度。然后使用第1步找到
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
Python数据挖掘
学习笔记(7)频繁模式挖掘算法----FP-growth
一、相关原理FP-Growth算法是韩嘉炜等人在2000年提出的关联分析算法,它采取如下分治策略:将提供频繁项集的数据库压缩到一棵频繁模式树(FP-tree),但仍保留项集关联信息。在算法中使用了一种称为频繁模式树(FrequentPatternTree)的数据结构。FP-tree是一种特殊的前缀树,由频繁项头表和项前缀树构成。FP-Growth算法基于以上的结构加快整个挖掘过程。FP-growt
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
Python数据挖掘
学习笔记(5)决策树分类算法----以ID3为例
一、相关原理决策树(DecisionTree)是在已知各种情况发生概率的基础上,通过构成决策树来求取净现值的期望值大于等于零的概率,评价项目风险,判断其可行性的决策分析方法,是直观运用概率分析的一种图解法。由于这种决策分支画成图形很像一棵树的枝干,故称决策树。在机器学习中,决策树是一个预测模型,他代表的是对象属性与对象值之间的一种映射关系。Entropy=系统的凌乱程度,使用算法ID3、C4.5和
Zhengyh@Smart3S
·
2020-07-07 00:34
Python
python数据挖掘
实战笔记——文本挖掘(8):用sklearn包进行关键字提取
概念:sklearn:全名Scikit-Learn,是基于python的机器学习模块,网址:http://scikit-learn.org/stable/index.html,里面对一些常用的机器学习方法进行了封装,在进行机器学习任务时,并不需要每个人都实现所有的算法,只需要简单的调用sklearn里的模块就可以实现大多数机器学习任务。机器学习任务通常包括分类(Classification)和回归
小柴~
·
2020-07-06 19:22
python
python数据挖掘
数据分析pandas的介绍及简单例子
pandas是python下最有力的数据挖掘和数据分析的工具之一,支持类似于SQL的数据库的增、删、查、改,并且带有丰富的数据处理函数,支持时间序列的分析功能,支持灵活处理缺失数据。pandas基本的数据结构是Series和DataFrame,series就是序列,类似于一维数组,dataframe相当于一张二维的表格,类似于二维数组,它的每一列都相当于一个series,为了定位series中的元
妙手书生2016
·
2020-07-06 19:46
python
上一页
2
3
4
5
6
7
8
9
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他