E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python数据挖掘
读《
python数据挖掘
与分析实战》之五
接上一篇异常值处理在数据预处理,异常值是否剔除,需视具体情况而定,因为异常值可能蕴含着有用的信息将含有异常值的记录直接删除的方法简单易行,但缺点也很明显,在观测值很少的情况下,这种删除会造成样本量不足,可能会改变变量的原有分布从而造成分析结果的不确定,视为缺失值处理的好处是可以利用现有变量的信息,对异常值进行填补数据集成数据挖掘需要的数据往往分布在不同的数据源中,数据集成就是将多个数据源合并存在一
行路者-慢慢来
·
2020-06-25 03:46
大数据
数据分析
Python数据挖掘
与机器学习实战读书笔记—机器学习基础
几个概念:人工智能:智能机器,如计算机做识别、判断、证明、学习和问题求解等思维活动。机器学习:人工智能的分支、核心。科学成分重。数据挖掘:从海量数据中获取有用数据。技术成分重。-机器学习概述什么是机器学习?通过历史数据的训练产生模型,输入新的数据到模型中,模型可以预测出未知的属性。-机器学习发展历程第一阶段:通过软件编程操控计算机完成逻辑推理功能,机器未能智能。缺乏大量先验知识。第二阶段:利用自身
我是一个脸
·
2020-06-25 00:29
机器学习与数据挖掘
2018-09-16
Python数据挖掘
学习笔记第一天----->分享
亲和性分析示例:根据购买商品习惯推荐商品本片文章主要是学习笔记分享先做一个自我的简单介绍,本人在IT这个行业的底子非常薄,之前学习过java但是因为学历的问题找了很久没有找到java开发的工作,面对当时的现实问题放弃了继续找java开发工作,这件事情对于我个人还是有影响和压力的,但是内心中并没有放弃写代码,当一个正规程序员的理想,正好我现在工作是数据分析师,但我想说没有灵魂的数据分析师不是一个好厨
最远的地方是哪里
·
2020-06-24 21:02
2019年
Python数据挖掘
就业前景怎么样?
Python语言的崛起让大家对web、爬虫、数据分析、数据挖掘等十分感兴趣。数据挖掘就业前景怎么样?关于这个问题的回答,大家首先要知道什么是数据挖掘。所谓数据挖掘就是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,做出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市
programmer_feng
·
2020-06-24 20:12
Python
Python数据挖掘
基础----numpy基本用法
本篇文章将详细介绍numpy的寄出使用方法:ndarray数据类型,numpy算数运算,numpy的索引与切片,numpy的统计计算函数,以及numpy的文件操作和矩阵的基础运算背景介绍Numpy最重要的一个特点就是其N维数组对象(即ndarray),该对象是一个快速而灵活的大数据集容器。你可以利用这种数组对整块的数据执行一些数学运算。ndarray是一个通用的同构数据多维容器,其中的所有元素必须
一只谦逊的猿
·
2020-06-24 17:37
数据挖掘
【挖掘模型】:Python-决策树-对销售高低的影响因素
代码结果:决策树模型源代码#比较简陋,没有决策树剪枝importosos.getcwd()os.chdir('D:\\完成的任务')importpandasaspd#参数初始化inputfile='F:/
python
dataheart
·
2020-06-24 15:15
Python数据挖掘
学习笔记-决策树分类
1、决策树算法原理&主要流程框架决策树方法在分类、决策、规则提取等领域有着广泛的应用。决策树是一种树状结构,其中包含三种节点:根节点:没有入边,但有零条或多条出边。内部节点:恰有一条入边和两条或多条出边。叶节点:恰有一条入边,但没有出边。也就是说每一个叶节点对应着一个分类,非叶节点对应着某个属性上的划分。构造决策树的核心问题是在每一步如何选择适当的属性对样本做拆分。常用的决策树算法有ID3算法、C
lilu916
·
2020-06-24 05:06
python数据分析
python dataframe 写入到txt文档中,及写入中文乱码问题
DataFrameDataFrame是Pandas库中处理表的数据结构,可看作是python中的类似数据库的操作,是
Python数据挖掘
中最常用的工具写入到txt中
大鱼七号船船长
·
2020-06-24 03:11
python
Python数据挖掘
-回归分析
本文用Python实现数据回归,包括线性回归(一元线性+多元线性回归)、Logistics回归。主要通过实验验证,部分例题来自网络。注:更多资源及软件请W信关注“学娱汇聚门”一、一元线性回归举例及代码实现:汽车卖家做电视广告数量与卖出的汽车数量:代码:1.3Python代码实现:importnumpyasnpdeffitSLR(x,y):n=len(x)dinominator=0numerator
Bentley-2012
·
2020-06-23 23:24
算法设计
数据挖掘
数据挖掘
python
Python数据挖掘
-Python with hadoop
一、SnakeBite1.1Snakebite介绍介绍:Snakebite由Spotify创建,需要python2(python3版本目前并不支持)andpython-protobuf2.4.1或更高版本。Snakebite提供了一个Python客户端库,允许客户从Python应用程序中以编程方式访问HDFS。客户端库使用protobuf与NameNode直接通信的消息。snakebite还包括一
Bentley-2012
·
2020-06-23 23:24
算法设计
数据挖掘
Hadoop
数据挖掘
python
数据建模&数据挖掘
Python数据挖掘
Python数据挖掘
-NLTK文本分析+jieba中文文本挖掘
一、NLTK介绍及安装(注:更多资源及软件请W信关注“学娱汇聚门”)1.1NLTK安装NLTK的全称是naturallanguagetoolkit,是一套基于python的自然语言处理工具集。nltk的安装十分便捷,只需要pip就可以。相对Python2版本来说,NLTK更支持Python3版本。pipinstallnltk在nltk中集成了语料与模型等的包管理器,通过在python解释器中执行>
Bentley-2012
·
2020-06-23 23:24
数据建模&数据挖掘
数据挖掘
python
Python数据挖掘
分布式单点登录系统的实现系列分享之:底层逻辑篇
数据分析部落分为了若干个交流小组:有
Python数据挖掘
小组、R语言小组、数据科技竞赛小组等等。所以,关于数据挖掘、机器学习、Python、R、数据平台等等专题的分享,我还会放到
朱元禄
·
2020-06-23 20:06
单点登录系统的实现(分布式)
Python数据分析、挖掘常用工具
可以被修改),元组(不可以被修改)2、字典(结构)3、集合(同数学概念上的集合)4、函数式编程(主要由lambda()、map()、reduce()、filter()构成)Python数据分析常用库:
Python
嗨学编程
·
2020-06-23 07:25
数据分析
Python数据挖掘
与机器学习实战——3.5 基于线性回归的股票预测
3.5基于线性回归的股票预测1.数据获取我们需要的数据集要通过quandl包获取,Anaconda3并未默认安装quandl,需要我们打开Anacondaprompt输入“pipinstallquandl”进行安装。通过quandl包可以获取到股票数据股票特征数据包括:Open(开盘价)、High(最高价)、Low(最低价)、Close(收盘价)、Volume(交易额)Adj.Open(调整后开盘
pillow_L
·
2020-06-22 16:28
线性回归的股票预测
Python数据挖掘
与机器学习实战——回归分析——线性回归及实例
回归分析回归分析(RegressionAnalysis)是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,是一种预测性的建模技术。线性回归:简单而言,就是将输入项分别乘以一些常量,再将结果加起来得到输出。线性回归包括一元线性回归和多元线性回归。一元线性回归线型回归分析中,如果仅有一个自变量与一个因变量,且其关系大致上可用一条直线表示,则称之为简单回归分析(一元线性回归)。如果发现因变
pillow_L
·
2020-06-22 16:28
Python数据挖掘
-时间序列-非季节性时间学分解
概念时间序列(TimeSeries)时间序列是均匀时间间隔上的观测值序列时间序列分析(TimeSeriesAnalysis)趋势分析序列分解序列预测时间序列分解(Time-SeriesDecomposition)时间写按照季节性来分类,分为季节性时间序列和非季节性时间序列非季节性时间序列:趋势部分、不规则部分;季节性时间序列:趋势部分、不规则部分、季节性部分非季节性时间序列分解MA(MovingA
anrao9657
·
2020-06-22 14:38
Python数据挖掘
学习02--numpy和pandas模块基本使用
一、numpy模块导入numpy模块并命名为npy>>>importnumpyasnpy1、创建数组(1)一维数组>>>x=npy.array(['22','18','15','4'])>>>xarray(['22','18','15','4'],dtype='>>(2)二维数组>>>y=npy.array([['aa','bb','cc'],['12','14'],['adasd']])>>>y
冰彡棒
·
2020-06-22 11:53
Python
Python数据挖掘
Python数据挖掘
与机器学习技术入门实战!
本文包含了五个知识点:数据挖掘与机器学习技术简介Python数据预处理实战常见分类算法介绍对鸢尾花进行分类案例实战类算法的选择思路与技巧一、数据挖掘与机器学习技术简介什么是数据挖掘?数据挖掘指的是对现有的一些数据进行相应的处理和分析,最终得到数据与数据之间深层次关系的一种技术。例如在对超市货品进行摆放时,牛奶到底是和面包摆放在一起销量更高,还是和其他商品摆在一起销量更高。数据挖掘技术就可以用于解决
pythonjavaphp
·
2020-06-22 03:30
Python
Python数据挖掘
1、特征工程有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。一个非常简单的例子,现在出一非常简答的二分类问题题,请你使用逻辑回归,设计一个身材分类器。输入数据X:身高和体重,标签为Y:身材等级(胖,不胖)。显然,不能单纯的根据体重来判断一个人
Metal1
·
2020-06-22 01:06
机器学习
[关系图谱] 二.Gephi导入共线矩阵构建作者关系图谱
推荐前文:[
python数据挖掘
课程]十七.社交网络Networkx库分析人物关系(初识篇)[关系图谱]一.Gephi通过共线矩阵构建知网作者关系图谱PS:2019年1~2月作者参加了CSDN2018年博客评选
Eastmount
·
2020-06-21 19:18
关系图谱
Python可视化
知识图谱
web数据挖掘及NLP
【
Python数据挖掘
课程】四.决策树DTC数据分析及鸢尾数据集分析
今天主要讲述的内容是关于决策树的知识,主要包括以下内容:1.分类及决策树算法介绍2.鸢尾花卉数据集介绍3.决策树实现鸢尾数据集分析前文推荐:【
Python数据挖掘
课程】一.安装Python及爬虫入门介绍
Eastmount
·
2020-06-21 19:46
Python数据挖掘课程
机器学习
数据挖掘
知识图谱
web数据挖掘及NLP
Python数据挖掘
教程-第7天(1):Python常用内置函数
到目前为止(3.8.2),Python解释器共计提供了69个内置函数和类型,这些函数可以在任意条件下被调用。例如我们之前用来查询变量类型的type()就是一个内置函数。type()实际上是类的构造方法,其返回值是一个type对象,大家在没有理解类与对象之前,也可以先简单地将其理解为一个函数。下面我们来详细介绍一下在初学阶段比较常用的内置函数,在描述函数的功能时也主要以初学阶段可以用到的功能为主。1
长行
·
2020-06-21 18:39
Python数据挖掘教程
Python数据挖掘
教程-第3天(1):变量
使用变量此前,我们已经了解了控制台输入和输出的方法,通过以下代码,我们可以实现了读取用户想到的数字并输出。number=input("你想到了什么数字?")print("你想到的数字是:",number)在这段代码中:第一行我们使用input()函数从控制台读取了用户输入的内容,并将其存入了名为number的变量中,而在第二行中,我们使用print()函数将number变量的值输出到了控制台中。我
长行
·
2020-06-21 18:39
Python数据挖掘教程
Python数据挖掘
——文本分析
一、一、定义:文本挖掘:从大量文本数据中抽取出有价值的知识,并且利用这些知识重新组织信息的过程。二、语料库(Corpus)语料库是我们要分析的所有文档的集合。importosimportos.pathfilePaths=[]#定义一个数组变量#再用OS.walk的方法传入目录#文件所在的文件目录,命名为root#root下的所有子目录,命名为dirs#root下的所有文件,命名为filesforr
zhuoyue65
·
2020-06-21 15:04
数据挖掘
Python数据挖掘
与机器学习技术入门实战
数十款阿里云产品限时折扣中,赶紧点击这里,领劵开始云上实践吧!本次直播视频精彩回顾,戳这里!直播涉及到的PPT,戳这里!课程主讲简介:韦玮,企业家,资深IT领域专家/讲师/作家,畅销书《精通Python网络爬虫》作者,阿里云社区技术专家。以下内容根据主讲嘉宾视频分享以及PPT整理而成。本次课程包含了五个知识点:1.数据挖掘与机器学习技术简介2.Python数据预处理实战3.常见分类算法介绍4.对鸢
zzm_
·
2020-06-21 11:37
Python数据分析、挖掘常用工具
挖掘场景中常用特性:列表(可以被修改),元组(不可以被修改)字典(结构)集合(同数学概念上的集合)函数式编程(主要由lambda()、map()、reduce()、filter()构成)Python数据分析常用库:
Python
MHyourh
·
2020-06-21 07:27
Python数据挖掘
教程-第3天(3):运算符
算术运算符在以上的内容中,我们已经涉及了加、减、乘、除、取余、取模、幂运算共7种运行。这类用于运算的符号叫做“运算符”,之前我们涉及的7种运算符都属于“算术运算符”。运算符功能+数字+数字=求和;字符串+字符串=按前后顺序合并字符串-数字-数字=计算差值*数字*数字=求积;字符串*数字=重复若干次的字符串/数字/数字=求商%数字%数字=取余(除法的余数部分)//数字//数字=取模(商的整数部分)*
长行
·
2020-06-20 22:50
Python数据挖掘教程
Python数据挖掘
与文本分析
在过去的两年间,Python一路高歌猛进,成功窜上“最火编程语言”的宝座。惊奇的是使用Python最多的人群其实不是程序员,而是数据科学家,尤其是社会科学家,涵盖的学科有经济学、管理学、会计学、社会学、传播学、新闻学等等。大数据时代到来,网络数据正成为潜在宝藏,大量商业信息、社会信息以文本等非结构化、异构型数据格式存储于网页中。非计算机专业背景的人也可借助机器学习、人工智能等方法进行研究。使用网络
唧唧堂
·
2020-06-07 00:00
视频教程-
Python数据挖掘
实战-机器学习
Python数据挖掘
实战计算机博士,专注于机器学习与计算机视觉领域,深度学习领域一线实战讲师。在图像识别领域有着丰富经验,实现过包括人脸识别,物体识别,关键点检测等多种应用的新算法。
weixin_30353673
·
2020-05-28 10:00
Python数据分析、挖掘常用工具
挖掘场景中常用特性:列表(可以被修改),元组(不可以被修改)字典(结构)集合(同数学概念上的集合)函数式编程(主要由lambda()、map()、reduce()、filter()构成)Python数据分析常用库
Python
深度沉迷学习
·
2020-04-14 12:22
【分析篇】:python统计各个变量之间的相关系数
catering_sale_all.xlsPaste_Image.png代码结果:餐饮销量数据相关性分析Paste_Image.png源代码importpandasaspdcatering_sale='F:/
python
dataheart
·
2020-04-10 05:33
时间序列分析预测
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程时间序列中常用预测技术,一个时间序列是一组对于某一变量连续时间点或连续时段上的观测值。
数据架构师
·
2020-04-09 22:15
机器学习系列课程
快速学习实战应用
时间序列
分析预测
Machine Learning -- 揭开机器学习的面纱
参考内容:
python数据挖掘
与机器学习实战.方魏.机械工业出版社.2019.05机器学习基础:从入门到求职.胡欢武.电子工业出版社.2019.031.何为机器学习?
欲_槿
·
2020-04-09 11:00
Python机器学习阶段学习线路图
按照如下学习步骤学习,可以掌握
Python数据挖掘
分析相关知识,入门人工智能。知识点细化:jupyter入门:jupyter软件安装、jupyter入门、numpy学习。
千_锋小小千
·
2020-04-07 17:16
Python数据挖掘
与分析----Pandas常用知识
前言Pandas基于两种数据类型:series与dataframe。一个series是一个一维的数据类型,其中每一个元素都有一个标签。series类似于Numpy中元素带标签的数组。其中,标签可以是数字或者字符串。一个dataframe是一个二维的表结构。Pandas的dataframe可以存储许多种不同的数据类型,并且每一个坐标轴都有自己的标签。你可以把它想象成一个series的字典项。Pand
我为峰2014
·
2020-03-30 18:14
Python数据挖掘
013-时序模式
时序模式是数据挖掘中的第四种应用类别。时序模式是基于时间序列的历史数据,来预测未来短期内的可能值。image.png1.时间序列的预处理拿到一个观察值序列后,首先要对它的纯随机性和平稳性进行检验,这两个重要的检验称为序列的预处理。根据检验结果可以将序列分为不同类型,对不同类型的序列采用不同的分析方法。对于纯随机序列,又称为白噪声序列,序列的各项之间没有任何相关关系。序列在进行完全无序的随机波动,可
科技老丁哥
·
2020-03-26 18:15
Python机器学习初步——第二部分
+++++++++++++++++++++++++#machine_five_ldmwp.py#@简介:用python进行机器学习和数据挖掘#@作者:Glen#@日期:2016.8.16#@资料来源:
Python
plutoese
·
2020-03-25 21:03
Python数据挖掘
与机器学习_通信信用风险评估实战(3)——特征工程
系列目录:
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据
Python数据挖掘
与机器学习_通信信用风险评估实战(2)——数据预处理有这么一句话在业界广为流传:数据和特征决定了机器学习的上限
padluo
·
2020-03-16 11:31
Python数据挖掘
环境搭建
deepin有很多小伙伴想学习python,但windows写python基本是坑,deepin属于linux分支,界面美观,内置大量桌面软件,对新手十分友好,这里尝试在深度系统(deepin)内安装python开发工具jupyter,并完成一个绘制折线图的入门案例将默认的bash更换为zsh(个人喜好,可跳过)首先,安装zsh:sudoapt-getinstallzsh先安装gitsudoapt
zhaoolee
·
2020-03-16 09:04
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据
案例及数据说明本案例以DataTech2017浙江大数据建模与创新应用大赛的模型挑战赛选题三:通信信用风险评估为例说明。此次比赛还在进行中,开放了浙江移动及相关企业脱敏后的数据,大家都可以拿来练练手。本选题用到的数据包括公共数据集、用户通话数据、违约行为数据。训练集数据:用户通话数据(201703-201706),违约行为数据(201707),公共数据-基本信息(201703-201706),公共
padluo
·
2020-03-15 06:00
Python数据挖掘
与机器学习_通信信用风险评估实战(4)——模型训练与调优
系列目录:
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据
Python数据挖掘
与机器学习_通信信用风险评估实战(2)——数据预处理
Python数据挖掘
与机器学习_通信信用风险评估实战
padluo
·
2020-03-14 15:33
数据挖掘入门系列教程(三点五)之决策树
数据挖掘入门系列教程(三点五)之决策树本来还是想像以前一样,继续学习《
Python数据挖掘
入门与实践》的第三章“决策树”,但是这本书上来就直接给我怼了一大串代码,对于决策树基本上没有什么介绍,可直接把我给弄懵逼了
段小辉
·
2020-03-14 00:00
Python机器学习初步——第一部分
++++++++++++++++++++#machine_classfied_ldmwp.py#@简介:用scikit-learn估计器分类#@作者:Glen#@日期:2016.8.13#@资料来源:
Python
plutoese
·
2020-03-13 11:53
需要做些什么
目前就是1、疯狂的看文章了解ML和DM,然后2、疯狂的python学会接着按这个步骤:零基础学习
Python数据挖掘
(修改版)1、python学习入门->……(现在需要做的)阅读MLDM相关/学习基础python
__YukiMakino
·
2020-03-12 07:31
【分析篇】:Python 拉格朗日插值代码(缺失值)和数据规范化
(缺失值的数据处理)importpandasaspd#导入数据分析库Pandasfromscipy.interpolateimportlagrange#导入拉格朗日插值函数inputfile='F:/
python
dataheart
·
2020-03-11 01:42
我打个电话过去,你敢不敢说声yes(一)
这其实是一篇关于
python数据挖掘
/机器学习的文章,分析的是葡萄牙某银行某次电话营销的数据,数据来自这里。(更多数据请看UCIMachineLearningRepository。)
爱斯翠摩鸡
·
2020-03-10 05:06
2017技术类书籍书单
(目前看完4本)Python笨办法学PythonFlaskWeb开发:基于Python的Web应用开发实战Python网络数据采集Python项目实战2Python基础教程Python数据分析
Python
MiracleWong
·
2020-03-04 11:47
Python数据挖掘
与机器学习实战——回归分析——逻辑回归
逻辑回归:逻辑回归也被称为广义线性回归模型,它与线性回归模型的形式基本上相同,最大的区别就在于它们的因变量(y)不同,如果是连续的,就是多重线性回归;如果是二项分布(0或1、是或否等),就是逻辑回归。Logistic回归虽然名字里带“回归”,但是它实际上是一种分类方法,主要用于两分类问题(即输出只有两种,分别代表两个类别)。逻辑回归就是这样的一个过程:面对一个回归或者分类问题,建立代价函数,然后通
pillow_L
·
2020-02-25 22:47
Logistic逻辑回归
logistic回归
数据挖掘之matplotlib入门
简单介绍matplotlib库是
Python数据挖掘
中的库之一,主要用于2D绘图,简单的3D绘图,数据可视化的库。
徐代龙
·
2020-02-23 23:01
Python数据挖掘
实战1:逻辑回归预测银行贷款拖欠率
Reference《Python数据分析与挖掘实战(第2版)》页码:P107,代码略有改进bankloan.xls数据下载Logistic回归建模pythonversion3.7#数据展示importpandasaspddata=pd.read_excel('bankloan.xls')Data=pd.DataFrame(data)Data.head()image.png#模型构建和模型的准确度i
wangsb_2020
·
2020-02-05 20:23
上一页
4
5
6
7
8
9
10
11
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他