E-COM-NET
首页
在线工具
Layui镜像站
SUI文档
联系我们
推荐频道
Java
PHP
C++
C
C#
Python
Ruby
go语言
Scala
Servlet
Vue
MySQL
NoSQL
Redis
CSS
Oracle
SQL Server
DB2
HBase
Http
HTML5
Spring
Ajax
Jquery
JavaScript
Json
XML
NodeJs
mybatis
Hibernate
算法
设计模式
shell
数据结构
大数据
JS
消息中间件
正则表达式
Tomcat
SQL
Nginx
Shiro
Maven
Linux
python数据挖掘
Python数据挖掘
与Stata应用实证寒假工作坊
课程概览·授课内容:邓旭东:python语法入门、网络爬虫(数据采集)、文本数据清洗与分析、机器学习等江艇:因果推断导论、截面数据的参数与非参数方法、面板数据、双重差分及其与匹配的结合王非:文献阅读及理论建构;数据清洗与数据描述;工具变量法;断点回归、合成控制及方法进展司继春:线性回归基础;线性面板数据模型;面板数据与因果推断:双重差分模型及其扩展;面板二元选择模型·时间:2021年1月25-26
唧唧堂
·
2021-01-01 00:00
python数据挖掘
项目实战 预测_《Python数据分析与挖掘实战》PDF+完整源码
该楼层疑似违规已被系统折叠隐藏此楼查看此楼本书共15章,分两个部分:基础篇、实战篇。基础篇介绍了数据挖掘的基本原理,实战篇介绍了一个个真实案例,通过对案例深入浅出的剖析,使读者在不知不觉中通过案例实践获得数据挖掘项目经验,同时快速领悟看似难懂的数据挖掘理论。读者在阅读过程中,应充分利用随书配套的案例建模数据,借助相关的数据挖掘建模工具,通过上机实验,以快速理解相关知识与理论。基础篇(第1~5章),
孙雪芸
·
2020-12-30 13:00
python数据挖掘项目实战
预测
python数据挖掘
与机器学习实战_
Python数据挖掘
| 实战案例之预测糖尿病
今天给大家讲解一个实战案例:如何根据现有数据预测糖尿病。在这个案例开始之前,希望大家回忆一下大学里讲过的线性回归的知识,这是数据挖掘里非常重要的一部分知识。当然,鉴于大家都学过,本篇就不再赘述。一.数据集介绍diabetesdataset数据集这是一个糖尿病的数据集,主要包括442行数据,10个属性值,分别是:Age(年龄)、性别(Sex)、Bodymassindex(体质指数)、AverageB
weixin_39814925
·
2020-12-07 12:07
python数据挖掘分析案例
python数据挖掘
是什么_
python数据挖掘
是什么
python数据挖掘
常用模块numpy模块:用于矩阵运算、随机数的生成等pandas模块:用于数据的读取、清洗、整理、运算、可视化等matplotlib模块:专用于数据可视化,当然含有统计类的seaborn
weixin_39602569
·
2020-11-29 02:55
python数据挖掘是什么
nlp 命名实体识别 算法_【Python实战项目】针对医疗数据进行命名实体识别
【实战案例】医学糖尿病数据命名实体识别,【
Python数据挖掘
解决方案】医学糖尿病数据命名实体识别wx7dcc75bb5e655e9b.h5.xiaoe-tech.com一、什么是命名实体识别?
weixin_39932344
·
2020-11-11 20:59
nlp
命名实体识别
算法
python医学应用
基于python的数据挖掘网课-利用 Python 练习数据挖掘
本文介绍那些使用
Python数据挖掘
实践用于发现和描述结构模式数据的工具。近些年来,Python在开发以数据为中心的应用中被用的越来越多。感谢大型科学计算社区的支持以及大大丰富的数据分析函数库。
weixin_37988176
·
2020-11-01 13:55
机器学习:SVM(支持向量机)原理推导
本篇将详细介绍SVM的原理推导过程,包括线性、近线性、非线性、优化方法等,大量思想都源自于《统计学习方法》和刘顺祥《零基础入门
python数据挖掘
与分析》。
尹某某
·
2020-10-09 13:19
机器学习
预备通知 |
Python数据挖掘
与Stata应用能力提升与实证前沿国庆工作坊
培训大纲开班时间10月1-2日(模块Ⅰ:
Python数据挖掘
)10月3-8日(模块Ⅱ:Stata应用能力提升与实证前沿)地点:小鹅通app(线上直播)费用:模块Ⅰ(Python)2000元/人模块Ⅱ(Stata
唧唧堂
·
2020-09-23 00:00
python常用模块(三) —— pandas高级处理(2)
视频见:Python教程4天快速入手
Python数据挖掘
1缺失值处理两种思路:1.删除含有缺失值的样本2.替换/插补importpandasaspd#读取数据movie=pd.read_csv(".
Leben&流觞
·
2020-09-15 06:07
python
数据挖掘
python
数据分析
python常用模块(二) —— numpy
参考视频视频:黑马Python教程4天快速入手
Python数据挖掘
切片图片出自:https://www.jianshu.com/p/a380222a32921Numpy优势1.1Numpy介绍Numpy
Leben&流觞
·
2020-09-15 06:34
python
python
数据分析
numpy
Python数据挖掘
建模 chapter_5 神经网络算法
1.人工神经网络:BP神经网络误差逆传播算法训练的多层前馈网络LM神经网络基于梯度下降和牛顿法结合点多层前馈网络,迭代少,精度高RBF径向积神经网络可以任意精度逼近连续函数,适合解决分类问题FNN模糊神经网络具有模糊系数或输入信号是模糊量的神经网络GMDH神经网络多项式神经网络,前馈神经网络中用于预测的不稳定结构网络ANFIS自适应神经网络全模糊结构,可自动产生、修正并高度概括规则(训练数据需要T
LegendGrass
·
2020-09-14 18:23
数据挖掘
python机器学习库sklearn——特征选择
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程移除低方差特征VarianceThreshold是特征选择的一个简单基本方法,它会移除所有那些方差不满足一些阈值的特征。
数据架构师
·
2020-09-14 17:51
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
为什么他也是做爬虫的,公众号 3 年就做到了 48W 粉?
今天给大家推荐一位自学转行
Python数据挖掘
算法的朋友:王大伟。他是公众号“Python爱好者社区”公众号的唯一小编,目前他的公众号有48W+粉丝。你与这些干货只差长按下图扫码关注!
VIP_CQCRE
·
2020-09-12 23:08
《
Python数据挖掘
:概念、方法与实践》关联规则挖掘
本节书摘来自华章出版社《SAFe4.0参考指南:精益软件与系统工程的规模化敏捷框架》一书中的第1章,第节,作者[美]梅甘·斯夸尔(MeganSquire)更多章节内容可以访问云栖社区“华章计算机”公众号查看。关联规则挖掘在数据挖掘工具箱中,计量某个模式的频率是一项关键任务。在某些情况下,较频繁出现的模式可能最终成为更加重要的模式。如果我们可以发现经常同时出现的两个或者三个项目,就更为有趣了。在本章
weixin_33889245
·
2020-09-12 14:43
视频教程-Python开发零基础入门-Django和前后端项目-Python
Python开发零基础入门-Django和前后端项目马哥教育Python金牌讲师,国内知名Python技术专家,在Python全栈、Python运维开发、
Python数据挖掘
、爬虫、人工智能等领域有深入研究
weixin_33681894
·
2020-09-12 11:35
Python数据挖掘
----Apriori算法
Apriori算法Apriori算法定义文字定义:Apriori算法是第一个关联规则挖掘算法,也是最经典的算法。它利用逐层搜索的迭代方法找出数据库中项集的关系,以形成规则,其过程由连接(类矩阵运算)与剪枝(去掉那些没必要的中间结果)组成。该算法中项集的概念即为项的集合。包含K个项的集合为k项集。项集出现的频率是包含项集的事务数,称为项集的频率。如果某项集满足最小支持度,则称它为频繁项—百度文库理解
肉猫子打包
·
2020-09-11 15:49
python
数据挖掘
大数据
Python数据挖掘
——数据概述
Python数据挖掘
——数据概述数据集由数据对象组成;数据的基本统计描述中心趋势度量均值中位数众数中列数数据集的最大值和最小值的平均度量数据分布极差最大值与最小值的差四分位数方差四分位数极差数据基本统计描述的图形显示一元分布分位数图分位数
林尧彬
·
2020-09-11 10:12
Python机器学习&数据挖掘7周实训!-韦玮-专题视频课程
作为一门优秀的编程语言,用于处理数据也非常方便,并且数据的可视化处理功能也非常强大,本课程将使用Python3一步一步讲解数据分析与挖掘以及机器学习相关的知识,并且全程采用实战案例教学,让学员可以从实际场景中学习
Python
韦玮老师
·
2020-09-11 10:29
视频教程
Python数据挖掘
处理完整项目及详细解释
对通话、短信以及上网记录的数据来预测风险用户本文代码全部采用jupyter运行先导入相关的包#-*-coding:UTF-8-*-importpandasaspdimportnumpyasnpfromxgboostimportXGBClassifierfromsklearn.ensembleimportRandomForestClassifierfromsklearnimportmetrics,m
bblueone
·
2020-09-10 22:44
项目
python
深度学习
数据分析
大数据
机器学习
Python数据挖掘
—分类—随机森林
概念随机森林(RandomForest):随机森林是一个包含多个决策树的分类器,并且其输出的类别是由个别数输出的类别的众数而定优点:适合离散型和连续型的属性数据;对海量数据,尽量避免了过度拟合的问题;对高维数据,不会出现特征选择困难的问题;实现简单,训练速度快,适合进行分布式计算1importpandas;23data=pandas.read_csv(4"D:\\PDM\\5.3\\data.cs
anrao9657
·
2020-09-10 12:34
Python数据挖掘
基础
目录数据挖掘基础环境安装与使用库的安装学习目标jupyternotebook的使用介绍优势快速入手markdown演示Matplotlib介绍基础绘图matplotlib.pyplot模块中文显示问题常用语句Numpy介绍常用操作数据挖掘基础环境安装与使用库的安装学习目标搭建好数据挖掘基础阶段环境,包括Matplotlib,Numpy,Pandas,Ta-Lib(技术指标库),tables(hdf
Ivy_Zhan2018
·
2020-08-25 17:35
Python
我所经历的字节跳动面试
面谈时间2020-8-23,面试时间下午5:30~6:20,牛客网视频面谈投了
Python数据挖掘
,然后上来就让面Java后端。猎头说不用考leetcode题,但是其实是需要考的。
Applied Sciences
·
2020-08-25 14:10
人生履历
python处理时序模型之StatsModels
StatsModels支持和Pandas的交是
Python数据挖掘
中的一对利刃组合。
nudt_qxx
·
2020-08-24 12:16
python
机器学习
数据挖掘
数学
Python数据挖掘
部分相关扩展库学习
python数据挖掘
部分相关扩展库学习参考学习资料:《Python数据分析与挖掘实战》1NumPy提供数组支持以及相应的高效处理函数importnumpyasnpa=np.array([2,0,1,5]
ZFour_X
·
2020-08-22 13:39
文本挖掘学习
python
数据挖掘
python数据挖掘
与处理实战学习笔记(1)
数据结构列表列表与元组的相关函数cmp(a,b):比较两个列表/元组的元素。len(a):列表/元组元素的个数。max(a):返回列表/元组元素的最大值。min(a):返回列表/元组元组最小值。sum(a):将列表/元组中的元素求和。sorted(a):对列表中的元素进行升序排列‘列表相关的修改方法a.append(1):将1添加到列表a的末尾。a.count(1):统计列表中元素1出现的次数。a
luckyflyyy
·
2020-08-21 19:55
第5章 LinearR/PLR/SVR/KNN/DTR/RFR(测算房价)
测算房价
python数据挖掘
预测Boston房价1.读取数据集:数据集来自UCI机器学习知识库。波士顿房屋这些数据于1978年开始统计,共506个数据点,涵盖了麻省波士顿不同郊区房屋14种特征的信息。
Klay Ye
·
2020-08-20 08:50
《scikit-learn
机器学习实例》
2020年7月8日日记
2020年7月8日日记:第一件大事:需要研究
python数据挖掘
,基于研究生统计建模大赛。
optisystem15
·
2020-08-15 21:33
日记
Jupyterhub安装配置及心得
Jupyter简介Jupyter是一款基于python的webnotebook服务,目前有大多
python数据挖掘
与机器学习爱好者使用这款服务,其特性其实与IpytohnNotebook差不多,准确说IpythonNotebook
weixin_34198453
·
2020-08-15 00:04
Python数据挖掘
过程之数据探索
数据探索根据观测、调查收集到初步的样本数据集后,接下来要考虑的问题是:样本数据集的数量和质量是否满足模型构建的要求?是否出现从未设想过的数据状态?其中有没有什么明显的规律和趋势?各因素之间有什么样的关联性?通过检验数据集的数据质量、绘制图表、计算某些特征量等手段,对样本数据集的结构和规律进行分析的过程就是数据探索。数据探索有助于选择合适的数据预处理和建模方法,甚至可以完成一些通常由数据挖掘解决的问
寸草心2130
·
2020-08-15 00:15
数据挖掘
Python 数据挖掘学习 一 结巴分词
近期,想对古典小说进行索引,和知识挖掘,所以研究了下
python数据挖掘
方面的知识Python安装python学习一python语法,及变量类型python学习二爬一个图片网站上python学习二02爬一个图片网站
清水迎朝阳
·
2020-08-14 19:54
Python
pyhton机器学习与数据挖掘 -- 线性回归
参考内容:
python数据挖掘
与机器学习实战.方魏.机械工业出版社.2019.05机器学习基础:从入门到求职.胡欢武.电子工业出版社.2019.03回归分析是一种应用极为广泛的数量分析方法。
落@槿(nick)
·
2020-08-14 18:05
机器学习
数据挖掘
python
机器学习
数据分析
Machine Learning -- 揭开机器学习的面纱
4.1按照学习方式类4.1.1监督学习4.1.2无监督学习4.1.3强化学习4.2按任务类型分类4.2.1回归问题4.2.2分类问题4.2.3聚类问题4.2.4降维问题5.开发机器学习的一般步骤参考内容:
python
落@槿(nick)
·
2020-08-14 18:04
机器学习
Python数据挖掘
学习——鸢尾花分类、OneR算法
《
Python数据挖掘
入门与实践》第一章内容,实现一个简单的分类处理,实现OneR算法。OneR算法的思路很简单,它根据已有的数据中,具有相同特征值的个体最可能属于哪个类别进行分类。
Samuel_0
·
2020-08-13 19:28
Python数据挖掘
python机器学习库sklearn——逻辑回归
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程逻辑分类的相关的知识内容可以参考http://blog.csdn.net/luanpeng825485697/article/details/
数据架构师
·
2020-08-13 15:38
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
python机器学习库sklearn——降维
全栈工程师开发手册(作者:栾鹏)
python数据挖掘
系列教程PCA主成分分析准确的PCA和概率解释:PCA用于对一组连续正交分量中的多变量数据集进行方差最大方向的分解。
数据架构师
·
2020-08-13 15:38
机器学习系列课程
快速学习实战应用
python系列课程
快速学习实战应用
真香!安利 6 个 Python 数据分析神器
Python数据挖掘
与文本分析&Stata应用能力提升与实证前沿云特训Python部分明天(6月29日-7月2日)开始上课,感兴趣的童鞋抓紧哦用Python处理数据大家都不陌生了,属常规操作,但常规之下还是也有些暗藏技巧的
邓旭东HIT
·
2020-08-12 10:44
利用Python进行机器学习和数据挖掘概述
利用
Python数据挖掘
和机器学习的概述前言:本文主要描述了使用Python进行数据挖掘业务的优势并介绍了相关的数据处理工具包pandas和机器学习算法库scikit-learn。
xiaolewennofollow
·
2020-08-10 08:32
机器学习
python
Python数据挖掘
指南
DataMininginPython:AGuide转载原文:https://www.springboard.com/blog/data-mining-python-tutorial/(全英)译文:1、数据挖掘和算法数据挖掘是从大型数据库的分析中发现预测信息的过程。对于数据科学家来说,数据挖掘可能是一项模糊而艰巨的任务-它需要多种技能和许多数据挖掘技术知识来获取原始数据并成功获取数据。您需要了解统计
dmg17866
·
2020-08-10 06:10
Ubuntu系统下
Python数据挖掘
机器学习库安装
安装pythonsudoaptinstallpython2.7安装pipsudoaptinstallpython2.7-pip安装库数组支持:(已验证)pipinstallnumpy矩阵支持:(已验证)pipinstallscipy绘图工具:(已验证)pipinstallmatplotlibsudoapt-getinstallpython-tk在此地址下载tcl和tk的安装包http://www.
Lisa_LJJ
·
2020-08-10 06:39
数据挖掘分析
Python数据挖掘
与机器学习_通信信用风险评估实战(1)——读数据
案例及数据说明本案例以DataTech2017浙江大数据建模与创新应用大赛的模型挑战赛选题三:通信信用风险评估为例说明。此次比赛还在进行中,开放了浙江移动及相关企业脱敏后的数据,大家都可以拿来练练手。本选题用到的数据包括公共数据集、用户通话数据、违约行为数据。训练集数据:用户通话数据(201703-201706),违约行为数据(201707),公共数据-基本信息(201703-201706),公共
weixin_34380781
·
2020-08-10 03:50
twitter API获取和使用(python tweepy库)
看《
Python数据挖掘
与与入门》这本书的时候有几章的内容需要使用Twitter获取Twitter的数据,在书中作者使用的是Twitter官方出的那个库,但是由于国内需要科学上网,这个库好像不支持使用代理
姜红杰
·
2020-08-09 10:04
python
Python数据挖掘
学习——亲和性分析
最近了解了一些
Python数据挖掘
方面的内容,主要学习了《
Python数据挖掘
入门与实践》这本书的内容,在这里对书中的内容以及我遇到的一些问题进行整理。数据挖掘旨在让计算机根据已有的数据作出决策。
Samuel_0
·
2020-08-08 21:48
Python数据挖掘
数据挖掘
Python数据挖掘入门与实践
亲和性分析
《
Python数据挖掘
入门与实践》读后感
抽空将《
Python数据挖掘
入门与实践》通读了一遍,初步了解了下相关算法及效果。若要深入研究,那还需要大量的时间进行专题研究,比如KMeans算法、随机森林、神经网络、MapReduce等等。
luocm
·
2020-08-08 17:23
Python
《
Python数据挖掘
入门与实战》第四章电影推荐案例
importpandasaspd#1000名用户和1700部电影all_ratings=pd.read_csv('u.data',delimiter='\t',header=None,names=['UserID','MovieID','Rating','Datetime'])all_ratings['Datetime']=pd.to_datetime(all_ratings['Datetime'
每天进步一点点2017
·
2020-08-08 16:49
机器学习
机器学习
Apriori
算法
Python之DataFrame数据处理
1.说明 DataFrame是Pandas库中处理表的数据结构,可看作是python中的类似数据库的操作,是
Python数据挖掘
中最常用的工具。下面介绍DataFrame的一些常用方法。
xieyan0811
·
2020-08-07 22:38
Python
python爬虫案例——知乎数据采集
全栈工程师开发手册(作者:栾鹏)python教程全解首先你需要了解
python数据挖掘
库urllib、urllib2、cookie的知识。
数据架构师
·
2020-08-05 13:03
python系列课程
快速学习实战应用
网络爬虫
系列课程
快速学习实战应用
Python数据挖掘
基础(四):Pandas高级处理
目录1.缺失值处理2.数据离散化2.1为什么要离散化?2.2什么是数据的离散化?2.3股票涨跌幅分组数据变成one-hot编码3.合并4.交叉表与透视表5.分组与聚合1.缺失值处理本文所使用到的所有数据在此处下载:链接:https://pan.baidu.com/s/16ayvfRw95K0xma9o3YPN3Q密码:qgt3判断缺失值是否存在,示例代码如下:importnumpyasnpimpo
Amo Xiang
·
2020-08-05 04:34
Python
部署Django到云服务器(centos+nginx+mysql+uwsgi+python3)【操作篇(1)】
要逆袭还得通过自己对数据的不断领悟,数据领域的技能都很简单,这些知识就在那里,等待你的觉醒;我们学习任何技能和知识,目的都是为了实践,我们学会了手艺,最后都是要赚钱的,有些朋友跟着jacky,一起学了
Python
朱元禄
·
2020-08-04 14:48
python
Python数据挖掘
| 实战案例之预测糖尿病
今天给大家讲解一个实战案例:如何根据现有数据预测糖尿病。在这个案例开始之前,希望大家回忆一下大学里讲过的线性回归的知识,这是数据挖掘里非常重要的一部分知识。当然,鉴于大家都学过,本篇就不再赘述。一.数据集介绍diabetesdataset数据集这是一个糖尿病的数据集,主要包括442行数据,10个属性值,分别是:Age(年龄)、性别(Sex)、Bodymassindex(体质指数)、AverageB
程序员lamed
·
2020-08-04 07:37
python
python数据挖掘
--特征工程篇(附代码)
记录数据挖掘路上遇到的常用特征工程方法和技巧(附代码),方便自己,方便他人,持续更新。1.哑编码对某一列数据进行pandas自带的(定性数据哑编码,定量数据二值化),并附上名字pd.get_dummies(all['MSSubClass'],prefix='MSSubClass')2.卡方特征选择从已有的特征中选择出影响目标值最大的特征属性常用方法:{分类:F统计量、卡方系数,互信息mutual_
睡醒了的小码媛
·
2020-08-01 05:28
机器学习
python数据分析
上一页
1
2
3
4
5
6
7
8
下一页
按字母分类:
A
B
C
D
E
F
G
H
I
J
K
L
M
N
O
P
Q
R
S
T
U
V
W
X
Y
Z
其他