Python实战笔记-常用知识点

一、自学Python的最终的目标是
a,实现自动化办公
b,实现数据的爬取
c,实现基本的数据分析(SEMMA)
S:Sample(收集数据)
常用手段:问卷调查,数据库查询,实验室实验,仪器设备的记录
E:Explore(数据探索)
探索方向:离散变量的分布比例,连续变量的分布形态,数据的异常和缺失,特征选择
M:Modify(数据修正)
常用修正方法:数据类型的转换,数据的一致性处理,异常值和缺失值的处理,数据形态的转换
M:Model(数据建模)
常用的模型:有监督的预测性模型(如回归、决策树、KNN等),有监督的判别模型(如logistics、贝叶斯、集成算法等),无监督模型(如Kmeans聚类、层次聚类、密度聚类等),半监督模型(如关联规则等)
A:Assess(模型评估)
常用十种检验方法:RMSE,混淆矩阵,ROC曲线,KS曲线
确保准确性:增加样本量,扩展维度ÿ

你可能感兴趣的:(K总编程笔记)