Python数据分析NumPy和pandas(四十、Python 中的建模库statsmodels 和 scikit-learn)
主要学习两个流行的建模工具包,statsmodels和scikit-learn。一、pandas与模型代码之间的接口模型开发的常见工作流程是使用pandas进行数据加载和清理,然后再切换到建模库来构建模型本身。模型开发过程的一个重要部分在机器学习中称为特征工程,这可以描述从原始数据集中提取可能在建模上下文中有用信息的任何数据转换或分析。之前学习的数据聚合和GroupBy工具经常用于特征工程上下文中