实验一:波士顿房价预测实验

基于ModelArts的波士顿房价预测实验

  • Jupyter notebook
    • 优点/作用
  • 个人体会与学习心得
  • 待解决问题

Jupyter notebook

优点/作用

Jupyter notebook可以直接在代码旁写出叙述性文档,而不是另外编写单独的文档。也就是它可以能将代码、文档等这一切集中到一处,让用户一目了然。

可以参考以下链接对Jupyter notebook进行学习了解:

jupyter notebook 可以做哪些事情?

Jupyter Notebook介绍、安装及使用教程

怎么安装Jupyter Notebook主题皮肤并设置教程

机器学习-一文理解GBDT的原理-20171001

机器学习算法(15)之Xgboost算法

个人体会与学习心得

1、终于明白Jupyter notebook为什么要用这种一个单元格一个单元格的形式,因为可以随时将输出结果显示在代码段旁边,有助于理解,代码含义和执行结果一目了然,而且一段一段的执行与报错我觉得调bug的代价更小,更便捷;而且这种形式非常有利于数据处理,能够将数据处理过程中的变化更直接的显示出来;

2、应该每一个输出使用一个单元格,否则最后一个输出结果会覆盖之前的输出结果;

3、python的语法规范全靠缩进来确定循环体范围,所以缩进一定要正确,否则代码运行会出错;

4、Jupyter notebook如果修改前面的单元格,想要把从修改处到最后的单元格全部重新运行一遍的话,可以点击工具栏的Cell–Run All Below,就可以实现;

5、我们为什么需要特征融合呢?为了将相关性强的特征进行融合,减少数据维度;

6、我们对数据进行标准化的目的是什么?加速收敛速度;提高精度。

7、由于我没有安装xgboost包,所以引用失败,快速安装一下:Windows下在Anaconda3中安装python版的XGBoost库

待解决问题

1、seaborn画图函数,sns.pairplot() 画图结果与实验指导书中不同,但是代码一致无误,可能是提前预设了坐标轴刻度值或者是作图的显示范围;但是画图结果不同会导致能否直观的看出异常值;

2、特征选取和特征融合具体细节不太懂;

3、面积特征融合部分得到的图片也不一样,但是这次是相反的,刻度比实验指导书上面要小(跟同学讨论后得出结论:这玩意我自己之后设置刻度参数调整一下就好了);

4、GBDT算法与Xgboost算法。

你可能感兴趣的:(笔记,机器学习,python,人工智能)