特征分析工程化

scikit 功能

Python 中的特征选择存储库 scikit-feature。

scikit-feature 是一个开源的 Python 特征选择库,由亚利桑那州立大学数据挖掘与机器学习实验室开发。它基于一个广泛使用的机器学习包 scikit-learn 以及两个科学计算包 Numpy 和 Scipy 构建。scikit-feature 包含大约 40 种流行的特征选择算法,包括传统的特征选择算法以及一些结构化和流式特征选择算法。

它旨在为特征选择的应用、研究和比较研究提供一个平台,分享特征选择研究中广泛使用的特征选择算法,并为研究人员和实践者在开发新的特征选择算法时进行实证评估提供便利。

https://github.com/jundongl/scikit-featurehttps://github.com/jundongl/scikit-feature

机器学习的特征选择

此存储库包含机器学习中用于特征选择的三种主要方法的代码,即过滤方法、包装方法和嵌入方法。所有代码均用 Python 3 编写。

状态:正在进行

https://github.com/anujdutt9/Feature-Selection-for-Machine-Learninghttps://github.com/anujdutt9/Feature-Selection-for-Machine-Learning

特征选择器:Python 中的简单特征选择

特征选择器是机器学习数据集降维的工具。

方法

有五种方法可用于识别要删除的特征:

  1. 缺失值
  2. 单一唯一值
  3. 共线特征
  4. 零重要性特征
  5. 低重要性特征

可视化

FeatureSelector包括许多可视化方法来检查数据集的特征。

关联热图,特征重要性柱状图

https://github.com/WillKoehrsen/feature-selectorhttps://github.com/WillKoehrsen/feature-selector

你可能感兴趣的:(文献,深度学习,人工智能,神经网络,笔记)