python中Fearturetools三个基本概念

  • 更新时间:2021-07-06 09:36:40
  • 编辑:郏元忠
本站精选了一篇相关的编程文章,网友苍北嘉根据主题投稿了本篇教程内容,涉及到Python相关内容,已被393网友关注,涉猎到的知识点内容可以在下方电子书获得。

参考资料

正文内容

这是一篇很好的python技术文章,觉得应该跟大家分享,把网友测试过的内容发布到这里,希望大家能有所收获。

python中Fearturetools三个基本概念

常规特征工程学方法通过人工构造特征,是一个繁琐、费时且易出错的过程。自动化特征工程是一个通过诸如Fearturetools之类的工具,从一组相关数据表中自动产生有用特征的过程。与手工生成的特征相比,该方法效率更高,重复性更高,并能更快的建立模型。

一、Featuretools是什么?

Featuretools是一个用于执行自动化特征工程的开源库。

二、Featuretools基本的三个概念

1、Feature Primitives(特征基元):

生成特征的常用方法,分为聚合、转换的方式。

特征加工方法

import featuretools as ft

ft.list_primitives()

2、Entity(实体)  

可以被看作类似Pandas DataFrame, 多个实体的集合称为Entityset。

实体间可以根据关联键添加关联关系Relationship。

3、dfs(深度特征合成) 

是从多个数据集创建新特征的过程,可以通过设置搜索的最大深度(max_depth)来控制所特征生成的复杂性。

相关教程

用户留言