scikit-Learn是基于python的机器学习模块,基于BSD开源许可证。这个项目最早由DavidCournapeau 在2007 年发起的,目前也是由社区自愿者进行维护。 scikit-learn的基本功能主要被分为六个部分,分类,回归,聚类,数据降维,模型选择,数据预处理,具体可以参考官方网站上的文档。 对于具体的机器学习问题,通常可以分为三个步骤,数据准备与预处理,模型选择与训练,模型验证与参数调优。 scikit-learn支持多种格式的数据,包括经典的iris数据,LibSVM格式数据等。
目录
- untroduction
- 安装scikit-Learn
- 用户指南
- 监督学习
- 无监督学习
- 模型选择和评估
- 检验
- 数据集转换
- 数据集加载工具
- 使用scikit-Learn计算
- 教程
- 使用scikit-Learn介绍机器学习
- 关于科学数据处理的统计学习教程
- 处理文本数据
- 选择正确的评估器
- 外部资源,视频和谈话
- API参考
- 常见问题
- 时光轴