正则表达式
正则表达式 (Regular Expression) 在代码中常简写为regex、regexp 或 RE,计算机科学的一个概念。正则表达式通常被用来检索、替换那些符合某个模式(规则)的文本。
列目录 ...
GitHub Flavored Markdown 规范
Markdown是一种轻量级标记语言,它以纯文本形式编写文档,易读(看起来舒服)、易写(语法简单)、易更改,并最终以HTML格式发布。由于markdown没有明确指定语法,随着编译器不一样,实现方式有 ...
Git 快速参考指南
Git 起步
版本控制系统
Git 是一个开源的分布式版本控制系统(Distributed Version Control System)。Git 和其它版本控制系统(包括 Subversion ...
KaTeX 基本数学符号
KaTeX 是一个快速,易于使用的JavaScript库,用于在Web上进行TeX数学渲染。
KaTeX兼容所有主流浏览器,包括Chrome,Safari,Firefox,Opera,Edge和IE ...
特征工程(I)--探索性数据分析
特征工程
有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。由此可见,特征工程在机器学习中占有相当重要的地位。在实际应用当中,可以说特征工程是机器学习成功的 ...
特征工程(V)--时序特征工程
时序特征工程
本案例并不涉及时序特征(time series),但在其他许多场景,时序特征处理可能会非常复杂。时序特征的处理方法有很多,这里参考sklearn中关于时间特征的案例简单介绍几种有代表性 ...
特征工程(II)--数据预处理
数据预处理
数据预处理是特征工程的最重要的起始步骤,需要把特征预处理成机器学习模型所能接受的形式,我们可以使用sklearn.preproccessing模块来解决大部分数据预处理问题。
本章使用两 ...
特征工程(IV)--特征选择
特征选择
摘要
我们现在已经有大量的特征可使用,有的特征携带的信息丰富,有的特征携带的信息有重叠,有的特征则属于无关特征,尽管在拟合一个模型之前很难说哪些特征是重要的,但如果所有特征不经筛选地全部 ...
特征工程(III)--特征构造
特征构造
特征构造是从现有数据创建新特征的过程。目标是构建有用的功能,帮助我们的模型了解数据集中的信息与给定目标之间的关系。
简单数学变换
我们可以根据业务含义,创建具有一些明显实际含义的补充特征 ...
Machine Learning Tutorial
Step 1: Imports and Configuration
import pandas as pdimport numpy as npimport copyimport jsonimport ...