机器学习中评估分类器性能

混淆矩阵(Confusion Matrix)

在机器学习领域和统计分类问题中,混淆矩阵confusion matrix)是可视化工具,特别用于监督学习,在无监督学习一般叫做匹配矩阵。矩阵的每一列代表一个类的实例预测,而每一行表示一个实际的类的实例。之所以如此命名,是因为通过这个矩阵可以方便地看出机器是否将两个不同的类混淆了(比如说把一个类错当成了另一个)。1

阅读剩余部分

使用virtualenv创建隔离环境

如果你希望在一个隔离的环境里工作(强烈推荐,这样你可以在库版本不冲突的情况下处理不同的项目),可以通过运行以下 pip 命令来安装 virtualenv

1
2
3
4
$ pip3 install --user --upgrade virtualenv
Collecting virtualenv
[...]
Successfully installed virtualenv

阅读剩余部分

HTTPS协议 & TLS协议

1. HTTPS协议

1.1 HTTP 和 HTTPS 协议的区别

HTTP 协议存在一定的缺点:

阅读剩余部分

吴恩达《机器学习》笔记(九)——支持向量机SVM

Support Vector Machines

12.1. Optimization Objective

支持向量机(Support Vector Machines,SVM)在学习复杂的非线性方程时提供了一种更为清晰更为强大的方式,属于监督学习算法。

阅读剩余部分

吴恩达《机器学习》笔记(七)——神经网络的学习

Neural Networks: Learning

9.1. Cost Function

首先引入一些标记:

阅读剩余部分

吴恩达《机器学习》笔记(六)——神经网络的表述

本节表述了神经网络在机器学习中的应用及表达形式,并做了简单的举例说明。

阅读剩余部分

吴恩达《机器学习》笔记(五)——正则化

评价一个模型拟合度是否优良的参考之一是它与实际数据集的偏差程度,我们用代价函数来定量,一般代价函数越小越好,但是当将它们应用在某些特定的机器学习应用时,会遇到过拟合(over-fitting)的问题。这时就需要采取一些措施,正则化就是其中一种方式。

阅读剩余部分

吴恩达《机器学习》笔记(四)——Logistic回归

本文内容介绍「logistic 回归」解决分类问题。

阅读剩余部分

吴恩达《机器学习》笔记(三)——多变量线性回归

本文内容介绍「多变量线性回归」问题。首先引入一个多维特征模型,利用「多变量梯度下降」来迭代求出代价函数最小值。之后介绍了「多项式回归」问题,以及「正规方程」,并把正规方程和梯度下降问题做了比较。

阅读剩余部分

吴恩达《机器学习》笔记(二)——单变量线性回归

本文内容主要介绍「单变量线性回归」的问题。借助一个单变量线性回归模型,求得它的「代价函数」,并利用「梯度下降」的方法来最小化代价函数。

阅读剩余部分