Search CTRL + K

监督学习

Subsymbolic AI 没有任何对其需要执行的任务进行描述的明确规则,所有知识都被编码在由数字组成的权重和阈值中,因为它的本质就是一个做大小比较然后输出是否的决策机器。那么我们如何给一个特定任务准确地设定正确的权重和阈值呢?Rosenblatt 答案是感知机通过自己的学习来获得这些数值。那感知机该如何学习以获得正确的数值呢?Rosenblatt 认为感知机应该通过条件计算(conditioning)来学习,即在样本上进行训练:触发正确行为时奖励,犯错时惩罚。这种形式的条件计算被称之为监督学习。在训练时,给系统一个样本,它就产生一个输出,然后在这时给它一个“监督信号”,提示它此输出与正确的输出有多大偏离,然后,系统会根据这个信号来调整它的权重和阈值。监督学习需要大量的正样本(positive),其中包括目标或者说是正确答案,比如不同人写的 8 的集合;还需要负样本,即不是 8 的集合。每个样本都是需要由人来标记其类别,用作监督信号。这一部分用于训练系统的正负样本被称为训练集(training set),其它的样本集合也就是测试集,这将用于评估系统在接受训练之后的表现和正确率。Rosenblatt 对人工智能的首要贡献是他对一个特定算法的设计,即感知机学习算法(perceptron-learning algorithm),感知机可以通过这一算法从样本中得到训练,来确定能够产生正确答案的权重和阈值。

Raymond 实习生为例,老板提供了很多已知结果的简历样本给 Raymond,这些样本可以分为两类:正样本,适合公司的简历;负样本,不适合公司的简历。在 Raymond 对简历作出自己的判断时,老板会告诉他判断是否正确,如果错误的话就需要重新调整权重。简单来说,通过一个监督者提供大量带标记的正负样本训练,以逐步靠近正确权重和阈值。