返回顶部

[学习经验] 机器学习算法原理、实现与实践——监督学习

[复制链接]
记哥哥Lv.7 显示全部楼层 发表于 2023-10-11 11:30:23 |阅读模式 打印 上一主题 下一主题

马上注册,享用更多功能,让你轻松玩转AIHIA梦工厂!

您需要 登录 才可以下载或查看,没有账号?立即注册

x
机器学习包括监督学习、非监督学习、半监督学习及强化学习,这里先讨论监督学习。
监督学习的任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。


1 基本概念1.1 输入空间、特征空间与输出空间
输入与输出所有可能取值的集合分别称为输入空间输出空间
每个具体的输入是一个实例(instance),通常由特征向量(feature vector)表示,这时,所有特征向量存在的空间称为特征空间。特征空间的每一维对应于一个特征。有时假设输入空间与特征空间为相同的空间。有时假设为不同的空间,这里需要将输入空间映射于特征空间,这一过程称为特征提取。模型实际上都是定义在特征空间上的。在监督学习中,往往把输入空间看为特征空间。通常用xx表示输入空间的一个实例

x=(x(1),x(2),…,x(i),x(n))Tx=(x(1),x(2),…,x(i),x(n))T

其中,x(i)x(i)表示xx的第ii个特征。注意区分x(i)x(i)与xixi,前者是一个实例中的第ii维特征的值,而后者表示一个训练集中的第ii个实例,它是一个向量。
监督学习从训练数据集合中学习模型,对测试数据进行预测。训练数据由输入(或特征向量)与输出对组成,训练集通常表示为:
T=(x1,y1),(x2,y2),…,(xN,yN)T=(x1,y1),(x2,y2),…,(xN,yN)
测试数据也是由相应的输入与输出对组成。
输入与输出变量均为连续变量的预测问题称为回归问题。输出变量为有限个离散变量的预测称为分类问题;输入变量与输出变量均为变量序列的预测问题称为标注问题

1.2 联合概率分布
监督学习假设输入与输出的随机变量XX和YY遵循联合概率分布P(X,Y)P(X,Y)。训练数据与测试数据被看作是依联合概率分布P(X,Y)P(X,Y)独立同分布产生的。
对于要统计分析的数据,存在这样的联合概率分布P(X,Y)P(X,Y),这是监督学习对数据的基本假设。

1.3 假设空间

监督学习的目的在于学习一个输入到输出的映射,这一映射由模型来表示。但这样的映射往往不止一个,学习的目标在于找到最好的这样的模型。由这样的模型构成的集合就是假设空间。
监督学习的模型可以是概率模型或非概率模型。由条件概率分布P(Y|X)P(Y|X)或决策函数Y=f(X)Y=f(X)表示。

2 监督问题的形式化表示

监督学习利用训练数据集学习一个模型,再用模型对测试样本集进行预测。由于在这个过程中需要训练数据集,而训练数据集往往是人工给出的,所以称为监督学习。
监督学习分为学习和预测两个过程,由学习系统与预测系统完成,可以描述为下图。
首先给定一个训练数据集:

T=(x1,y1),(x2,y2),…,(xN,yN)T=(x1,y1),(x2,y2),…,(xN,yN)

其中(xi,yi),i=1,2,…,N(xi,yi),i=1,2,…,N,称为样本或样本点。xixi为一个输入的观测值,yiyi为输出的观测值。
监督学习中,假设训练数据与测试数据是依联合概率分布P(X,Y)P(X,Y)独立同分布产生的。
在学习的过程中,学习系统利用给定的训练数据集,通过学习得到一个模型,表示为条件概率分布^P(Y|X)P^(Y|X)或决策函数Y=^f(X)Y=f^(X)。
在预测过程中,预测系统对给定的测试样本集中的输入xN+1xN+1,由模型YN+1=argmaxyN+1^P(yN+1|xN+1)YN+1=argmaxyN+1P^(yN+1|xN+1)或yN+1=^f(xN+1)yN+1=f^(xN+1)给出相应的输出yn+1yn+1
在学习的过程中,每一个(xi,yi)(xi,yi)都会给模型带来一些信息,具体地说就是,对于输入xixi,一个具体的模型y=f(x)y=f(x)会产生一个输出f(xi)f(xi),然后用f(xi)f(xi)与训练样本的输出yiyi对比,然后学习模型会根据这个差距适当的自我调整,以保证下次再遇到xixi这个输入时,预测的比现在好。


本文转载至:思维之际
AIHIA梦工厂,共建AI人脉圈,共享AI时代美好生活!
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

AIHIA梦工厂旨在建立涵盖广泛人工智能行业,包括AI芯片、AI工业应用、AI电商、AI自动驾驶、AI智慧城市、智慧农业等人工智能应用领域。梦工厂为每位AI人提供技术交流、需求对接、行业资源、招聘求职、人脉拓展等多个方面交流学习平台促进人工智能的发展和应用。
  • 官方手机版

  • 联盟公众号

  • 商务合作

  • Powered by Discuz! X3.5 | Copyright © 2023, AIHIA梦工厂
  • 苏ICP备2023025400号-1 | 苏公网安备32021402002407 | 电信增值许可证:苏B2-20231396 | 无锡腾云驾数技术服务有限公司 QQ