主页 > 专属服务器 > > 正文

全站加速_数据库企业_最新活动

来源:胜利云 发布时间:2021-06-09 17:20 标签:企业加速数据库全站最新活动
浏览:

如果您通过使用SAP Leonardo机器学习基金会的一些API、服务或应用程序直接或间接地使用机器学习算法,您需要了解一些基本策略,以便成功地对算法或学习模型进行培训或测试。

此博客文章不提供完整的信息机器学习基础讲座。但它应该为您提供基本的术语和指导,使您能够理解培训和测试应用程序、服务或API的常用策略。

我们将使用线性回归算法遍历相关的术语和符号。线性回归可以用来学习一个函数来预测给定特征集的某些值。

所有的机器学习算法都试图优化/最小化代价函数J,以找到给定问题的最佳模型。线性回归的代价函数为

给定m个训练样本或数据对(x,y),其中x可以是单个特征或n个特征的集合。其中y=f(x)是算法需要学习的函数,

学习的假设h在单个特征时记为

,在n个特征时记为

为最小化代价函数,采用梯度下降法对模型参数Θ进行优化,

学习率记为α属于超参数类。为确保算法在给定的恒定学习速率下收敛,需要用正则化项扩展代价函数。

正则化参数λ也是一个超参数。

现在,我们应该熟悉下一段所需的术语。

任何机器学习算法的输入都是数据。数据越多越好。算法的训练和测试遵循简单的分阶段方法。

首先训练算法,然后验证算法。这两个步骤通常按顺序执行几次,以提高模型的精度。之后,物联网安全,您测试模型,如果其精度高于某个可接受水平,则部署它。

用于培训、验证和测试的数据应来自同一分布。你必须把数据分成两部分。第一个也是更大的部分,你将用于培训和验证。用于测试的较小部分。没有适用于所有学习和数据域的最佳分割。通常你会使用80%的数据进行培训和验证,如何用大数据,20%用于测试。但是,如果你有数百万条数据记录,90:10甚至95:5这样的分割也是适用的。

你想用于培训和验证的数据集必须再次分割成两部分。而且,没有对所有域都有效的最佳分割关系。您可以使用80:20或90:10这样的分割,只需确保大多数用于训练。

在训练阶段,模型参数得到优化。用于优化超参数的验证数据集。您可以通过使用随机不同的数据拆分来迭代这两个步骤。这也称为交叉验证。

最常见的交叉验证技术称为K-Fold,将训练和验证数据分成大小相同的K个子集。使用子集的K-1作为训练数据,1个子集作为验证数据,数据与大数据技术,运行K个迭代。在每一次迭代中,你使用不同的子集进行验证。

一旦这两个阶段完成,你就将模型应用到你的测试数据集。这必须是算法/模型以前没有看到的数据。此测试数据集上模型的精度应与将应用该模型的任何新数据的精度相同。–当然,只有当用于培训、验证和测试的数据分布与应用算法/模型的数据分布相似时,

在部署模型之前,您需要知道它的性能如何。请记住,您的模型已经学习到一个假设,该假设应尽可能接近实际函数,该函数确定一组给定特征的值,这些特征是您要对其执行预测或分类操作的对象的特征。

因此,在训练数据集和验证数据集上计算模型的误差。在第一种情况下,你可以得到以下结果。这个模型太合适了。它的鲁棒性很低。在第二种情况下2。该模型是欠拟合的,具有很强的鲁棒性。在这两种情况下,您的模型在新数据上的表现都不好。模型是稳健的,这是一个很好的模型,可以进入测试阶段。

在文献中,怎么查看大数据,你会发现偏差和方差这两个术语可以用来分类模型。对于给定的问题,具有高偏差的模型不够复杂,并且倾向于欠拟合(情况2)。具有高方差的模型过度拟合(训练)数据(案例1.)。

如果您的模型具有高偏差,您可以应用以下策略来提高其准确性:

获取其他特征添加多项式特征减少正则化参数

如果您的模型方差较大,可以采用以下策略来提高其精度:

获取更多的训练数据减少功能的数量增加正则化参数

你可以从数学课上记住,如果你试图优化一个代价函数,中移物联网,你将面临陷入局部最优的危险。有时远离你所寻求的全局最优解。

现在,最近的研究表明,模型中使用的参数越多(或特征越多,因为每个特征有一个模型参数),解空间就越像马鞍。在这样的空间中,你不可能陷入局部最优。唯一可能发生的不好的事情是,你到达了一个高原,进一步的进展需要很长时间。这种平台的中心也称为鞍点,有论文假设深层神经网络收敛于(退化的)鞍点[1]。

发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

热门文章

  • 亚马逊云_海报cdn_优惠券
    <strong>亚马逊云_海报cdn_优惠券</strong>

    亚马逊云_海报cdn_优惠券

    消费者在哪里?这不是医疗保健领域的"捉迷藏"游戏,而是建立一个全面运转的医疗保健系统所需要的关键缺失要素。让消费者参与进来——作为一个消费...

  • 云解析_svn服务器安装_限时特惠
    <strong>云解析_svn服务器安装_限时特惠</strong>

    云解析_svn服务器安装_限时特惠

    集成/docker/梅索斯/marathonapachemesos是一个用于调度和管理分布式应用程序的开源集群管理器。Mesos几乎就像整个集群是一个单一的集群一样分配CPU和RAM等资源...

  • 云服务器_阿里云服务器账号_哪家好
    <strong>云服务器_阿里云服务器账号_哪家好</strong>

    云服务器_阿里云服务器账号_哪家好

    技术支持副总裁Aileen Wyer和高级系统管理员Maruf Rahman最近与我们坐下来讨论我们的合作伙伴关系如何帮助CAN Capital的遗留备份基础设施现代化,以简化数据管...

  • 消息队列_折枝by困倚危楼百度云_新注册优
    <strong>消息队列_折枝by困倚危楼百度云_新注册优</strong>

    消息队列_折枝by困倚危楼百度云_新注册优

    今天,两位前行业分析师(现在是Veeam高管)讨论了塑造数据保护行业和IT格局的趋势:Jason Buffington@JBuff,前ESG数据保护首席分析师Dave Russell@BackupDave,Ga...

  • 中间件_服务器能干什么_超低折扣
    <strong>中间件_服务器能干什么_超低折扣</strong>

    中间件_服务器能干什么_超低折扣

    Nathan Sielaff,World Vision的系统工程师,负责备份、存储等。他致力于创建一个灵活和敏捷的IT环境,这样组织就不必担心底层基础设施,可以将精力集中在任...

云储存

更多 >
  • <strong>百度云_阿里云搜索_评分榜</strong>
    百度云_阿里云搜索_评分榜

    附件非常有用,它们使文档完整,节省时间和精力,并且非常易于使用。你浏览,你附加和…它完成了!现在呢?查看文档或主数据记录中的"附件"选项卡...

  • <strong>阿里云_视频网站建设_价格</strong>
    阿里云_视频网站建设_价格

    如果您与"Pick Pack and Production Manager"一起工作,那么您已经熟悉了适合多种场景的灵活选择标准。某些标准集是一次性使用的,而其他标准集可能会定期重复...

云储存香港带宽_华为智汇云_折扣
云储存微软云_建筑企业网站_限量秒杀
云储存云存储_中国经济与社会发展统计数据库
云储存虚拟主机_西南林业大学阿里云_折扣
云储存阿里云_故事的故事百度云_企业0元试用