主页 > 云储存 > > 正文

分布式数据库_阿里云服务器过户_排行榜

浏览:

分布式数据库_阿里云服务器过户_排行榜

每年的假期里,大数据应用技术,我都会发现自己在正常的SAP世界之外有一个小小的技术项目,来尝试一些新的东西,或者研究一些与我的工作没有直接关系,但从长远来看可能会有影响的创新话题。这个假期——在2014年,我把注意力集中在大数据和预测分析主题上之后——我决定看一看深度学习和神经网络。

在过去几年中,深度学习取得了重大突破,2012年DNNResearch在ImageNet大规模可视应用方面取得了成功,这可能是两个重要的里程碑表彰挑战,随后是2014年谷歌网的胜利,你可以在这里阅读更多。该领域学术界的领军人物现在为谷歌(Google)、Facebook和百度(Baidu)等公司工作。有意思的是,似乎进步主要来自更大的训练集("大数据")以及更强大的计算能力,包括集群和GPU处理,而不是方法上的重大变化。关于更多的内容,你可能想读这篇文章。

在任何情况下,我都是通过阅读一些基于MNIST的教程来学习这篇文章的,这些教程可以处理手写的数字——例如,阅读信封上的邮政编码。这是一个很好的开始,现代的深度学习技术可以在数据集上达到98-99%的准确率。然而,这不是最具挑战性的任务,为什么不更进一步呢?

这是意外之喜。12月15日,Kaggle开始了国家数据科学碗比赛(比赛将持续到2015年3月底)。比赛包括将海洋浮游生物的图像分为121个不同的类别,提供约30000个标记图像的训练集,八斗大数据,以及130000个测试集,你必须提供分类。这些图像是黑白的,有不同的大小和形状,宽度和高度大约在30像素到200像素之间。这是一个需要解决的现实问题,同时也可以通过排行榜跟踪您的进度,以及您与其他人相比的表现。

我在这个行业已经有一段时间了,并且必须认识到工具链的状态通常是一个很好的指示,表明特定技术的成熟程度或新程度面积是。当我在90年代开始使用Java时,我们只有一个基本的文本编辑器和javac,没有华丽的ide或框架。我最初使用Hadoop的经历并没有什么不同。类似地,还没有任何简单的点击式环境来实现这一点。

我对Python比较在行,但以前从未使用过NumPy、SciPy或scikit learn,它们是该语言的主要扩展,更不用说Theano了。幸运的是,如何安装Theano,包括所有的依赖关系和所需的配置,使您的模型通过C包和GPU上运行的大幅加速,这里是非常好的描述。不过,要准备好在这方面花费大量时间。我从一个新的Linux安装开始,并将其修补到最新和最棒的版本,然后经历了NumPy、SciPy和openBLAS配置,还编译了一个NVIDIA内核驱动程序,甚至在到达Theano之前。最后,一旦安装了Theano,它将运行大约1-2个小时的测试,以确保一切正常,并利用GPU。总而言之,我花了大约一天的时间使所有的东西都能正常工作并进行了第一次测试。为了让您了解GPU加速的重要性,返利app,如果您可以访问它,我在没有GPU的单独Linux桌面上运行了一个早期测试,同样的型号在CPU上运行了24小时,在GPU上运行了大约20分钟(这不完全是一个公平的比较,因为有GPU的PC也有更好的CPU,但它让人感觉到GPU加速对于深度学习是多么有益,甚至是至关重要)。

我经历了几次迭代,但最终得到了下面的模型,这是我提交给竞争对手的最佳材料(到目前为止)。该模型使用4个卷积层进行子采样(或下采样)。第四层被展平并完全连接到1024个隐藏节点(即每个第4层节点连接到每个隐藏层节点),最后完全连接到121个节点,每个节点代表一个浮游生物类。该模型使用线性整流器,而不是sigmoid,云主机,用于节点和辍学。

你可以阅读更多关于卷积网络如何工作的介绍,但主要思想是:通过一系列过滤器运行源图像,以便检测可能识别单个浮游生物类型的特征。这些滤波器是通过反向传播在训练周期中学习的,您可以看到下面第一个卷积层的滤波器示例。在上图中,您可以看到这32个过滤器在一个历元训练后的状态(即在处理了一轮训练集之后),而在下图中,则是在最后一个历元训练后的结果。

您可以看到,淘客大联盟,最初它仍然是相当随机的,但在65个历元训练后,会出现不同的"形状",例如最后一个历元表示从左下到右上的边。源图像通过这些过滤器来创建32个不同的"特征图"。每一个都会再次经过这个过程,最终得到64、128和256个特征图,每个特征图都经过3×3个过滤器,然后是2×2最大池子采样,其中保留最高值。

最后,这些最终特征图连接到隐藏层,隐藏层本身连接到121个输出节点。

发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

热门文章

  • 对象存储_网站集约化建设_哪家好
    对象存储_网站集约化建设_哪家好

    对象存储_网站集约化建设_哪家好

    当戴夫·麦克卢尔首次提出海盗指标的概念时,它震撼了创业界的核心。尽管你现在可能知道他是500家初创企业的幕后推手,但在贝宝(PayPal)上市前担任...

  • 数据库_数据库事务原理_安全稳定
    <strong>数据库_数据库事务原理_安全稳定</strong>

    数据库_数据库事务原理_安全稳定

    为CloudFlare客户提供对源站的免费和高性能加密2014年秋季,CloudFlare推出了Universal SSL,并将通过HTTPS访问的网站数量增加了一倍。在短短几天内,我们颁发了...

  • 百度云_企业邮箱怎么设置签名_排行榜
    百度云_企业邮箱怎么设置签名_排行榜

    百度云_企业邮箱怎么设置签名_排行榜

    在快节奏的销售世界里,时间是无价的。这正是为什么你需要停止切换标签,使用新的Pipedrive Chrome扩展直接从Gmail使用Pipedrive的强大功能。如果你是一个狂...

  • 游戏服务器_节点服务器_优惠
    <strong>游戏服务器_节点服务器_优惠</strong>

    游戏服务器_节点服务器_优惠

    nomad0.11为任务引入了生命周期部分,可以用来表示任务依赖关系。这可以用来表示任务组中任务之间的任务依赖关系,甚至可以利用consur来表示任务间的任...

  • 企业邮箱_华为云techwave_企业级
    <strong>企业邮箱_华为云techwave_企业级</strong>

    企业邮箱_华为云techwave_企业级

    遵守一套不断发展的数据隐私法规的需求可能看起来很繁重,或者会导致公司停滞不前,不知道下一步该采取什么措施。如果不了解这些法规对日常运营的...

云储存

更多 >
  • 负载均衡_腾讯企业邮箱开通_高性价比
    负载均衡_腾讯企业邮箱开通_高性价比

    SAP Lumira&Design Studio于2月23日至24日在古尔冈举办的实践研讨会 请加入我们,了解我们在敏捷可视化、仪表板和应用程序方面的创新,并体验SAP Lumira和SAP D...

  • <strong>全站加速_找不到服务器_0元</strong>
    全站加速_找不到服务器_0元

    3D打印这一概念在过去的几年中以其科幻的内涵吸引了很多人的注意。今天,3D打印已经进入了许多家庭,甚至作为一个复杂的儿童玩具。3D打印是一项重要...

云储存对象存储_域名备案网址_评分榜
云储存腾讯云_绝不后悔百度云_多少钱
云储存域名备案_163邮箱服务器地址_返利
云储存云存储_呼市网站建设_怎么申请
云储存虚拟主机_阿里云是什么意思_企业0元试用