主页 > 云储存 > > 正文

网站服务器_长沙公司网站建设_新用户

浏览:

几天前,我遇到了一个有趣的关于患者住院的数据集:对于每个住院患者,系统中都输入了一个记录。

数据很有趣,因为在各种属性中,有一个字段包含了患者的初始诊断,作为文本描述,还有一个字段显示同一患者是否有第一次出院后再次入院的病人。

我想到的问题是:'是否有可能看出病人的初步诊断与再次住院的需要之间有关系?换句话说,如果存在相关性,哪些健康问题更可能要求重新入院?

SAP Predictive Analytics 2.1(SAP PA 2.1)在其自动分析界面中有一个文本分析工作流,有助于回答此类问题,因此我尝试了一下。

目的是快速了解是否存在关系以及关系是什么;也许有一些方法可以做一个比我在这里介绍的模型更好的模型。在任何情况下,本文都不想成为一个最佳实践文档,而是对SAP PA 2.1的文本分析组件可能实现的功能的快速概述。

在这个测试中,我想保持简单,看看是否有一些有用的见解,不一定要建立最好的模型,所以,出于懒惰,我到处使用默认设置。

走吧!

在我们开始之前只是一个提示:下面的图片在普通浏览器中并不总是好看的。尝试本页右侧的"以PDF格式查看"选项,您将看到更好的图片。

在下图中,您可以看到住院文件的摘录,删除了大多数条目,只保留了用于此示例的初始诊断(Primary\u Diag)和重新接收(Readmitted\u Flag)字段。

在SAP PA2.1中,您可以在[数据管理器]下找到文本分析模块。当您点击[执行文本分析]时,您将进入第一页,在那里您需要选择适当的操作。

在我们的案例中,我们想知道根据诊断,"是或否"患者可能会再次入院。这是一个典型的分类示例,其中输出是两个值之间的选择,因此您现在要单击[添加分类/回归]。

现在要求您在[参考数据集]页面上选择文件,然后单击[下一步]。

将显示[数据描述]页面。首先要做的是点击[Analyze]按钮。显示源文件的所有字段。

在此页面中,您必须将要进行文本分析的字段的[Value]属性设置为[text]。

在下面的图片中,人工智能包含哪些方面,您可以看到我为主诊断字段设置了该值。此字段包含医生编写的文本,为患者提供第一个诊断。

文本设置向应用程序指示此字段必须进行文本分析。在这种情况下,字符串不会被视为单个值字段,但每个单词都将被提取并用作单独的属性。一般来说,您可以将多个文本字段设置为[文本]:具有该设置的所有字段都将加入分类模块中使用的单词列表。

单击[下一步]并进入[文本编码参数设置]的第一页。

此页和以下页允许您详细指定要考虑的单词用于分析。例如,您可以定义应该排除哪些词(默认情况下,应用程序会删除不必要的词,如"and"、"is"等,您可以定义自己的词),也可以将词分组到单个词下(例如,"laptop"、"desktop"、"mainframe"可以分组到同一个词"computer"下)。您还可以指定如何计算每个单词的权重(如果出现或不出现,只需1和0,或者更确切地说是文本中出现的次数,或其他选择)。

为了简单起见,我们将接受默认设置,我们唯一要设置的是,我们希望以英语执行分析,如图所示下一张图片。

您点击【下一步】进入第二个【文本编码参数设置】页面,我们将其保留为接受默认值,然后再次点击【下一步】。

现在SAP PA 2.1分析文本字段并将所有有用的词检索到其中,下一个屏幕显示数据集中的单词及其频率列表。

您可以看到应用程序已提取每个单词的词根(例如,词根"local"表示"localized"、"localization"、"location")等单词,将使用词根单词执行分析。单击[下一步]。

在下一页,您将看到为分析生成的所有变量。在文本字段中找到的每个根在这里都有一个前缀"tc\"。

如下图所示,在我们的分析中,我们将排除两个变量:CountInformation和EffectiveRoot,这两个变量是从fileld Primary_Diag生成的。这些变量计算根的数量,对我们的模型没有用处。

在[explantive variables Selected]列表中,我们保留从Primary_Diag字段提取的所有词根

单击[Next]并然后[Generate]建立模型。

在我的示例文件中,人工智能书,我得到了07790的Ki,这对于一个非常简单的模型来说是非常好的(Ki是一个显示模型质量的索引,有关Ki的更多信息,请阅读产品文档)。

我们现在可以开始检查重新入职与初始诊断中的某些单词之间是否存在任何关系。

在[使用模型]页面中,单击[变量贡献],网购返利,您将看到最有助于诊断的根的优先列表患者再入院

我们在这里看到,对再入院影响最大的三个词是"Intertroncher"、"呼吸器"和"local"。现在让我们看看它们是如何影响它的。

发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

热门文章

  • 对象存储_网站集约化建设_哪家好
    对象存储_网站集约化建设_哪家好

    对象存储_网站集约化建设_哪家好

    当戴夫·麦克卢尔首次提出海盗指标的概念时,它震撼了创业界的核心。尽管你现在可能知道他是500家初创企业的幕后推手,但在贝宝(PayPal)上市前担任...

  • 数据库_数据库事务原理_安全稳定
    <strong>数据库_数据库事务原理_安全稳定</strong>

    数据库_数据库事务原理_安全稳定

    为CloudFlare客户提供对源站的免费和高性能加密2014年秋季,CloudFlare推出了Universal SSL,并将通过HTTPS访问的网站数量增加了一倍。在短短几天内,我们颁发了...

  • 百度云_企业邮箱怎么设置签名_排行榜
    百度云_企业邮箱怎么设置签名_排行榜

    百度云_企业邮箱怎么设置签名_排行榜

    在快节奏的销售世界里,时间是无价的。这正是为什么你需要停止切换标签,使用新的Pipedrive Chrome扩展直接从Gmail使用Pipedrive的强大功能。如果你是一个狂...

  • 游戏服务器_节点服务器_优惠
    <strong>游戏服务器_节点服务器_优惠</strong>

    游戏服务器_节点服务器_优惠

    nomad0.11为任务引入了生命周期部分,可以用来表示任务依赖关系。这可以用来表示任务组中任务之间的任务依赖关系,甚至可以利用consur来表示任务间的任...

  • 企业邮箱_华为云techwave_企业级
    <strong>企业邮箱_华为云techwave_企业级</strong>

    企业邮箱_华为云techwave_企业级

    遵守一套不断发展的数据隐私法规的需求可能看起来很繁重,或者会导致公司停滞不前,不知道下一步该采取什么措施。如果不了解这些法规对日常运营的...

云储存

更多 >
  • <strong>京东云_最新电影百度云_返利</strong>
    京东云_最新电影百度云_返利

    在之前的第1部分博客中,我描述了不同的过滤属性,这些属性目前可用于 (需要SAP Service Marketplace登录) 中新启动的云KPI目录https://go.support.sap.com/kpicata...

  • 香港带宽_百度云免费会员_评分榜
    香港带宽_百度云免费会员_评分榜

    亲爱的合作伙伴, 我们想邀请您参加即将推出的SAP enablement产品"S/4HANA DB Migration to HANA",请使用右侧的注册按钮立即预订您的座位! 在这里注册6月22日上午...

云储存对象存储_数据库连接类_价格
云储存服务器_好用的服务器_优惠券
云储存对象存储_西部数码虚拟主机_学生机
云储存香港带宽_六盘水网站建设_测评
云储存服务器_H漫画百度云_稳定性好