主页 > 专属服务器 > > 正文

亚马逊云_真正免费的云服务器_学生机

来源:胜利云 发布时间:2021-09-26 01:01 标签:免费亚马逊生机真正服务器
浏览:

业务伙伴重复检查用于在创建新业务伙伴时找出系统中存在的潜在业务伙伴重复项。它依赖于HANA的能力来使用给定的数据对数据库执行模糊搜索,并计算具有某些匹配的记录的总体排名。HANA使用Levenshtein算法来计算术语的相似性。将HANA的容错搜索和排序功能与FSI创建动态SQL"Where"子句的灵活性相结合,业务伙伴重复检查可靠且高效地查找重复项。

Levenshtein算法:以它的开发者Vladimir Levenshtein,"Levenshtein算法"采用了这种计算方法Levenshtein距离,即两个给定字符串或序列之间的距离,通过找出将一个字符串转换为另一个字符串所需的最小操作数,其中一个操作是插入、删除或替换单个字符。它通常用于需要确定两个字符串有多相似或不同的应用程序中,例如拼写检查器。

重复检查在计算相似性分数时考虑这些"节点"(=属性集合):姓名、邮政地址、电子邮件、传真、电话、生日(仅适用于个人)、其他标识符。一、 e.计算上述节点与数据库上现有业务伙伴的单一相似度,最后将单一相似度聚合为总相似度。在这一步中,节点通过业务配置微调"业务伙伴重复检查权重"中配置的不同权重来贡献总相似度。

用一个简短的例子来说明这个:让假设您正在创建一个新联系人,其dataName=BondE e mail=j。bond@mi6.com

假设上已经存在类似的联系人数据库:名称=电子邮件=j。bond@mi6.com

姓名的相似度为1–¼=0.75=75%。电子邮件地址的相似度为1=100%。

现在,总相似度取决于"业务伙伴重复检查权重"中配置的姓名和电子邮件的权重。只有name和e-mail的权重是相关的,因为其他节点的相似度是0权重:名称权重=30E-mail weight=70

要将单个相似度组合起来,重复检查使用所谓的OR公式:

R=节点的等级或模糊相似度

w=节点权重

i=索引值节点

n=单个节点的数量

在这个例子中,我们得到这个总数相似性:SIM=SQRT((30²*0.75²+70²*1²)/(30²+70²))=SQRT(5406.25/5800)=0.97=97%

如果您减少姓名的权重,增加电子邮件的权重,返利淘联盟,则总相似度也会增加,100%匹配的贡献率也会增加与相似度较低的节点"name"相比,节点"e-mail"增加了。

现在让我们看第二个示例,其中我们只输入新节点的名称联系人:姓名=债券

现在"业务伙伴重复检查权重"中的配置完全不相关,家庭人工智能,因为没有需要的部分加起来。那个意思是总的相似性仅仅是独立于任何权重:SIM=0.75 = 75%

摘要:节点您在"业务伙伴重复检查权重"中配置的权重只会改变对上述每个节点的影响程度(例如名称或地址)有助于总的相似性相比,其他节点。注意节点权重是相对权重,即只有一个节点权重与其他节点权重的比值是相关的,而不是绝对值。例如,人工智能书,如果你将所有节点权重加倍,计算出的模糊相似度保持不变。

托马斯,非常感谢你的完整回答。现在我将不再告诉我的客户重复检查只是一个花哨的黑匣子

我现在可以给他们完整的公式,甚至建议一个晚上的数学课程!

嗨,托马斯,

谢谢你非常好和详细的答复。

我们客户的IT部门问了我们一个简单的问题:那么Levenshtein距离的阈值是多少,以便将业务伙伴包括在检查的重复列表中?我们猜应该在80%~90%左右,对吗?

非常感谢,海淘返现,

戴维德

嗨戴维德,

在业务配置范围内您可以配置这个阈值。如果你想要一个强壮的,人工智能行业分析,业务伙伴中等或弱重复检查。

这里是相应的阈值:'业务伙伴强重复检查':85%'业务伙伴中等重复检查':80%

'业务伙伴弱重复检查':70%

默认设置为'业务伙伴中等重复检查',即80%的门槛。

祝您好运,托马斯

谢谢,托马斯。这正是我们需要的信息。

干杯,

戴维德

这个文档是由以下讨论产生的:重复检查规则背后的算法

发表评论
验证码: 点击我更换图片

注:网友评论仅供其表达个人看法,并不代表本站立场。

热门文章

  • 亚马逊云_海报cdn_优惠券
    <strong>亚马逊云_海报cdn_优惠券</strong>

    亚马逊云_海报cdn_优惠券

    消费者在哪里?这不是医疗保健领域的"捉迷藏"游戏,而是建立一个全面运转的医疗保健系统所需要的关键缺失要素。让消费者参与进来——作为一个消费...

  • 云解析_svn服务器安装_限时特惠
    <strong>云解析_svn服务器安装_限时特惠</strong>

    云解析_svn服务器安装_限时特惠

    集成/docker/梅索斯/marathonapachemesos是一个用于调度和管理分布式应用程序的开源集群管理器。Mesos几乎就像整个集群是一个单一的集群一样分配CPU和RAM等资源...

  • 云服务器_阿里云服务器账号_哪家好
    <strong>云服务器_阿里云服务器账号_哪家好</strong>

    云服务器_阿里云服务器账号_哪家好

    技术支持副总裁Aileen Wyer和高级系统管理员Maruf Rahman最近与我们坐下来讨论我们的合作伙伴关系如何帮助CAN Capital的遗留备份基础设施现代化,以简化数据管...

  • 消息队列_折枝by困倚危楼百度云_新注册优
    <strong>消息队列_折枝by困倚危楼百度云_新注册优</strong>

    消息队列_折枝by困倚危楼百度云_新注册优

    今天,两位前行业分析师(现在是Veeam高管)讨论了塑造数据保护行业和IT格局的趋势:Jason Buffington@JBuff,前ESG数据保护首席分析师Dave Russell@BackupDave,Ga...

  • 中间件_服务器能干什么_超低折扣
    <strong>中间件_服务器能干什么_超低折扣</strong>

    中间件_服务器能干什么_超低折扣

    Nathan Sielaff,World Vision的系统工程师,负责备份、存储等。他致力于创建一个灵活和敏捷的IT环境,这样组织就不必担心底层基础设施,可以将精力集中在任...

云储存

更多 >
  • <strong>香港带宽_视频云存储_0元</strong>
    香港带宽_视频云存储_0元

    这些年来,我参加过几次同性恋、双性恋、双性恋和双性恋的游行,在澳大利亚生活时,我曾多次为悉尼同性恋狂欢节做志愿者。现在,自从2014年我转到帕...

  • <strong>免备案CDN_备案老域名出售_三重好礼</strong>
    免备案CDN_备案老域名出售_三重好礼

    SAP Korea于6月10日和11日举办的首个"设计思维弹出式学校"取得了巨大成功。首尔的设计与共同创新中心团队领导了此次活动,该活动是与韩国最有影响力的商...

云储存天翼云_3096天百度云链接资源_返现
云储存百度云_服务器海外_最新活动
云储存CDN_腾讯的企业邮箱_9元
云储存云数据库_asp网站空间_学生机
云储存香港服务器_vpn服务器设置_精选特惠