Logo cn.artbmxmagazine.com

使用数据挖掘的优势

目录:

Anonim

随着ICT的到来,信息以惊人的速度大量生成,随着ICT的到来,信息几乎在下雨,到达了世界各地公司的计算机和服务器,并且由于当今的存储能力,信息可能会迷失在数据的海洋中,但并非所有的数据都对组织有用。

这就是为什么为了更好地处理存储的信息以及到达信息的原因,有必要使用有助于搜索信息的工具,不仅如此,还需要具有允许获得清晰准确信息的工具。通过获得的数据提高生产率。

数据挖掘是一种工具,可以帮助执行这些任务以利用已存储的信息,但是并不是所有组织都知道或做的事情,因为数据挖掘等其他工具也可以执行类似任务,例如大数据但是每个人都有其特点。

在本文中,我们可以看到数据挖掘如何成为提高公司生产力的非常有用的工具,并且以同样的方式,我们将看到数据挖掘如何与其他工具进行交互,使用数据挖掘的好处及其特殊特征。

定义。

根据(wikipedia.org,2018),数据挖掘意味着以下内容:

它使用人工智能,机器学习,统计和数据库系统的方法。数据挖掘过程的总体目标是从数据集中提取信息,并将其转换为易于理解的结构,以供以后使用。除了原始分析阶段外,它还涉及数据和数据库管理方面,

数据处理,模型和推理注意事项,兴趣度量,计算复杂性理论注意事项,发现结构的后处理,可视化和在线更新。

(Marqués,2014)给出的另一个定义告诉我们,数据挖掘是:

数据挖掘是从大型数据集中发现可操作信息的过程。使用数学分析来推断数据中存在的模式和趋势。通常,由于关系太复杂或数据太多,传统的数据探索无法检测到这些模式。

可以收集这些模式和趋势并将其定义为数据挖掘模型。数据挖掘模型可以应用于以下场景:

  • 预测:计算销售量并预测服务器负载或服务器停机时间风险和可能性:选择最佳的客户进行直接邮件分发,确定风险方案的可能的收支平衡点,以及诊断和其他结果的概率分配建议:确定可以一起出售的产品并生成建议顺序搜索:分析客户放置在购物车中的物品并预测可能发生的事件。分组:将客户或事件分配到相关项目组中,以及亲和力分析和预测。(microsoft.com,2018)

数据挖掘的主要阶段。

据说数据挖掘是允许探索大型数据库以便找到可以在将来的决策中为我们提供有价值的信息的模式的一组技术。数据挖掘过程通常具有四个主要阶段:

  • 确定目标数据处理模型确定结果分析

第一个步骤处理客户想要从数据库中提取的信息类型。第二阶段是需要更多工作的阶段,因为它必须选择,清理,丰富,减少和转换客户提供给我们的数据库。处理完并准备实施人工智能算法后,我们必须选择哪种算法可以给我们带来最佳效果。

为特定的分析任务选择最佳算法时,这是一个很大的挑战,并取决于要解决的问题。数据挖掘中基本上存在五个不同的问题:分类,回归,分段,关联和序列分析。

为了解决这些问题,可以使用许多算法,主要算法有:关联,聚类,决策树,线性回归,朴素贝叶斯分类器,神经网络,序列和序列聚类。临时。

最后,最后一步是分析结果。当前,这项工作正在许多业务领域中进行,例如数据安全,财务,健康,市场营销,欺诈检测,在线搜索,自然语言处理或新型智能汽车。(非常有趣.es)

数据挖掘与大数据的集成。

数据挖掘包括一组用于提取信息的技术,而大数据是一种能够在合理的时间内以真实的方式捕获,管理和处理数据的技术。数据挖掘需要大数据来简化其数据处理和管理,与此同时,大数据需要数据挖掘来进行预测性数据分析和检测趋势。我们可以说技术和工具之间存在相互融合。

大数据技术能够利用它们来快速,准确地捕获,存储,管理和处理大量数据。

从根本上讲,它使用各种技术(包括数据挖掘)专注于预测分析和检测趋势。通过定义模型和使用不同的技术,目标是将数据变成有价值的资产。

使用这项技术,我们可以确定常见的模式,这些模式可用于发现新的市场利基,定义有关当前或未来客户的关键特征,生成参数,指标或流程。

它包括业务方式的转变,在许多情况下,可以提高公司的盈利能力和生产率。

数据挖掘具有多种功能,并且可以像执行常规分析一样使用,它是从大数据中提取价值的好资源。两者的结合使两种工具都具有更大的潜力。(Balagueró,2017年)

数据挖掘和大数据应用示例。

由于大数据和数据挖掘具有不同的功能,因此适用于不同的上下文,因此我们将看到一些有关其应用范围的示例。

沃尔特·迪斯尼(Waltt Disney)利用大数据来分析其客户的路线并实时改善他们的体验,从而可以更好地了解用户或消费者。

数据挖掘分析信息以发现并发现可疑的行为模式。这将适用于寻找犯罪行为的模式,分析与银行或微生物学研究中欺诈或欺诈相关的行为模式,以建立细菌之间的行为模式。(Balagueró,2017年)

数据挖掘周期

  1. 信息用户必须确定业务问题和数据可以为公司增值的领域。同样,重要的是要确定信息变化很大的区域,但这些区域对于公司的竞争力至关重要。为此,可以处理各种标准,没有可以称为正确的特定标准。目的是确定将用作数据挖掘过程输入的标准,思想,规范和问题;要分析历史信息,用户将选择适当的挖掘算法。随后,将这些算法转换为挖掘程序,这些程序将使用先前定义的条件执行搜索。将通过数据挖掘过程获得的信息纳入决策过程;以及将发现的发现呈现给负责运营的人员,以便将获得的信息整合到公司的流程中,并可以用于解决问题。测量结果:测量发现的结果的价值向决策者提供解决所发现问题和第一点中定义的标准的信息。在解决第一点中确定的问题和定义的标准方面提供给决策者的信息。在解决第一点中确定的问题和定义的标准方面提供给决策者的信息。(拉古尼斯,2016)。

文字挖掘

文本挖掘是一个新兴的领域,它试图从语言的自然文本中提取有意义的信息。它可以广义地描述为分析文本以提取对特定目的有用的信息的过程。与数据库中存储的数据类型相比,文本是结构化的,无定形的,并且在算法上难以处理。但是,在现代文化中,文本是正式交换信息的最常用工具。文本挖掘领域通常会处理其功能是传达事实,信息或观点的文本,并且即使成功仅是部分成功,尝试自动从所述文本中提取信息的动机也令人信服。 。

短语“文本挖掘”通常用于指代分析大量文本和自然语言并检测词汇或语言使用模式以尝试提取可能有用的信息的任何系统。(拉米雷斯,2016)

与其他信息管理技术相比,使用数据挖掘的优势。

  • 数据挖掘源于管理组织数据库中包含的信息的需求,与用于信息管理的其他过程相比,此过程具有一系列优势,例如:数据挖掘提供企业领导者的关系和知识,在许多情况下是组织中不存在的,这是一组关系和知识。数据挖掘可以帮助公司选择他们走公司路线的途径,并获得优势。与市场竞争者竞争,因为通过使用数据挖掘,人们将知道只有公司才知道的信息。可以这么说,我们人类有能力以肤浅的方式检测模式和异常,这就是为什么通过使用数据挖掘可以更好地感知肉眼难以定位的模式的原因。简单的欣赏。(Franco,2016年)

数据挖掘和其他学科。

数据挖掘和类似学科之间有一定的界限,例如统计,人工智能等。有人认为,数据挖掘无非就是用商业术语包装的统计数据,将其转化为可销售的产品。另一方面,其他人在其中发现了一系列使其与其他学科有所不同的特定问题和方法。

事实上,在实践中,数据挖掘中常用的所有模型和算法(神经网络,回归和分类树,逻辑模型,主成分分析等)在其他领域。(wikipedia.org,2018)

从统计。

当然,从统计数据中提取饮料的数据,可以采用以下技术:

  • 方差分析,通过该方差分析评估不同总体中一个或多个连续变量的均值之间是否存在显着差异回归:定义一个或多个变量与一组第一个预测变量之间的关系。平方:用于检验变量之间相关性的假设聚类分析:允许在确定数量的组中对以多种属性(二元,定性或定量)为特征的个体群体进行分类,基于个体的相似性或差异判别分析:允许对先前建立的组中的个体进行分类,允许查找这些组元素的分类规则,时间序列:允许基于该知识并在以下假设的前提下研究变量随时间的演变,以便做出预测。不会有结构上的变化。(wikipedia.org,2018)

计算。

通过计算,他采用了以下技术:

  • 遗传算法:它们是数值优化方法,其中要优化的一个或多个变量与研究变量一起构成信息的一部分。为响应变量获得更好值的分析变量的那些配置将对应于具有更高繁殖能力的部分。通过繁殖,最好的部分可以忍受,并且它们的比例世代相传。您还可以引入随机元素来修改变量(变异)。经过一定数量的迭代后,总体将由针对优化问题的良好解决方案组成,因为已经丢弃了糟糕的解决方案,因此需要反复迭代。使用模拟智能系统的计算机系统,分析可用数据。在人工智能系统中,将构筑专家系统和神经网络专家系统:这些系统是根据专家的知识得出的实际规则创建的。主要基于推理或因果关系智能系统:它们类似于专家系统,但在专家未知的新情况下具有更大的优势神经网络:通常,它们是并行数值处理方法,其中变量通过线性或非线性变换进行交互,直到获得输出。根据测试数据,将这些输出与应保留的输出进行对比,导致反馈过程,通过该过程重新配置网络,直到获得合适的模型为止。(wikipedia.org,2018)

通过数据挖掘,您可以对数据进行比使用常规查询方法复杂得多的查询。信息挖掘所提供的功能可以极大地提高业务决策的质量和可靠性。

例如,常规方法可以告诉银行它提供哪种类型的银行帐户最赚钱。取而代之的是,数据挖掘使银行可以创建已经拥有该类型帐户的客户的资料。然后,银行可以使用数据挖掘来查找与该配置文件匹配的其他客户,从而能够发起专门针对这些客户的营销活动。

数据挖掘可以识别业务数据中的模式,例如超市的购买记录中的模式。例如,如果客户购买产品A和B,那么他们最有可能购买哪种产品C?准确回答此类问题对于创建业务战略非常有用。

数据挖掘可以识别已知客户群的特征,例如信誉不佳的客户。然后,公司可以使用这些特征来选择新客户,并预测他们是否也会信誉欠佳。数据挖掘工具使在大型数据库中发现此类信息变得容易且自动化。(ibm.com)

结论。

信息已成为公司的重要资产,最近,由于用户信息处理不当,Facebook陷入了一个非常严重的问题,这涉及到剑桥分析公司,因为它允许该公司处理用户数据全部用于更好地竞选当时的候选人唐纳德·特朗普。

这个严重的问题导致公司的所有者马克·扎克伯格本人不得不在美国国会面前宣布为什么允许这样的事情,他想参考的是今天产生的信息。它具有很大的价值,具有很大的分量,因为随着ITC的到来,组织受到信息的轰炸。

今天产生的信息太多,以至于必须开发能够处理它的人工智能,已经建立了可以以更复杂和有效的方式处理所产生的信息的神经网络,例如在google或youtube,因为其用户超过数十亿。

毫无疑问,数据挖掘已经成为支撑信息产生的一部分力量的工具,但是我们必须始终谨慎对待信息的处理方式以及允许谁处理信息。

论文提案。

与专门从事数据挖掘的公司签订协议,以使学生参与其中。

总体目标。

让学生从事与数据挖掘管理相关的项目或工作,并吸收更多的该主题以进行更充分的准备。

谢谢。

感谢我的母亲,她每天都有继续前进的力量,并且让我走到了我所在的地方;感谢我的老师们,他们贡献了自己的时间和知识继续我的学业,并自此以来对费尔南多·阿奎尔和赫尔南德斯博士表示感谢他在行政管理基础知识和CONACYT方面给了我们所有的经验和知识,因为它为我们提供了支持,以激励我们继续前进以追求精通冒险。

参考书目。

T.Balagueró(2017年11月1日)。https://www.deustoformacion.com。

于2018年5月26日从https://www.deustoformacion.com检索:https://www.deustoformacion.com/blog/gestion-empresas/que-es-mineria-datosbig-data

LG,佛朗哥(2016年4月6日)。https://www.gestiopolis.com。于2018年5月26日从https://www.gestiopolis.com检索:

www.gestiopolis.com/mineria-datos-textos/

ibm.com。(sf)。https://www.ibm.com。从2018年5月26日从https://www.ibm.com检索:https://www.ibm.com/support/knowledgecenter/es/SSEPGG_10.5.0/com.ibm.im.ov erview.doc / c_dm_goals.html

XA拉古尼斯(2016年6月2日)。https://www.gestiopolis.com。恢复于

2018年5月26日,来自https://www.gestiopolis.com:

www.gestiopolis.com/mineria-datos-informacion/

Marqués,P.(2014年)。通过示例进行数据挖掘。西班牙:

  1. 图书。

microsoft.com。(2018年5月1日)。https://docs.microsoft.com。从2018年5月26日从https://docs.microsoft.com检索:https://docs.microsoft.com/eses/sql/analysis-services/data-mining/data-mining-concepts?view=sql -analysisservices-2017

veryinteresante.es。(sf)。https://www.muyinteresante.es。检索26

2018年5月,来自https://www.muyinteresante.es:

www.muyinteresante.es/tecnologia/preguntas-respuestas/que-es-la-mineriade-datos-311477406441

AA拉米雷斯(2016年9月21日)。https://www.gestiopolis.com。

于2018年5月26日从https://www.gestiopolis.com检索:https://www.gestiopolis.com/mineria-datos-e-informacion/

wikipedia.org。(2018年4月27日)。https://es.wikipedia.org。检索26

2018年5月,来自https://es.wikipedia.org:

es.wikipedia.org/wiki/Miner%C3%ADa_de_datos

使用数据挖掘的优势