Logo cn.artbmxmagazine.com

数据挖掘

目录:

Anonim

通常比没有信息可用更糟糕的是拥有很多信息并且不知道如何处理它。在过去的几年中,人类已经开发出了强大的能力来生成和收集数据,因为有些机器可以以较低的存储成本对其进行处理。

但是,尽管如此,在这些海量数据中,有许多隐藏的信息非常重要,但无法使用经典的信息检索技术进行访问。

由于数据挖掘或数据挖掘,所有这些信息的发现都是可能的,在本文的开发中,我们将看到的其他特征之一是使用人工智能,该人工智能可以识别数据中的模式和关系,从而可以创建模型。

在本文的开发过程中,将开发数据挖掘的主题,它的特征,方法和主要应用领域是什么。

关键字:

  • 数据挖掘数据挖掘信息分析数据处理数据库

数据挖掘

一般

令人好奇的是,在我们所处的那个时代,我们被认为是信息时代,因为有了它,我们可以迅速了解世界各地的事件,数据可以形成混乱而杂乱的墙。

决策所用的原材料并非总是最便宜的,因此有必要出去寻找它,尽管看起来很简单,但并非如此,因为有必要选择性地提取数据以获得经济利益。

所有这一切都被称为数据挖掘,尽管稍后会正确定义,这就像在说,如果“白雪公主”矮人外出工作以寻找宝石,他们还必须拿起合适的镐和铲子来获取它们。在这种情况下,将获得正确的信息。

数据挖掘的主要目的是从数据集中提取信息,对其进行处理和完善,以便能够将其转换为易于理解的结构,以备后用。

使用数据挖掘的组织由于不再采取错误的步骤,因此可以迅速看到其投资回报,其应用就是检测超市的消费习惯。(DuránMena,2014)

什么是数据挖掘?

以下是来自不同作者的一些数据挖掘定义:

  • 数据挖掘是允许您从大型数据集中检测其他信息的过程,因为它使用数学分析来推断数据中存在的模式和趋势。 (SQL Server,2014年)数据挖掘是一个过程,其目的是通过搜索程序和其他具有解释性且可以发现的指标,从大型数据库中提取,发现和存储某些相关信息。通过应用这些工具。 (Larrieta和SantillánGómez,2007年)数据挖掘,也称为“数据或知识发现”,是从不同角度分析数据并将其汇总为有用信息的过程。 (信息技术,2009)数据挖掘或数据挖掘是允许自动或半自动浏览大型数据库以查找重复的模式,趋势或规则以解释行为的一组技术。给定上下文中的数据(Sinnexus,2007年)

数据挖掘的应用

(SQL Server,2014年)可以在以下情况下应用数据挖掘模型:

  • 预测:它可以计算销售量并预测负载或服务器停机时间风险和概率:帮助选择最佳客户以进行正确的邮件分发,并分配诊断概率或其他一些结果建议:用于确定产品搜索顺序:分析客户输入购物车中的商品,从而预测可能发生的事件。分组:将客户或事件分为特定的类别,从而分析或预测亲和力。

数据挖掘的主要特征和目标

(Vallejos,2006年)数据挖掘的最重要特征是:

  • 探究位于数据库或数据仓库内部的数据,因为它们倾向于随着时间的流逝存储大量信息,在某些情况下,这些数据库或数据仓库成为数据市场或通常保存在其中Internet或Intranet服务器采矿的外部环境通常是服务器与客户端之间的关系。数据挖掘工具可帮助提取埋藏在公司档案或公共记录中的信息矿石数据挖掘产生了一些类型信息:
  • 协会分类序列预测分组

在数据挖掘中,希望从中得出一些假设来选择数据,并寻求数据来描述或指示它们为何如此。

随后,对假设进行了验证,因此数据挖掘必须提供一种探索性的方法,尽管使用数据挖掘来确认假设有些危险,因为进行了某种程度的有效推断。

数据挖掘是一种由集成了多个区域的阶段组成的技术,但不应与软件混淆。

当前,有一些功能强大的数据挖掘应用程序或工具可以促进项目的开发,尽管通常会使用其他工具对其进行补充。

数据挖掘过程的各个阶段

尽管数据挖掘往往彼此不同,但是它们的通用过程包括四个主要阶段:

确定目标

第一阶段是在

数据挖掘专家的指导下处理客户可能想要的目标划分。

数据再处理

在第二阶段,它基本上是指数据库的选择,清理,充实,缩减和转换,该阶段通常消耗数据挖掘项目总时间的约70%。

确定模型

第三阶段,这从对数据的统计分析开始,然后以图形方式显示以具有近似值。

根据设定的目标和要执行的任务,可以使用在人工智能的不同领域开发的某些算法。

结果分析

数据挖掘项目的各个阶段(Vallejos,2006年)

在最后阶段,对获得的结果进行验证,并与统计分析和图表进行比较。

客户必须确定他们是否是新客户,以及他们是否提供可以使他们做出决定的新知识。

使用用途

每年,在不同的大会和研讨会上,具有不同应用程序的研究人员会面,尤其是在美国,数据挖掘已融入组织,大学,政府,医院和许多公司的生活,有兴趣探索其基础数据的。

在政府中

联邦调查局将分析商业数据库,以发现恐怖分子。

在公司里

  • 它可以检测信用卡欺诈行为,发现人们为什么从手机公司中脱颖而出,识别超市的购物习惯,预测电视观众的人数

在大学

它可以让您知道大学的应届毕业生是否从事与其所学内容相关的专业活动。

在特别调查中

开发SKYCAT项目,该项目基于分组技术和决策树,从而能够以高可靠性对对象进行分类。

在体育俱乐部

NBA团队使用智能的应用程序来支持其教练团队。(瓦列霍斯,2006年)

结论

正如我们在本文的开发中所看到的那样,数据挖掘或数据挖掘可用于培养客户忠诚度,因为它允许我们向他们提供他们认为有价值的东西,因为它的特征之一是识别具有一定放弃倾向的行为模式。根据已经这样做的客户的数据进行删除,因此组织可以始终保持领先一步,并提供一些激励措施来留住客户。

这种信息分析也有许多重要的应用领域,例如医学,预防和控制欺诈,调查与恐怖主义有关的行为,工程学和遗传学。

数据挖掘人员说,它基本上是与业务混合在一起的统计数据,他们认为,它所使用的方法和所面临的各种问题使其变得独特且高度相关。

总而言之,数据挖掘作为一种新兴的技术而呈现,它当然具有几个优点,例如,研究人员和业务人员之间的交汇点,为组织节省了大量资金以及允许开放新的技术。商业机会。除了使用数据挖掘,还意味着要照顾到很多细节,最终可以准确地做出决策。

参考资料

  • DuránMena,C.(2014年8月6日)。福布斯墨西哥。从https://www.forbes.com.mx/mineria-de-datos-informacion-precisa-y-relevante/密歇根州拉里埃塔(Larrieta)和密西西比州桑蒂兰·戈麦斯(SantillánGómez,AM)获得(2007年)。电子期刊UNAM。取自2016年3月,摘自数据挖掘:概念,特征,结构和应用程序:http://www.ejournal.unam.mx/rca/190/RCA19007.pdfRAE。 (2014)。西班牙皇家学院。从http://dle.rae.es/srv/search获得?M = 30&w =杂色Sinnexus。 (2007)。商业智能战略计算。检索自2016年3月,网址:http://www.sinnexus.com/business_intelligence/datamining.aspxSQL Server。 (2014)。微软。从https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx信息技术获得。 (2009)。信息系统:数据处理,计划和资源管理。检索自2016年3月,网址为http://www.tecnologias-informacion.com/mineria-de-datos.html Vallejos,SJ(2006)。 ExaUnne.edu。检索自2016年3月,从http://exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf

杂色:异质,聚集而不确定。(RAE,2014年)

下载原始文件

数据挖掘