Logo cn.artbmxmagazine.com

数据挖掘。信息作为无价资产

目录:

Anonim

信息是无价的资产

在新古典经济学模型中,存在大量的假设,该假设允许建立条件以解释市场内代理商的行为。但是,这种假设在实际情况中很少见:这种假设是完美的信息

在理想的世界中,所有参与市场竞争的代理商都具有关于其消费者的偏好和竞争对手的决策的完备知识。此外,消费者完全了解市场上发生的所有事件,并根据此完美信息做出决策。

完美信息是指所有代理商都充分了解市场上发生的所有事件的情况。但是,完美的信息是无法实现的,因为市场处于持续不断且不可阻挡的变革中。

公司需要产生一种方法,使他们能够确定潜在消费者的趋势和偏好,以及分析竞争对手的潜在动向。了解所有这些变量对于所讨论的公司而言是无价的,因为公司的生存和发展与所做出的决策息息相关。

但是,市场信息往往是尽可能静态的。由于社会趋势,政治运动,宗教信仰和意识形态趋势,消费者不断调整自己的想法和喜好。因此,在特定时间了解市场偏好并不能保证该信息长期保持最新状态。

公司需要设计工具,使其能够获取和分析大量信息,以识别趋势,从而使他们做出最佳选择。在存在成千上万种不同偏好的世界中,公司必须选择使他们能够满足尽可能多客户的选项。

拥有正确的信息可以使个人针对每种情况做出适当的决定。在缺少足够信息的情况下,很明显趋势倾向于失败或走运。由于信息对于决策至关重要,因此其价值不可估量。

在现实世界中,完美的信息是不存在的元素。信息是有成本的,公司需要在成本中包括获得相关信息所产生的费用。有效获取信息的组织是具有无限潜力的组织。

公司如何获取有关市场趋势的信息?随着技术的发展,用户越来越接近公司。几年前,公司通过自己与消费者进行的调查获得了数据。但是,随着互联网作为大众传播手段的引入,个人可以通过社交网络显示自己的偏好,在社交网络中使用识别偏好的方式。

公司可以通过各种方式获得市场信息,这取决于他们的方法和所选样本的大小,其准确性程度不同。但是,这些分析通常会导致大型的原始数据库,而用肉眼无法获得趋势。

为了分析包含数百万个定性和定量数据的数据库,有必要使用允许我们识别信息,趋势和机会中最重要部分的方法。在数据库分析和挖掘之间有一个类比。采矿中使用了大量资源,但是,它们需要使用特定的计划。

如果不先对地下内容进行具体分析,采矿公司就不会花费数百万美元进行挖掘。该公司不会随机进入某个地区并开始开采。以同样的方式,数据分析师具有避免在分析中花费额外资源的特定方法。

数据挖掘是一个涉及多个科学和学科的过程,从心理学到统计,计算,数学,甚至使用人工智能中的应用技术,都涉及多个科学和学科。数据挖掘的目的是确定趋势,使分析师能够做出正确的决策。

数据挖掘的使用不仅仅与市场分析相对应,该工具还可以用于需要分析大量信息的任何调查中。但是,在这篇简短的文章中,将在市场和组织的背景下分析该工具的使用。

什么是数据挖掘?

考虑到引用了几段的类比,可以构造关于什么是数据挖掘的模糊概念。根据引用了Fayyad等人(1996)的Vallejos(2006,p。11)的定义,数据挖掘是“识别有效性的非平凡过程,它是新颖的,潜在有用的和可理解的可理解模式。隐藏在数据中。”

该技术定义提供了一些基本概念,以了解该工具的使用。Vallejos(2006)还引用了Molina等人(2001)从商业角度来解释该概念,将概念定义为:“一组区域的整合,其目的是从偏向决策的数据库。”

数据挖掘的目的是对可用信息进行分析,以寻找可确定组织行动流程的模式。数据挖掘是更大过程中的一个阶段,称为从数据库中提取知识。

涉及数据库分析的学科涉及统计,人工智能,计算机图形学和强大的处理能力。如果没有能够每分钟管理和计算数百万个结果的计算能力,就不可能想到一种适当的数据分析方法。

但是,根据Vallejos(2006)的观点,数据挖掘的概念并非源于现代计算技术的诞生。为了解释数据挖掘的概念,有必要理解“数据库中的知识发现”的概念。这个概念是能够基于正确方法进行正确数据分析的基本要素。

数据库中的知识发现

随着20世纪计算机技术的发展,除了减少了处理信息本身的成本外,存储信息的成本已大大降低。随着成本的降低,对信息本身的分析已经发生了转变,直到可以以降低的成本进行高度详细的研究。

但是,如果您无法分析原始信息中模式形成的隐藏信息,则拥有大量数据是没有用的。数据的真正价值在于可以从中提取的信息。成功的企业建立在对模式的正确探索和基于预期和准备的决策基础上。

根据Vallejos(2006)的资料,产生和分析世界信息的能力已经大大提高,以至于每20个月翻一番。组织执行SQL序列为了获得基本信息。但是,他们需要更高级的技术才能定义数据中最重要的趋势。

根据Vallejos(2006)的CBD旨在自动处理大量数据以在其中找到有用的知识。以这种方式,用户可以为他们的方便使用信息。知识具有特定的层次结构,需要从一般到特定的层次进行分析。

基于数据挖掘的技术

数据挖掘的基础是长期研究过程的结果。当信息存储在计算机设备中时,技术的发展就开始了。数据挖掘取决于3种技术:

  • 大量数据收集强大的微处理器计算机数据挖掘算法

Vallejos(2006)提到商业可用性数据库正在以前所未有的速度增长。数据挖掘算法找到了一种有意识地克服经典统计方法的方法。

数据挖掘的主要特征和目标如下:(Vallejos,2006)

  • 深入研究存储在数据仓库中的数据库中的数据,可以从Internet或Intranet来源获取数据;数据挖掘环境维护客户端-服务器体系结构。从隐藏在公共记录中的信息中提取矿石Miner是数据钻探的最终用户,挖掘数据可带来出乎意料的结果数据挖掘工具易于组合和适当分析产生5种类型的信息o关联o序列o分类o分组或预测

数据挖掘保留了一种科学的方法,因为它提出了用于设计实验以收集数据的假设。使用此系统,您可以获得新知识。数据挖掘是一种探索性的方法,而不是一种确认性的方法。

数据挖掘的范围

近年来,数据挖掘技术取得了多项进步。使用当前技术,可以通过提供新功能来产生新的商机。但是,数据挖掘的成本往往会随着专业化程度的提高而增加。根据Vallejos(2006)的研究范围如下:

  • 自动化的趋势和行为预测:

数据挖掘使您可以自动在大型数据库中查找可预测信息的过程。问题通常需要人工分析,但是现在可以直接回答。

观察分析的一个例子是针对目标进行系统营销。数据挖掘使用结果分析来定位新的营销活动。通过这种技术,我们可以识别某些人口部门的行为并重复其行为。

  • 自动发现先前已知的模型:

数据挖掘工具使您可以一步确定先前已知的模型。该方法还可以识别银行系统中的欺诈交易并发现异常。

  • 自动海量分析:

在并行处理系统中实施自动化技术时,可以在数分钟内分析数据库。用户可以在日益复杂的分钟内执行自动分析。如此高的速度可以提供更好的预测。

如何解决数据挖掘问题?

定义数据挖掘是一个可以检测大数据集中的信息的过程之后,我们可以采用该工具使用的方法。我们必须意识到,挖掘的基本进展是分析常规技术不可见的复杂关系。

Microsoft的SQL Server(Microsoft,2014年)为我们提供了一种对于数据分析领域的初学者来说易于理解的方法。如前所述,SQL序列在执行简单分析时具有广泛的用途,但是需要更高级的技术来获取所有信息。在这种情况下,我们将以介绍性的方式分析SQL方法论。

要执行数据挖掘模型,必须定义以下时刻(Microsoft,2014年):

  1. 定义问题准备数据探索数据生成模型探索和验证模型部署和更新模型

但是,此过程不是单向的,而是周期性的。实施模型后,有必要再次执行该过程以确认可以开发新模型。SQL允许执行的数据挖掘往往会改善自身。

定义问题:

如下图所示,数据挖掘过程的第一步是明确定义问题并考虑使用数据的方法来提供问题的答案。(微软,2014年)

准备数据:

数据清除不仅涉及删除无效数据或对缺失值进行插值,还包括寻找数据中的隐藏相关性,识别最准确的数据源以及确定最适合分析的列。(微软,2014年)

探索数据:

通过浏览数据以了解业务问题,可以确定数据集是否包含错误数据,然后可以制定一种策略来纠正问题或对业务的典型行为进行更深入的描述。(Microsoft,2014年)。生成模型:

在处理结构和模型之前,挖掘模型只是一个容器,该容器指定要用于输入的列,要预测的属性以及告诉算法如何处理数据的参数。(微软,2014年)

开发和验证模型:

训练数据集用于构建模型,测试数据集用于通过创建预测查询来检查模型的准确性。(微软,2014年)

实施和更新模型:

挖掘模型进入生产环境后,您可以根据需要执行不同的任务,例如使用预测模型,创建统计查询或创建报告。(微软,2014年)

数据分析的未来

随着社交媒体的发展,具有足够购买力以访问互联网的个人已成为一种无穷无尽的信息来源。当前,用户自己通过Internet外包他们的口味和消费习惯,这使得获取数据变得更加容易。

通过信息系统中的这种控制,公司可以了解每个人的消费习惯,并根据用户提供的信息中显示的内容制作广告。

当前,互联网广告主要基于对个人偏好的个人研究。至关重要的是,数据挖掘的发展必须能够生成不仅识别趋势而且识别个人行为的系统。

论文建议:

提出了以下主题:“数据挖掘:使用面向个人消费者的营销工具”,以便开发数据挖掘工具,该工具可以管理通过社交网络获得的信息,并将其集中在目标广告目标上。

本文的目的是:

  • 数据挖掘的发展营销技术的发展数据分析的技术应用

参考书目

微软。(2014)。SQL Server 2014.从https://msdn.microsoft.com/esmx/library/ms174949(v=sql.120).aspx获得

提示和技巧。(2012)。SQL中的基本语句。取自https://cwflores.wordpress.com/2008/09/11/sentencias-basicas-en-sql/

Vallejos,S。(2006)。东北国立大学。从数据挖掘获得:

exa.unne.edu.ar/informatica/SO/Mineria_Datos_Vallejos.pdf

SQL语句是用于访问数据库的声明性语言,它使您可以指定各种类型的操作。这些句子允许处理代数和关系演算以便检索信息。资料来源:(提示和技巧,2012年)。

下载原始文件

数据挖掘。信息作为无价资产