Logo cn.artbmxmagazine.com

大数据。分析大量信息

目录:

Anonim

在我们生活的时代,很难想到我们没有互联网的熟人的家,因为此工具将一直存在,而且这是我们是否想要的东西,我们每天都会使用大数据进行各种活动从休闲到与居住在我们以外的亲戚聊天,进行我们的工作活动或进行任何形式的搜索。

通过我们进行的所有这些活动,形成了数量可观的数据,这对于组织而言至关重要,因为它们知道当前正在发生的事情,有关消费者利益或如何进入各种市场的信息。这样可以预测将来会发生什么,很难修复组​​织可以使用此信息进行的所有操作。

在过去,不可能认为组织可以完成上述所有操作,因为尽管已经可以使用计算机,但它们的功能还不够强大。但是随着技术的发展,这已经成为现实,必须感谢大数据,这是本文所基于的中心概念,以便了解其对组织的影响力和范围,因为这大大提高了竞争力,是决策的决定性因素。

如上所述,生成的数据量非常大,使其处理起来很复杂。但是公司几乎需要实时的数据,这就是大数据将成为关键的地方。

关键概念。

下面提到一些关键概念,以便读者可以更好地理解本文。

“它是定量或定性的属性或变量的符号表示形式(数字,字母,算法,空间等)。数据描述了经验事实,事件和制度。它是计算机通过不同方式接收的值或参考,数据表示程序员在解决方案的构造或算法的开发中操纵的信息。“ (维基百科,2018)

“正是这种知识体系,人类才能发展出更好,更健康,更令人愉悦的环境,最重要的是创造舒适的环境来优化生活。” (Definista,2011年)

大数据

“数据集或数据集的组合,其大小(容量),复杂性(可变性)和增长率(速度)使使用传统技术和工具(例如关系数据库和统计数据)难以捕获,管理,处理或分析它们常规或可视化软件包,必须在有用的时间内提供。” (PowerData,2018年)。

大数据的起源

自从发明了书写以来,人类已经存储了各种信息,这一直没有改变,因为如今有了先进的数据捕获系统,它已成为日常但非常重要的过程。

数据估计,未来十年将有40 ZB 世界各地产生的信息,这相当于从世界每个海岸上将每粒沙粒增加五十七倍。

根据Ciampagna(2015)的研究,以下是一些事件,这些事件与互联网的出现共同导致了我们现在所知的大数据。以下是最具代表性的事件:

  • o积累数字信息的成本急剧下降,因此,这种方法现在比在纸上积累便宜。o Google推出了信息搜索引擎,该搜索引擎很快将成为世界上最受欢迎的信息搜索引擎。
    • Michael Lesk预测,数字信息的增长速度将是每年十倍。
  • 一项名为“大数据实时可视化探索”的研究论文首次使用了大数据一词。
  • 创建Web 2.0是一个用户在其中创建自己的信息的网页;创建Hadoop,这是一个具有大数据环境的网站,对用户完全免费。
  • 手机首次在计算机上实现了互联网的出色使用,这导致了持续的连接并增加了数据流量。来自世界各地的CEO进行的一项调查得出的结论是,有88%的人说BIG数据分析对您的组织至关重要。

这些数据是视网膜扫描仪,指纹或更复杂的DNA读取器所包含的数据,这种与安全措施相关的技术,但最终将成为对组织有用的数据,因为它们可能是维护社会安全的要素。

数据转换

由于组织已经捕获了数据(以上一点中讨论的所有方式),因此它们将拥有过多的数据,这可能是因为它们分散了,与其余部分没有太多的相关性。因此,现在继续将它们放置在相同的空间并具有相同的样式。

在此过程的这一部分,提取,转换和加载(ETL)系统将进入,其目的是消除不必要的数据,将重要的数据归为一类,以便为它们提供相同的格式,并将其加载到组织建立的数据库中。

大数据工具

知识工程研究所(Knowledge Engineering Institute)(2016)指出,如今,我们可以找到各种工具来帮助我们开发大数据,以下是当今最常用的工具的一些示例:

Hadoop。

Hadoop是用于处理大数据的典型工具,它是免费使用的,并且被视为存储的标准工作环境,尽管它还分析和处理大量数据,但已被Facebook和Yahoo!等全球组织使用。

Elasticsearch。

它是搜索大量复杂数据的强大工具。

它使我们能够随时分析并查阅大量数据。它可以用于全文本搜索,因为数据是根据标准进行排序的,因此可以非常快速地获取数据。

“借助Elasticsearch,如果需要更多功能,我们可以进行复杂的文本搜索,可视化节点状态并进行扩展而无需太多需求。” (知识工程研究所,2016)

Apache Storm。

该工具目前旨在发挥作用,可以持续处理数据,例如来自社交网络的数据,大量数据(估计每分钟在Facebook上共享约70万条内容) )。

资料分析

组织依靠多种技术来分析其拥有的大量数据,其中最受认可的是:

协会。

使用这种技术,您可以找到由不同变量关联的数据。目的是找到其他变量会发生什么的预测。

一个例子是能够通过电子销售向客户销售与他们消费的产品类似的产品。

数据挖掘。

一组调整统计方法的技术,并存储在数据库中。数据挖掘与其他工具一起寻找大量数据的模式。

组。

您正在寻找的这种类型的工具是生成的大量数据的工具,将其分成较小的部分,以便发现这些数据之间的相似性并了解指出它们的条件。

找到结果之间的相似性并对要分析的数据进行初步评估非常重要。

文字分析。

由于用户生成的大多数数据都是文本,例如电子邮件,互联网搜索等。此过程试图从该数据中删除信息,以便为各种主题建模或预测用户将来的搜索。

最后,我们如何可视化数据?

由于我们具有最终结果,因此在捕获,处理和分析大量数据之后,我们必须找到某种方式将其呈现给最终用户。

各种研究表明,最终用户更喜欢结构良好的演示文稿,比较图显示结果,而不是带有大量数字和简单结论的表格。

可以通过Mondrian平台表示这种情况的一个示例,“它是一个平台,允许通过对已有数据进行的分析来查看信息。借助这个平台,我们尝试覆盖更特定的受众,并且将有限的实用程序作为组织的整体记分卡。” (维基百科,2018)

也是信息图表 在呈现通过数据分析获得的结果时,它们已经成为一种时尚,因为它是一种用于大众接收的视觉有趣,生动而简单的材料。

沃达丰最近创建的工具的示例

在西班牙,更具体地说是在巴塞罗那市,在世界移动通信大会期间,沃达丰为该国中小型企业提供了一种工具,以利用大数据,以便他们可以了解和使用沃达丰消费者生成的数据,并且为他们提供有关其业务未来决策的服务。

沃达丰表示,数据将是完全匿名的,并且数据将涉及他们的行为模式,例如:他们去过的地方,在那里呆了多长时间,通话时间,他们经常访问的互联网页面,购买了什么,安装的移动应用程序等。

91%的西班牙人口通过手机访问互联网。

租用名为“ Vodafone Analytics”的大数据工具的中小型企业将必须每月支付订阅费才能访问所有这些数据。

这些特权信息将使他们可以对某个产品需要多少库存做出更可靠的决策,查看是否可以开设新的分支机构以及针对特定领域的广告活动,等等。

同样,沃达丰指出,它不仅针对该国的中小企业,而且公共机构也可以加入,以便就各种对社会重要的问题做出城市规划,公共交通使用的决策。

它的商业化将有两种变体,一种将直接与组织的需求相关联,另一种将信息按模块放置,每月花费约1,000或1,500欧元。

大数据的重要性

在整个阅读过程中,有可能阅读或推断各种优势,这对组织而言意味着拥有大数据所能提供的一切,但根据PowerData(2018)的具体说明,这些优势对于各种组织面临的各种情况。

旅游。

客户满意并享受他们的逗留是在该领域开展业务的组织成功的关键,但是自满程度并不总是容易量化的,尤其是在组织需要的时候。

使用大数据使这些组织能够分析其客户抛出的数据,对其进行分析并针对特定情况做出判断,因此也许可以在问题为时过早之前避免出现问题。

健康。

在关注客户健康的组织中,大数据可以提供很多。病历,健康计划,获得的保险以及许多其他活动可能很难控制,因为它们充满了对组织最重要的信息。

大数据输入的地方,它将准确快速地分析所有存储的信息,并且可以及时做出对患者的任何诊断或治疗的判断。

行政。

今天,行政部门面临着巨大的挑战:要维持甚至提高质量和生产率,但预算要短。在大数据的帮助下,它可以增加运营,并且管理人员将对组织中进行的所有活动有更广阔的视野。

零售。5

近年来,随着消费者现在期望零售商知道他们想要什么以及何时想要它们,商品的交易方式已经取得了进步。

大数据为从事此类业务的人们提供了强大的支持,因为他们现在掌握了大量有关客户真正想要什么,他们的购买习惯是什么,知道品牌或产品的信息。客户所忠实的客户之一。他们能

5这个概念通常与大量销售有关,但与许多不同的买家有关。(波尔图,

2014)

预测哪些产品将在消费者中流行,或者推荐不同种类的产品。

具有GPS的智能手机或其他外围设备的增加,使组织能够将客户附近的广告定位到客户。这增加了提供服务的组织的利润,并提供了吸引新消费者的可能性。

论文提案。

在Orizaba市的一家中小企业中实施大数据以改善其广告。

目的。

了解消费者的需求,以便中小型企业可以开展促销活动并对其产品做广告,以增加广告。

谢谢。

我感谢我的家人,感谢我的全力支持和推动我一天一天继续前进的努力,感谢Orizaba技术学院向我敞开大门,让我继续在行政工程硕士和Fernando Aguirre博士以及

埃尔南德斯(Hernández)在行政管理基础知识研讨会上用我的知识激发了我的兴趣,以执行每篇分配的文章。

结论。

通过阅读本文,我们已经认识到大数据是一个相对较新的工具,但是对于世界上没有任何事物将是暂时的,因为随着我们今天拥有的大量数据流,它越来越多请求了一些可以使我们获得大数据的方法。

大数据是组织乃至社会管理方式变革的一部分。因此,我认为,这将为人类其他类型的进化奠定基础。

参考书目。

JM Ciampagna(2015年3月4日)。何塞教授的博客。从https://elprofejose.com/2015/03/04/una-breve-historia-sobre-big-data-que-todo-elmundo-deberia-leer/获取

定。(2011年8月23日)。概念定义。从http://concepcióndefinicion.de/tecnologia/获得

IGN集团。(2017年5月2日)。IGN中小型企业的集团管理解决方案。从https://ignsl.es/historia-del-big-data/获得

知识工程研究所。(2016年10月13日)。IIC知识工程研究所。从《 http://www.iic.uam.es/innovacion/her tools-big-data-para-empresa /》获得

MARTÍNEZ,V.(2018年2月27日)。沃达丰为中小企业推出了“大数据”工具,以更好地了解他们的客户。世界 。

PowerData。(2018)。PowerData数据管理专家。从https://www.powerdata.es/big-data获得

维基百科。(2018年2月20日)。维基百科免费的百科全书。从https://es.wikipedia.org/wiki/Dato获得

维基百科。(2018年2月27日)。维基百科,免费的百科全书。从https://es.wikipedia.org/wiki/Macrodatos获得

_________

零字节是信息存储的单位,其符号为ZB,相当于1021个字节。(维基百科,2018)

电子邮件。

通过该过程,组织可以从多个源移动数据,重新格式化和清除数据,然后将其上载到另一个数据库进行分析,或者上载到另一个支持业务流程的操作系统。(维基百科,2018)

它是合成的,解释性的和易于理解的图像和文本的组合,以便在视觉上传达信息以促进信息的传输。(Ofifacil,2018年)

全球定位系统。

大数据。分析大量信息