Logo cn.artbmxmagazine.com

数据挖掘,文字和情感应用

目录:

Anonim

在互联网出现和创建网络之前,大多数交流都是通过口头进行的,其中没有任何对话的证据或证据,但是目前这非常互联网革命带来的差异比什么都重要。

已经创建了以大量工具和过程为代表的计算机系统,人们可以通过这些工具和过程更快,更好地学习。

毫无疑问,在对话中生成的大量数据中发现知识是一个挑战。因此,文本挖掘应运而生,代表了自动文本处理的最新研究领域

在社交网络出现之前,人们不限领域地相互推荐,但是在当今的互联网中,用户可以从各个领域和世界各地的人们中找到意见。

在致力于产品和服务制造的公司方面,分析在Internet上传播的产品和服务的观点已成为当今至关重要的战略。

通过这种方式,公司意识到在优化品牌的社会氛围方面进行的投资与他们生产的产品的性能之间有着非常密切的关系。

数据,文本,情感的挖掘

在互联网出现和创建网络之前,大多数交流都是通过口头进行的,其中没有任何对话的证据或证据,但是目前这非常互联网革命带来的差异比什么都重要。

当前,对话的数据以更快的速度存储,人们和组织参与了信息交换,这是通过电子邮件,虚拟聊天,文本消息,博客和论坛来完成的。

在自然语言处理方面取得的进步代表了对文档进行分析的机会,并且网络使诸如学校之类的地区能够在短时间内呈现出重要的进步。

因此,已经创建了以大量工具和过程为代表的计算机系统,人们可以通过这些工具和过程更快,更好地学习。

数据挖掘是指通过分析大量数据来发现知识的过程。

与教育有关的数据挖掘技术的主要应用是:

  • 个性化系统:通过这些系统,可以从用户那里获取尽可能多的数据,以改善向他们提供的服务推荐系统:它们的有用性体现在为用户提供不同主题方面,这些主题可能感兴趣的是,可以通过将这些概要文件与主题特征进行比较来完成修改系统:是指通过进行必要的修改以改善用户体验来检测需求。错误检测。

文字挖掘

文本挖掘是一门专门用于获取未通过标识文本模式明确定义的信息的学科。

毫无疑问,在对话中产生的大量数据中发现知识是一项挑战,因此,文本挖掘应运而生,并代表了自动文字处理的最新研究领域。

文本挖掘,“被定义为在文本集合中发现有趣的模式的自动过程,这些模式不得在集合中的任何文本中明确显示,而必须通过关联其中几个内容而产生”(Barrio ,2014)

例如,在Twitter上,直到它显然可以指示出感兴趣的主题为止,但是由于数据挖掘,用户可以根据他们的偏好,想法和观点进行分类。(semanticwebbuilder,2016年)。

数据挖掘过程包括以下阶段:

  1. 预处理:在此阶段,文本被转换为某种形式的结构化或半结构化表示形式,从而以某种方式简化了后续分析发现:在此阶段,对中间表示进行了分析,其主要目标是建立感兴趣的模式或知识。

文本挖掘应用

数据挖掘应用程序包括:

  • 信息提取:在网络上可以找到大量文档,文本挖掘可以从大量文本中提取相关信息,并可以定义和关联实体,从而揭示相关信息

通过对文本的管理,定义了实体及其关系,揭示了重要的语义信息,这些信息被用作元数据,同时又被添加到Web内容中,从而有助于理解这些文档。

  • 情感分析或观点挖掘:它是对社交网络用户产生的观点的分析,有助于揭示特定主题的重要信息,从而可以支持商业智能和决策等不同领域客户分类:文档分类:这是促进文档检索和导航的关键方面,因为如果您想从项目开发的不同领域获取信息,这将非常困难,但是要感谢使用挖掘算法可以将文档分组为数据,以便获得描述每个组的信息,以便更轻松地理解每个组。其目的是获得属于特定主题的一组文档的一般描述,这些方法可以分为两类:
    1. 提取摘要:由从文本中提取的信息单元组成的摘要摘要,在这种摘要中,合成信息不一定由文本中包含的信息单元组成。
    知识的提取:通过数据挖掘,可以表示通过知识模型提取的信息。

文本挖掘的挑战

文本挖掘必须面临以下挑战:

  1. 您必须了解生成文本挖掘的不同任务的内容的上下文,因为您必须知道作者是谁,作者所在的地区以及历史时刻,才能理解信息。除了获取信息和寻求获取知识之外,这还意味着将在该区域的不同任务中提取的信息转换为机器可以理解的语言,这是必须分析的大量信息,这可能非常在高效流程方面很难解决,必须定义并行算法以更好地利用当前的计算基础架构。(洛萨达,2016年)。

挖掘感受

在社交网络出现之前,人们不限领域地相互推荐,但是在当今的互联网中,用户可以从各个领域和世界各地的人们中找到意见。

在致力于产品和服务制造的公司方面,分析在Internet上传播的产品和服务的观点已成为当今至关重要的战略。

通过这种方式,公司意识到在优化品牌的社会氛围方面进行的投资与他们生产的产品的性能之间有着非常密切的关系。

分析意见中的感觉是将数据挖掘技术应用于表达情绪的文本上执行的过程。

数据挖掘涉及为特定目的提取数据中隐含的信息,该信息以前是未知的,可能对某些过程有用。

以这种方式,可以理解,数据挖掘准备,探测和探索数据以提取隐藏在其中的信息。

数据挖掘包含旨在提取数据库中隐含的可操作知识的所有技术。

数据挖掘的基础属于人工智能,使用数据挖掘过程提取的模型解决了预测,分类和分割问题的解决方案。

情感挖掘的目标

挖掘情感的主要目的是创建网络工具,以使提取不同社交网络的意见变得更加容易,以便以后对其进行分类。

但是,此工具必须能够提供一种有趣且友好的界面,适合专门针对意见分类的系统培训,并且比简单数据更易于显示结果。

这样,将有可能证明用户意见的重要性以及这些意见如何影响市场或某些产品故障时的普及和整合。(2011年摘录)

采矿历史的一些历史

“意见挖掘”一词首先出现在www会议上发表的一篇文章中 在2003年,由于该出版物的出现,该词在与网络搜索或信息检索密切相关的社区中非常流行。

文章指出,理想意见工具应处理针对既定主题进行的搜索结果。

但是,情感分析一词在2001年的与营销有关的文章中出现了类似的现象,并在以后在这些领域的著作中发表时与计算机世界相关。(洛佩兹,2011年)

结论

数据,文本和情感的挖掘在当今世界中非常重要,因为由于这个原因,可以合成获取和解码Internet上存在的,包含用于数据收集的相关数据的信息的过程。许多公司的决定,以及改善客户服务和产品开发流程的决定。

数据,文本和情感挖掘促进了全世界所有人的活动,并旨在继续突飞猛进。

采矿业面临的最大挑战是获得可靠的数据,并根据其来源对其进行分类,以便为人类的最佳决策获得最佳结果。

书目参考

Barrio,E.(2014年)。文本挖掘,用于分析SIENA中的合作。拉古纳大学。

洛佩兹(Lopez,L.)(2011)。基于情感分析的分类器。IUMA。

Lozada,A.(2016年)。语义webbuilder。从semanticwebbuilder获取。

www.semanticwebbuilder.org.mx/es_mx/swb/Mineria_de_textos_y_sus_aplicaciones

佩拉多,J。(2011)。数据挖掘应用于网络舆情分析中。大学信息学院。

Semanticwebbuilder。(2016)。语义webbuilder。从semanticwebbuilder获取:

wb / Processing_of_Natural_Language_and_Mineria_de_textos

论文提案

观点挖掘及其对跨国公司发展的当前影响。

全球资讯网

下载原始文件

数据挖掘,文字和情感应用