什么是数据挖掘?基础知识及其技术。

第四次工业革命的基础将在很大程度上取决于数据(Data)连接(Connectivity)性。能够开发或创建数据挖掘解决方案的分析服务(Analysis Services)将在这方面发挥关键作用。它可以帮助分析和预测针对潜在买家的客户购买行为的结果。(customer purchasing behavior)数据(Data)将成为一种新的自然资源,从这些未分类的数据中提取相关信息的过程将变得非常重要。因此,正确理解数据挖掘这个(Data Mining)术语(term –) 、它的过程和应用可以帮助我们为这个流行语开发一个整体的方法。

数据挖掘基础(Data Mining Basics)及其技术

数据挖掘

数据挖掘,也称为数据中的知识发现(Knowledge Discovery in Data)( KDD ),是关于搜索大型数据存储以发现超出简单分析的模式和趋势。然而,这不是一个单一步骤的解决方案,而是一个多步骤的过程,并且在不同的阶段完成。这些包括:

1] 数据收集和准备

它从数据收集及其适当的组织开始。这有助于显着提高找到可以通过数据挖掘发现的信息的机会

2] 模型构建和评估

数据挖掘过程(mining process)的第二步是各种建模技术的应用。这些用于将参数校准为最佳值。所采用的技术在很大程度上取决于满足各种组织需求和做出决策所需的分析能力。

让我们简要地研究一些数据挖掘技术。发现大多数组织将两种或多种数据挖掘技术结合在一起,形成满足其业务需求的适当流程。

阅读(Read):什么是大数据?

数据挖掘技术

  1. 关联—— (Association – )关联(Association)是广为人知的数据挖掘技术之一。在此基础上,基于同一事务中项目之间的关系破译模式。因此(Hence),它也被称为关系技术(relation technique)。大品牌零售商依靠这种技术来研究客户的购买习惯/偏好。例如,在跟踪人们的购买习惯时,零售商可能会发现顾客在购买巧克力时总是会购买奶油,因此建议他们下次购买巧克力时也可能想购买奶油。
  2. 分类(Classification)——这种数据挖掘技术(data mining technique)与上述不同之处在于它基于机器学习(machine learning)并使用线性规划(Linear programming)决策树(Decision)神经网络(Neural network)等数学技术。在分类中,公司尝试构建可以学习如何将数据项分类的软件。例如,一家公司可以在应用程序中定义一个分类,“给定所有提出从公司辞职的员工的记录,预测未来可能从公司辞职的人数。” 在这种情况下,公司可以将员工的记录分为“离开”和“留下”两类。然后它可以使用它的数据挖掘软件(mining software)将员工分类为之前创建的不同组。
  3. 集群(Clustering)——表现出相似特征的不同(Different)对象通过自动化组合在一个集群中。许多这样的集群被创建为类和对象(具有相似的特征)相应地放置在其中。为了更好地理解这一点,让我们考虑一个图书馆图书管理(book management)的例子。在图书馆中,大量的书籍被完全编目。相同类型的项目一起列出。这使我们更容易找到我们感兴趣的书。同样,通过使用聚类技术(clustering technique),我们可以将具有某种相似性的书籍保存在一个聚类中,并为其分配合适的名称。所以,如果读者想找一本相关的书(book relevant)对他的兴趣,他只需要去那个书架,而不是搜索整个图书馆。因此,聚类技术(clustering technique)定义类并将对象放入每个类中,而在分类技术中,对象被分配到预定义的类中。
  4. 预测(Prediction)——预测是一种数据挖掘技术(data mining technique),通常与其他数据挖掘技术(data mining technique)结合使用。它涉及分析趋势、分类、模式匹配(pattern matching)和关系。通过以适当的顺序(sequence one)分析过去的事件或实例,可以安全地预测未来的事件。例如,如果选择销售作为自变量,而利润(variable and profit)作为依赖于销售的变量,则预测分析技术(prediction analysis technique)可用于销售预测未来利润。然后,根据历史销售和利润数据(sale and profit data),可以绘制一条拟合回归曲线(regression curve),用于利润预测(profit prediction)
  5. 决策树(Decision trees)——在决策树(decision tree)中,我们从一个有多个答案的简单问题开始。每个答案都会导致另一个问题,以帮助对数据进行分类或识别,以便对其进行分类,或者可以根据每个答案进行预测。例如,我们使用以下决策树(decision tree)来确定是否打板球ODI数据挖掘决策树(Data Mining Decision Tree):从根节点(root node)开始,如果天气预报(weather forecast)预测下雨,我们应该避免当天的比赛。或者,如果天气预报(weather forecast)很清楚,我们应该打比赛。

数据挖掘(Data Mining)是各种行业和学科(如通信、保险(Insurance)教育(Education)制造(Manufacturing)银行和零售(Banking and Retail)等)分析工作的核心。因此,在应用不同的技术之前,有关于它的正确信息是必不可少的。



About the author

我是一名 Windows 10 技术人员,多年来一直在帮助个人和企业利用新操作系统。我对 Microsoft Office 有丰富的知识,包括如何为不同的用户自定义外观和个性化应用程序。此外,我知道如何使用 Explorer 应用程序来探索和查找计算机上的文件和文件夹。



Related posts