OpenI 启智社区

启智社区,确实给力

当前位置:首页 > 学习 > 实训 >

数据挖掘

数据挖掘

  • 来源:国防科技大学
  • 章节:4 单元:16

  • 丁兆云_nudt

  • 周鋆

  • 唐九阳

  • 沈大勇

  • 朱先强

  • 刘毅

  • 人工智能组
进入实训课程

课程简介:

近年来,数据挖掘引起了信息产业界的极大关注,其主要原因是存在大量数据,可以广泛使用,并且迫切需要将这些数据转换成有用的信息和知识。获取的信息和知识可以广泛用于各种应用,包括商务管理,生产控制,市场分析,工程设计和科学探索等。
课程理论学习请登录中国大学MOOC:https://www.icourse163.org/course/NUDT-1461782176
课程学习教材:《数据挖掘原理与应用》,丁兆云等著,机械工业出版社,2022.01。
数据挖掘是人工智能和数据库领域研究的热点问题,所谓数据挖掘是指从数据库的大量数据中揭示出隐含的、先前未知的并有潜在价值的信息的非平凡过程。数据挖掘是一种决策支持过程,它主要基于人工智能、机器学习、模式识别、统计学、数据库、可视化技术等,高度自动化地分析企业的数据,作出归纳性的推理,从中挖掘出潜在的模式,帮助决策者调整市场策略,减少风险,作出正确的决策。
本课程全面介绍数据挖掘的原理、算法和分类。主要内容包括数据挖掘的基本概念、数据预处理过程、数据挖掘算法和数据挖掘分类,包括对KNN、SVM、Bagging、随机森林、Boosting等分类器的案例介绍以及可视化。




>图片来源于网络

课程章节:

初识数据挖掘

本章节将介绍贝叶斯分类和特征选择,以贝叶斯分类作为数据挖掘分类实践任务的起点,开启数据挖掘的学习。

数据预处理

数据预处理是指在对数据进行数据挖掘之前,先对原始数据进行必要的清洗、集成、转换、离散和规约等一系列的处理工作,已达到挖掘算法进行知识获取研究所要求的最低规范和标准。通常数据预处理包括:数据清洗、数据集成、数据变换、数据规约等。 本章节将对数据操作预处理过程,包括数据清洗、数据转换、数据降维。

数据挖掘算法

数据挖掘算法是根据数据创建数据挖掘模型的一组试探法和计算。 为了创建模型,算法将首先分析提供的数据,并查找特定类型的模式和趋势。 本章节将介绍数据挖掘的常用算法,包括线性回归、基础聚类、密度聚算法等。

数据挖掘分类

数据分类是一个两阶段过程,包括学习阶段构建分类模型和分类阶段使用模型预测给定数据的类标号。 分类是一种重要的数据分析形式,它提取刻画重要数据类的模型,这种模型称为分类器,预测分类的(离散的、无序的)类标号。 本章节将介绍数据挖掘中用到的分类器,包括KNN、SVM、神经网络、随机森林、Boosting、Bagging、GBDT。