数据挖掘算法研究

  • 创建于 2015-10-13
  • 1923
Name:数据挖掘算法研究
No.:S081105TL006Semester:秋季学期
Hour:20Credit:1.0
Teacher:刘莹
Introduction:
 
本课程在强调对先进理论学习的同时,还注重理论与实践相结合,使计算机专业研究生深入掌握数据挖掘的科研动向,最新技术,培养研究生的学习能力,开阔眼界,为将来的发展打好基础。
Content:
 
Topic 1: 并行计算基础 (Principles of parallel computing)
并行式和分布式计算技术的必要性和重要性,并行计算环境,并行计算的基本方法,并行计算编程
Topic 2: 分布式计算环境 (Distributed computing)
分布式计算的体系结构、特点,与并行式数据挖掘的相同点、不同点
Topic 3: 高性能数据挖掘技术(High performance data mining techniques)
并行数据挖掘技术的优越性,重要性,SPRINT, 基于SMP的决策树分类,并行K-means,并行关联规则CCPD, CountDist,并行相随模式GSP等
Topic 4: 数据流挖掘(Stream data mining)
数据流的定义,模型,特性,影响数据流挖掘的主要因素,基于K-means的数据流聚类,基于decision tree的数据流分类,frequent mining on multiple time granularities,change detection in streams等
Topic 5: 文本挖掘(Text mining)
文本挖掘与信息检索(information retrieval)的区别,数据结构特性,measures for text retrieval,基于关键字的关联分析,文本分类,文本聚类
Topic 6: 网络挖掘(Web mining)
网络挖掘的特性,网络文档的分类(Web document classification),网络使用挖掘 (Web usage mining)
Topic 7:应用(applications)
信用评分、商务智能、科学模拟计算
Material:
 
References: