大数据机器学习
大数据机器学习
5万+人选课
更新日期:2024/04/18
开课平台 学堂在线
开课高校 清华大学
开课教师 袁春
学科专业 工学计算机类
开课时间 2024/01/25 - 2024/07/23
课程周期 26 周
开课状态 开课中
每周学时 -
课程简介

《大数据机器学习》课程是面向信息学科的高年级本科生或研究生开设的基础理论课,目的是培养学生深入理解大数据机器学习理论基础,牢固掌握大数据机器学习方法,并能够解决实际问题等综合能力。课程的主要内容包括:统计学习基本理论,机器学习基本方法,深度学习理论和方法。

课程大纲
第一章 概述
1.机器学习定义和典型应用
2.机器学习和人工智能的关系
3.深度学习方法和其它人工智能方法的共性和差异
4.机器学习和数据挖掘的关系
5.机器学习和统计学习的关系
6.机器学习的发展历程
7.大数据机器学习的主要特点
第二章 机器学习基本概念
1机器学习的基本术语
2.监督学习
3.假设空间
4.学习方法三要素
5.奥卡姆剃刀定理
6.没有免费的午餐定理
7.训练误差和测试误差
8.过拟合与模型选择
9.泛化能力
10.生成模型和判别模型
第三章 模型性能评估
1.留出法
2.交叉验证法
3.自助法
4.性能度量
5.PR曲线
6.ROC和AUC曲线
7.代价敏感错误率
8.假设检验
9.T检验
10.偏差和方差
第四章 感知机
1.感知机模型
2.感知机学习策略
3.感知机学习算法
第五章 聚类
1.原型聚类描述
2.性能度量
3.1原型聚类 k均值算法
3.2 原型聚类 学习向量算法
3.3 原型聚类 密度聚类
3.4原型聚类 层次聚类
第六章 贝叶斯分类器及图模型
1.综述
2.概率图模型
3.贝叶斯网络
4.朴素贝叶斯分类器
5.半朴素贝叶斯分类器
6.贝叶斯网络结构学习推断
7.吉布斯采样
第七章 决策树和随机森林
开头
1.决策树模型与学习基本概念
2.信息量和熵
3.决策树的生成
4.决策树的减枝
5.CART算法
6.随机森林
第八章 逻辑斯谛回归与最大熵模型
简介
1.逻辑斯谛回归模型
2.最大熵模型
3.模型学习的最优化方法
第九章 SVM
1.开头
2.SVM简介
3.线性可分支持向量机
4. 凸优化问题的基本概念
5.支持向量的确切定义
6.线性支持向量机
svm相关拓展资料
第十章 核方法与非线性SVM
开头
1.泛函基础知识
2. 核函数和非线性支持向量机
3. 序列最小最优化算法
第十一章 降维与度量学习
开头
1. k近邻学习
2. 降维嵌入
3. 主成分分析
4. 核化线性降维
5. 流型学习和度量学习
第十二章 提升方法
1. 提升方法Adaboost算法
2. Adaboost算法的训练误差分析
3. Adaboost算法的解释
4. Adaboost的实现
adaboost拓展资料
第十三章 EM算法及混合高斯模型
开头
1. 问题提出
2. EM算法的引入
3. EM算法的收敛性
4. EM算法在高斯混合模型学习中的应用
5. EM算法的推广
第十四章 计算学习理论
开头
1. 计算学习理论的基础知识
2. 概率近似正确学习理论
3. 有限假设空间
4. VC维
5. 学习稳定性
第十五章 隐马尔可夫模型
开头
1. 隐马尔科夫模型的基本概念
2. 概率计算算法
3. 学习算法
4预测算法
第十六章 条件随机场
开头
1.概率无向图模型
2.条件随机场的定义与形式
3.条件随机场的计算问题
4.条件随机场的学习算法
5.条件随机场的预测算法
第十七章 概率图模型的学习与推断
开头
1.精确推断法:变量消去法和信念传播法
2.近似推断法:MCMC和变分推断
第十八章 神经网络和深度学习
1.神经网络的发展历程
2.神经网络的基本概念以及常见的神经网络(一)
3.神经网络的基本概念以及常见的神经网络(二)
4.玻尔兹曼机
5.深度学习
第十九章 深度学习正则化方法
1. 深度学习简介和架构设计
2. 计算图形式的反向传播算法
3.深度学习的正则化方法(一)
4.深度学习的正则化方法(二)
第二十章 深度学习优化方法
1.深度学习的优化问题
2.神经网络优化的挑战
3.神经网络的优化算法
4.相关策略
期末考试