简介
本课程是黑马程序员出品的AI大模型必备机器学习系统教程,共计150余集,从机器学习基础概念、经典算法原理到完整实战项目,覆盖K近邻(KNN)、线性回归、逻辑回归、决策树、集成学习(随机森林、AdaBoost、GBDT、XGBoost)、KMeans聚类、朴素贝叶斯等主流算法,并配套鸢尾花分类、手写数字识别、银行信贷、癌症预测、电信用户流失、泰坦尼克号生存预测、红酒品质分类、商品评论情感分析、电力负荷时序预测等丰富实战案例。课程以“算法推导+代码实现+项目落地”为核心,帮助学员系统掌握机器学习建模全流程(特征工程、模型训练、评估调优、部署)。无论你是AI初学者、数据科学爱好者,还是希望系统提升机器学习工程能力的开发者,本课程都将是你进阶AI大模型的必经之路。课程还包含数据挖掘实战、时序预测等进阶内容,真正实现从理论到工业级应用的能力跃迁。
各集标题与链接
机器学习课程导学
内容小结:介绍课程整体结构、学习目标、所需基础知识以及学习路径规划。
视频链接:点击观看
第一章-机器学习概述-01.机器学习_大纲介绍
内容小结:机器学习章节大纲概览,明确学习重点。
视频链接:点击观看
第一章-机器学习概述-02.机器学习_相关概述目录介绍
内容小结:机器学习相关概念概述目录,建立知识框架。
视频链接:点击观看
第一章-机器学习概述-03.机器学习_AI_ML_DL介绍
内容小结:讲解人工智能、机器学习、深度学习三者之间的关系与区别。
视频链接:点击观看
第一章-机器学习概述-04.机器学习_基于规则和模型的介绍
内容小结:对比基于规则的系统与基于模型的机器学习方法。
视频链接:点击观看
第一章-机器学习概述-05.机器学习_应用领域和发展史介绍
内容小结:机器学习在各行业的应用案例以及发展历史脉络。
视频链接:点击观看
第一章-机器学习概述-06.机器学习_名词介绍
内容小结:解释数据集、特征、标签、训练集、测试集等基础名词。
视频链接:点击观看
第一章-机器学习概述-07.机器学习_算法分类
内容小结:监督学习、无监督学习、半监督学习、强化学习的分类与区别。
视频链接:点击观看
第一章-机器学习概述-08.机器学习_建模流程
内容小结:标准机器学习项目流程:数据获取、预处理、特征工程、模型选择、训练、评估、部署。
视频链接:点击观看
第一章-机器学习概述-09.机器学习_特征工程介绍
内容小结:特征工程的重要性及常见方法(归一化、标准化、特征编码、降维等)。
视频链接:点击观看
第一章-机器学习概述-10.上午内容回顾
内容小结:回顾上午所学知识点,巩固记忆。
视频链接:点击观看
第一章-机器学习概述-11.机器学习_模型拟合问题
内容小结:欠拟合、过拟合的概念、原因及解决方案(正则化、增加数据等)。
视频链接:点击观看
第一章-机器学习概述-12.机器学习_环境搭建
内容小结:安装Python、Anaconda、Jupyter及scikit-learn等必要库。
视频链接:点击观看
第一章-机器学习概述-13.KNN算法_简介
内容小结:K近邻算法的基本思想、原理及适用范围。
视频链接:点击观看
第一章-机器学习概述-14.KNN算法_思路分析
内容小结:KNN算法的详细步骤(计算距离、选取K个近邻、投票/平均)。
视频链接:点击观看
第一章-机器学习概述-15.KNN算法_分类思想代码实现
内容小结:使用scikit-learn实现KNN分类器,并测试简单数据集。
视频链接:点击观看
第一章-机器学习概述-16.KNN算法_回归思想代码实现
内容小结:KNN回归的使用方法,预测连续值。
视频链接:点击观看
第二章-KNN算法-01.常用的距离度量方式
内容小结:欧氏距离、曼哈顿距离、闵可夫斯基距离等距离公式。
视频链接:点击观看
第二章-KNN算法-02.特征预处理_归一化
内容小结:Min-Max归一化原理及代码实现。
视频链接:点击观看
第二章-KNN算法-03.特征预处理_标准化
内容小结:Z-score标准化(均值0,方差1)的原理与实现。
视频链接:点击观看
第二章-KNN算法-04.鸢尾花案例_查看数据集
内容小结:加载sklearn内置鸢尾花数据集,了解数据特征和标签。
视频链接:点击观看
第二章-KNN算法-05.鸢尾花案例_数据集可视化
内容小结:使用matplotlib可视化鸢尾花数据的散点图矩阵。
视频链接:点击观看
第二章-KNN算法-06.鸢尾花案例_切分训练集和测试集
内容小结:使用train_test_split划分训练集和测试集。
视频链接:点击观看
第二章-KNN算法-07.鸢尾花案例_模型的评估和预测
内容小结:训练KNN模型,进行预测并计算准确率。
视频链接:点击观看
第二章-KNN算法-08.交叉验证和网格搜索_介绍
内容小结:交叉验证的意义与网格搜索调参的基本概念。
视频链接:点击观看
第二章-KNN算法-09.交叉验证和网格搜索_代码实现
内容小结:使用GridSearchCV对KNN进行超参数调优(如K值选择)。
视频链接:点击观看
第二章-KNN算法-10.手写数字识别_数据集介绍
内容小结:加载digits手写数字数据集,了解图像数据格式。
视频链接:点击观看
第二章-KNN算法-11.手写数字识别_绘制数字
内容小结:将数字图像数据可视化显示。
视频链接:点击观看
第二章-KNN算法-12.手写数字识别_训练和保存模型
内容小结:训练KNN模型并使用joblib保存模型文件。
视频链接:点击观看
第二章-KNN算法-13.手写数字识别_加载和使用模型
内容小结:加载已保存模型对新数据进行预测。
视频链接:点击观看
第二章-KNN算法-14.解决预测错误的Bug
内容小结:排查和修复模型预测时可能出现的维度不匹配等问题。
视频链接:点击观看
第三章-线性回归-01.今日内容大纲介绍
内容小结:线性回归章节学习内容概览。
视频链接:点击观看
第三章-线性回归-02.线性回归简介
内容小结:线性回归的基本形式、假设以及应用场景。
视频链接:点击观看
第三章-线性回归-03.线性回归API_入门
内容小结:使用scikit-learn的LinearRegression进行简单线性回归。
视频链接:点击观看
第三章-线性回归-04.损失函数介绍
内容小结:均方误差(MSE)作为损失函数的推导与意义。
视频链接:点击观看
第三章-线性回归-05.导数_复习
内容小结:复习导数基本概念,为梯度下降打基础。
视频链接:点击观看
第三章-线性回归-06.偏导数_复习
内容小结:偏导数的计算,多变量函数求导。
视频链接:点击观看
第三章-线性回归-07.上午内容回顾
内容小结:回顾上午的线性回归基础内容。
视频链接:点击观看
第三章-线性回归-08.矩阵_复习
内容小结:复习矩阵乘法、转置、逆矩阵等基础知识。
视频链接:点击观看
第三章-线性回归-09.一元线性回归_正规方程法
内容小结:使用正规方程求解一元线性回归参数。
视频链接:点击观看
第三章-线性回归-10.多元线性回归_正规方程法(上)
内容小结:多元线性回归的正规方程推导(上)。
视频链接:点击观看
第三章-线性回归-11.多元线性回归_正规方程法(下)
内容小结:正规方程代码实现及注意事项。
视频链接:点击观看
第三章-线性回归-12.补充_为啥转换时是Xw
内容小结:解释线性回归中矩阵表示法为何是X乘w。
视频链接:点击观看
第三章-线性回归-13.单变量_梯度下降法
内容小结:梯度下降法求解单变量线性回归的参数更新过程。
视频链接:点击观看
第三章-线性回归-14.多变量_梯度下降法
内容小结:多变量梯度下降的向量化实现。
视频链接:点击观看
第四章-线性回归-01.银行信贷案例_梯度下降法
内容小结:使用梯度下降法构建银行信贷预测模型。
视频链接:点击观看
第四章-线性回归-02.梯度下降算法分类
内容小结:批量梯度下降、随机梯度下降、小批量梯度下降的区别。
视频链接:点击观看
第四章-线性回归-03.回归模型_评估方法
内容小结:均方误差(MSE)、平均绝对误差(MAE)、R²分数等评估指标。
视频链接:点击观看
第四章-线性回归-04.正规方程_线性回归对象API介绍
内容小结:sklearn中LinearRegression的详细API参数与使用。
视频链接:点击观看
第四章-线性回归-05.梯度下降_线性回归对象API介绍
内容小结:SGDRegressor随机梯度下降回归器的使用。
视频链接:点击观看
第四章-线性回归-06.代码演示_欠拟合
内容小结:构造欠拟合示例并观察模型表现。
视频链接:点击观看
第四章-线性回归-07.代码演示_正好拟合
内容小结:良好拟合的模型示例。
视频链接:点击观看
第四章-线性回归-08.代码演示_过拟合
内容小结:过拟合的演示(高次多项式回归)。
视频链接:点击观看
第四章-线性回归-09.L1和L2正则化解释
内容小结:L1正则化(Lasso)、L2正则化(Ridge)的原理与效果对比。
视频链接:点击观看
第五章-逻辑回归-01.今日内容大纲介绍
内容小结:逻辑回归章节内容概览。
视频链接:点击观看
第五章-逻辑回归-02.逻辑回归_简介
内容小结:逻辑回归用于二分类问题,输出概率值。
视频链接:点击观看
第五章-逻辑回归-03.逻辑回归_概率相关知识回顾
内容小结:概率基础知识回顾(条件概率、对数几率)。
视频链接:点击观看
第五章-逻辑回归-04.逻辑回归_原理介绍
内容小结:Sigmoid函数、决策边界、损失函数(对数损失)。
视频链接:点击观看
第五章-逻辑回归-05.逻辑回归案例_癌症预测
内容小结:使用逻辑回归对乳腺癌数据集进行良/恶性预测。
视频链接:点击观看
第五章-逻辑回归-06.混淆矩阵及精确率, 召回率, F1值介绍
内容小结:分类评估指标详解:TP、FP、TN、FN,精确率、召回率、F1-score。
视频链接:点击观看
第五章-逻辑回归-07.混淆矩阵_精确率_召回率_F1值_代码演示
内容小结:在癌症预测案例中计算并输出混淆矩阵及各项指标。
视频链接:点击观看
第五章-逻辑回归-08.混淆矩阵_总结
内容小结:总结分类评估指标的使用场景。
视频链接:点击观看
第五章-逻辑回归-09.ROC曲线和AUC指标介绍(了解)
内容小结:ROC曲线含义、AUC面积的意义。
视频链接:点击观看
第五章-逻辑回归-10.ROC曲线_案例(了解)
内容小结:绘制ROC曲线并计算AUC值。
视频链接:点击观看
第六章-决策树-01.逻辑回归_电信用户流失预测_数据预处理
内容小结:电信用户流失数据集加载与预处理(缺失值、编码)。
视频链接:点击观看
第六章-决策树-02.逻辑回归_电信用户流失预测_数据可视化
内容小结:对预处理后的数据进行可视化探索。
视频链接:点击观看
第六章-决策树-03.逻辑回归_电信用户流失预测_模型训练预测评估
内容小结:训练逻辑回归模型,预测流失并评估。
视频链接:点击观看
第六章-决策树-04.决策树_简介
内容小结:决策树算法的基本思想(树形结构、if-then规则)。
视频链接:点击观看
第六章-决策树-05.决策树_信息熵简介
内容小结:信息熵的定义、计算公式及物理意义。
视频链接:点击观看
第六章-决策树-06.决策树_信息增益计算
内容小结:信息增益的计算方法(ID3算法核心)。
视频链接:点击观看
第六章-决策树-07.ID3决策树_搭建
内容小结:手写ID3决策树构建过程。
视频链接:点击观看
第六章-决策树-08.上午内容回顾
内容小结:回顾决策树上午内容。
视频链接:点击观看
第六章-决策树-09.C4.5树_信息增益率
内容小结:C4.5算法使用信息增益率作为分裂准则。
视频链接:点击观看
第六章-决策树-10.Cart树原理介绍
内容小结:CART树(分类与回归树)基于基尼指数或MSE的分裂准则。
视频链接:点击观看
第六章-决策树-11.三种决策树总结
内容小结:对比ID3、C4.5、CART的异同与适用场景。
视频链接:点击观看
第六章-决策树-12.泰坦尼克号案例_数据集介绍
内容小结:泰坦尼克号乘客数据字段含义与任务目标。
视频链接:点击观看
第六章-决策树-13.泰坦尼克号案例_代码演示
内容小结:使用决策树(CART)预测乘客生存情况,并进行特征工程。
视频链接:点击观看
第六章-决策树-14.CART决策树_回归用法
内容小结:使用CART决策树解决回归问题。
视频链接:点击观看
第七章-集成学习-01.回归决策树和线性回归对比
内容小结:对比决策树回归与线性回归的效果差异。
视频链接:点击观看
第七章-集成学习-02.决策树_剪枝介绍
内容小结:预剪枝和后剪枝的方法与作用。
视频链接:点击观看
第七章-集成学习-03.集成学习_大纲介绍
内容小结:集成学习章节内容概览。
视频链接:点击观看
第七章-集成学习-04.集成学习_简介
内容小结:集成学习通过组合多个弱学习器提升性能。
视频链接:点击观看
第七章-集成学习-05.集成学习_Bagging和Boosting思想介绍
内容小结:Bagging(并行)与Boosting(串行)的核心思想对比。
视频链接:点击观看
第七章-集成学习-06.Bagging思想_随机森林算法介绍
内容小结:随机森林的原理(Bagging+随机特征选择)。
视频链接:点击观看
第七章-集成学习-07.随机森林API_泰坦尼克号案例
内容小结:使用RandomForestClassifier对泰坦尼克号数据进行分类。
视频链接:点击观看
第七章-集成学习-08.Boosting思想_AdaBoost自适应提升树介绍
内容小结:AdaBoost算法通过调整样本权重迭代训练弱分类器。
视频链接:点击观看
第七章-集成学习-09.AdaBoost算法_推导过程
内容小结:AdaBoost权重更新公式与弱分类器权重的数学推导。
视频链接:点击观看
第七章-集成学习-10.AdaBoost算法_葡萄酒案例
内容小结:使用AdaBoost对葡萄酒数据集进行分类。
视频链接:点击观看
第七章-集成学习-11.GBDT算法_梯度提升树介绍
内容小结:GBDT通过拟合残差进行迭代提升。
视频链接:点击观看
第七章-集成学习-12.GBDT算法_推导过程
内容小结:GBDT梯度提升的数学推导。
视频链接:点击观看
第七章-集成学习-13.GBDT算法_泰坦尼克号案例
内容小结:使用GradientBoostingClassifier预测泰坦尼克号生存情况。
视频链接:点击观看
第八章-KMeans算法-01.XGBoost极限梯度提升树_简介
内容小结:XGBoost的特点与优势(正则化、并行计算等)。
视频链接:点击观看
第八章-KMeans算法-02.XGBoost极限梯度提升树_推导
内容小结:XGBoost目标函数的二阶泰勒展开与分裂增益计算。
视频链接:点击观看
第八章-KMeans算法-03.XGBoost API介绍
内容小结:xgboost库的安装与基本API使用。
视频链接:点击观看
第八章-KMeans算法-04.XGBoost案例_红酒品质分类_数据预处理
内容小结:加载红酒品质数据集,进行标准化等预处理。
视频链接:点击观看
第八章-KMeans算法-05.XGBoost案例_红酒品质分类_模型训练
内容小结:训练XGBoost分类模型。
视频链接:点击观看
第八章-KMeans算法-06.XGBoost案例_红酒品质分类_模型评测
内容小结:评估模型性能,输出分类报告。
视频链接:点击观看
第八章-KMeans算法-07.朴素贝叶斯_简介
内容小结:朴素贝叶斯的基本原理(贝叶斯定理+特征条件独立假设)。
视频链接:点击观看
第八章-KMeans算法-08.商品评论情感分析_思路分析
内容小结:使用朴素贝叶斯进行文本情感分类的流程。
视频链接:点击观看
第八章-KMeans算法-09.商品评论情感分析_数据预处理
内容小结:文本分词、去停用词、构建词袋模型。
视频链接:点击观看
第八章-KMeans算法-10.商品评论情感分析_模型训练和预测
内容小结:训练朴素贝叶斯模型并进行情感预测。
视频链接:点击观看
第八章-KMeans算法-11.聚类算法_简介
内容小结:无监督学习中的聚类任务及KMeans算法基本思想。
视频链接:点击观看
第八章-KMeans算法-12.聚类算法_API初识
内容小结:使用sklearn的KMeans对简单数据聚类。
视频链接:点击观看
第八章-KMeans算法-13.聚类算法_推导流程
内容小结:KMeans算法的数学推导(各点分配、质心更新)。
视频链接:点击观看
第九章-数据挖掘实战项目-01.聚类算法评估指标_SSE介绍
内容小结:误差平方和(SSE)作为聚类内部评估指标。
视频链接:点击观看
第九章-数据挖掘实战项目-02.聚类算法评估指标_SSE代码实现
内容小结:计算KMeans聚类结果的SSE值。
视频链接:点击观看
第九章-数据挖掘实战项目-03.聚类算法评估指标_sc, ch轮廓系数介绍
内容小结:轮廓系数(Silhouette Coefficient)与Calinski-Harabasz指数。
视频链接:点击观看
第九章-数据挖掘实战项目-04.sc, ch轮廓系数_代码演示
内容小结:计算轮廓系数并选择最佳K值。
视频链接:点击观看
第九章-数据挖掘实战项目-05.用户分群_求解最优K值
内容小结:使用肘部法(Elbow)结合轮廓系数确定最佳聚类数。
视频链接:点击观看
第九章-数据挖掘实战项目-06.用户分群_代码实现
内容小结:对用户消费数据进行聚类分群,并分析各群特征。
视频链接:点击观看
第九章-数据挖掘实战项目-07.时序数据介绍
内容小结:时间序列数据的特点与常见分析任务。
视频链接:点击观看
第九章-数据挖掘实战项目-08.时序数据分类介绍
内容小结:时序预测、分类、聚类等不同类型任务。
视频链接:点击观看
第九章-数据挖掘实战项目-09.时序预测_算法介绍
内容小结:常用的时序预测模型(ARIMA、Prophet、LSTM、XGBoost等)。
视频链接:点击观看
第九章-数据挖掘实战项目-10.电力负荷预测案例_背景介绍
内容小结:电力负荷预测项目的业务背景与目标。
视频链接:点击观看
第九章-数据挖掘实战项目-11.电力负荷预测案例_项目搭建
内容小结:创建项目目录结构,配置开发环境。
视频链接:点击观看
第九章-数据挖掘实战项目-12.电力负荷预测案例_日志功能介绍
内容小结:集成日志记录模块,便于调试。
视频链接:点击观看
第九章-数据挖掘实战项目-13.电力负荷预测案例_数据预处理
内容小结:电力负荷数据的缺失值处理、格式转换。
视频链接:点击观看
第九章-数据挖掘实战项目-14.电力负荷预测案例_定义电力负荷模型类
内容小结:封装预测模型类,统一训练和预测接口。
视频链接:点击观看
第九章-数据挖掘实战项目-15.电力负荷预测案例_查看数据整体和各小时负荷分布
内容小结:可视化整体负荷以及各小时平均负荷。
视频链接:点击观看
第九章-数据挖掘实战项目-16.电力负荷案例_按照月份_假日可视化数据
内容小结:按月、按是否为假日分组可视化负荷变化。
视频链接:点击观看
第九章-数据挖掘实战项目-17.电力负荷案例_特征工程_添加小时和月份字段
内容小结:从时间戳中提取小时、月份等周期性特征。
视频链接:点击观看
第九章-数据挖掘实战项目-18.电力负荷案例_特征工程_添加上n小时(窗口字段)
内容小结:构造滑动窗口特征(过去n小时的负荷值)。
视频链接:点击观看
第九章-数据挖掘实战项目-19.电力负荷案例_特征工程_昨日同时刻负荷
内容小结:加入前一天相同时刻的负荷作为特征。
视频链接:点击观看
第九章-数据挖掘实战项目-20.电力负荷案例_模型训练_评估_保存
内容小结:训练XGBoost回归模型,评估MSE/R²,保存模型。
视频链接:点击观看
第九章-数据挖掘实战项目-21.电力负荷案例_预测类代码实现
内容小结:实现预测类,加载模型对新数据进行预测。
视频链接:点击观看
第九章-数据挖掘实战项目-22.电力负荷案例_解析预测特征(上)
内容小结:对预测期的时间特征进行构造(上)。
视频链接:点击观看
第九章-数据挖掘实战项目-23.电力负荷案例_解析预测特征(下)
内容小结:完成预测特征工程,准备输入模型。
视频链接:点击观看
第九章-数据挖掘实战项目-24.电力负荷案例_结果展示
内容小结:可视化真实负荷与预测负荷对比。
视频链接:点击观看
第九章-数据挖掘实战项目-25.电力负荷案例_扩展思路
内容小结:探讨模型改进方向(更多特征、深度学习等)。
视频链接:点击观看
【课程完结】
内容小结:课程总结,鼓励学员继续深入学习与实践。
视频链接:点击观看
说明:以上链接可直接点击跳转对应集数观看。课程共130集,从导学到完结按顺序编排。
回复