简介
本课程是黑马程序员出品的AI大模型NLP自然语言处理保姆级系统教程,共计187集,涵盖从文本预处理、词向量、经典序列模型(RNN/LSTM/GRU)、Seq2Seq架构、注意力机制、Transformer完整代码实现,到预训练模型(BERT、GPT、ELMo)以及HuggingFace Transformers库实战的全链路知识。课程以“保姆级”教学为特色,从jieba分词、one-hot编码、Word2Vec、FastText讲起,逐步深入RNN/LSTM/GRU原理及人名分类案例,再到基于GRU的英译法机器翻译项目(含注意力机制),然后完整手写Transformer的每个组件(位置编码、多头注意力、前馈网络、编码器解码器、掩码等),最终搭建完整的Transformer翻译模型。预训练模型部分讲解BERT、GPT、ELMo架构,并使用Transformers库完成文本分类、特征提取、完形填空、阅读理解、NER、文本摘要等任务,以及中文分类、填空、NSP等迁移学习案例。课程包含大量代码演示与项目实战,帮助学员真正掌握从传统NLP到Transformer再到预训练大模型的全栈技能。无论你是NLP初学者、算法工程师,还是希望深入理解Transformer与大模型的开发者,本课程都将是你学习NLP的最佳指南。
各集标题与链接
Day01-01.NLP阶段大纲介绍(理解)
内容小结:介绍课程整体结构、学习路线及NLP阶段的学习目标。
视频链接:点击观看
Day01-02.NLP发展简史介绍(了解)
内容小结:回顾NLP从规则方法到统计学习再到深度学习的发展历程。
视频链接:点击观看
Day01-03.NLP应用场景介绍(了解)
内容小结:介绍NLP在搜索、推荐、客服、机器翻译等领域的实际应用。
视频链接:点击观看
Day01-04.文本预处理的主要模块介绍(理解)
内容小结:讲解文本预处理流程(分词、清洗、标准化、去停用词等)。
视频链接:点击观看
Day01-05.如何创建沙箱及关联PyCharm(掌握)
内容小结:演示创建Python虚拟环境(沙箱)并在PyCharm中配置使用。
视频链接:点击观看
Day01-06.jieba分词_精确模式介绍(掌握)
内容小结:使用jieba的精确模式进行中文分词,适合文本分析。
视频链接:点击观看
Day01-07.jieba分词_全模式介绍(理解)
内容小结:jieba全模式分词,输出所有可能的词语组合。
视频链接:点击观看
Day01-08.jieba分词_搜索引擎模式介绍(掌握)
内容小结:搜索引擎模式分词,在精确模式基础上对长词再次切分。
视频链接:点击观看
Day01-09.jieba分词_繁体字(理解)
内容小结:jieba对繁体中文分词的支持与转换。
视频链接:点击观看
Day01-10.jieba分词_用户自定义词典(理解)
内容小结:加载自定义词典提高特定领域的分词准确率。
视频链接:点击观看
Day01-11.文本预处理_NER和POS解释(理解)
内容小结:介绍命名实体识别(NER)和词性标注(POS)的任务。
视频链接:点击观看
Day01-12.文件张量表示法_one-hot编码介绍(理解)
内容小结:One-hot编码的概念、优缺点及其在NLP中的应用。
视频链接:点击观看
Day01-13.one-hot编码_获取(理解)
内容小结:通过代码实现获取文本的one-hot表示。
视频链接:点击观看
Day01-14.one-hot编码_使用(理解)
内容小结:演示one-hot编码在简单分类任务中的使用。
视频链接:点击观看
Day01-15.one-hot编码_简单实现思路(掌握)
内容小结:手动实现one-hot编码的Python代码。
视频链接:点击观看
Day01-16.word2vec_CBOW原理介绍(理解)
内容小结:Word2Vec的CBOW模型原理,通过上下文预测中心词。
视频链接:点击观看
Day02-01.Word2Vec之SkipGram词向量解释(理解)
内容小结:Skip-Gram模型原理,通过中心词预测上下文。
视频链接:点击观看
Day02-02.FastText_环境搭建(掌握)
内容小结:安装FastText库并配置开发环境。
视频链接:点击观看
Day02-03.FastText_词向量模型的训练和保存(掌握)
内容小结:使用FastText训练词向量模型并保存到文件。
视频链接:点击观看
Day02-04.FastText_加载_查看_模型效果检验(掌握)
内容小结:加载预训练模型,查看词向量并测试相似度。
视频链接:点击观看
Day02-05.FastText_模型参数设定(掌握)
内容小结:讲解FastText训练参数(维度、窗口、学习率等)的影响。
视频链接:点击观看
Day02-06.WordEmbedding和Word2Vec的区别(理解)
内容小结:区分WordEmbedding(广义词嵌入)与Word2Vec(具体算法)。
视频链接:点击观看
Day02-07.WordEmbedding_获取词向量(掌握)
内容小结:使用Gensim加载预训练词向量并获取词的向量表示。
视频链接:点击观看
Day02-08.WordEmbedding_查看词向量的相似性(了解)
内容小结:计算词之间的余弦相似度,找出最相似的词。
视频链接:点击观看
Day02-09.文本分析_标签数据分布查看(理解)
内容小结:对分类数据集进行标签分布可视化,分析类别平衡性。
视频链接:点击观看
Day02-10.扩展_map()函数功能介绍(理解)
内容小结:Python内置map()函数的使用方法及示例。
视频链接:点击观看
Day02-11.文本分析_句子长度分布分析(理解)
内容小结:统计文本数据中句子的长度分布,为序列填充提供依据。
视频链接:点击观看
Day02-12.文本分析_正负样本长度散点分布(理解)
内容小结:用散点图可视化正负样本的句子长度分布差异。
视频链接:点击观看
Day02-13.扩展_chain()函数介绍(理解)
内容小结:itertools.chain()函数用于合并多个可迭代对象。
视频链接:点击观看
Day02-14.文本分析_词汇统计(掌握)
内容小结:统计语料中的词频,绘制高频词表。
视频链接:点击观看
Day02-15.文本分析_高频形容词词云(掌握)
内容小结:使用WordCloud库生成高频形容词的词云图。
视频链接:点击观看
Day02-16.扩展_zip()函数用法解释(理解)
内容小结:zip()函数将多个可迭代对象打包成元组序列。
视频链接:点击观看
Day02-17.文本特征处理_n-gram代码演示(掌握)
内容小结:生成文本的n-gram特征,用于文本分类等任务。
视频链接:点击观看
Day02-18.扩展_如何计算两个文本的相似度(理解)
内容小结:介绍余弦相似度、Jaccard相似度等文本相似度计算方法。
视频链接:点击观看
Day03-01.文本长度规范_代码实现(掌握)
内容小结:对文本序列进行统一长度填充(padding)或截断。
视频链接:点击观看
Day03-02.回译数据增强法介绍(了解)
内容小结:通过将文本翻译成另一种语言再译回原语言来扩充数据。
视频链接:点击观看
Day03-03.RNN模型简介(了解)
内容小结:循环神经网络(RNN)的基本思想及适用场景。
视频链接:点击观看
Day03-04.RNN的分类介绍(掌握)
内容小结:RNN的不同类型(单输入单输出、多输入多输出等)。
视频链接:点击观看
Day03-05.RNN的模型结构(理解)
内容小结:RNN的循环单元、隐藏状态更新公式及时间展开图。
视频链接:点击观看
Day03-06.RNN代码_基础版(掌握)
内容小结:使用PyTorch实现基础RNN模块并前向传播。
视频链接:点击观看
Day03-07.RNN代码_修改句子长度(理解)
内容小结:处理不同长度序列的RNN输入方式。
视频链接:点击观看
Day03-08.RNN代码_修改隐藏层及总结(理解)
内容小结:调整RNN隐藏层维度,总结RNN代码注意事项。
视频链接:点击观看
Day03-09.LSTM模型_原理图解(上)_理解
内容小结:LSTM的门控结构(遗忘门、输入门、输出门)初步介绍。
视频链接:点击观看
Day03-10.LSTM模型_原理图解(下)_理解
内容小结:LSTM的细胞状态更新与门控机制详细推导。
视频链接:点击观看
Day03-11.Bi-LSTM模型_介绍(理解)
内容小结:双向LSTM同时利用过去和未来信息,提升序列建模能力。
视频链接:点击观看
Day03-12.LSTM模型_代码实现(掌握)
内容小结:使用PyTorch实现LSTM层并查看输出。
视频链接:点击观看
Day03-13.GRU模型_原理图解(掌握)
内容小结:门控循环单元(GRU)的结构(更新门、重置门)。
视频链接:点击观看
Day03-14.GRU模型_代码演示(掌握)
内容小结:PyTorch中GRU的使用,与LSTM对比。
视频链接:点击观看
Day03-15. RNN人名分类案例_需求介绍(了解)
内容小结:介绍基于RNN的人名国籍分类任务的数据和评估指标。
视频链接:点击观看
Day03-16.RNN人名分类案例_获取全局字母表和国家名(掌握)
内容小结:从数据中构建所有可能字符的字母表及国家类别列表。
视频链接:点击观看
Day03-17.RNN人名分类案例_读取数据到内存(掌握)
内容小结:加载人名及其对应国籍的数据,存入内存。
视频链接:点击观看
Day03-18.RNN人名分类案例_构建数据集对象(掌握)
内容小结:将数据封装为PyTorch Dataset,支持索引读取。
视频链接:点击观看
Day03-19.RNN人名分类案例_构建数据加载器对象(掌握)
内容小结:使用DataLoader批量加载数据,用于训练。
视频链接:点击观看
Day04-01.扩展_LogSoftmax()函数讲解(理解)
内容小结:LogSoftmax与Softmax的关系,以及数值稳定性优势。
视频链接:点击观看
Day04-02.全球人名分类案例_搭建RNN模型(掌握)
内容小结:定义RNN分类器模型(Embedding+RNN+Linear)。
视频链接:点击观看
Day04-03.全球人名分类案例_测试RNN模型(理解)
内容小结:对RNN模型进行前向传播测试,验证输出形状。
视频链接:点击观看
Day04-04.全球人名分类案例_搭建LSTM和GRU模型(掌握)
内容小结:修改模型使用LSTM或GRU替换RNN。
视频链接:点击观看
Day04-05.全球人名分类案例_测试三种模型(理解)
内容小结:对比RNN、LSTM、GRU在相同数据上的前向传播结果。
视频链接:点击观看
Day04-06.全球人名分类案例_RNN模型训练(掌握)
内容小结:编写训练循环,对RNN模型进行训练并保存最佳模型。
视频链接:点击观看
Day04-07.全球人名分类案例_LSTM模型训练(掌握)
内容小结:训练LSTM模型,观察收敛情况。
视频链接:点击观看
Day04-08.全球人名分类案例_GRU模型训练(掌握)
内容小结:训练GRU模型,对比与RNN/LSTM的性能。
视频链接:点击观看
Day04-09.全球人名分类案例_三种模型可视化(了解)
内容小结:绘制训练损失曲线,直观比较三种模型的效果。
视频链接:点击观看
Day04-10.全球人名分类案例_RNN模型预测(掌握)
内容小结:加载训练好的RNN模型,对新的人名进行国籍预测。
视频链接:点击观看
Day04-11.全球人名分类案例_思路总结(理解)
内容小结:总结人名分类案例的完整流程和关键点。
视频链接:点击观看
Day05-01.注意力机制介绍(了解)
内容小结:注意力机制在NLP中的作用,使模型关注输入中的重要部分。
视频链接:点击观看
Day05-02.注意力机制_QKV简介(理解)
内容小结:介绍Query、Key、Value的概念及在注意力计算中的角色。
视频链接:点击观看
Day05-03.注意力机制_实现步骤介绍(理解)
内容小结:详细讲解注意力计算的过程(得分、softmax、加权求和)。
视频链接:点击观看
Day05-04.Seq2Seq架构_任务介绍(理解)
内容小结:Seq2Seq模型用于序列到序列任务(机器翻译、文本摘要)。
视频链接:点击观看
Day05-05.Seq2Seq架构_加入注意力机制(理解)
内容小结:在Seq2Seq解码器中引入注意力,动态编码源端信息。
视频链接:点击观看
Day05-06.扩展1_普通的Encoder_Decoder框架(理解)
内容小结:基础编码器-解码器结构,不包含注意力。
视频链接:点击观看
Day05-07.扩展2_加入注意力机制的Encoder_Decoder框架(理解)
内容小结:带有注意力机制的编码器-解码器架构图。
视频链接:点击观看
Day05-08.扩展3_注意力概率分布的计算方式(理解)
内容小结:详解注意力权重的计算方法(加性、点积、缩放点积)。
视频链接:点击观看
Day05-09.扩展4_软注意力_硬注意力_自注意力机制简介(理解)
内容小结:区分软注意力(可微分)与硬注意力,以及自注意力的概念。
视频链接:点击观看
Day05-10.常见的注意力计算规则介绍(掌握)
内容小结:列举加性注意力、点积注意力、缩放点积注意力的公式。
视频链接:点击观看
Day05-11.扩展_bmm()函数简介(理解)
内容小结:PyTorch中的批量矩阵乘法(bmm)的用法。
视频链接:点击观看
Day05-12.注意力机制_代码实现(掌握)
内容小结:使用PyTorch实现缩放点积注意力模块。
视频链接:点击观看
Day05-13.注意力机制_测试代码(掌握)
内容小结:测试注意力模块,验证输出形状和梯度。
视频链接:点击观看
Day05-14.注意力机制_参数解释(理解)
内容小结:分析注意力模块中各项参数的意义和影响。
视频链接:点击观看
Day06-01.英译法案例_需求介绍(理解)
内容小结:介绍英译法机器翻译任务的数据集和评估标准。
视频链接:点击观看
Day06-02.英译法案例_如何配置CUDA环境及测试(上)(掌握)
内容小结:配置PyTorch CUDA环境,检查GPU可用性。
视频链接:点击观看
Day06-03.英译法案例_如何配置CUDA环境_实操(掌握)
内容小结:实际安装CUDA和cuDNN,配置PyTorch GPU版本。
视频链接:点击观看
Day06-04.扩展_配置CUDA环境总结(了解)
内容小结:总结CUDA环境配置的常见问题和注意事项。
视频链接:点击观看
Day06-05.英译法案例_数据清洗函数(掌握)
内容小结:实现数据清洗函数,去除无效字符、统一大小写等。
视频链接:点击观看
Day06-06.英译法案例_数据预处理函数(掌握)
内容小结:对句子进行分词、构建词汇表、序列化处理。
视频链接:点击观看
Day06-07.英译法案例_构建数据集对象(掌握)
内容小结:创建PyTorch Dataset类,返回源语言和目标语言的索引序列。
视频链接:点击观看
Day06-08.英译法案例_获取数据加载器对象(掌握)
内容小结:使用DataLoader进行批量数据加载和填充。
视频链接:点击观看
Day06-09.英译法案例_构建基于GRU的编码器(掌握)
内容小结:实现GRU编码器,将输入序列编码为上下文向量。
视频链接:点击观看
Day06-10.英译法案例_测试基于GRU的编码器(理解)
内容小结:前向传播测试编码器,检查输出形状。
视频链接:点击观看
Day06-11.英译法案例_基于GRU的无Attention的解码器_思路分析(理解)
内容小结:分析不带注意力机制的解码器设计思路。
视频链接:点击观看
Day06-12.英译法案例_构建基于GRU解码器(无Attention)(掌握)
内容小结:实现基础GRU解码器,仅依赖编码器最终状态。
视频链接:点击观看
Day06-13.英译法案例_测试基于GRU的无Attention解码器(理解)
内容小结:测试解码器的前向传播,验证Teacher Forcing逻辑。
视频链接:点击观看
Day06-14.英译法案例_基于GRU有Attention的解码器_思路分析(掌握)
内容小结:分析带注意力机制的解码器如何利用编码器所有隐藏状态。
视频链接:点击观看
Day06-15.英译法案例_基于GRU有Attention的解码器_代码实现_上(掌握)
内容小结:编写带注意力的解码器类,实现初始化部分。
视频链接:点击观看
Day06-16.英译法案例_基于GRU有Attention的解码器_代码实现_下(掌握)
内容小结:完成解码器前向传播,集成注意力计算。
视频链接:点击观看
Day07-01.英译法案例_带注意力机制的解码器层_测试代码(理解)
内容小结:测试带注意力的解码器,可视化注意力权重(可选)。
视频链接:点击观看
Day07-02.英译法案例_模型搭建_总结(理解)
内容小结:整合编码器、解码器、注意力模块形成完整Seq2Seq模型。
视频链接:点击观看
Day07-03.Teacher Forcing_教师强制(理解)
内容小结:解释Teacher Forcing训练策略及其优缺点。
视频链接:点击观看
Day07-04.英译法案例_模型训练_单批次(掌握)
内容小结:编写单个batch的训练代码,包括前向、损失计算、反向传播。
视频链接:点击观看
Day07-05.扩展_view()函数演示(理解)
内容小结:PyTorch中view()函数用于改变张量形状的示例。
视频链接:点击观看
Day07-06.英译法案例_模型训练_完整代码(掌握)
内容小结:完成整个训练循环,保存模型权重。
视频链接:点击观看
Day07-07.英译法案例_模型训练_总结(理解)
内容小结:总结英译法训练过程中的关键参数和调优经验。
视频链接:点击观看
Day07-08.英译法案例_模型预测_代码实现(掌握)
内容小结:实现推理函数,使用训练好的模型进行翻译预测。
视频链接:点击观看
Day07-09.英译法案例_模型预测_代码测试(掌握)
内容小结:对测试样本进行翻译,查看输出效果。
视频链接:点击观看
Day07-10.英译法案例_绘制张量图(了解)
内容小结:使用TensorBoard等工具可视化模型训练中的张量变化。
视频链接:点击观看
Day07-11.Transformer框架_由来介绍(了解)
内容小结:Transformer模型提出的背景及其对NLP的变革意义。
视频链接:点击观看
Day07-12.Transformer架构介绍_文字版(理解)
内容小结:文字描述Transformer的编码器-解码器架构。
视频链接:点击观看
Day07-13.Transformer架构图_上(理解)
内容小结:详解Transformer架构图的左半部分(编码器)。
视频链接:点击观看
Day07-14.Transformer架构图_下(理解)
内容小结:详解Transformer架构图的右半部分(解码器及输出)。
视频链接:点击观看
Day08-01.学习Transformer架构的路线(理解)
内容小结:建议的学习顺序:词嵌入→位置编码→注意力→编码器→解码器。
视频链接:点击观看
Day08-02.Transformer架构_词嵌入层代码实现(掌握)
内容小结:实现Transformer的词嵌入层(nn.Embedding)。
视频链接:点击观看
Day08-03.Transformer架构_位置编码层原理介绍(理解)
内容小结:讲解正弦/余弦位置编码的公式及作用。
视频链接:点击观看
Day08-04.Transformer架构_位置编码总结(理解)
内容小结:总结位置编码的设计思想和实现要点。
视频链接:点击观看
Day08-05.Transformer架构_位置编码层_代码实现(掌握)
内容小结:使用PyTorch实现位置编码层。
视频链接:点击观看
Day08-06.Transformer架构_位置编码层_代码测试(理解)
内容小结:测试位置编码输出,观察不同位置的编码差异。
视频链接:点击观看
Day08-07.扩展_上三角矩阵演示(理解)
内容小结:使用triu函数生成上三角掩码矩阵。
视频链接:点击观看
Day08-08.扩展_下三角矩阵演示(理解)
内容小结:使用tril函数生成下三角掩码矩阵。
视频链接:点击观看
Day08-09.扩展_掩码张量的可视化(理解)
内容小结:可视化掩码张量,理解其形状和值。
视频链接:点击观看
Day08-10.扩展_masked_fill()函数介绍(理解)
内容小结:masked_fill()函数用于将掩码位置填充为指定值。
视频链接:点击观看
Day08-11.Transformer架构_注意力机制代码实现及测试(掌握)
内容小结:实现Transformer中的缩放点积注意力,并测试掩码。
视频链接:点击观看
Day08-12.多头注意力机制_原理图(上)_理解
内容小结:多头注意力的并行计算思想,图解多头结构。
视频链接:点击观看
Day08-13.多头注意力机制_原理图(下)_理解
内容小结:多头注意力的输出拼接与线性变换。
视频链接:点击观看
Day08-14.多头注意力机制_代码实现(掌握)
内容小结:实现MultiHeadAttention模块,包含多个注意力头。
视频链接:点击观看
Day08-15.多头注意力机制_代码测试(理解)
内容小结:测试多头注意力模块,验证输出维度。
视频链接:点击观看
Day08-16.前馈全连接层_代码实现及测试(掌握)
内容小结:实现Transformer中的前馈神经网络(FFN)。
视频链接:点击观看
Day09-01.规范化层_代码实现(掌握)
内容小结:实现层归一化(LayerNorm)。
视频链接:点击观看
Day09-02.规范化层_代码测试(理解)
内容小结:测试层归一化的效果。
视频链接:点击观看
Day09-03.扩展_BN和LN的区别(理解)
内容小结:对比批归一化(BatchNorm)与层归一化(LayerNorm)。
视频链接:点击观看
Day09-04.子层结构搭建_代码实现(掌握)
内容小结:实现残差连接子层(Add & Norm)的结构。
视频链接:点击观看
Day09-05.子层结构搭建_代码测试(理解)
内容小结:测试子层结构。
视频链接:点击观看
Day09-06.编码器层_代码实现(掌握)
内容小结:实现单个编码器层(多头注意力+残差+FFN+残差)。
视频链接:点击观看
Day09-07.编码器层_代码测试(理解)
内容小结:测试编码器层的前向传播。
视频链接:点击观看
Day09-08.编码器_代码实现及测试(掌握)
内容小结:堆叠多个编码器层形成完整编码器。
视频链接:点击观看
Day09-09.解码器层_代码实现(掌握)
内容小结:实现单个解码器层(掩码自注意力、交叉注意力、FFN)。
视频链接:点击观看
Day09-10.解码器层_代码测试(理解)
内容小结:测试解码器层。
视频链接:点击观看
Day09-11.解码器_代码实现及测试(掌握)
内容小结:堆叠解码器层形成完整解码器。
视频链接:点击观看
Day09-12.输出部分_代码实现(掌握)
内容小结:实现输出层(线性变换+LogSoftmax)。
视频链接:点击观看
Day09-13.输出部分_代码测试(理解)
内容小结:测试输出模块。
视频链接:点击观看
Day09-14.完整的Transformer架构搭建_上(掌握)
内容小结:组装编码器、解码器、输出层形成完整Transformer模型。
视频链接:点击观看
Day09-15.完整的Transformer架构搭建_下(掌握)
内容小结:完成模型前向传播的编写。
视频链接:点击观看
Day09-16.Transformer架构测试_上(理解)
内容小结:测试模型在随机数据上的前向传播。
视频链接:点击观看
Day09-17.Transformer架构组件介绍(理解)
内容小结:总结Transformer各组件的名称和功能。
视频链接:点击观看
Day09-18.Transformer架构测试_下(理解)
内容小结:使用真实数据测试Transformer模型效果。
视频链接:点击观看
Day10-01.Fasttext_简介及环境搭建(理解)
内容小结:FastText的简介及安装配置。
视频链接:点击观看
Day10-02.Fasttext_哈夫曼树介绍(理解)
内容小结:FastText中利用哈夫曼树进行层次Softmax加速。
视频链接:点击观看
Day10-03.Fasttext_负采样介绍(理解)
内容小结:负采样技术原理及其在FastText中的应用。
视频链接:点击观看
Day10-04.Fasttext_直接训练_代码实现(掌握)
内容小结:使用FastText训练词向量模型。
视频链接:点击观看
Day10-05.Fasttext优化_数据预处理(掌握)
内容小结:对训练数据进行清洗和预处理。
视频链接:点击观看
Day10-06.Fasttext优化_调整训练轮数和学习率(掌握)
内容小结:调整epoch和学习率以获得更好词向量。
视频链接:点击观看
Day10-07.Fasttext优化_调整NGram和损失函数(掌握)
内容小结:使用n-gram特征和不同损失函数优化模型。
视频链接:点击观看
Day10-08.Fasttext优化_自动调参(掌握)
内容小结:利用FastText的自动调参功能找到最佳超参数。
视频链接:点击观看
Day10-09.Fasttext优化_多分类多标签任务(掌握)
内容小结:使用FastText处理多分类和多标签分类任务。
视频链接:点击观看
Day10-10.Fasttext_模型保存和加载(掌握)
内容小结:保存训练好的模型文件并重新加载。
视频链接:点击观看
Day10-11.Fasttext_词向量迁移介绍(理解)
内容小结:将FastText词向量用于其他下游任务的迁移方法。
视频链接:点击观看
Day10-12.迁移学习介绍(理解)
内容小结:迁移学习的概念及其在NLP中的重要性。
视频链接:点击观看
Day10-13.常见的预训练NLP模型介绍(理解)
内容小结:介绍ELMo、GPT、BERT、T5等主流预训练模型。
视频链接:点击观看
Day10-14.Transformers库介绍及环境搭建(理解)
内容小结:HuggingFace Transformers库的安装与基本使用。
视频链接:点击观看
Day10-15.NLP任务_Pipeline方式_文本分类(掌握)
内容小结:使用pipeline快速进行文本分类。
视频链接:点击观看
Day10-16.NLP任务_Pipeline方式_特征提取(掌握)
内容小结:使用pipeline提取文本的特征向量。
视频链接:点击观看
Day10-17.NLP任务_Pipeline方式_完形填空(掌握)
内容小结:使用pipeline完成完形填空(fill-mask)任务。
视频链接:点击观看
Day11-01.pipeline方式_阅读理解任务(理解)
内容小结:使用pipeline进行问答(抽取式阅读理解)。
视频链接:点击观看
Day11-02.pipeline方式_文本摘要任务(理解)
内容小结:使用pipeline生成文本摘要。
视频链接:点击观看
Day11-03.pipeline方式_NER任务(理解)
内容小结:使用pipeline进行命名实体识别(NER)。
视频链接:点击观看
Day11-04.自动模型方式_文本分类任务(掌握)
内容小结:使用AutoModelForSequenceClassification加载预训练模型进行文本分类。
视频链接:点击观看
Day11-05.自动模型方式_特征提取任务(掌握)
内容小结:使用AutoModel提取文本的特征向量。
视频链接:点击观看
Day11-06.自动模型方式_完形填空任务(掌握)
内容小结:使用AutoModelForMaskedLM进行完形填空。
视频链接:点击观看
Day11-07.自动模型方式_阅读理解任务(掌握)
内容小结:使用AutoModelForQuestionAnswering进行抽取式问答。
视频链接:点击观看
Day11-08.自动模型方式_文本摘要任务(理解)
内容小结:使用AutoModelForSeq2SeqLM进行文本摘要。
视频链接:点击观看
Day11-09.自动模型方式_NER任务(理解)
内容小结:使用AutoModelForTokenClassification进行命名实体识别。
视频链接:点击观看
Day11-10.具体模型方式_完形填空任务(掌握)
内容小结:直接使用特定模型类(如BertForMaskedLM)进行完形填空。
视频链接:点击观看
Day11-11.迁移学习_中文分类案例_数据加载(掌握)
内容小结:加载中文分类数据集(如THUCNews)。
视频链接:点击观看
Day11-12.迁移学习_中文分类案例_数据预处理(掌握)
内容小结:对中文文本进行分词、编码、构造Dataset。
视频链接:点击观看
Day12-01.迁移学习_中文分类案例_模型搭建(掌握)
内容小结:使用BERT中文预训练模型搭建分类器。
视频链接:点击观看
Day12-02.迁移学习_中文分类案例_模型训练(掌握)
内容小结:训练BERT中文分类模型。
视频链接:点击观看
Day12-03.迁移学习_中文分类案例_模型评估(掌握)
内容小结:评估模型的准确率、精确率、召回率等。
视频链接:点击观看
Day12-04.迁移学习_中文填空案例_数据预处理(掌握)
内容小结:为完形填空任务准备数据,构造带掩码的句子。
视频链接:点击观看
Day12-05.迁移学习_中文填空案例_模型搭建(掌握)
内容小结:使用BERT进行MLM(掩码语言模型)微调。
视频链接:点击观看
Day12-06.迁移学习_中文填空案例_模型训练(掌握)
内容小结:训练完形填空模型。
视频链接:点击观看
Day12-07.迁移学习_中文填空案例_模型评估(掌握)
内容小结:评估模型预测掩码位置的准确率。
视频链接:点击观看
Day12-08.迁移学习_NSP案例_自定义数据集对象(掌握)
内容小结:为下一句预测(NSP)任务创建自定义数据集。
视频链接:点击观看
Day12-09.迁移学习_NSP案例_数据预处理(掌握)
内容小结:生成正样本(连续句子)和负样本(随机句子)。
视频链接:点击观看
Day12-10.迁移学习_NSP案例_模型搭建(掌握)
内容小结:使用BERT的池化输出加分类层实现NSP。
视频链接:点击观看
Day12-11.迁移学习_NSP案例_模型训练和评估(掌握)
内容小结:训练NSP模型并评估准确率。
视频链接:点击观看
Day12-12.BERT模型介绍(理解)
内容小结:BERT的全称、核心思想和创新点。
视频链接:点击观看
Day12-13.BERT模型架构介绍(理解)
内容小结:BERT的Transformer编码器堆叠、输入表示等。
视频链接:点击观看
Day12-14.BERT预训练任务_MLM和NSP介绍(理解)
内容小结:BERT的两个预训练任务:掩码语言模型(MLM)和下一句预测(NSP)。
视频链接:点击观看
Day12-15.BERT模型总结(理解)
内容小结:总结BERT的优势、局限及后续发展。
视频链接:点击观看
Day12-16.ELMo模型介绍(理解)
内容小结:ELMo(Embeddings from Language Models)的上下文词向量思想。
视频链接:点击观看
Day12-17.GPT模型介绍(理解)
内容小结:GPT(Generative Pre-trained Transformer)的自回归生成能力。
视频链接:点击观看
说明:以上链接可直接点击跳转对应集数观看。
回复