黑马程序员AI大模型NLP自然语言处理保姆级教程，PyTorch实现Transformer完整代码解析+预训练模型，一套搞定文本分类翻译情感分析等实战项目-AI技术圈

简介

本课程是黑马程序员出品的AI大模型NLP自然语言处理保姆级系统教程，共计187集，涵盖从文本预处理、词向量、经典序列模型（RNN/LSTM/GRU）、Seq2Seq架构、注意力机制、Transformer完整代码实现，到预训练模型（BERT、GPT、ELMo）以及HuggingFace Transformers库实战的全链路知识。课程以“保姆级”教学为特色，从jieba分词、one-hot编码、Word2Vec、FastText讲起，逐步深入RNN/LSTM/GRU原理及人名分类案例，再到基于GRU的英译法机器翻译项目（含注意力机制），然后完整手写Transformer的每个组件（位置编码、多头注意力、前馈网络、编码器解码器、掩码等），最终搭建完整的Transformer翻译模型。预训练模型部分讲解BERT、GPT、ELMo架构，并使用Transformers库完成文本分类、特征提取、完形填空、阅读理解、NER、文本摘要等任务，以及中文分类、填空、NSP等迁移学习案例。课程包含大量代码演示与项目实战，帮助学员真正掌握从传统NLP到Transformer再到预训练大模型的全栈技能。无论你是NLP初学者、算法工程师，还是希望深入理解Transformer与大模型的开发者，本课程都将是你学习NLP的最佳指南。

各集标题与链接

Day01-01.NLP阶段大纲介绍(理解)

内容小结：介绍课程整体结构、学习路线及NLP阶段的学习目标。
视频链接：点击观看

Day01-02.NLP发展简史介绍(了解)

内容小结：回顾NLP从规则方法到统计学习再到深度学习的发展历程。
视频链接：点击观看

Day01-03.NLP应用场景介绍(了解)

内容小结：介绍NLP在搜索、推荐、客服、机器翻译等领域的实际应用。
视频链接：点击观看

Day01-04.文本预处理的主要模块介绍(理解)

内容小结：讲解文本预处理流程（分词、清洗、标准化、去停用词等）。
视频链接：点击观看

Day01-05.如何创建沙箱及关联PyCharm(掌握)

内容小结：演示创建Python虚拟环境（沙箱）并在PyCharm中配置使用。
视频链接：点击观看

Day01-06.jieba分词_精确模式介绍(掌握)

内容小结：使用jieba的精确模式进行中文分词，适合文本分析。
视频链接：点击观看

Day01-07.jieba分词_全模式介绍(理解)

内容小结：jieba全模式分词，输出所有可能的词语组合。
视频链接：点击观看

Day01-08.jieba分词_搜索引擎模式介绍(掌握)

内容小结：搜索引擎模式分词，在精确模式基础上对长词再次切分。
视频链接：点击观看

Day01-09.jieba分词_繁体字(理解)

内容小结：jieba对繁体中文分词的支持与转换。
视频链接：点击观看

Day01-10.jieba分词_用户自定义词典(理解)

内容小结：加载自定义词典提高特定领域的分词准确率。
视频链接：点击观看

Day01-11.文本预处理_NER和POS解释(理解)

内容小结：介绍命名实体识别（NER）和词性标注（POS）的任务。
视频链接：点击观看

Day01-12.文件张量表示法_one-hot编码介绍(理解)

内容小结：One-hot编码的概念、优缺点及其在NLP中的应用。
视频链接：点击观看

Day01-13.one-hot编码_获取(理解)

内容小结：通过代码实现获取文本的one-hot表示。
视频链接：点击观看

Day01-14.one-hot编码_使用(理解)

内容小结：演示one-hot编码在简单分类任务中的使用。
视频链接：点击观看

Day01-15.one-hot编码_简单实现思路(掌握)

内容小结：手动实现one-hot编码的Python代码。
视频链接：点击观看

Day01-16.word2vec_CBOW原理介绍(理解)

内容小结：Word2Vec的CBOW模型原理，通过上下文预测中心词。
视频链接：点击观看

Day02-01.Word2Vec之SkipGram词向量解释(理解)

内容小结：Skip-Gram模型原理，通过中心词预测上下文。
视频链接：点击观看

Day02-02.FastText_环境搭建(掌握)

内容小结：安装FastText库并配置开发环境。
视频链接：点击观看

Day02-03.FastText_词向量模型的训练和保存(掌握)

内容小结：使用FastText训练词向量模型并保存到文件。
视频链接：点击观看

Day02-04.FastText_加载_查看_模型效果检验(掌握)

内容小结：加载预训练模型，查看词向量并测试相似度。
视频链接：点击观看

Day02-05.FastText_模型参数设定(掌握)

内容小结：讲解FastText训练参数（维度、窗口、学习率等）的影响。
视频链接：点击观看

Day02-06.WordEmbedding和Word2Vec的区别(理解)

内容小结：区分WordEmbedding（广义词嵌入）与Word2Vec（具体算法）。
视频链接：点击观看

Day02-07.WordEmbedding_获取词向量(掌握)

内容小结：使用Gensim加载预训练词向量并获取词的向量表示。
视频链接：点击观看

Day02-08.WordEmbedding_查看词向量的相似性(了解)

内容小结：计算词之间的余弦相似度，找出最相似的词。
视频链接：点击观看

Day02-09.文本分析_标签数据分布查看(理解)

内容小结：对分类数据集进行标签分布可视化，分析类别平衡性。
视频链接：点击观看

Day02-10.扩展_map()函数功能介绍(理解)

内容小结：Python内置map()函数的使用方法及示例。
视频链接：点击观看

Day02-11.文本分析_句子长度分布分析(理解)

内容小结：统计文本数据中句子的长度分布，为序列填充提供依据。
视频链接：点击观看

Day02-12.文本分析_正负样本长度散点分布(理解)

内容小结：用散点图可视化正负样本的句子长度分布差异。
视频链接：点击观看

Day02-13.扩展_chain()函数介绍(理解)

内容小结：itertools.chain()函数用于合并多个可迭代对象。
视频链接：点击观看

Day02-14.文本分析_词汇统计(掌握)

内容小结：统计语料中的词频，绘制高频词表。
视频链接：点击观看

Day02-15.文本分析_高频形容词词云(掌握)

内容小结：使用WordCloud库生成高频形容词的词云图。
视频链接：点击观看

Day02-16.扩展_zip()函数用法解释(理解)

内容小结：zip()函数将多个可迭代对象打包成元组序列。
视频链接：点击观看

Day02-17.文本特征处理_n-gram代码演示(掌握)

内容小结：生成文本的n-gram特征，用于文本分类等任务。
视频链接：点击观看

Day02-18.扩展_如何计算两个文本的相似度(理解)

内容小结：介绍余弦相似度、Jaccard相似度等文本相似度计算方法。
视频链接：点击观看

Day03-01.文本长度规范_代码实现(掌握)

内容小结：对文本序列进行统一长度填充（padding）或截断。
视频链接：点击观看

Day03-02.回译数据增强法介绍(了解)

内容小结：通过将文本翻译成另一种语言再译回原语言来扩充数据。
视频链接：点击观看

Day03-03.RNN模型简介(了解)

内容小结：循环神经网络（RNN）的基本思想及适用场景。
视频链接：点击观看

Day03-04.RNN的分类介绍(掌握)

内容小结：RNN的不同类型（单输入单输出、多输入多输出等）。
视频链接：点击观看

Day03-05.RNN的模型结构(理解)

内容小结：RNN的循环单元、隐藏状态更新公式及时间展开图。
视频链接：点击观看

Day03-06.RNN代码_基础版(掌握)

内容小结：使用PyTorch实现基础RNN模块并前向传播。
视频链接：点击观看

Day03-07.RNN代码_修改句子长度(理解)

内容小结：处理不同长度序列的RNN输入方式。
视频链接：点击观看

Day03-08.RNN代码_修改隐藏层及总结(理解)

内容小结：调整RNN隐藏层维度，总结RNN代码注意事项。
视频链接：点击观看

Day03-09.LSTM模型_原理图解(上)_理解

内容小结：LSTM的门控结构（遗忘门、输入门、输出门）初步介绍。
视频链接：点击观看

Day03-10.LSTM模型_原理图解(下)_理解

内容小结：LSTM的细胞状态更新与门控机制详细推导。
视频链接：点击观看

Day03-11.Bi-LSTM模型_介绍(理解)

内容小结：双向LSTM同时利用过去和未来信息，提升序列建模能力。
视频链接：点击观看

Day03-12.LSTM模型_代码实现(掌握)

内容小结：使用PyTorch实现LSTM层并查看输出。
视频链接：点击观看

Day03-13.GRU模型_原理图解(掌握)

内容小结：门控循环单元（GRU）的结构（更新门、重置门）。
视频链接：点击观看

Day03-14.GRU模型_代码演示(掌握)

内容小结：PyTorch中GRU的使用，与LSTM对比。
视频链接：点击观看

Day03-15. RNN人名分类案例_需求介绍(了解)

内容小结：介绍基于RNN的人名国籍分类任务的数据和评估指标。
视频链接：点击观看

Day03-16.RNN人名分类案例_获取全局字母表和国家名(掌握)

内容小结：从数据中构建所有可能字符的字母表及国家类别列表。
视频链接：点击观看

Day03-17.RNN人名分类案例_读取数据到内存(掌握)

内容小结：加载人名及其对应国籍的数据，存入内存。
视频链接：点击观看

Day03-18.RNN人名分类案例_构建数据集对象(掌握)

内容小结：将数据封装为PyTorch Dataset，支持索引读取。
视频链接：点击观看

Day03-19.RNN人名分类案例_构建数据加载器对象(掌握)

内容小结：使用DataLoader批量加载数据，用于训练。
视频链接：点击观看

Day04-01.扩展_LogSoftmax()函数讲解(理解)

内容小结：LogSoftmax与Softmax的关系，以及数值稳定性优势。
视频链接：点击观看

Day04-02.全球人名分类案例_搭建RNN模型(掌握)

内容小结：定义RNN分类器模型（Embedding+RNN+Linear）。
视频链接：点击观看

Day04-03.全球人名分类案例_测试RNN模型(理解)

内容小结：对RNN模型进行前向传播测试，验证输出形状。
视频链接：点击观看

Day04-04.全球人名分类案例_搭建LSTM和GRU模型(掌握)

内容小结：修改模型使用LSTM或GRU替换RNN。
视频链接：点击观看

Day04-05.全球人名分类案例_测试三种模型(理解)

内容小结：对比RNN、LSTM、GRU在相同数据上的前向传播结果。
视频链接：点击观看

Day04-06.全球人名分类案例_RNN模型训练(掌握)

内容小结：编写训练循环，对RNN模型进行训练并保存最佳模型。
视频链接：点击观看

Day04-07.全球人名分类案例_LSTM模型训练(掌握)

内容小结：训练LSTM模型，观察收敛情况。
视频链接：点击观看

Day04-08.全球人名分类案例_GRU模型训练(掌握)

内容小结：训练GRU模型，对比与RNN/LSTM的性能。
视频链接：点击观看

Day04-09.全球人名分类案例_三种模型可视化(了解)

内容小结：绘制训练损失曲线，直观比较三种模型的效果。
视频链接：点击观看

Day04-10.全球人名分类案例_RNN模型预测(掌握)

内容小结：加载训练好的RNN模型，对新的人名进行国籍预测。
视频链接：点击观看

Day04-11.全球人名分类案例_思路总结(理解)

内容小结：总结人名分类案例的完整流程和关键点。
视频链接：点击观看

Day05-01.注意力机制介绍(了解)

内容小结：注意力机制在NLP中的作用，使模型关注输入中的重要部分。
视频链接：点击观看

Day05-02.注意力机制_QKV简介(理解)

内容小结：介绍Query、Key、Value的概念及在注意力计算中的角色。
视频链接：点击观看

Day05-03.注意力机制_实现步骤介绍(理解)

内容小结：详细讲解注意力计算的过程（得分、softmax、加权求和）。
视频链接：点击观看

Day05-04.Seq2Seq架构_任务介绍(理解)

内容小结：Seq2Seq模型用于序列到序列任务（机器翻译、文本摘要）。
视频链接：点击观看

Day05-05.Seq2Seq架构_加入注意力机制(理解)

内容小结：在Seq2Seq解码器中引入注意力，动态编码源端信息。
视频链接：点击观看

Day05-06.扩展1_普通的Encoder_Decoder框架(理解)

内容小结：基础编码器-解码器结构，不包含注意力。
视频链接：点击观看

Day05-07.扩展2_加入注意力机制的Encoder_Decoder框架(理解)

内容小结：带有注意力机制的编码器-解码器架构图。
视频链接：点击观看

Day05-08.扩展3_注意力概率分布的计算方式(理解)

内容小结：详解注意力权重的计算方法（加性、点积、缩放点积）。
视频链接：点击观看

Day05-09.扩展4_软注意力_硬注意力_自注意力机制简介(理解)

内容小结：区分软注意力（可微分）与硬注意力，以及自注意力的概念。
视频链接：点击观看

Day05-10.常见的注意力计算规则介绍(掌握)

内容小结：列举加性注意力、点积注意力、缩放点积注意力的公式。
视频链接：点击观看

Day05-11.扩展_bmm()函数简介(理解)

内容小结：PyTorch中的批量矩阵乘法（bmm）的用法。
视频链接：点击观看

Day05-12.注意力机制_代码实现(掌握)

内容小结：使用PyTorch实现缩放点积注意力模块。
视频链接：点击观看

Day05-13.注意力机制_测试代码(掌握)

内容小结：测试注意力模块，验证输出形状和梯度。
视频链接：点击观看

Day05-14.注意力机制_参数解释(理解)

内容小结：分析注意力模块中各项参数的意义和影响。
视频链接：点击观看

Day06-01.英译法案例_需求介绍(理解)

内容小结：介绍英译法机器翻译任务的数据集和评估标准。
视频链接：点击观看

Day06-02.英译法案例_如何配置CUDA环境及测试(上)(掌握)

内容小结：配置PyTorch CUDA环境，检查GPU可用性。
视频链接：点击观看

Day06-03.英译法案例_如何配置CUDA环境_实操(掌握)

内容小结：实际安装CUDA和cuDNN，配置PyTorch GPU版本。
视频链接：点击观看

Day06-04.扩展_配置CUDA环境总结(了解)

内容小结：总结CUDA环境配置的常见问题和注意事项。
视频链接：点击观看

Day06-05.英译法案例_数据清洗函数(掌握)

内容小结：实现数据清洗函数，去除无效字符、统一大小写等。
视频链接：点击观看

Day06-06.英译法案例_数据预处理函数(掌握)

内容小结：对句子进行分词、构建词汇表、序列化处理。
视频链接：点击观看

Day06-07.英译法案例_构建数据集对象(掌握)

内容小结：创建PyTorch Dataset类，返回源语言和目标语言的索引序列。
视频链接：点击观看

Day06-08.英译法案例_获取数据加载器对象(掌握)

内容小结：使用DataLoader进行批量数据加载和填充。
视频链接：点击观看

Day06-09.英译法案例_构建基于GRU的编码器(掌握)

内容小结：实现GRU编码器，将输入序列编码为上下文向量。
视频链接：点击观看

Day06-10.英译法案例_测试基于GRU的编码器(理解)

内容小结：前向传播测试编码器，检查输出形状。
视频链接：点击观看

Day06-11.英译法案例_基于GRU的无Attention的解码器_思路分析(理解)

内容小结：分析不带注意力机制的解码器设计思路。
视频链接：点击观看

Day06-12.英译法案例_构建基于GRU解码器(无Attention)(掌握)

内容小结：实现基础GRU解码器，仅依赖编码器最终状态。
视频链接：点击观看

Day06-13.英译法案例_测试基于GRU的无Attention解码器(理解)

内容小结：测试解码器的前向传播，验证Teacher Forcing逻辑。
视频链接：点击观看

Day06-14.英译法案例_基于GRU有Attention的解码器_思路分析(掌握)

内容小结：分析带注意力机制的解码器如何利用编码器所有隐藏状态。
视频链接：点击观看

Day06-15.英译法案例_基于GRU有Attention的解码器_代码实现_上(掌握)

内容小结：编写带注意力的解码器类，实现初始化部分。
视频链接：点击观看

Day06-16.英译法案例_基于GRU有Attention的解码器_代码实现_下(掌握)

内容小结：完成解码器前向传播，集成注意力计算。
视频链接：点击观看

Day07-01.英译法案例_带注意力机制的解码器层_测试代码(理解)

内容小结：测试带注意力的解码器，可视化注意力权重（可选）。
视频链接：点击观看

Day07-02.英译法案例_模型搭建_总结(理解)

内容小结：整合编码器、解码器、注意力模块形成完整Seq2Seq模型。
视频链接：点击观看

Day07-03.Teacher Forcing_教师强制(理解)

内容小结：解释Teacher Forcing训练策略及其优缺点。
视频链接：点击观看

Day07-04.英译法案例_模型训练_单批次(掌握)

内容小结：编写单个batch的训练代码，包括前向、损失计算、反向传播。
视频链接：点击观看

Day07-05.扩展_view()函数演示(理解)

内容小结：PyTorch中view()函数用于改变张量形状的示例。
视频链接：点击观看

Day07-06.英译法案例_模型训练_完整代码(掌握)

内容小结：完成整个训练循环，保存模型权重。
视频链接：点击观看

Day07-07.英译法案例_模型训练_总结(理解)

内容小结：总结英译法训练过程中的关键参数和调优经验。
视频链接：点击观看

Day07-08.英译法案例_模型预测_代码实现(掌握)

内容小结：实现推理函数，使用训练好的模型进行翻译预测。
视频链接：点击观看

Day07-09.英译法案例_模型预测_代码测试(掌握)

内容小结：对测试样本进行翻译，查看输出效果。
视频链接：点击观看

Day07-10.英译法案例_绘制张量图(了解)

内容小结：使用TensorBoard等工具可视化模型训练中的张量变化。
视频链接：点击观看

Day07-11.Transformer框架_由来介绍(了解)

内容小结：Transformer模型提出的背景及其对NLP的变革意义。
视频链接：点击观看

Day07-12.Transformer架构介绍_文字版(理解)

内容小结：文字描述Transformer的编码器-解码器架构。
视频链接：点击观看

Day07-13.Transformer架构图_上(理解)

内容小结：详解Transformer架构图的左半部分（编码器）。
视频链接：点击观看

Day07-14.Transformer架构图_下(理解)

内容小结：详解Transformer架构图的右半部分（解码器及输出）。
视频链接：点击观看

Day08-01.学习Transformer架构的路线(理解)

内容小结：建议的学习顺序：词嵌入→位置编码→注意力→编码器→解码器。
视频链接：点击观看

Day08-02.Transformer架构_词嵌入层代码实现(掌握)

内容小结：实现Transformer的词嵌入层（nn.Embedding）。
视频链接：点击观看

Day08-03.Transformer架构_位置编码层原理介绍(理解)

内容小结：讲解正弦/余弦位置编码的公式及作用。
视频链接：点击观看

Day08-04.Transformer架构_位置编码总结(理解)

内容小结：总结位置编码的设计思想和实现要点。
视频链接：点击观看

Day08-05.Transformer架构_位置编码层_代码实现(掌握)

内容小结：使用PyTorch实现位置编码层。
视频链接：点击观看

Day08-06.Transformer架构_位置编码层_代码测试(理解)

内容小结：测试位置编码输出，观察不同位置的编码差异。
视频链接：点击观看

Day08-07.扩展_上三角矩阵演示(理解)

内容小结：使用triu函数生成上三角掩码矩阵。
视频链接：点击观看

Day08-08.扩展_下三角矩阵演示(理解)

内容小结：使用tril函数生成下三角掩码矩阵。
视频链接：点击观看

Day08-09.扩展_掩码张量的可视化(理解)

内容小结：可视化掩码张量，理解其形状和值。
视频链接：点击观看

Day08-10.扩展_masked_fill()函数介绍(理解)

内容小结：masked_fill()函数用于将掩码位置填充为指定值。
视频链接：点击观看

Day08-11.Transformer架构_注意力机制代码实现及测试(掌握)

内容小结：实现Transformer中的缩放点积注意力，并测试掩码。
视频链接：点击观看

Day08-12.多头注意力机制_原理图(上)_理解

内容小结：多头注意力的并行计算思想，图解多头结构。
视频链接：点击观看

Day08-13.多头注意力机制_原理图(下)_理解

内容小结：多头注意力的输出拼接与线性变换。
视频链接：点击观看

Day08-14.多头注意力机制_代码实现(掌握)

内容小结：实现MultiHeadAttention模块，包含多个注意力头。
视频链接：点击观看

Day08-15.多头注意力机制_代码测试(理解)

内容小结：测试多头注意力模块，验证输出维度。
视频链接：点击观看

Day08-16.前馈全连接层_代码实现及测试(掌握)

内容小结：实现Transformer中的前馈神经网络（FFN）。
视频链接：点击观看

Day09-01.规范化层_代码实现(掌握)

内容小结：实现层归一化（LayerNorm）。
视频链接：点击观看

Day09-02.规范化层_代码测试(理解)

内容小结：测试层归一化的效果。
视频链接：点击观看

Day09-03.扩展_BN和LN的区别(理解)

内容小结：对比批归一化（BatchNorm）与层归一化（LayerNorm）。
视频链接：点击观看

Day09-04.子层结构搭建_代码实现(掌握)

内容小结：实现残差连接子层（Add & Norm）的结构。
视频链接：点击观看

Day09-05.子层结构搭建_代码测试(理解)

内容小结：测试子层结构。
视频链接：点击观看

Day09-06.编码器层_代码实现(掌握)

内容小结：实现单个编码器层（多头注意力+残差+FFN+残差）。
视频链接：点击观看

Day09-07.编码器层_代码测试(理解)

内容小结：测试编码器层的前向传播。
视频链接：点击观看

Day09-08.编码器_代码实现及测试(掌握)

内容小结：堆叠多个编码器层形成完整编码器。
视频链接：点击观看

Day09-09.解码器层_代码实现(掌握)

内容小结：实现单个解码器层（掩码自注意力、交叉注意力、FFN）。
视频链接：点击观看

Day09-10.解码器层_代码测试(理解)

内容小结：测试解码器层。
视频链接：点击观看

Day09-11.解码器_代码实现及测试(掌握)

内容小结：堆叠解码器层形成完整解码器。
视频链接：点击观看

Day09-12.输出部分_代码实现(掌握)

内容小结：实现输出层（线性变换+LogSoftmax）。
视频链接：点击观看

Day09-13.输出部分_代码测试(理解)

内容小结：测试输出模块。
视频链接：点击观看

Day09-14.完整的Transformer架构搭建_上(掌握)

内容小结：组装编码器、解码器、输出层形成完整Transformer模型。
视频链接：点击观看

Day09-15.完整的Transformer架构搭建_下(掌握)

内容小结：完成模型前向传播的编写。
视频链接：点击观看

Day09-16.Transformer架构测试_上(理解)

内容小结：测试模型在随机数据上的前向传播。
视频链接：点击观看

Day09-17.Transformer架构组件介绍(理解)

内容小结：总结Transformer各组件的名称和功能。
视频链接：点击观看

Day09-18.Transformer架构测试_下(理解)

内容小结：使用真实数据测试Transformer模型效果。
视频链接：点击观看

Day10-01.Fasttext_简介及环境搭建(理解)

内容小结：FastText的简介及安装配置。
视频链接：点击观看

Day10-02.Fasttext_哈夫曼树介绍(理解)

内容小结：FastText中利用哈夫曼树进行层次Softmax加速。
视频链接：点击观看

Day10-03.Fasttext_负采样介绍(理解)

内容小结：负采样技术原理及其在FastText中的应用。
视频链接：点击观看

Day10-04.Fasttext_直接训练_代码实现(掌握)

内容小结：使用FastText训练词向量模型。
视频链接：点击观看

Day10-05.Fasttext优化_数据预处理(掌握)

内容小结：对训练数据进行清洗和预处理。
视频链接：点击观看

Day10-06.Fasttext优化_调整训练轮数和学习率(掌握)

内容小结：调整epoch和学习率以获得更好词向量。
视频链接：点击观看

Day10-07.Fasttext优化_调整NGram和损失函数(掌握)

内容小结：使用n-gram特征和不同损失函数优化模型。
视频链接：点击观看

Day10-08.Fasttext优化_自动调参(掌握)

内容小结：利用FastText的自动调参功能找到最佳超参数。
视频链接：点击观看

Day10-09.Fasttext优化_多分类多标签任务(掌握)

内容小结：使用FastText处理多分类和多标签分类任务。
视频链接：点击观看

Day10-10.Fasttext_模型保存和加载(掌握)

内容小结：保存训练好的模型文件并重新加载。
视频链接：点击观看

Day10-11.Fasttext_词向量迁移介绍(理解)

内容小结：将FastText词向量用于其他下游任务的迁移方法。
视频链接：点击观看

Day10-12.迁移学习介绍(理解)

内容小结：迁移学习的概念及其在NLP中的重要性。
视频链接：点击观看

Day10-13.常见的预训练NLP模型介绍(理解)

内容小结：介绍ELMo、GPT、BERT、T5等主流预训练模型。
视频链接：点击观看

Day10-14.Transformers库介绍及环境搭建(理解)

内容小结：HuggingFace Transformers库的安装与基本使用。
视频链接：点击观看

Day10-15.NLP任务_Pipeline方式_文本分类(掌握)

内容小结：使用pipeline快速进行文本分类。
视频链接：点击观看

Day10-16.NLP任务_Pipeline方式_特征提取(掌握)

内容小结：使用pipeline提取文本的特征向量。
视频链接：点击观看

Day10-17.NLP任务_Pipeline方式_完形填空(掌握)

内容小结：使用pipeline完成完形填空（fill-mask）任务。
视频链接：点击观看

Day11-01.pipeline方式_阅读理解任务(理解)

内容小结：使用pipeline进行问答（抽取式阅读理解）。
视频链接：点击观看

Day11-02.pipeline方式_文本摘要任务(理解)

内容小结：使用pipeline生成文本摘要。
视频链接：点击观看

Day11-03.pipeline方式_NER任务(理解)

内容小结：使用pipeline进行命名实体识别（NER）。
视频链接：点击观看

Day11-04.自动模型方式_文本分类任务(掌握)

内容小结：使用AutoModelForSequenceClassification加载预训练模型进行文本分类。
视频链接：点击观看

Day11-05.自动模型方式_特征提取任务(掌握)

内容小结：使用AutoModel提取文本的特征向量。
视频链接：点击观看

Day11-06.自动模型方式_完形填空任务(掌握)

内容小结：使用AutoModelForMaskedLM进行完形填空。
视频链接：点击观看

Day11-07.自动模型方式_阅读理解任务(掌握)

内容小结：使用AutoModelForQuestionAnswering进行抽取式问答。
视频链接：点击观看

Day11-08.自动模型方式_文本摘要任务(理解)

内容小结：使用AutoModelForSeq2SeqLM进行文本摘要。
视频链接：点击观看

Day11-09.自动模型方式_NER任务(理解)

内容小结：使用AutoModelForTokenClassification进行命名实体识别。
视频链接：点击观看

Day11-10.具体模型方式_完形填空任务(掌握)

内容小结：直接使用特定模型类（如BertForMaskedLM）进行完形填空。
视频链接：点击观看

Day11-11.迁移学习_中文分类案例_数据加载(掌握)

内容小结：加载中文分类数据集（如THUCNews）。
视频链接：点击观看

Day11-12.迁移学习_中文分类案例_数据预处理(掌握)

内容小结：对中文文本进行分词、编码、构造Dataset。
视频链接：点击观看

Day12-01.迁移学习_中文分类案例_模型搭建(掌握)

内容小结：使用BERT中文预训练模型搭建分类器。
视频链接：点击观看

Day12-02.迁移学习_中文分类案例_模型训练(掌握)

内容小结：训练BERT中文分类模型。
视频链接：点击观看

Day12-03.迁移学习_中文分类案例_模型评估(掌握)

内容小结：评估模型的准确率、精确率、召回率等。
视频链接：点击观看

Day12-04.迁移学习_中文填空案例_数据预处理(掌握)

内容小结：为完形填空任务准备数据，构造带掩码的句子。
视频链接：点击观看

Day12-05.迁移学习_中文填空案例_模型搭建(掌握)

内容小结：使用BERT进行MLM（掩码语言模型）微调。
视频链接：点击观看

Day12-06.迁移学习_中文填空案例_模型训练(掌握)

内容小结：训练完形填空模型。
视频链接：点击观看

Day12-07.迁移学习_中文填空案例_模型评估(掌握)

内容小结：评估模型预测掩码位置的准确率。
视频链接：点击观看

Day12-08.迁移学习_NSP案例_自定义数据集对象(掌握)

内容小结：为下一句预测（NSP）任务创建自定义数据集。
视频链接：点击观看

Day12-09.迁移学习_NSP案例_数据预处理(掌握)

内容小结：生成正样本（连续句子）和负样本（随机句子）。
视频链接：点击观看

Day12-10.迁移学习_NSP案例_模型搭建(掌握)

内容小结：使用BERT的池化输出加分类层实现NSP。
视频链接：点击观看

Day12-11.迁移学习_NSP案例_模型训练和评估(掌握)

内容小结：训练NSP模型并评估准确率。
视频链接：点击观看

Day12-12.BERT模型介绍(理解)

内容小结：BERT的全称、核心思想和创新点。
视频链接：点击观看

Day12-13.BERT模型架构介绍(理解)

内容小结：BERT的Transformer编码器堆叠、输入表示等。
视频链接：点击观看

Day12-14.BERT预训练任务_MLM和NSP介绍(理解)

内容小结：BERT的两个预训练任务：掩码语言模型（MLM）和下一句预测（NSP）。
视频链接：点击观看

Day12-15.BERT模型总结(理解)

内容小结：总结BERT的优势、局限及后续发展。
视频链接：点击观看

Day12-16.ELMo模型介绍(理解)

内容小结：ELMo（Embeddings from Language Models）的上下文词向量思想。
视频链接：点击观看

Day12-17.GPT模型介绍(理解)

内容小结：GPT（Generative Pre-trained Transformer）的自回归生成能力。
视频链接：点击观看

说明：以上链接可直接点击跳转对应集数观看。

📲 申请成为合伙人

简介