大模型原理:输入-目标对
大模型原理:预训练目标-因果语言建模(CLM)掩码语言建模(MLM)、下一句预测(NSP)
大模型架构选型:纯编码器、纯解码器与 Encoder-Decoder 区别
python importlib模块(动态导入、查看模块版本号)
大模型原理:BPE分词器 tiktoken的介绍、使用
大模型原理:BPE分词器比较:tokenizers和tiktoken
大模型原理:BPE分词器介绍
大模型原理:控制文本的特殊标记(token)
大模型原理:词汇表、分词器类,将文本转换为词元ID,将词元ID转回文本
大模型原理:文本分词(将输入文本分割为独立的词元)