我的AI学习笔记

理解监督学习、无监督学习和强化学习

2025-05-20 机器学习基础

监督学习是利用一组已知类别的样本来训练模型，让模型能够对新的、未知的样本进行分类或预测。就像学生通过带答案的练习题来学习。常见的算法有线性回归、逻辑回归、支持向量机（SVM）等。

2025-05-18 大语言模型

Transformer模型是现代大语言模型（如GPT系列）的基石。其核心是自注意力（Self-Attention）机制，它允许模型在处理序列数据时，能够权衡不同单词的重要性，从而更好地理解上下文关系。这解决了传统RNN模型难以处理长距离依赖的问题。

2025-05-15 计算机视觉

CNN通过模拟人类视觉系统来识别图像。它主要由卷积层、池化层和全连接层组成。卷积层通过滤波器（或称卷积核）提取图像的局部特征（如边缘、角点），池化层则对特征图进行降采样，减少计算量的同时保留关键信息。

2025-05-12 机器学习基础

过拟合指模型在训练集上表现完美，但在未见过的测试集上表现糟糕，因为它学习到了训练数据中的噪声。欠拟合则是模型过于简单，未能捕捉到数据的基本规律。正则化、增加数据量、提前终止等是防止过拟合的常用方法。

2025-05-10 大语言模型

提示工程（Prompt Engineering）是一门指导大语言模型生成高质量输出的艺术。一个好的提示应该清晰、具体，并提供足够的上下文。例如，通过指定角色（“你是一个资深程序员”）、提供示例（Few-shot learning）等方式，可以显著提升模型回答的准确性和相关性。