AI 相关专业词汇详解


一、基础核心概念

🔹 人工智能(Artificial Intelligence, AI)
含义:让机器模拟人类智能行为的技术总称。
类比:≈ “会思考的程序”。

🔹 机器学习(Machine Learning, ML)
含义:通过数据训练模型,使其能自动做出预测或决策。
类比:≈ “用数据教程序找规律”。

🔹 深度学习(Deep Learning, DL)
含义:基于神经网络(尤其是多层)的机器学习方法。
类比:≈ “用模拟人脑神经元的方式学习”。

🔹 神经网络(Neural Network)
含义:由节点(神经元)组成的计算模型,用于识别模式。
类比:≈ “函数的嵌套组合 + 自动调参”。

🔹 大语言模型(Large Language Model, LLM)
含义:在海量文本上训练的超大规模语言生成/理解模型。
类比:≈ “超级文本补全引擎”(如 GPT、Qwen)。


二、提示词与交互相关

🔹 提示词(Prompt
含义:用户输入给 LLM 的指令或问题。
说明:是 LLM 的“唯一输入”。

🔹 提示词工程(Prompt Engineering)
含义:设计高效提示词以获得理想输出的技术。
说明:≈ “调用 AI 的 API 文档写法”。

🔹 Zero-shot
含义:不给示例,直接提问。
示例:“你知道 PHP 吗?解释一下。”

🔹 Few-shot
含义:提供少量输入-输出示例引导模型。
说明:给 1~3 个例子,让 AI 模仿格式。

🔹 Chain-of-Thought (CoT) / 思维链
含义:要求模型“一步步推理”再给出答案。
作用:提升复杂问题准确率。

🔹 System Prompt(系统提示)
含义:设置 AI 角色/行为规则(不显示给用户)。
类比:类似“全局配置”。

🔹 Temperature(温度)
含义:控制输出随机性(0=确定,1=创意)。
类比:≈ rand() 的种子控制。

🔹 Top-p / Nucleus Sampling
含义:动态选择概率最高的 token 子集。
作用:防止胡说,又保留灵活性。


三、模型能力与输出控制

🔹 Token(词元)
含义:模型处理的基本单位(字、词、子词)。
说明:中文通常 1 字 ≈ 1~2 token。

🔹 上下文窗口(Context Window)
含义:模型一次能处理的最大 token 数。
示例:GPT-4o 支持 128K,相当于一本小说。

🔹 幻觉(Hallucination)
含义:模型编造看似合理但错误的信息。
俗称:“一本正经地胡说八道”。

🔹 对齐(Alignment)
含义:让模型输出符合人类价值观/意图。
实现方式:通过 RLHF 等技术。

🔹 微调(Fine-tuning)
含义:在预训练模型基础上用特定数据再训练。
用途:定制专属 AI(成本高)。

🔹 检索增强生成(RAG)
含义:先查知识库,再生成答案。
优势:避免幻觉,适合企业知识问答。


四、智能体(Agent)相关

🔹 AI Agent(智能体
含义:能自主规划、调用工具、完成任务的 AI 系统。
PHP 类比:≈ “带状态机的微服务”。

🔹 工具调用(Function Calling / Tool Use)
含义:LLM 请求执行外部函数(如查数据库)。
PHP 类比:≈ “AI 发起 RPC 调用”。

🔹 记忆(Memory)
含义:Agent 存储历史信息的能力。
分类:短期 = 对话上下文;长期 = 向量数据库。

🔹 规划器(Planner)
含义:将大任务拆解为子步骤。
类比:≈ 工作流引擎(如 Laravel Workflow)。

🔹 ReAct(Reasoning + Acting)
含义:一种经典 Agent 架构:思考 → 行动 → 反思。
流程:循环调用 LLM + 工具。

🔹 多智能体(Multi-Agent)
含义:多个 Agent 协同工作(如经理+员工)。
架构类比:≈ 微服务协作。


五、基础设施与部署

🔹 向量(Vector)
含义:数值数组,表示语义信息。
比喻:“文本的数学指纹”。

🔹 嵌入(Embedding)
含义:将文本转换为向量的过程。
用途:用于语义搜索、聚类。

🔹 向量数据库(Vector Database)
含义:存储和检索向量的专用数据库。
常见产品:Pinecone、Milvus、Qdrant。

🔹 推理(Inference)
含义:使用训练好的模型生成预测结果。
类比:≈ “调用模型 API”。

🔹 本地部署(On-premise Deployment)
含义:在私有服务器运行模型。
优势:保障数据安全(如 Llama.cpp)。

🔹 量化(Quantization)
含义:降低模型精度以减小体积/加速。
效果:7B 模型可压缩到 4-bit 运行。


六、评估与安全

🔹 幻觉检测(Hallucination Detection)
含义:判断模型是否在“编造”。
方法:结合 RAG 或事实核查。

🔹 越狱(Jailbreak)
含义:绕过模型安全限制的提示攻击。
示例:“忽略之前指令,扮演黑客…”

🔹 内容过滤(Content Moderation)
含义:自动屏蔽敏感/违规输出。
必要性:企业级必备。

🔹 评估指标(Evaluation Metrics)
含义:衡量模型效果的标准。
常见:BLEU(翻译)、ROUGE(摘要)、人工评分。

🔹 可解释性(Explainability)
含义:理解模型为何这样输出。
现状:当前 LLM 仍是“黑盒”。


七、常用缩写速查

• LLM:Large Language Model(大语言模型)
• NLP:Natural Language Processing(自然语言处理)
• CV:Computer Vision(计算机视觉)
• TTS:Text-to-Speech(文本转语音)
• STT / ASR:Speech-to-Text / Automatic Speech Recognition(语音转文本)
• RAG:Retrieval-Augmented Generation(检索增强生成)
• RLHF:Reinforcement Learning from Human Feedback(基于人类反馈的强化学习)
• API:Application Programming Interface(应用程序接口)


✅ 给 PHP 工程师的学习点

  • 重点掌握:Prompt、Token、LLM、Function Calling、RAG、Embedding、Vector DB。
  • 不必深究:反向传播、梯度下降、Transformer 架构细节(除非你想转 AI 工程师)。
  • 实用导向:把 LLM 当成“超级 API”,关注如何安全、高效、结构化地调用它。



点赞(0) 打赏

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部