跳到主要内容

人工智能术语表

本术语表收录了人工智能、数据工程、数据科学和机器学习领域内的常用术语,帮助您更好地理解相关概念。

快速导航

A | B | C | D | E | F | I | K | L | M | N | P | R | S | T | V | W | X | Y


A

AI Agent(AI 智能体)

AI Agent 是一种具备自主决策能力的智能系统,能够在复杂环境中独立执行任务。它通过感知环境状态、分析信息并做出决策来实现目标。AI Agent 的核心特征包括:

  • 环境感知与反馈:能够实时感知环境变化,根据反馈调整行为策略
  • 自主推理能力:具备内部对话机制,能够进行逻辑推理和决策
  • 任务规划:自动生成和管理任务列表,制定执行计划
  • 适应性学习:在执行过程中不断学习和优化,提高任务完成效率

AI 幻觉(AI Hallucination)

AI 幻觉是指人工智能系统生成看似合理但实际不准确或完全虚构的内容的现象。这是当前大语言模型面临的主要挑战之一:

  • 训练数据局限:当模型遇到训练数据中未覆盖的问题时,可能生成错误信息
  • 过度自信:模型对不确定的答案表现出过高的置信度
  • 上下文理解偏差:对复杂或模糊的上下文理解不完整,导致错误推理
  • 知识边界模糊:模型无法准确识别自身知识的边界,在不确定时仍给出答案

AI 数据库(AI Database)

AI 数据库是专门为人工智能应用优化的数据存储和管理系统,与传统数据库相比具有独特的设计理念:

  • 向量数据支持:原生支持高维向量数据的存储、索引和检索
  • 相似度搜索优化:内置高效的相似度搜索算法,支持语义检索
  • AI 模型集成:提供与机器学习框架的无缝集成接口
  • 大规模处理能力:针对 AI 应用的大数据量特点进行性能优化

认证授权(Authentication & Authorization)

认证授权是信息系统安全的基础,确保只有合法用户能够访问相应的系统资源:

  • 身份验证机制:通过用户名密码、生物识别、数字证书等方式验证用户身份
  • 权限控制系统:基于角色或属性的访问控制,精确管理用户权限
  • 安全令牌管理:使用 JWT、OAuth 等标准协议管理用户会话和访问令牌
  • 多因素认证:结合多种认证方式提高安全性,如短信验证码、硬件令牌等

API 网关(API Gateway)

API 网关是微服务架构中的关键组件,作为所有客户端请求的统一入口点:

  • 统一接口管理:提供单一入口点,简化客户端与后端服务的交互
  • 智能路由转发:根据请求特征将流量路由到相应的后端服务
  • 负载均衡:在多个服务实例间分配请求,提高系统可用性
  • 安全防护:实施认证、授权、限流、防攻击等安全策略

B

批量处理(Batch Processing)

批量处理是一种数据处理模式,将大量数据作为一个整体进行处理,适用于对实时性要求不高的场景:

  • 批量数据处理:将多个数据项组合成批次,一次性处理大量数据
  • 处理效率优化:通过减少系统调用次数和网络传输,显著提高处理效率
  • 资源利用优化:合理分配计算资源,避免频繁的资源分配和释放
  • 成本控制:通过批量处理降低单位数据的处理成本

业务流程(Business Process)

业务流程是企业运营中的核心概念,通过系统化的方法管理和优化业务活动:

  • 流程编排:定义业务活动的执行顺序和条件,实现复杂业务逻辑
  • 自动化执行:通过工作流引擎自动执行重复性任务,提高效率
  • 状态管理:跟踪流程执行状态,支持暂停、恢复、回滚等操作
  • 异常处理:建立完善的异常处理机制,确保业务连续性

C

上下文学习(Context Learning)

上下文学习是现代 AI 系统的重要能力,使模型能够根据具体情境调整行为:

  • 情境理解:分析当前对话或任务的上下文信息,理解用户意图
  • 动态适应:根据上下文变化调整响应策略和输出格式
  • 准确性提升:利用上下文信息提高回答的相关性和准确性
  • 交互优化:通过上下文记忆提供更自然的对话体验

控制台(Console)

控制台是系统管理的核心界面,为管理员提供全面的系统监控和管理功能:

  • 可视化管理界面:提供直观的图形化界面,简化系统管理操作
  • 实时监控面板:展示系统关键指标,支持实时监控和告警
  • 配置管理工具:集中管理系统配置,支持配置的版本控制和回滚
  • 运维操作中心:集成常用运维操作,提高运维效率

容器化(Containerization)

容器化是现代应用部署的主流方式,通过容器技术实现应用的标准化部署:

  • 应用封装:将应用及其依赖打包成独立的容器镜像
  • 环境一致性:确保应用在不同环境中的行为一致性
  • 资源隔离:通过容器技术实现进程、网络、存储的隔离
  • 弹性扩展:支持快速启动和停止,实现应用的弹性伸缩

D

数据向量化(Data Vectorization)

数据向量化是将各种类型的数据转换为数值向量的过程,是 AI 系统处理数据的基础:

  • 多模态转换:支持文本、图像、音频等多种数据类型的向量化
  • 语义保持:在转换过程中保持数据的语义信息和关系
  • 相似度计算:向量化后的数据支持高效的相似度计算
  • AI 模型兼容:生成的向量格式与主流 AI 模型兼容

分布式系统(Distributed System)

分布式系统是由多个独立计算节点组成的系统,通过网络协调工作:

  • 多节点协作:多个计算节点协同工作,共同完成复杂任务
  • 高可用性:通过冗余设计提高系统可用性,避免单点故障
  • 水平扩展:通过增加节点数量提升系统处理能力
  • 容错机制:具备故障检测和恢复能力,确保系统稳定运行

数据集管理(Dataset Management)

数据集管理是 AI 项目中的关键环节,涉及数据的全生命周期管理:

  • 数据采集存储:建立标准化的数据采集和存储流程
  • 数据预处理:包括数据清洗、格式转换、特征提取等操作
  • 质量控制:建立数据质量评估和监控机制
  • 版本管理:跟踪数据集的变更历史,支持版本回滚

部署管理(Deployment Management)

部署管理是软件交付过程中的重要环节,确保应用能够稳定可靠地运行:

  • 环境配置:管理不同环境的配置差异,确保部署一致性
  • 版本控制:跟踪应用版本,支持灰度发布和蓝绿部署
  • 自动化部署:通过 CI/CD 流水线实现自动化部署
  • 回滚机制:在部署出现问题时快速回滚到稳定版本

E

嵌入向量(Embedding Vector)

嵌入向量是将离散对象映射到连续向量空间的技术,是现代 NLP 和推荐系统的基础:

  • 语义表示:将词汇、句子或文档转换为包含语义信息的数值向量
  • 维度压缩:将高维稀疏数据转换为低维稠密向量
  • 相似度计算:支持通过向量距离计算语义相似度
  • 模型输入:为深度学习模型提供标准化的输入格式

事件驱动(Event-Driven)

事件驱动架构是一种松耦合的系统设计模式,通过事件进行组件间通信:

  • 异步通信:组件通过事件进行异步通信,提高系统响应性
  • 解耦设计:生产者和消费者解耦,提高系统灵活性
  • 实时响应:支持实时事件处理,快速响应业务变化
  • 可扩展性:易于添加新的事件处理器,扩展系统功能

F

特征工程(Feature Engineering)

特征工程是机器学习项目中的关键步骤,直接影响模型的性能:

  • 特征提取:从原始数据中提取有意义的特征
  • 特征转换:对特征进行标准化、归一化等变换
  • 特征选择:选择对模型最有价值的特征子集
  • 特征构造:基于领域知识构造新的特征

前端框架(Frontend Framework)

前端框架为 Web 应用开发提供结构化的解决方案:

  • 组件化开发:通过可复用组件提高开发效率
  • 状态管理:统一管理应用状态,简化数据流
  • 路由控制:管理单页应用的页面导航
  • 性能优化:提供虚拟 DOM、懒加载等性能优化机制

I

索引优化(Index Optimization)

索引优化是数据库性能调优的重要手段:

  • 查询加速:通过合理的索引设计显著提高查询速度
  • 存储优化:优化索引结构,减少存储空间占用
  • 维护成本:平衡查询性能和索引维护成本
  • 并发支持:支持高并发访问场景下的索引操作

接口文档(Interface Documentation)

接口文档是 API 开发和使用的重要参考:

  • 规范说明:详细描述 API 的功能、参数、返回值
  • 示例代码:提供多种编程语言的调用示例
  • 错误处理:说明可能的错误情况和处理方法
  • 版本管理:跟踪 API 版本变化和兼容性

K

知识图谱(Knowledge Graph)

知识图谱是一种结构化的知识表示方法:

  • 实体关系建模:以图的形式表示实体及其关系
  • 语义推理:支持基于图结构的推理查询
  • 知识融合:整合多源异构数据构建统一知识库
  • 智能问答:为智能问答系统提供知识支撑

Kubernetes 编排(Kubernetes Orchestration)

Kubernetes 是容器编排的事实标准:

  • 容器管理:自动化容器的部署、扩展和管理
  • 服务发现:提供服务注册和发现机制
  • 自动扩缩容:根据负载自动调整服务实例数量
  • 负载均衡:在多个服务实例间分配流量

L

语言模型(Language Model)

语言模型是自然语言处理的核心技术:

  • 文本理解:理解自然语言的语法和语义
  • 文本生成:生成符合语法和语义规则的文本
  • 上下文建模:建模文本中的长距离依赖关系
  • 多任务学习:支持翻译、摘要、问答等多种 NLP 任务

日志管理(Log Management)

日志管理是系统运维的重要组成部分:

  • 日志收集:统一收集分布式系统的日志信息
  • 实时监控:实时分析日志,及时发现异常
  • 告警机制:基于日志模式触发告警通知
  • 性能分析:通过日志分析系统性能瓶颈

M

机器学习(Machine Learning)

机器学习是人工智能的核心分支:

  • 数据驱动:从数据中自动学习模式和规律
  • 模式识别:识别数据中的复杂模式
  • 预测分析:基于历史数据预测未来趋势
  • 决策支持:为业务决策提供数据支撑

微服务(Microservices)

微服务是一种分布式系统架构模式:

  • 服务拆分:将单体应用拆分为独立的微服务
  • 独立部署:每个服务可以独立开发和部署
  • 技术多样性:不同服务可以使用不同的技术栈
  • 团队自治:支持小团队独立负责特定服务

N

神经网络(Neural Network)

神经网络是深度学习的基础:

  • 仿生设计:模拟人脑神经元的连接方式
  • 层次结构:通过多层网络学习复杂特征
  • 非线性映射:通过激活函数实现非线性变换
  • 端到端学习:支持从原始输入到最终输出的端到端学习

网络通信(Network Communication)

网络通信是分布式系统的基础:

  • 协议标准:遵循 TCP/IP、HTTP 等标准协议
  • 数据传输:确保数据的可靠传输
  • 安全加密:通过 TLS/SSL 等技术保证通信安全
  • 性能优化:通过连接池、压缩等技术优化性能

P

提示工程(Prompt Engineering)

提示工程是优化 AI 模型输出的重要技术:

  • 提示设计:设计有效的提示词引导模型输出
  • 格式控制:通过提示控制输出的格式和结构
  • 上下文管理:合理管理提示的上下文信息
  • 效果优化:通过迭代优化提示效果

性能监控(Performance Monitoring)

性能监控是确保系统稳定运行的重要手段:

  • 指标采集:收集 CPU、内存、网络等关键指标
  • 实时监控:实时展示系统运行状态
  • 趋势分析:分析性能指标的变化趋势
  • 容量规划:基于监控数据进行容量规划

R

检索增强生成(RAG)

RAG 是结合检索和生成的 AI 技术:

  • 知识检索:从外部知识库检索相关信息
  • 上下文增强:将检索结果作为生成的上下文
  • 准确性提升:通过外部知识提高生成内容的准确性
  • 实时更新:支持知识库的实时更新

资源调度(Resource Scheduling)

资源调度是分布式系统中的核心问题:

  • 资源分配:合理分配计算、存储、网络资源
  • 负载均衡:在多个节点间均衡分配负载
  • 优先级管理:根据任务优先级分配资源
  • 弹性伸缩:根据负载动态调整资源分配

S

相似度搜索是信息检索的重要技术:

  • 向量检索:在高维向量空间中进行相似度搜索
  • 语义匹配:基于语义相似度而非字面匹配
  • 算法优化:使用 ANN 算法提高搜索效率
  • 大规模支持:支持亿级向量的高效检索

系统管理(System Administration)

系统管理是 IT 运维的核心工作:

  • 用户管理:管理用户账户和权限
  • 配置管理:维护系统配置的一致性
  • 资源监控:监控系统资源使用情况
  • 安全策略:实施系统安全策略

服务网格(Service Mesh)

服务网格是微服务架构的基础设施层:

  • 服务通信:管理服务间的网络通信
  • 流量管理:控制服务间的流量路由
  • 安全控制:实施服务间的安全策略
  • 可观测性:提供服务调用的监控和追踪

T

文本向量化(Text Vectorization)

文本向量化是 NLP 的基础技术:

  • 文本编码:将文本转换为数值向量表示
  • 语义保持:在向量化过程中保持文本语义
  • 维度控制:控制向量维度以平衡性能和效果
  • 模型兼容:生成与下游模型兼容的向量格式

任务管理(Task Management)

任务管理是项目管理的重要组成部分:

  • 任务规划:制定任务计划和时间安排
  • 进度跟踪:实时跟踪任务执行进度
  • 资源协调:协调任务所需的人力和物力资源
  • 状态监控:监控任务状态和执行质量

V

向量数据库(Vector Database)

向量数据库是专门为 AI 应用设计的数据库:

  • 向量存储:原生支持高维向量数据存储
  • 相似度检索:提供高效的向量相似度搜索
  • 索引优化:针对向量数据优化索引结构
  • AI 集成:与机器学习框架深度集成

版本控制(Version Control)

版本控制是软件开发的基础工具:

  • 变更跟踪:跟踪代码的所有变更历史
  • 分支管理:支持并行开发和功能分支
  • 协作开发:支持多人协作开发
  • 发布管理:管理软件版本和发布流程

W

工作流(Workflow)

工作流是业务流程自动化的核心技术:

  • 流程建模:以图形化方式建模业务流程
  • 自动执行:自动执行预定义的业务流程
  • 状态管理:跟踪流程执行状态和进度
  • 异常处理:处理流程执行中的异常情况

工作台(Workbench)

工作台是开发者的集成开发环境:

  • 工具集成:集成各种开发和调试工具
  • 项目管理:管理开发项目和代码库
  • 调试支持:提供代码调试和性能分析功能
  • 资源监控:监控开发环境的资源使用

WebSocket

WebSocket 是实现实时通信的网络协议:

  • 全双工通信:支持客户端和服务器的双向通信
  • 低延迟:相比 HTTP 轮询具有更低的延迟
  • 长连接:维持持久连接,减少连接开销
  • 实时推送:支持服务器主动向客户端推送消息

X

向量索引(Vector Index)

向量索引是提高向量检索效率的关键技术:

  • 检索加速:通过索引结构大幅提高检索速度
  • 内存优化:优化索引的内存使用效率
  • 精度控制:在检索速度和精度间找到平衡
  • 动态更新:支持索引的动态更新和维护

Y

语义理解(Semantic Understanding)

语义理解是 AI 系统理解人类语言的核心能力:

  • 语义解析:理解文本的深层含义和意图
  • 上下文关联:建立文本中概念间的关联关系
  • 意图识别:识别用户的真实意图和需求
  • 情感分析:分析文本中表达的情感倾向