想理解人工智能?使用我们包含 100 多个 AI 术语的词汇表,从基础开始。
加速器 - 专为促进更快的AI计算而设计的专用硬件,用于更高性能的模型训练和推理。
AI对齐 - 确保AI系统的行为方式与人类价值观和意图相一致的努力。
AI助手 - 由AI驱动的工具,旨在协助用户完成各种任务,如回答问题、提供建议或提供指导。
AI审计 - 评估AI系统是否符合道德标准、性能指标和监管要求的过程。
AI偏见 - AI系统中的系统性错误,可能导致不公平或歧视性结果,通常反映了训练数据中的偏见。
AI治理 - 负责任地管理AI技术开发和使用的政策、实践和结构。
AI素养 - 对AI概念、能力和局限性的理解,使人能够与AI系统进行有见地的交互和评估。
AI风险管理 - 识别、评估和减轻AI系统潜在负面影响的策略和实践。
AI安全 - 专注于开发可靠、可控且不会造成意外伤害的AI系统的领域。
算法公平性 - 确保AI系统在做决策时不歧视特定群体或个人的方法。
通用人工智能(AGI) - 一种理论上的AI系统,能够在各种任务中与人类认知能力相媲美并超越。
人工智能(AI) - 可以创造、推理和解决历史上需要人类执行的问题的计算机系统。
超级人工智能(ASI) - 假设的AI,在所有领域超越人类智能,引发深刻的伦理和存在问题。
注意力(又称注意力机制或注意力模型) - 神经网络中的机制,允许AI模型专注于输入数据的特定部分,提高语言翻译和图像分析等任务的性能。
反向传播 - 机器学习中的算法,通过计算误差并向后调整各层权重来训练神经网络。
BERT(双向编码器表示的Transformers) - 一种基于Transformer的AI模型,通过查看每个标记的前后词来处理文本,也称为双向训练。
大数据 - 极大的数据集,需要专门的AI技术和工具进行处理和分析。
思维链 - AI提示技术,鼓励语言模型在解决问题时逐步推理,以提高输出质量。
聊天机器人 - 像ChatGPT这样的AI驱动工具,旨在与人类进行自然的对话。
中文房间 - 一个思想实验,挑战AI系统真正理解语言的概念,质疑机器智能的本质。
计算 - 运行AI任务所需的处理能力和资源,影响模型的规模和复杂性。
计算机视觉 - AI领域,训练计算机解释和理解来自世界的视觉信息。
卷积神经网络(CNNs) - 专门设计用于处理网格状数据的神经网络,特别适用于图像分析任务。
对比语言-图像预训练(CLIP) - 一种NLP模型,学习连接文本和图像,支持多用途视觉识别任务。
上下文窗口 - AI模型在做预测或响应时可以一次考虑的信息量。
对话式AI - 能够以自然、对话方式与人交互的AI系统,通常通过聊天界面。
自定义模型 - 在特定数据上训练以执行特定任务的AI模型,通常根据个人或组织的独特需求定制。
数据增强 - 人为增加训练数据的数量或多样性的过程,帮助AI模型更好地泛化到新情况。
数据标注 - 向原始数据添加描述性标签的过程,使AI系统能够从标记的例子中学习。
数据预处理 - 清洁和格式化原始数据的过程,使其适合AI模型训练并改善学习结果。
数据集 - 用于训练和测试AI模型的信息集合,使其能够学习模式并进行预测。
深度学习 - 使用神经网络分析和学习大量数据的机器学习技术。
深度伪造 - AI图像生成技术,将现有图像或视频中的人物替换为他人的肖像。
扩散 - 通过逐渐去噪随机模式生成图像的AI模型,产生高质量、多样化的输出。
双降 - 机器学习中的现象,随着模型复杂性增加,模型性能最初改善,然后恶化,然后再次改善。
嵌入 - 将离散数据转换为数字向量的机器学习技术,帮助AI模型理解项目之间的关系。
涌现 - 复杂的AI行为从简单规则或交互中产生的现象,通常以意想不到的方式。
端到端学习 - 机器学习技术,模型直接从输入到输出学习任务的所有步骤,无需手动设计的中间阶段。
伦理AI - 以尊重人权和价值观的方式开发和部署AI系统的指导方针和标准。
可解释AI(XAI) - 使AI决策过程对人类可理解的方法,增强透明度和信任。
专家系统 - 模拟特定领域人类专家决策的AI程序,使用预定义的规则和知识库。
少样本学习 - 机器学习技术,模型通过很少的训练样本就能取得良好性能。
微调 - 通过在较小数据集上训练预训练AI模型,以增强特定任务性能的过程。
联邦学习 - 跨多个设备或服务器训练AI模型的方法,通过保持原始数据本地化来保护数据隐私。
前向传播 - 机器学习中的算法,输入数据通过神经网络的层流动,产生输出或预测。
基础模型 - 在大量数据上训练的大规模AI模型,作为各种下游任务的通用基础。基础模型的训练通常花费数亿美元。
频率惩罚 - 一种AI参数,阻止模型重复生成相同的词或短语。
生成式AI - 能够基于从训练数据中学习的模式创建新内容(如图像、视频或文本)的AI系统。
生成式预训练Transformer(GPT) - 基于Transformer架构的人工神经网络,通过预测序列中的下一个词来生成类似人类的文本。
梯度下降 - 机器学习中使用的优化方法,通过反复调整参数来减少错误,训练模型。
GPU - 为并行计算优化的专用处理器,用于加速AI模型训练和推理。
幻觉 - AI模型生成其训练中不包含的内容的现象,导致荒谬或错误的输出。
隐藏层 - 神经网络中的中间层,从输入数据中学习和表示复杂特征。
超参数调优 - 为AI模型设置最佳配置以实现最佳性能的过程。
图像描述 - 生成图像内容自然语言描述的AI图像处理技术。
图像上色 - 为灰度或黑白图像添加颜色的AI图像处理技术。
图像去噪 - 去除图像中的噪声或不需要的干扰以提高质量的AI图像处理技术。
图像生成 - 从头创建新图像的AI图像处理技术,通常基于文本描述或其他图像。
图像修复 - 重建图像缺失或损坏部分的AI图像处理技术。
图像识别 - 识别和分类数字图像中的对象或场景的AI图像处理技术。
图像分割 - 将图像分为多个部分或对象的AI图像处理技术,识别属于每个部分的像素。
图像到图像转换 - 接收图像输入(如照片)并用它生成新图像的AI图像处理技术。
图像放大 - 在保持或提高质量的同时增加图像分辨率的AI图像处理技术。
增量学习 - AI系统从新数据中持续更新知识而不忘记先前学习的信息的能力。
推理 - AI模型训练完成后,使用训练模型生成新预测或输出的过程。
指令调优 - 通过使用更好的提示和例子引导预训练语言模型产生更高质量输出的过程。
大型语言模型(LLM) - 在大量文本上训练的AI模型,能够理解和生成类似人类的语言。
潜在空间 - 模型学习的数据压缩表示,捕获其最重要的特征和模式。
损失函数 - 量化模型预测输出和实际值之间差异的方法。
机器学习(ML) - AI的子集,使用算法和统计识别模式并从数据中提取洞见,无需显式编程。
机器翻译 - 使用机器学习算法自动将文本从一种语言翻译到另一种语言。
专家混合体 - 结合多个专业模型(专家)解决问题不同部分的AI模型,通过门控网络为给定输入选择合适的专家。
模型压缩 - 减少AI模型大小和计算需求的技术,使其能部署在资源受限的设备上。
模型部署 - 将训练好的AI模型整合到生产环境中的过程,使其可用于实际应用。
模型评估 - 使用测试数据评估AI模型性能,确保其满足准确性和可靠性标准。
模型可解释性 - 用于理解和解释AI模型如何做出决策的技术,促进透明度和信任。
模型可解读性 - 用于衡量人类理解AI模型预测背后推理容易程度的技术,有助于验证和改进。
模型监控 - 持续观察部署的AI模型,确保性能一致并检测潜在问题或偏差。
模型训练 - 通过向AI模型展示标记示例来教导其做出准确预测的过程。
模型版本控制 - 跟踪AI模型不同迭代的系统,促进协作并在需要时实现回滚。
多模态AI - 能够处理和输出混合数据格式(如文本、图像、音频)内容的AI系统。
命名实体识别(NER) - 识别和分类文本中命名实体(如人物、组织、地点)的NLP技术。
自然语言处理(NLP) - AI的子集,专注于使计算机能够理解、解释和生成人类语言。
神经辐射场(NeRF) - 通过学习光线从不同角度与场景中的物体互动的方式,从2D图像创建3D场景的人工神经网络。
目标函数 - 在优化问题(如机器学习)中用于定义算法旨在实现的目标的方法。
过拟合 - 当模型与其训练数据过于紧密对应,导致在新数据和预测上表现不佳时发生的情况。
参数 - AI模型的内部设置,决定其如何处理输入数据并生成输出。
词性标注(POS) - 给文本中的词语标记语法类别(如名词、动词、形容词)的NLP技术。
存在惩罚 - 阻止模型生成先前文本中已出现的词语的AI参数。
预训练 - 在特定任务微调前,在大量文本和代码数据集上对语言模型进行的初始训练阶段。
提示 - 给予AI模型的初始文本输入,设定上下文并引导模型的输出。
提示工程 - 设计和优化提示以从AI模型中获取最佳响应的过程。
提示注入 - 创建恶意提示以操控AI模型生成未预期或有害输出的行为。
提示泄露 - 欺骗AI模型披露其系统提示的提示注入攻击,可能包含保密或敏感信息。
强化学习 - 机器学习技术,智能体通过在环境中采取行动获得奖励或惩罚来学习决策。
来自人类反馈的强化学习(RLHF) - 人类反馈用于指导强化学习算法中学习过程的AI技术。
正则化 - 通过向机器学习模型添加约束来防止过拟合的AI技术。
设计负责任的AI - 将伦理考虑和社会影响整合到AI系统开发每个阶段的方法。
RoBERTa(稳健优化的BERT预训练方法) - BERT的优化版本,在更多数据上训练更长时间,在文本理解任务上表现更好。
情感分析 - 确定文本中表达的情感基调或观点的NLP技术。
奇点 - 假设的时间点,AI超越人类智能,导致不可预测的技术和社会后果。
停止序列 - 特定的词或短语,向AI模型发出停止生成文本的信号。
风格迁移 - 将一幅图像的艺术风格应用到另一幅图像内容的AI图像处理技术。
监督学习 - 机器学习技术,模型在标记数据上训练,学习从输入预测输出。
符号人工智能 - 基于知识的显式表示和基于逻辑的推理的AI方法,与机器学习方法形成对比。
温度 - 控制输出随机性的AI参数;温度越低输出越可预测,温度越高则鼓励更具创造性和意外的输出。
TensorFlow - 开源软件库,用于在各种平台上实现和部署机器学习模型。
令牌 - AI模型可以处理的最小有意义文本单位,通常代表一个字符或一个词。
令牌限制 - 语言模型在单个输入中可以处理或在单个输出中生成的最大令牌数。
Top-k采样 - 从k个最可能的选项中选择下一个词的AI技术,使输出更可预测。
Top-p(核采样) - 从累积概率超过阈值p的最小最可能下一个词集合中选择下一个词的AI技术。
TPU - 由Google设计的定制处理器,用于高效执行机器学习工作负载。
迁移学习 - 机器学习技术,预训练模型适应一个新的但相关的任务,利用其现有知识。
Transformer - 人工神经网络架构,能够追踪顺序数据的关系,将输入序列转换为输出序列。
图灵测试 - 由Alan Turing提出的智能测试,将智能定义为人类无法判断是在与另一个人类还是计算机交谈。
欠拟合 - 当模型过于简单而无法捕获训练数据中的基本关系时发生,导致在新数据上表现不佳。
无监督学习 - 机器学习技术,在没有标记响应的情况下,发现输入数据中的隐藏模式或内在结构。
验证数据 - 数据集的单独部分,在训练期间不展示给模型,以评估模型的性能。
XLNet - 通过以所有可能的顺序预测词语来增强上下文理解的语言模型。
零样本学习 - 机器学习技术,指训练模型能够在没有见过的新类别或任务上正确做出预测的能力。