AI分享圈

帅气的我简直无法用语言描述！

文章44 网址0 书籍0 软件0 评论0

已发布44

梯度下降（Gradient Descent）是什么，一文看懂

梯度下降（Gradient Descent）是求解函数最小值的核心优化算法。算法通过计算函数的梯度（各偏导数组成的向量）确定下降方向，按θ=θ-η·∇J(θ)的规则迭代更新参数。

AI答疑

1个月前

08.6K

逻辑回归（Logistic Regression）是什么，一文看懂

逻辑回归（Logistic Regression）是用于解决二分类问题的统计学习方法。核心目标是根据输入特征预测样本属于特定类别的概率。模型通过线性组合特征值，利用S形函数将线性输出映射到0到1之间的...

AI答疑

1个月前

010.5K

正则化（Regularization）是什么，一文看懂

正则化（Regularization）是机器学习与统计学中防止模型过拟合的核心技术。正则化通过在目标函数中添加与模型复杂度相关的惩罚项，控制拟合程度。常见形式包括L1和L2正则化：L1产生稀疏解，适用...

AI答疑

1个月前

010.2K

生成对抗网络（Generative Adversarial Network）是什么，一文看懂

生成对抗网络（Generative Adversarial Network，GAN）是一种深度学习模型，由Ian Goodfellow等人于2014年提出。框架通过两个神经网络的对抗训练来实现生成模型...

AI答疑

1个月前

012.4K

自注意力（Self-Attention）是什么，一文看懂

自注意力（Self-Attention）是深度学习中的一种关键机制，最初在Transformer架构中被提出并广泛应用。核心思想是让模型能同时关注输入序列中的所有位置，通过加权汇总的方式计算每个位置的...

AI答疑

1个月前

014.9K

多任务学习（Multi-Task Learning）是什么，一文看懂

多任务学习（Multi-Task Learning, MTL）并非孤立的算法，而是一种富有智慧的机器学习范式。

AI答疑

1个月前

011.2K

扩散模型（Diffusion Model）是什么，一文看懂

扩散模型（Diffusion Model）是一种生成模型，专门用于创建新的数据样本，例如图像、音频或文本。模型的核心灵感来源于物理学中的扩散过程，模拟粒子从高浓度区域向低浓度区域自然扩散的现象。在机器...

AI答疑

2个月前

014.3K

模型微调（Fine-tuning）是什么，一文看懂

模型微调（Fine-tuning）是机器学习中迁移学习的一种具体实现方式。核心流程以预训练模型为基础，预训练模型利用大规模数据集学习通用模式，形成广泛的特征提取能力。微调阶段则引入特定任务的数据集，对...

AI答疑

2个月前

011.8K

注意力机制（Attention Mechanism）是什么，一文看懂

注意力机制（Attention Mechanism）是模仿人类认知过程的计算技术，最初应用于机器翻译领域，后成为深度学习的重要组成部分。

AI答疑

2个月前

015.7K

Transformer 架构（Transformer Architecture）是什么，一文看懂

Transformer 架构是一种深度学习模型，专为处理序列到序列的任务设计，例如机器翻译或文本摘要。核心创新在于完全依赖自注意力机制，摒弃了传统的循环或卷积结构。允许模型并行处理序列中的所有元素，大...

AI答疑

2个月前

016.4K

加载更多