排序:
已完成

大模型训练中的“混合精度训练”是如何实现的?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
混合精度训练(Mixed Precision Training)在保持模型精度的前提下,用半精度(FP16/BF16)进行大部分计算,用单精度(FP32)存储主权重与梯度累积以防止数值下溢/溢出。实现...
👍 1,3
已完成

AI开发语言Rust在构建高性能推理服务中有哪些优势?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
Rust是一种注重内存安全与并发性能的系统级语言,在AI推理服务开发中优势明显。其一,无垃圾回收机制使延迟可预测,适合对响应时间敏感的场景;其二,所有权与借用检查系统在编译期防止数据竞争与内存泄漏,提...
👍 1,3
已完成

MoE模型在推理阶段如何保证专家负载均衡?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
混合专家模型(MoE)推理时若某些专家被频繁选中而其他专家闲置,会导致计算资源浪费与显存热点。常用策略包括在门控网络中引入负载均衡损失(Load Balancing Loss),惩罚专家选择分布的极端...
👍 1,3
已完成

大模型中的“位置编码”有哪些主流实现方式及其优劣?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
位置编码(Positional Encoding)为Transformer提供序列顺序信息,常见方式有绝对位置编码与相对位置编码。绝对位置编码包括原始Transformer的正弦/余弦固定编码和可学习...
👍 1,3
已完成

什么是AI开发中的“算子融合”?它在推理优化中有何价值?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
算子融合(Operator Fusion)是将多个连续的神经网络计算步骤合并为单个内核执行的技术,常见于深度学习推理优化。典型例子是将卷积、批归一化(BatchNorm)与激活函数(ReLU)融合为一...
👍 1,5
已完成

AI落地案例:某银行如何用图神经网络识别洗钱网络?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
该银行构建了包含账户、交易、设备、IP等节点的异构图,利用图神经网络(GNN)捕捉隐蔽的资金流转模式。传统规则引擎难以识别跨越多层转账与伪装交易,而GNN通过消息传递机制聚合邻居节点特征,可发现异常子...
👍 1,4
已完成

大模型训练中的“权重衰减”与L2正则有何区别与联系?

🔥
@151*****000 最后更新于2025/12/1 11:15:25
权重衰减(Weight Decay)是在优化器更新参数时对权重大小施加惩罚的正则化手段,本质上等价于在损失函数中加入L2正则项(λ‖w‖2)。两者的联系在于数学形式相同,但实现方式略有差异:L2正则在...
👍 1,4
已完成

艺术创作理论中,“负空间”的运用如何改变观众的感知重心?

🔥
@151*****000 最后更新于2025/12/1 10:37:59
回答:留白或空隙能引导视线聚焦主体,同时引发观者对缺席物的联想,使作品在有限元素中产生扩展的想象空间。...
👍 1,3
已完成

智谱AI 2026年5月推出GLM-5指令大模型,实现“多语言零样本指令迁移”

🔥
@151*****000 最后更新于2025/11/29 17:50:48
GLM-5支持100+语言的指令零样本迁移(如用中文指令直接生成法语营销文案),小语种任务准确率较传统模型提升65%,已服务“一带一路”沿线企业超1000家。...
👍 1,5
已完成

微软 2026年1月Copilot X升级“指令知识图谱联动”,支持动态知识更新

🔥
@151*****000 最后更新于2025/11/29 17:50:36
Copilot X接入全球最大实时知识图谱(覆盖2026年最新科研、政策数据),指令中携带[Latest-Data]标签时,模型可自动调用最新信息生成回答,时效性提升90%。...
👍 1,3
已完成

阿里云 2026年4月通义千问3.0行业版支持“边缘指令实时推理”

🔥
@151*****000 最后更新于2025/11/29 17:50:24
通义千问3.0行业版可在边缘设备(如工厂工控机、车载终端)本地执行指令推理,延迟<10ms,满足智能制造、自动驾驶等低延迟场景需求。...
👍 1,4
已完成

Stability AI 2026年3月联合MIT发布“指令因果推理框架”Causal-Prompt

🔥
@151*****000 最后更新于2025/11/29 17:50:08
Causal-Prompt框架使模型能理解指令中隐含因果关系(如“降价→销量提升”的逻辑链),复杂决策任务(如商业策略生成)的合理性评分提升50%。...
👍 1,4
已完成

百度 2026年2月文心一言5.0推出“指令合规卫士”,自动拦截违规指令

🔥
@151*****000 最后更新于2025/11/29 17:49:55
文心一言5.0内置合规引擎,可实时检测指令中的隐私泄露、偏见风险(如“生成地域歧视文案”),拦截准确率达99.2%,已通过国家网信办“生成式AI安全认证”。...
👍 1,4
已完成

🔥
@151*****000 最后更新于2025/11/29 17:49:40
LLaMA-4-130B-Instruct突破上下文限制,支持单指令处理1万亿token长文本(约2000万汉字),长文档分析任务(如古籍研究)准确率较上一代提升45%。...
👍 1,4
已完成

Google 2026年4月Gemini Ultra 2.0实现“自进化指令优化”,无需人工调参

🔥
@151*****000 最后更新于2025/11/29 17:49:26
Gemini Ultra 2.0可基于用户反馈自动迭代指令策略(如连续3次修改同一指令后,模型自主生成更优版本),指令调试时间缩短80%,已集成至Workspace全产品线。...
👍 1,3
已完成

DeepSeek 2026年1月上线“指令智能体市场”,支持一键调用行业专属Agent

🔥
@151*****000 最后更新于2025/11/29 17:49:14
DeepSeek推出指令智能体平台,汇聚超5000个垂直领域Agent(如“医疗诊断指令师”“法律文书生成员”),用户通过自然语言指令即可调用,响应速度<0.5秒。...
👍 1,4
已完成

Anthropic 2026年3月推出Claude 4 Opus,强化“跨模态指令融合”能力

🔥
@151*****000 最后更新于2025/11/29 17:48:58
Claude 4 Opus支持文本+3D模型+实时传感器数据的联合指令输入(如“分析产线3D图纸+温度数据,生成故障预警方案”),工业场景任务完成效率提升60%。...
👍 1,15
已完成

🔥
@151*****000 最后更新于2025/11/29 17:48:42
GPT-5新增指令引擎可自动预判用户潜在需求(如输入“写产品文案”时,主动询问“目标人群/风格偏好”),指令理解准确率较GPT-4提升55%,已向企业API开放。...
👍 1,17
已完成

迭代式交互精炼初始输出结果有标准吗?

🔥
@151*****000 最后更新于2025/12/31 16:15:22
首次生成的回答可能不够精确或完整,建议采用迭代式对话进行修正。用户可基于初稿提出细化要求,如“请补充参考文献支持上述观点”或“请用更通俗的语言重述第三段”。这种人机协作模式不仅提升内容质量,也体现了研...
👍 1,41
共 199 条记录,当前显示第 181- 条