Tag: Fine-Tuning

马来西亚的机遇:拥抱中国开源AI革命

DeepSeek R1的出现为马来西亚的AI生态系统带来了机遇。通过拥抱开源AI,马来西亚可以降低成本,促进创新,并确保数据自主权。关键在于更新政策、投资人才培养以及构建本地化的AI模型。

马来西亚的机遇:拥抱中国开源AI革命

Deepseek-R1效应:推理语言模型创新的催化剂

Deepseek-R1加速了推理语言模型的发展,通过数据质量、强化学习和创新训练策略实现了高效推理。

Deepseek-R1效应:推理语言模型创新的催化剂

释放AI力量:用强化学习微调o4-mini

利用强化学习微调OpenAI的o4-mini,为企业打造定制化AI解决方案,提升效率和竞争力。

释放AI力量:用强化学习微调o4-mini

解密知识蒸馏:AI模型如何互学

探索知识蒸馏:强大AI模型将其知识传授给小型高效模型,提升效率和可扩展性,重新定义AI系统的构建方式。

解密知识蒸馏:AI模型如何互学

Nvidia新模型超越DeepSeek-R1:14万H100小时

Nvidia的Llama-Nemotron系列开源模型超越DeepSeek-R1,训练细节完全公开,揭示了模型如何通过14万H100小时训练实现卓越性能。

Nvidia新模型超越DeepSeek-R1:14万H100小时

微软小模型惊艳:6千样本炼成“数学作弊码”

尽管 DeepSeek-R2 尚未发布,微软小模型却展示了卓越的推理能力,训练数据量出奇的小。

微软小模型惊艳:6千样本炼成“数学作弊码”

Meta LlamaCon解码:深入剖析LLM领域

Meta的LlamaCon大会深入探讨了LLM和多模态应用。虽未发布突破性模型,但探索了该技术的未来发展方向,以及Llama 4的多模态优势和API的灵活性。

Meta LlamaCon解码:深入剖析LLM领域

DeepSeek:推动企业AI采纳的变革

DeepSeek以大幅降低的AI模型成本,引发了AI行业震荡,或将加速企业AI采纳,重塑行业格局。

DeepSeek:推动企业AI采纳的变革

微软 Phi-4-Reasoning-Plus:精巧而强大的推理模型

微软发布了Phi-4-Reasoning-Plus,一款专为复杂推理任务设计的开源语言模型。它基于Phi-4架构,通过监督微调和强化学习显著提升了数学、科学、编码和逻辑问题的解决能力。

微软 Phi-4-Reasoning-Plus:精巧而强大的推理模型

定制Amazon Nova模型提升工具利用率

通过Amazon Bedrock定制Amazon Nova模型,提高工具调用精度,增强AI决策能力和运营效率,构建更强大的智能体工作流。

定制Amazon Nova模型提升工具利用率