Tag: allm.link | zh-CN

照亮内部迷宫:Anthropic解码LLM运作的探索

Anthropic开创性地使用'电路追踪'技术,深入探究大型语言模型(LLMs)的内部运作机制。研究揭示了模型如何在不同语言间处理概念,其'思维链'与实际计算路径的差异,以及解决问题时采用的非人类方法,旨在提升AI的安全性和可信度。

照亮内部迷宫:Anthropic解码LLM运作的探索

打破序列瓶颈:NVIDIA FFN Fusion 提升大模型效率

NVIDIA 推出 FFN Fusion 技术,通过并行化 Transformer 中的前馈网络层,显著提升大型语言模型 (LLM) 的推理效率。该技术在 Llama 模型上验证,大幅降低延迟和计算成本,同时保持模型性能,为 AI 计算优化开辟新路径。

打破序列瓶颈:NVIDIA FFN Fusion 提升大模型效率

AI 梦想龙猫:数字艺术新时代的 Ghibli 风格肖像创作

探索如何使用 AI 工具,特别是免费的 xAI Grok 3,将照片转化为 Studio Ghibli 风格的艺术作品。了解 Ghibli 美学的独特之处,以及 OpenAI ChatGPT 与 Grok 在实现这一流行趋势中的作用和差异。

AI 梦想龙猫:数字艺术新时代的 Ghibli 风格肖像创作

Meta 人工智能计划登陆印尼,面向用户与营销人员

Meta 在印尼推出 Meta AI 和 AI Studio,集成至 WhatsApp 等平台,利用 Llama 3.2 提供本地化智能助手和图像生成功能。同时发布 AI 营销工具,优化品牌与 Instagram 创作者的合作,旨在提升用户体验和广告效果。

Meta 人工智能计划登陆印尼,面向用户与营销人员

马斯克策划800亿美元合并:X社交平台并入AI企业xAI

Elon Musk 确认将社交平台 X 并入其人工智能企业 xAI。此次全股票交易对 xAI 估值800亿美元,X 估值330亿美元,旨在融合 X 的庞大数据与 xAI 的先进 AI 能力,打造统一的科技巨头。

马斯克策划800亿美元合并:X社交平台并入AI企业xAI

Musk将X并入xAI:科技巨头帝国的新策略

Elon Musk将社交媒体平台X并入其人工智能企业xAI。此次全股票交易对X估值330亿美元,对xAI估值800亿美元,旨在整合数据、AI模型与分发渠道,但也引发了关于透明度和治理的疑问。

Musk将X并入xAI:科技巨头帝国的新策略

穿越动荡:Nvidia万亿市值蒸发与AI投资风向转变

Nvidia市值蒸发超万亿美元,引发对AI投资热潮可持续性的质疑。市场情绪降温,受Microsoft数据中心暂停、CoreWeave IPO疲软、通胀压力及竞争加剧影响,AI的短期经济前景面临重新评估,市场从狂热转向谨慎。

穿越动荡:Nvidia万亿市值蒸发与AI投资风向转变

像素的代价:ChatGPT图像热潮下OpenAI面临GPU危机

OpenAI CEO Sam Altman坦承,GPT-4o图像生成需求激增导致GPU不堪重负,迫使公司实施速率限制。文章探讨了GPU在AI中的作用、GPT-4o的吸引力、用户影响、基础设施成本挑战以及对计算效率的追求。

像素的代价:ChatGPT图像热潮下OpenAI面临GPU危机

人工智能的持续进击:新模型与战略重塑格局

近期AI领域进展迅速:Google推出'思考模型'Gemini 2.5,阿里云发布紧凑多模态Qwen2.5,DeepSeek V3增强推理与实践技能,Landbase设立应用AI实验室聚焦Agentic AI,webAI与MacStadium合作支持Apple Silicon部署。这些发展凸显了AI能力的提升、专业化趋势及战略布局。

人工智能的持续进击:新模型与战略重塑格局

解锁领域专长:大语言模型的微调、合并与能力涌现

探索如何通过微调(CPT、SFT、DPO、ORPO)和模型合并(特别是 SLERP)技术,使 Llama 和 Mistral 等大型语言模型适应材料科学等专业领域,并揭示模型合并带来的能力涌现现象。

解锁领域专长:大语言模型的微调、合并与能力涌现