解锁领域专长:大语言模型的微调、合并与能力涌现
探索如何通过微调(CPT、SFT、DPO、ORPO)和模型合并(特别是 SLERP)技术,使 Llama 和 Mistral 等大型语言模型适应材料科学等专业领域,并揭示模型合并带来的能力涌现现象。
探索如何通过微调(CPT、SFT、DPO、ORPO)和模型合并(特别是 SLERP)技术,使 Llama 和 Mistral 等大型语言模型适应材料科学等专业领域,并揭示模型合并带来的能力涌现现象。
Nvidia 推出 Project G-Assist,一款实验性的设备端 AI 助手,专为 GeForce RTX GPU 设计。它在本地运行,提供情境游戏辅助和系统管理,无需云端处理,标志着 AI 融入游戏体验的新方式。
一份法庭文件揭示了Meta与其Llama AI模型托管方之间的收益分成协议。这一合作模式标志着人工智能领域协作与商业化的一个显著发展,预示着未来AI发展将更注重合作与价值共享。
英伟达预测2028年数据中心市场将达1万亿美元,加速了AMD的增长。AMD凭借其MI350系列GPU、强劲的财务业绩和超级计算能力,正迅速崛起,成为AI芯片竞赛中的有力竞争者,挑战英伟达的领导地位。
Mistral AI任命Geoff Soon为亚太区营收副总裁,旨在拓展亚太市场、增加资源投入、利用其丰富经验推动创新和产品开发,并为潜在的IPO做准备。公司同时注重客户互动、品牌建设、创新文化和合规性。
随着数据中心基础设施投资激增,英伟达预测2028年将达万亿美元。除了英伟达,AMD也蓄势待发,其财务状况强劲,技术领先,并在高性能计算和人工智能领域获得重要合作伙伴。
Meta 与 Data Science Africa 合作,推出 Llama Impact Grant 计划,提供 2 万美元资金,支持撒哈拉以南非洲地区的初创企业和研究人员利用开源 AI 模型 Llama 推动社会和经济发展,特别是在健康、科学和农业领域。
一份法庭文件揭示了 Meta 通过 Llama AI 模型与云服务商进行收入分成。这与 Zuckerberg 此前声称的不以销售 AI 模型访问权限为商业模式的说法相悖,同时 Meta 还面临着使用盗版电子书训练模型的版权侵权指控。
AI 联盟由 IBM 和 Meta 于 2023 年 12 月与其他 50 个创始成员共同成立,在短短一年多的时间里,其成员已发展到全球 140 多个组织。 联盟致力于开放 AI 生态,并在短短一年内取得了显著成就。
Meta CEO Mark Zuckerberg宣布,Llama AI模型家族的累计下载量已超过10亿次。这一里程碑标志着Meta在人工智能领域的显著进展,及其模型在Facebook、Instagram和WhatsApp等平台上的广泛应用。