Tag: Fine-Tuning

NVIDIA发布Llama Nemotron Nano VL

NVIDIA推出Llama Nemotron Nano VL,一款精简的视觉语言模型,旨在提升文档理解能力,具备高效和精准的特点。

NVIDIA发布Llama Nemotron Nano VL

HTX:协作共筑更强大的未来

新加坡内政科技局 (HTX) 通过人工智能等尖端技术,加强与全球领先公司的合作,赋能新加坡内政团队,共筑更强大的未来。

HTX:协作共筑更强大的未来

DeepSeek R1升级挑战领先LLM

DeepSeek R1-0528升级版挑战OpenAI O3和谷歌Gemini 2.5 Pro,提升推理能力并减少幻觉,推动AI发展。

DeepSeek R1升级挑战领先LLM

Google MedGemma:开源AI模型革新医学分析

Google推出了MedGemma,这是一套开源生成式AI模型,有望彻底改变医疗保健领域的医疗文本和图像分析。

Google MedGemma:开源AI模型革新医学分析

QwenLong-L1:长文本推理的革新

QwenLong-L1通过创新框架,提升大语言模型处理长文本的推理能力,开启企业应用新纪元。

QwenLong-L1:长文本推理的革新

NVIDIA发布轻量级LLM:Nemotron Nano 4B

NVIDIA发布Nemotron Nano 4B,一款为边缘AI应用和科学推理设计的轻量级开源语言模型,算力需求低,性能强大。

NVIDIA发布轻量级LLM:Nemotron Nano 4B

新加坡HTX携手Mistral AI和微软,引领Gen AI模型

新加坡HTX与Mistral AI及微软合作,开创Gen AI模型,提升公共安全领域能力。

新加坡HTX携手Mistral AI和微软,引领Gen AI模型

Sarvam AI发布240亿参数LLM

Sarvam AI发布了240亿参数的大型语言模型,擅长印度语言和复杂推理任务,是印度语言和推理能力方面的重大突破。

Sarvam AI发布240亿参数LLM

Sarvam AI发布强大LLM,挑战Meta和Google

Sarvam AI发布Sarvam-M,一款240亿参数的多语言LLM,在印度语言、数学和编程方面表现出色,性能与Meta和Google的更大模型相媲美。

Sarvam AI发布强大LLM,挑战Meta和Google

SK电讯A.X 4.0:语言模型深度解析

SK电讯悄然发布A.X 4.0,深入研究其大型语言模型,该模型针对韩语进行了优化,并展示了其性能、技术规格和未来增强功能。

SK电讯A.X 4.0:语言模型深度解析