腾讯混元 - T1 推理模型性能逼近 OpenAI o1,解码速度提升 2 倍成关键 腾讯近日推出其最新大型语言模型——混元-T1,并声称该模型在推理能力上可与 OpenAI 的顶级推理系统相媲美。 据腾讯介绍,混元-T1 在训练过程中大量运用强化学习,高达 96.7% 的训练后算力用... AIAI资讯# 大型语言模型# 强化学习# 混元-T1 1个月前010
阿里发布多模态新成果 Qwen2.5-VL-32B:视觉、语言与数学推理多面手 在人工智能领域,阿里巴巴近期开源的 Qwen2.5-VL-32B-Instruct 模型令人瞩目。作为 Qwen2.5 系列的一员,该 32B 版本在性能与本地运行便捷性间找到平衡。 这款模型经强化学... AIAI资讯# Qwen2.5-VL-32B-Instruct# 多模态模型# 大型语言模型 1个月前000
DeepSeek-V3-0324 悄然发布:性能飙升,免费商用,消费级电脑轻松跑 DeepSeek 近日悄然发布了其最新力作——大型语言模型 DeepSeek-V3-0324,在人工智能行业内引发了轩然大波。这款容量高达 641GB 的模型在 Hugging Face 上低调现身,... AIAI资讯# ClaudeSonnet3.5# DeepSeek-V3-0324# HuggingFace 1个月前010