访问方式:开放重量
Mistral 是欧洲最大的人工智能公司之一。其 Mistral Large 2 模型、Pixtral Large多模态模型和 Le Chat 聊天机器人都是 GPT-4o、Gemini、ChatGPT 和其他最先进人工智能工具的直接竞争对手。
Mistral Large 2 提供开放重量,可用于研究和商业用途。虽然这不是完全开放的许可证,但这意味着它可以针对特定用途进行训练。
奎文
开发商:阿里云
参数: 0.5 亿、1.5 亿、30 亿、70 亿、140 亿、320 亿、720 亿
上下文窗口:最多 1,000,000
Qwen 是中国科技巨头阿里巴巴推出的 AI 模型系列。Qwen2.5 的不同系列 韩国电报数据库 中有数十种开放模型,包括针对视觉、编码、数学和百万级 token 上下文量身定制的模型。
性能最高的模型Qwen2.5 Max在各种基准测试中都与 GPT-4o 和 Gemini 2.0 Pro 等模型相当甚至超过它们。目前,它仅通过 Qwen 聊天机器人和 API 提供。
Phi-3 和 Phi-4
开发商:微软
参数: 38亿、70亿、140亿
上下文窗口:最多 128,000 个
访问:开放
微软的 Phi-3 系列小型语言模型针对小规模模型的性能进行了优化。38 亿参数的 Mini、70 亿参数的 Small、140 亿参数的 Medium 和 147 亿参数的 Phi-4 在语言任务上的表现均优于大型模型。
这些模型可通过 Azure AI Studio、Hugging Face 和其他开放模型平台获得。