
AI模型如雨后春笋般涌现,涉及重要科技公司如Google,以及初创公司如OpenAI和Anthropic。跟踪最新的AI模型可能令人不知所措。
引发困惑的是,AI模型常常基于行业基准进行推广。但这些技术指标往往对真实的用户和公司如何使用它们知之甚少。
为了澄清疑虑,TechCrunch编制了一份自2024年以来发布的最先进AI模型的概述,其中包含如何使用它们以及它们最擅长的领域。我们将不断更新这份清单以追踪最新的发布。
目前市面上有超过一百万个AI模型:比如HuggingFace就托管了超过140万个。因此,这份清单可能会错过一些在某种程度上表现更好的模型。
2025年发布的AI模型
OpenAI o3-mini
这是OpenAI最新的推理模型,优化用于STEM相关任务,如编码、数学和科学。虽然不是OpenAI最强大的模型,但由于体积较小,该公司称其成本显着降低。它可免费使用,但对于重度用户需要订阅。
OpenAI深度研究
OpenAI的深度研究旨在对某一主题进行深入研究,并提供清晰的引用。此服务仅适用于每月200美元的ChatGPT专业版订阅。OpenAI建议将其应用于从科技到购物研究等各个领域,但需要注意的是AI仍然存在幻觉问题。
迷斯特拉雷猫
Mistral推出了多模态AI个人助手Le Chat的应用版本。Mistral声称Le Chat的响应速度比其他任何聊天机器人都要快。该付费版本还包括法新社(AFP)的最新新闻。《Le Monde》的测试发现Le Chat的性能令人印象深刻,虽然比ChatGPT更容易出错。
OpenAI Operator
OpenAI的Operator旨在成为一个可以独立完成任务的个人实习生,比如帮助您购买杂货。需要每月200美元的ChatGPT专业版订阅。AI代理的潜力巨大,但仍处于实验阶段:《华盛顿邮报》的一位评论员表示Operator自行决定以31美元购买一打鸡蛋,并使用评论员的信用卡支付。
谷歌双子座2.0专业实验
谷歌双子座备受期待的旗舰模型声称在编码和理解一般知识方面表现出色。它还具有200万令牌的超长上下文窗口,有助于需要快速处理大量文本的用户。该服务要求至少每月支付19.99美元的谷歌One AI高级订阅。
2024年发布的AI模型
DeepSeek R1
这款中国AI模型让硅谷为之震撼。DeepSeek的R1在编码和数学方面表现出色,而其开源性意味着任何人都可以在本地运行它。此外,它是免费的。然而,R1集成了中国政府的审查制度,并因潜在将用户数据传送回中国而面临日益增加的禁令。
Gemini深度研究
深度研究在简洁明了的文档中总结了谷歌的搜索结果。该服务对学生和其他需要快速研究摘要的人很有帮助。然而,其质量远不如真正的同行审阅论文。深度研究需要每月支付19.99美元的谷歌One AI高级订阅。
Meta Lama 3.3 7B
这是Meta开源Llama AI模型的最新和最先进版本,Meta宣传此版本是其迄今为止成本最低、效率最高的版本,尤其在数学、一般知识和遵循说明方面表现出色。它是免费的且开源。
OpenAI Sora
Sora是一个根据文本创建逼真视频的模型。虽然它可以生成完整场景而不仅仅是片段,但OpenAI承认它经常生成的“物理现象不现实”。目前仅在ChatGPT的付费版本中提供,从每月20美元的Plus版开始。
阿里巴巴Qwen QwQ-32B-Preview
这款模型是少数几个在某些行业基准上能与OpenAI o1抗衡的模型,擅长数学和编码。具有讽刺意味的是对于一个“推理模型”,阿里巴巴表示它在常识推理方面还有“改进空间”。TechCrunch的测试显示它还整合了中国政府的审查制度。它是免费且开源的。
Anthropic的计算机使用
Claude的计算机使用旨在控制您的计算机完成诸如编码或预订飞机票等任务,使其成为OpenAI Operator的前身。然而,计算机使用仍处于测试阶段。价格通过API计算:输入每1百万令牌收费0.80美元,输出每1百万令牌收费4美元。
x.AI的Grok 2
x.AI,埃隆·马斯克拥有的AI公司,推出了旗舰Grok 2聊天机器人的增强版本,声称“速度快三倍”。免费用户每两小时限制提问10个问题,而订阅X的高级和高级+计划的用户则享有更高的使用限制。x.AI还推出了一个名为Aurora的图像生成器,可生成高度写实的图像,包括一些图形或暴力内容。
OpenAI o1
OpenAI的o1系列旨在通过“深思熟虑”来给出更好的答案。OpenAI声称该模型擅长编码、数学和安全性,但也存在欺诈人类的问题。o1需要订阅每月20美元的ChatGPT Plus。
Anthropic的Claude Sonnet 3.5
Anthropic声称Claude Sonnet 3.5是最优秀的模型。它以其编码能力而闻名,被认为是科技内部人士的首选聊天机器人。该模型可以在Claude上免费使用,但重度用户需要每月支付20美元的专业订阅。虽然它可以理解图像,但无法生成图像。
OpenAI GPT 4o-mini
OpenAI称GPT 4o-mini为迄今为止性价比最高、速度最快的模型,这得益于其小尺寸。它旨在实现广泛任务,如为客户服务聊天机器人提供动力。该模型可在ChatGPT的免费版上使用。它更适合处理高强度简单任务而不是更复杂的任务。
Cohere Command R+
Cohere的Command R+模型在企业复杂的检索增强生成(RAG)应用方面表现出色。这意味着它能够很好地查找和引用特定信息片段。(RAG的发明者实际上在Cohere工作。)然而,RAG并不能完全解决AI的幻觉问题。