首页科技快讯 GPT-4 Turbo惨遭碾压谷歌刚发布的Gemini 1.5 Pro有多强？

GPT-4 Turbo惨遭碾压谷歌刚发布的Gemini 1.5 Pro有多强？

来源：晰数塔互联网快讯时间：2024年02月16日 21:26

本文源自:财联社

在本周之前，如果被问及“地球上最强的AI模型是哪个？”时，绝大多数人都会下意识地指向OpenAI去年11月发布的GPT-4 Turbo。然而，几个月过去，这个问题的答案已经悄然发生变化。

当地时间周四，谷歌突然发布“下一代AI模型”——Gemini 1.5。相较于更新迭代的速度（注：谷歌去年12月才刚发布Gemini 1.0），新一代模型展现出的生产力暴增更是勾起了业界强烈的兴趣。

（来源：谷歌）

核心爆点：一次性处理一百万tokens

作为新版本最大的亮点，Gemini 1.5版本中首个登场的多模态通用模型Gemini 1.5 Pro，把稳定处理上下文的上限扩大至100万tokens。这里需要强调的是，虽然字面表达是“上下文”，但AI模型已经跨入多模态时代，新出的前沿大模型基本都支持处理文字、代码，以及图片、语音、视频等富媒体。

横向对比，两个月前发布的Gemini 1.0 Pro上下文理解限制为3.2万tokens，老对手OpenAI的GPT-4 Turbo也只支持12.8万tokens。

（来源：谷歌）

Token这个概念可能有一点绕。换一种方式来解释，就是能够一次性丢给Gemini 1.5 Pro 超过70万个单词的文本、3万行代码、11个小时的音频，或1个小时的视频，然后指挥它干活。对大模型而言，上下文窗口是对应用场景的最主要限制——若无法“读”完50万字的文件，自然就无法进行处理。

之所以能一次性处理大量资料，是因为谷歌的模型采用了“多专家模型”（MoE）的算法，意味着回应需求时只会跑整体模型的一部分，这样回应速度更快，谷歌处理起来也更省事。

谷歌CEO皮查伊也透露，谷歌的研究人员已经成功测试过1000万tokens的上下文窗口。这意味着未来的AI模型能做到一次性处理《权力的游戏》全本（目前已经出版的5本书全文总数达到173万个单词）。

值得一提的是，目前谷歌开放给开发者的测试版本中，Gemini 1.5 Pro的token限制只有12.8万个。不过谷歌DeepMind的CEO德米斯·哈萨比斯直言不讳地表示，后续会推出新的收费层级，供解锁100万tokens的版本。作为对比，目前使用谷歌Gemini 1.0 pro模型的订阅服务每月收费19.99美元。