人妖 telegram 新版Llama 3 70B反超405B!Meta开卷后西宾,谷歌马斯克都来抢镜
克雷西 发自 凹非寺人妖 telegram
量子位 | 公众号 QbitAI
OpenAI“双12”刚进行到第二天,就把大模子圈搅得好不骚扰!
一边是Meta没预报就发布了Llama 3.3,70B版块就能收场过去405B的性能。
另一边谷歌的Gemini也上线了新的实际版模子,再一次登上大模子竞技场榜首。
有网友嘉赞,o1、Llama 3.3和新版Gemini接连发布,马斯克的Grok3也要来,还有GPT-4.5初露脉络……这几乎是最棒的一个圣诞季。
Llama 3.3:70B收场405B后果
Llama 3.3目下唯有70B一个型号。
但在指示撤职(IFEval)、数学(MATH)、推理(GPQA Diamond)等界限,水平都高出了七月份发布的Llama 3.1 405B。
在言语(MMLU)、代码(HumanEval)、长文本和多语种才气上,得益也和Llama 3.1 405B比拟接近。
而在器用使用(BFCL)上,和405B的差距则显得稍大一些。
不外,Llama 3.3的使用老本要比Llama 3.1 405B低得多。
固然Llama自身是免费的,然而各个大模子平台的作事价钱也可以行为经营老本的一个参考。
在Meta互助的平台当中,Llama 3.3最低廉的价钱是0.1/0.4好意思元每百万输入/输出Token。
而Llama 3.1 405B,则是1好意思元每百万输入token,是Llama 3.3的10倍,输出token为1.8好意思元,是Llama 3.3的4.5倍。
Meta生成式AI团队指点者Ahmad Al-Dahle暗示,Llama 3.3能用70B收场405B的后果,主淌若“利用了后西宾时刻的最新推崇”,并点名其中包括在线偏好优化(online preference optimization)。
Meta AI官方账号也提到,Llama 3.3的逾越归功于新的对都经过和在线强化学习时刻的逾越。
目下,Llama 3.3的模子权重已在官网和Hugging Face上盛开下载。
Gemini迎来周岁诞辰
Gemini 1206上线的这天,刚好是Gemini的一周岁诞辰。
不外,从节律和以日历定名的容貌来看,Gemini更像是一次例行更新(上一个版块是1121)。
天然得益已经很可以的,径直登上了lmsys大模子竞技场的榜首。
而况不仅仅总得益夺冠,勤苦领导词、代码、数学、创意写稿等各个单项名次也都是第一。
本体上,Gemini此前有个1114版块,也当了一周的“榜一老迈”,其后被更新的GPT-4o给比了下去。
当今的最新版块,又让Gemini重新回到了榜单上的王座。
此外,谷歌AI Studio居品认真东说念主(原OpenAI成立者社区摆布)Logan先容,Gemini 1206领有2百万token的高下文窗口,目下可通过谷歌AI Studio和Gemini API免费使用。
谷歌首席科学家Jeff Dean暗示,获取这么的得益是对Gemini诞辰最佳的庆祝容貌。
不外也有网友给谷歌泼了盆冷水,暗示o1还没出当今这个榜单上,而况GPT-4.5就要来了,谷歌第一的位置只怕很快又会被OpenAI夺走。
One More Thing
除了谷歌和Meta,马斯克xAI也被哄传行将发布Grok 3。
有网友发现,正在测试的Grok 2 mini隐没了,以为这是要发Grok 3的征兆。
除了对Grok 3的推测,还有一条更细则的音问——此前要充会员才能用的Grok,当今可以免用度了。
不外免用度户用量比拟有限,每两小时只可科罚10条音问,而图片分析一天只可科罚三张。
有趣味的是,咱们试了试究诘Grok我方,它也暗示Grok 3野心在这个月上线。
但捏马的是,点进背面援用的音问源,发现这名博主亦然问Grok之后发的帖子……
那么,在这个发布密集的十二月,你最钟意不祥最期待哪一款居品呢?
参考荟萃:
日韩av[1]https://x.com/AIatMeta/status/1865079067390956006[2]https://x.com/Ahmad_Al_Dahle/status/1865071436630778109[3]https://x.com/lmarena_ai/status/1865080944455225547— 完 —
量子位 QbitAI · 头条号签约
怜惜咱们人妖 telegram,第一时候获知前沿科技动态