Meta发布开源AI模型Llama 31,训练期间使用16万个英伟达H100 GPU

发布日期:2024-09-09 15:14

来源类型:开心锤锤 | 作者:少主刘粲

阅读提醒: 当地时间 7 月 23 号,Meta 公司发布了迄今为止最强大的开源 AI 模型 Llama 3.1。该模型不仅规模庞大,性能也堪比最强大的闭源模型。这称得上是开源 AI 领域的一个重要里程碑。Llama 3.1 模型家族总共有三个版本,规模最大的旗舰版本拥有 405B(4050 亿)参数,是近年来最大的开源 AI 模型。其余两个较小版本的参数量分别是 700 亿和 80 亿。Meta 声称,Ll...
【2024澳门天天开好彩大全开奖记录】 【澳门天天六开彩正版澳门】 【白小姐三肖】 【2024年正版资料免费大全】 【澳门最准一肖一码】 【澳门一码一码100准确】 【澳门天天开彩期期精准】 【2024澳门天天六开彩结果】 【管家婆一肖一码一个】 【2024澳门精准正版澳门码】 【澳门六开彩天天开奖结果】 【2024香港正版资料大全视频】 【2024新澳天天开好彩大全】

当地时间 7 月 23 号,Meta 公司发布了迄今为止最强大的开源 AI 模型 Llama 3.1。该模型不仅规模庞大,性能也堪比最强大的闭源模型。这称得上是开源 AI 领域的一个重要里程碑。


Llama 3.1 模型家族总共有三个版本,规模最大的旗舰版本拥有 405B(4050 亿)参数,是近年来最大的开源 AI 模型。其余两个较小版本的参数量分别是 700 亿和 80 亿。


Meta 声称,Llama 3.1 405B 模型在多项基准测试中的表现超过了 OpenAI 的 GPT-4o 和 Anthropic 的 Claude 3.5 Sonnet。


“到目前为止,开源大型语言模型在功能和性能方面大多落后于闭源模型。现在,我们正迎来一个由开源引领的新时代。”


Meta 在官方博客中写道,“迄今为止,所有 Llama 版本的总下载量已超过 3 亿次,而这仅仅是个开始。”



(来源:Meta)



模型评估


据介绍,Llama 3.1 系列模型展现了多方面的能力提升,在常识、可操纵性、数学、工具使用和多语言翻译等功能方面可与顶级 AI 模型相媲美。


Meta 对 Llama 3.1 进行了全面的评估,包括超过 150 个基准数据集的测试,涵盖多种语言和任务类型。


此外,该模型还经过了广泛的人工评估,与竞争模型在真实应用场景中进行比较。



图 | 模型评估结果(来源:Meta)


总体而言,Llama 3.1 405B 模型在推理、数学等多项任务中的表现与 GPT-4、GPT-4o 和 Claude 3.5 Sonnet 相当,在长文本、多语言等领域甚至更胜一筹。


不过在代码基准测试中,Llama 3.1 405B 模型的表现不如 Claude 3.5 Sonnet。



图 | 模型评估结果(来源:Meta)


此外,在小型模型性能对比中,Llama 3.1 的 8B 和 70B 模型均表现出色,与同等规模的闭源和开源模型相比具有很强的竞争力,在几乎所有测试中都打败了对手。



图 | 模型评估结果(来源:Meta)



模型能力与应用


Meta 表示,Llama 3.1 系列模型的上下文窗口达到了 128K,相当于一本 50 页的书,并且提供英语、德语、法语、意大利语、葡萄牙语、印地语、西班牙语和泰语等多语言支持,大大提升了长文本和多语种内容的处理能力。


Meta 生成式人工智能副总裁艾哈迈德·达尔(Ahmad Al-Dahle)表示,Llama 3.1 模型能够集成搜索引擎应用程序编程接口(API,Application Programming Interface),根据复杂查询从互联网检索信息,并调用多个工具完成任务。例如,它可以生成并执行 Python 代码来绘制图表。


不过,Llama 3.1 目前还不是多模态模型,仅支持文本输入。但 Meta 表示,正在开发能识别图像、视频,并理解(和生成)语音的 Llama 模型。


在应用方面,与之前的 Llama 模型一样,Llama 3.1 405B 可在亚马逊 AWS、微软 Azure 和谷歌 Cloud 等云平台上下载或使用。它还会与 Meta 的产品结合,为用户提供聊天机器人和信息查询等服务。


该模型目前已经用在 Meta.ai 和 Meta AI 虚拟助手上。从本周开始,Llama 3.1 将首先登陆 WhatsApp 和美国的 Meta.ai 网站,随后几周将上线 Instagram 和 Facebook。


虽然最先进的 Llama 3.1 405B 模型可以在 Meta.ai 上免费使用,但每周提示数量有限(上限不详),超过限制则会切换到更小的 70B 模型。这似乎表明 405B 模型对于 Meta 来说还是太昂贵了,无法全面运行。



模型规模与训练


Llama 3.1 405B 模型的训练规模令人惊叹。


Meta 使用了超过 1.6 万个英伟达 H100 GPU,在超过 15 万亿个 tokens(的数据集)上进行训练,相当于 7500 亿个单词。


尽管 Meta 没有透露具体的开发成本,但仅根据其使用的英伟达芯片价格估算,成本就已高达数亿美元。


Meta 对其整个训练堆栈进行了重大优化,以达到如此大规模的训练目标。


在模型架构方面,他们选择了标准的仅解码器 transformer 模型,而非混合专家模型,以最大化训练稳定性。


训练数据方面,Meta 通过改进处理和数据筛选流程,提高了训练数据的质量。


此外,他们还选取了迭代式的后训练程序,“每轮都使用监督微调和直接偏好优化,用高质量的合成数据不断提升模型性能”。



开源策略与生态系统


尽管开发成本高昂,Meta 仍坚持开源 Llama 模型。


Meta 的 CEO 马克·扎克伯格(Mark Zuckerberg)在公开信中表示,相比专有模型,开源 AI 模型终将超越它们,并且已经在以更快的速度改进,最终和 Linux 一样,成为支持大多数手机、服务器和设备的开源操作系统。


他预测,“Llama 3.1 的发布将成为行业的一个转折点,未来大多数开发者更青睐于使用开源模型。”



图 | 扎克伯格的公开信(来源:Meta)


为了推广 Llama 3.1,Meta 正与包括微软、亚马逊、谷歌、英伟达和 Databricks 在内的 20 多家公司合作,帮助开发者部署自己的模型。


Meta 声称,Llama 3.1 在生产环境中的运行成本仅为 OpenAI 的 GPT-4o 的一半左右。


与此同时,Meta 更新了 Llama 的许可条款,让开发者可以通过 Llama 3.1 模型的输出,来开发第三方 AI 模型。


这一变化解决了 AI 社区对 Meta 模型的一个主要批评,是公司积极争取 AI 领域话语权的一部分。


此外,为了确保模型的安全性和道德性,Meta 首次在 Llama 3.1 的“红队测试”(对抗性测试)中包括了潜在的网络安全和生物化学用例。


他们还公开了一个完整的参考系统,其中包括多个示例应用程序和新组件,如多语言安全模型 Llama Guard 3 和提示注入过滤器 Prompt Guard。


然而,关于训练数据的问题仍然存在争议。Meta 拒绝透露具体的数据来源,只表示使用了合成数据来改进模型。


总而言之,Llama 3.1 系列模型的发布,象征着开源 AI 模型在性能上第一次和顶级闭源模型相匹敌。这可能会对 AI 行业产生深远影响,推动更多创新和应用。


参考资料:

https://ai.meta.com/blog/meta-llama-3-1/

https://about.fb.com/news/2024/07/open-source-ai-is-the-path-forward/

https://www.theverge.com/2024/7/23/24204055/meta-ai-llama-3-1-open-source-assistant-openai-chatgpt

https://techcrunch.com/2024/07/23/meta-releases-its-biggest-open-ai-model-yet/


运营/排版:何晨龙

【2024澳门六开彩开奖结果查询表】 【2024澳门天天六开彩免费】 【2024澳门正版开奖结果】 【2024年新澳门精准免费】 【澳门六开彩天天免费领取】 【澳门王中王100%的资料2024】 【2024新澳门天天开好彩大全】 【新澳精准资料免费提供】 【今天新澳门结果】 【澳门三码三码精准】 【2024澳门天天六开好彩】 【2024澳门天天开好彩大全53期】 【热播综艺推荐】 【新澳门六开彩开奖网站】
【新澳2024年精准资料期期】 【澳门彩资料大全书】 【澳门六开彩天天开奖结果生肖卡】 【新奥门特免费资料大全】 【新澳内部资料精准一码】 【2024天天开好彩大全正版】 【澳门一码一肖一待一中】 【新澳天天开奖资料大全】 【王中王免费资料大全料大全一一】 【澳门一码一肖一特一中管家婆】 【郑州暴雨一男子遇险死亡】 【2024新澳门天天彩开奖记录】 【2024澳门天天开彩】 【2024年澳门的资料】

下载中心

视频封面

视频名称:电影《姥姥的外孙》曝“姥姥的石榴树”片段 细节拉满透视中式家庭

大小: 6.5GB 下载:(768245) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:补贴15%,最高2000元!八种家电以旧换新实施细则发布!

大小: 8.4GB 下载:(444025) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:团长靳东:行动大于一切好的作品才是王道魏楷之下,苏轼<明月几时有>的古韵新章(书法:张德进)

大小: 4.9GB 下载:(57866) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:沙特掀桌子,力挺巴勒斯坦!中东纷纷看向普京,中东大战正在酝酿

大小: 6.4GB 下载:(218208) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:月嫂烫伤出生27天婴儿,上海宝妈质疑事情没解决月嫂竟能继续上户

大小: 4.9GB 下载:(108205) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中国驻米兰总领事馆举办“温暖迎春”新春招待会唐朝诗人贺知章,为啥在仕途上比李白混得好?扒一扒贺知章的故事

大小: 7.5GB 下载:(117255) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:DNF手游攻略:每日投入两小时,零氪金也能尽数收获所有奖励!为什么刘亦菲从不接清宫戏,当她换上“甄嬛装”后,一出场就剧终

大小: 4.6GB 下载:(541863) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:锐评|让英雄的店一直火!火锅店排队,是善意和敬意的汇聚

大小: 6.2GB 下载:(345261) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:突发!中国银行行长,辞职

大小: 9.1GB 下载:(926340) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:要掀桌子?中美在北京开始举行一轮战略沟通,中方就台湾问题关切

大小: 4.9GB 下载:(30991) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:为什么你做的长线投资总在亏?

大小: 3.1GB 下载:(445565) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:为建设中华民族现代文明贡献学理智慧——“建设中华民族现代文明”研讨会综述

大小: 6.2GB 下载:(260096) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:把记载做厚、纪念做长,福寿园发布数字家祠“元家载”弗里克再造惨案,巴萨7-0巴拉多利德,拉菲尼亚戴帽+助攻,莱万传射

大小: 8.4GB 下载:(261226) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:【新思想引领新征程】数字中国绘就高质量发展新图景

大小: 9.3GB 下载:(166150) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《青春有你2》开播,导师才艺秀炸场,网友:大型lia粉丝见面会他贪污2000万,恶意限制国乒,逼刘国梁孔令辉退役,如今惩罚到了

大小: 7.5GB 下载:(889853) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:新风向!这届年轻人,洗浴中心打游戏!

大小: 2.1GB 下载:(971202) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:TF三代团出道,六子成团笑翻全网:这组合能处,有颜有才自带笑点

大小: 4.7GB 下载:(240076) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:惊呆了!芭莎爆料四大女艺人耍大牌,她们的真实面目竟是这样!

大小: 6.2GB 下载:(724342) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:刚刚,伊朗大消息,国际原子能机构表态!深夜,金融大佬去世!最新任命,事关“国家队”五代的历史就是一部皇帝和武将相互猜忌的历史

大小: 7.1GB 下载:(658952) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:美媒:拜登最新表态称“没人能让我出局,我会竞选到底”

大小: 9.8GB 下载:(380924) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:笑晕了!邱贻可与方博直播,必提莎莎,主打真诚,马琳会取代他吗

大小: 7.1GB 下载:(574032) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:中油电能公布拟收购融资,融资额5979亿人民币,投资方为中国石油天然气集团修勾真的好可爱!

大小: 7.3GB 下载:(197542) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:贾康:中国房地产市场变化趋势与房地产税改革

大小: 6.7GB 下载:(620662) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:体育教师集体备课现象如何加强管理与改善

大小: 3.6GB 下载:(968167) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:那个人要来了,德国会变天吗?

大小: 5.1GB 下载:(967774) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:惊人一幕!老农劳作热情过高,心脏起搏器竟“跳出”体外

大小: 9.2GB 下载:(216743) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:“多线作战”或加剧乌克兰军队人力危机

大小: 1.3GB 下载:(911697) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:《恋与深空》推出“靖西绣球”限定活动,全球玩家共赏中国非遗之美《度华年》前世今生都选择了家族,苏容卿对李蓉的爱根本拿不出手

大小: 8.6GB 下载:(769676) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:银行理财净值大面积回撤,什么原因?影响多大?投资者该如何操作?

大小: 2.5GB 下载:(435924) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:一对环球旅行者如何用6大穷游方法以2500美元旅行了24个国家?

大小: 9.3GB 下载:(392075) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)
视频封面

视频名称:罗永浩“真还传”第二季:已还债824亿

大小: 7.6GB 下载:(653931) 语言: 中文字幕 最后更新: 2024年09月10日

下载视频 (注:防盗链已开启)

评论

打开APP查看45条评论

卜建钦

2秒前

该模型目前已经用在 Meta.

刘劬

5分钟前

这似乎表明 405B 模型对于 Meta 来说还是太昂贵了,无法全面运行。

崔圆圆

2天前

1 的发布将成为行业的一个转折点,未来大多数开发者更青睐于使用开源模型。

发表您的评论: