分类导航

服务器资讯|IT/互联网|云计算|区块链|软件资讯|操作系统|手机数码|百科知识|免费资源|头条新闻|

服务器之家 - 新闻资讯 - 手机数码 - 可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

2023-10-13 20:49未知服务器之家手机数码

IT之家 10 月 13 日消息，据 Y Combinator 论坛消息，名为 Georgi Gerganov 开发者日前使用苹果 M2 Ultra 芯片，进行了一系列 LLaMA 模型推理测试，测试显示该芯片在并行运行 128 个 Llama 2 7B 流时，效果较佳。 ▲ 图源Georgi Gerganov 在GitHub 披露

IT之家 10 月 13 日消息，据 Y Combinator 论坛消息，名为 Georgi Gerganov 开发者日前使用苹果 M2 Ultra 芯片，进行了一系列 LLaMA 模型推理测试，测试显示该芯片在并行运行 128 个 Llama 2 7B 流时，效果较佳。

可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

▲ 图源Georgi Gerganov 在GitHub 披露的测试表现

据悉，LLaMA 模型推理测试强调内存带宽，而非计算能力，而苹果的 M2 Ultra 芯片号称“内存带宽达800GB/s”，因此推理时效果良好。

可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

▲ 图源Georgi Gerganov 在 GitHub 披露的测试表现

不过虽然 M2 Ultra 芯片的内存带宽具有优势，但用户最多只能获得 192 GB RAM，用户花费 5600 美元（IT之家注：国行 44999 人民币）购买搭载 M2 Ultra 芯片及 192GB 运行内存的 Mac Studio，价格足够买一台“拥有 1TB RAM、搭载 RTX 4090 的 PC”。

可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

▲ 图源Y Combinator

可并行运行 128 个 LLaMA 2 7B 流，开发者测试苹果 M2 Ultra 芯片模型推理表现

▲ 图源苹果官网

Georgi Gerganov 据此认为，如果用户的工作负载（如推理）不需要超过 192 GB，那么选择相关机器时可以更重视“内存带宽”表现，但如果用户有其他工作需求，则可以看看相对应价格的 PC。

参考

M2 Ultra can run 128 streams of Llama 2 7B in parallel
开发者在 GitHub 上提交的测试结果

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

延伸 · 阅读

2024-12-13宁王疑似内涵王多多：我老了可以告诉儿子我有
2024-12-13《博德之门3》Steam促销开启！238.4元即可体验年度
2024-12-13世界首颗！日本木壳人造卫星升空：完成使命后
2024-12-13曝小米15系列激活量接近80万！破百万或指日可待
2024-12-13AYANEO 3掌机官宣!定位年度旗舰双AMD处理器可选
2024-12-13索尼总裁谈《星鸣特攻》暴死：索尼仍在学习未

精彩推荐

手机数码

特斯拉人形机器人将于 7 月亮相上海 2023 世界人工智能大会

IT之家 6 月 30 日消息，据上海浦东发布官方微信消息，2023 世界人工智能大会将于 7 月 6 日至 8 日在上海举办。本届大会聚焦科学前沿和产业发展，围绕技...

未知702023-06-30
手机数码

华为折叠屏手机Mate X维修价格公布屏幕组件需7080元

近日，华为官方公布了华为Mate X的维修价格。据华为商城显示，华为折叠屏手机 Mate X屏幕组件维修价格为 7080 元，主板维修价格为 3579 元，左右电池盖维...

站长之家6112019-11-20
手机数码

联想全新 ThinkPad E16 笔记本即将推出：16 英寸 2.5K 屏、13代酷睿处

IT之家 5 月 16 日消息，联想海外官网现已公布了全新 ThinkPad E16Gen 1 (Intel) 笔记本的详细信息，预计将在不久后推出。这款笔记本属于 ThinkPad E 系列，即定位...

未知1862023-05-16
手机数码

iOS14beta5需要升级吗 iOS14beta5使用体验怎么样

苹果公司在8月19日推出了 iOS14 beta5测试版，这也是iOS14第五个测试版本，主要修复了上个版本存在的《王者荣耀》闪退、手机容易发热等问题，不少用户想...

站长之家7542020-08-21
手机数码

夏天打开IQUNIX OG80 快乐贩卖机的正确方法

打哈欠会传染，这是我们都知道的冷知识。而告诉你买东西也一样会被传染你信不信？就如同我身边很多人都买了BMW，什么540Li啊，X3啊，我要是有点钱估计...

zzvips.com2192022-12-03
手机数码

m1蓝牙连接不上是怎么回事苹果M1 Mac蓝牙经常断是什么原因

m1蓝牙连接不上是怎么回事?据 AppleInsider 报道，许多新的 M1MacBook Air，MacBook Pro 和 Mac mini 用户遇到了蓝牙连接的问题，这对于独立的 Mac mini 来说尤其令人烦...

站长之家13192020-11-26
手机数码

华为余承东：用十年努力让方舟编译器对话世界，接下来会全面

2019 华为全球开发者大会将在8月9日-11日在华为松山湖基地召开。本次开发者大会邀请了1500位合作伙伴、5000名全球开发者，将是华为历来规模最大的一次会...

IT之家3092019-08-06
手机数码

消息称英伟达将推 RTX 4080 Ti 显卡，与 4080 同价

IT之家 10 月 7 日消息，据可靠爆料人“MEGAsizeGPU”消息，英伟达将在 2024 年初推出 RTX 4080 显卡的升级版，可能称为 RTX 4080 Super 或 RTX 4080 Ti。 RTX 4080 Ti 将搭...

未知1312023-10-07