10月8日消息,据外媒援引知情人士的话称,微软计划在下个月的年度开发者大会上推出该公司首款AI芯片。
微软的芯片类似于英伟达的图形处理单元(GPU),专为数据中心服务器设计,用于训练和运行大型语言模型,这是OpenAI的ChatGPT等会话人工智能功能背后的软件。微软的数据中心服务器目前使用英伟达的GPU来支持OpenAI和Intuit等云客户,以及微软生产力应用程序中的人工智能功能。
这款代号为“Athena(雅典娜)”的芯片可能会在11月14日于西雅图举行的微软Ignite大会上亮相。雅典娜预计将与英伟达的旗舰微处理器H100 GPU竞争,以加速数据中心的人工智能。这款定制芯片已经由微软及其合作伙伴OpenAI的团队秘密测试。
微软在2019年左右开始开发雅典娜芯片,寻求削减成本,同时也希望在与英伟达的谈判中增加筹码。Azure目前依靠英伟达的gpu来支持微软、OpenAI和云客户使用的人工智能功能。但有了雅典娜,微软可以追随竞争对手AWS和谷歌的脚步,向云用户提供自己的AI芯片。
雅典娜的性能细节尚不清楚,但微软希望该芯片能与英伟达的H100相媲美。虽然许多公司都在吹捧卓越的硬件和成本效益,但由于英伟达的CUDA平台,该公司的GPU仍然是人工智能开发者的首选。吸引用户使用新的硬件和软件将是微软的关键。
在GPU供应紧张的情况下,微软内部开发AI芯片也可能减少对英伟达的依赖。据报道,在开始与OpenAI密切合作后,微软订购了至少数十万颗英伟达芯片,以支持OpenAI的产品和研究需求。
OpenAI可能也在考虑减少对微软和英伟达芯片的依赖。最近有报道称,人工智能研究实验室正在考虑制造自己的AI芯片。OpenAI网站上最近发布的招聘信息也表明,该公司打算招聘人才来评估和共同设计人工智能硬件。
虽然微软和其他云提供商没有立即停止从英伟达购买GPU的计划,但从长远来看,说服他们的客户更多地转向内部芯片,而不是英伟达的GPU服务器,在经济上可能是有益的。微软还与AMD在其即将推出的AI芯片MI300X上密切合作。随着人工智能工作负载的激增,这种多样化的方法提供了多种选择。云计算的竞争对手也在采用类似的策略来避免厂商锁定。
亚马逊和谷歌已经将他们的AI芯片战略性地整合到他们云业务的推广中。亚马逊向OpenAI的竞争对手Anthropic提供了资金支持,条件是Anthropic将使用亚马逊的人工智能芯片Trainium和interentia。与此同时,谷歌云宣布,包括人工智能图像开发商Midjourney和Character AI在内的客户正在使用该公司的张量处理单元。
随着AI芯片成为数据中心的重要组成部分,押注这一领域的回报可能会很高。随着这一发展,微软也将加入竞争对手的行列,争夺AI芯片领域的市场份额。有了雅典娜,微软可以为云计算客户提供更多选择,同时在下一代人工智能基础设施方面制定更独立的路线。