中国电信是一家国有运营商,该公司开发了两款完全在国产处理器上进行训练的LLMs。
这一突破体现了中国在芯片自主化,特别是在人工智能领域取得的进步。
该公司的人工智能研究院宣布,其开源模型 TeleChat2-115B 以及另一个未公开的模型在数万个中国芯片上进行了训练。鉴于美国对中国获取尖端芯片(如 Nvidia 最新的 AI 处理器)的限制日益严格,这一消息尤为重要。
据人工智能研究院称,这一成就体现了我国在培养自己的法学硕士方面完全自给自足,这些硕士为 OpenAI 的 ChatGPT 等工具提供了支持。他们还认为这是中国追求人工智能技术创新和独立的新篇章的开始。
中国电信透露,这个未命名的模型拥有一万亿个参数。通俗地说,参数是人工智能模型在训练过程中用来学习的变量;模型的参数越多,它就越聪明,越强大。另一个模型TeleChat2-115B拥有超过1000亿个参数。
中国公司正在努力保持人工智能领域的竞争力,尤其是在华盛顿实施出口限制的情况下。尽管中国电信没有具体说明芯片供应商,但《南华早报》报道称,该公司此前曾提到华为的 Ascend 芯片是其 LLM 开发的一部分。
受到美国制裁的华为最近开始与中国潜在客户测试一款新的人工智能处理器。各家公司都在寻找英伟达高端硬件的替代品,而华为似乎正在填补这一空白。
据消息人士透露,华为已向中国主要服务器公司提供 Ascend 910C 处理器样品进行测试。该芯片还将提供给中国互联网公司,其中许多公司长期以来一直依赖 Nvidia 的技术。
对于本土 AI 公司而言,华为的 Ascend 芯片和训练解决方案正成为 Nvidia 产品的可行替代品。除华为外,中国电信还通过其国云服务提供中国初创公司寒武纪的处理器。
这些合作可能会帮助中国最大限度地减少对 Nvidia GPU 等外国芯片的依赖,这些芯片长期以来一直是训练 AI 模型的首选。
由于美国出口法规限制获取 A100 和 H100 等先进 Nvidia GPU,一些国内AI公司不得不求助于黑市。然而,许多公司选择使用功率较低的替代品,以确保他们能够继续享受 Nvidia 的官方支持和服务。