OSI发布首个开源AI定义框架，推动人工智能领域透明化发展

开放源代码促进会（OSI）公布了一个定义框架，以评估人工智能系统是否可以归类为开源。

第一个开源人工智能定义 (OSAID) 在All Things Open 大会上发布，标志着全球多年研究、国际研讨会和长达一年的社区设计过程的全面努力的成果。

OSI 被世界各地的个人、组织和政府机构公认为开源定义的权威机构，它通过与行业利益相关者的广泛合作开发了该框架。该框架定义了开源 AI 的含义，并坚持认为无论是功能齐全的 AI 系统、模型、权重和参数还是其他结构元素，都适用相同的开源要求。

开源人工智能系统必须在授予四项基本自由的条款下提供：

这些自由既适用于功能齐全的系统，也适用于系统的离散元素。行使这些自由的前提是能够访问首选形式来修改系统，其中包括详细的数据信息、完整的源代码和模型参数。

OSI 董事会主席 Carlo Piana 表示：“开源 AI 定义 1.0 版的共同设计过程非常完善、全面、包容且公平。董事会相信，该过程产生的定义符合开源定义和四项基本自由中定义的开源标准。”

该框架最重要的要求之一是要求开源模型提供足够的有关其训练数据的信息，以确保“熟练的人员可以使用相同或相似的数据重新创建基本等效的系统”， Mozilla人工智能战略负责人 Ayah Bdeir 表示。

贝德尔承认，尽管这种方法可能并不完美，但它代表了意识形态纯粹性和现实世界实施之间的实际妥协。她表示，要求不切实际的高标准可能会对该倡议的目标产生反作用。

数字公共产品联盟( DPGA) 表示支持 OSI 在定义开源 AI 方面的领导地位。DPGA 秘书处首席执行官 Liv Marte Nordhaug 证实，该组织将把这项基础工作纳入 AI 应用数字公共产品标准的更新中。

以在人工智能开发领域从事非营利工作而闻名的EleutherAI 研究所也认可了这一定义。

EleutherAI 研究所执行董事 Stella Biderman 表示：“开源 AI 定义是推动 AI 领域开源原则优势的必要步骤。我们相信，这一定义支持独立机器学习研究人员的需求，并促进最大的 AI 开发商之间的更大透明度。”

该定义强调了在共享开源模型和权重时包含数据信息和代码的重要性。这些要求确保了透明度和修改人工智能系统的能力。

OSI 执行董事 Stefano Maffulli 承认开发过程中面临的挑战，并指出尽管偶尔会出现激烈的争论和不同的意见，但最终结果与项目最初的目标一致。

他说道：“这是一个起点，我们将持续努力与社区合作，逐步完善这一定义。”

OSAID 不需要特定的法律机制来确保模型参数可供所有人免费使用，尽管它可能涉及许可证或法律文书。随着法律体系处理这些开源人工智能系统，这一方面预计将随着时间的推移变得更加清晰。