充分利用开源AI

发表时间:2024-04-23 11:44作者:A16Z

科技风蓝色CHATGPT公众号封面首图__2024-04-23+11_49_16.jpg


在人工智能的世界里,很少有术语能像一个简单的四个字母的单词“Open”那样引起如此多的反应。无论是围绕商业模式和“开放”实际定义的行业辩论,

还是政府积极讨论如何规范模型,似乎每个人都对人工智能模型的“开放”含义有自己的看法,包括好的、坏的和丑陋的方面。


但平心而论,这种情况有其原因。在一个许多开发者已经习惯于在技术栈的每个层面上都使用开源工具的世界里,强大的模型被锁定在企业许可证和公司道德

后面的想法可能会令人不安——尤其是对于像人工智能这样承诺带来变革性变革的技术。更广泛地说,这是一个谁能够在该领域创新的问题,以及人工智能建

设者需要遵守谁的发布时间表和安全护栏的问题。


在这一集的播客中,我们重放了一场在二月份的小组讨论,重点关注了开源人工智能模型的现状和未来。由a16z普通合伙人安杰尼·米德哈(Anjney Midha)

主持,讨论特邀了三位小组成员(吉姆·泽姆林(Jim Zemlin),Linux基金会;米切尔·贝克尔(Mitchell Baker),Mozilla;以及珀西·梁(Percy Liang),斯坦福大学

/Together AI),他们对这个话题有很多思考,并有几十年在开源工作中的实战经验。他们讨论了当今人工智能时刻与以往关于开源的辩论如何比较,分享了他们

对“开放”的定义,并就如何最好地确保人工智能社区拥有一个开放的未来提供了建议。


以下是讨论的一些亮点(略有编辑):


米切尔·贝克尔:“开源社区管理的一件事是能够在一系列定义上相互共存。我的意思是,我们斗争过,但那场斗争出现在开源许可证中……这些是真正的

激烈战斗,比如‘这是我的宪法,这是我的社区’。”


“但有一个规范定义,人们可以在谱系上的不同地方。所以我认为现在有一个开放的东西,不是开源,而是开放,这将非常有用。作为一个社区,我们说,

‘这是完全开放的。你谈论的是中间的某个部分’,并且有谱系上的一些地方,能够围绕其中的某个部分团结起来。”


“现在,会有差异,我们可能会在我们自己之间为是否最大化主义是唯一真正的方式而战斗。但我认为在当今环境下,这比早期的开源压力要大得多,

[我们必须]能够在一个社区内容纳细微差别,并理解在整个谱系中,我们正在寻找的有关开放的某些东西。”


珀西·梁:“我觉得一些[监管]决策……是基于猜测和不确定性,因为我们根本没有证据。例如,我认为有很多人担心这些模型被用来生成虚假信息或帮助

人们制造生物武器等等……所有这些都是真的,你可能会提示Llama 2让它告诉你一些事情,但问题是,你做什么?你关闭Llama 2吗?”


“我认为那个特定案例没有意义,因为如果你看看整个生态系统,嗯,有其他方式你可能会获得信息。也许它更快地将信息传递给你,现在你必须考虑这涉及多少

额外风险。然后还有虚假信息的传播或生物武器的制造,也许监管应该更针对下游而不是上游的实际原始模型。”


“所以这些是需要进行的关于适当反应的讨论。但是,是的,当然,这些技术可能会被滥用。我认为这是理所当然的,但你如何应对这需要实际的细微差别和审查。


吉姆·泽姆林:“开源社区非常擅长很多事情。他们不擅长的一件事是集体向政策制定者用简单的术语解释。拥有一个更统一和清晰的声音是我认为相当困

难的事情……我认为有机会向政策制定者介绍技术栈的细微差别,哪些地方更加开放或不那么开放——在硬件层面、构建块层面、数据层面是否过于集中?”


“[也有机会]避免经典的当技术制造问题时,答案总是更多的技术。在这种情况下,我认为我们可以做一些工作来避免一些监管机构会实时查看的最直接的担忧。”


如果你喜欢这一集,你还可以听听我们本周发布的另一集:Scope the Enterprise LLM Market。特邀嘉宾是纳文·劳(Naveen Rao),一位两次创办人工智能公司

的创始人,目前是Databricks生成性人工智能的副总裁。


以上内容来自:https://a16z.com/podcast/making-the-most-of-open-source-ai/


Futhercloud.com



未画科技是一家以云计算和人工智能技术为基础的企业人工智能解决方案供应商。致力于为企业和组织提供企业级的生成式大模型的开发平台FutherFlow和高性能的算力云服务Futhercloud。