作者和 OpenAI 的 ChatGPT 的版权之争

四年前,我出版了我的第一本书:《末世:世界末日简要指南》

它确实…好吗?我在您现在正在阅读的网站上获得了问答 -谢谢,迪伦!——这本书最终帮助我找到了运营 Future Perfect 的工作。有一天,我从一个电台热播节目转到另一个电台热播节目,试图用五分钟的片段向从费城到菲尼克斯的早间 DJ 解释为什么我们应该更加担心人类灭绝的威胁,以及我们可以采取哪些措施来防止这种情况的发生。 。

但它并不是畅销书。让我们这样说吧——大约每六个月,我就会收到出版商的一封信,其中包含“不支付版税声明”,这有点像从你父母那里得到一张圣诞贺卡,只不过它没有钱,只是包含了记下告诉你他们养育你花了多少钱。

所以我承认,几个月前,当我收到来自aisafety.info的人发来的一封电子邮件时,我有点高兴,他们的目标是创建一个集中中心,用于解释有关人工智能安全和人工智能一致性的问题——如何让人工智能对人类目标负责——对普通受众负责。为此,他们正在构建一个大型语言模型(取了一个令人愉快的名字“ Stampy ”),它可以充当聊天机器人,回答人们可能提出的有关该主题的问题。(该网站刚刚软启动,而 Stampy 仍处于原型阶段。)他们请求允许使用我的书《End Times》,其中包含关于人工智能存在风险的长章,作为 Stampy 将训练的数据的一部分在。

我的第一个想法,就像任何作者的想法一样:有人实际上读过(或者至少知道)我的书!但后来我又想到:作为一名作家,允许聊天机器人接受你自己作品的训练意味着什么?(而且是免费的,不少于。)我是否为一个可以帮助人们更好地理解像人工智能安全这样复杂而重要的主题的项目做出了贡献?或者我只是在加速自己的过时过程?

培训天数

随着像 ChatGPT 这样的大型语言模型变得更加广泛和更加强大,这些都是现在的问题。正如我的同事萨拉·莫里森 (Sara Morrison)今年夏天报道的那样,已经有一些代表作家和艺术家针对谷歌和 OpenAI 等大型科技公司提起的集体诉讼,这些公司声称他们的作品(包括整本书)已被用来训练聊天机器人,而无需任何授权。他们的许可并且没有报酬。8 月,一群著名小说家——包括《权力的游戏》作者乔治·R·R·马丁(George RR Martin),他确实还有其他一些截止日期需要遵守——对 ChatGPT 制造商 OpenAI 提起诉讼,指控其“大规模系统性盗窃”。

这种担忧并不是什么新鲜事——科技公司长期以来一直因利用人们的数据来改进和完善他们的产品而受到批评,而这种方式通常对普通用户来说远非透明。但人工智能的感觉有所不同,瑞安·克拉克森律师告诉萨拉,他的律师事务所是一些集体诉讼的幕后黑手。“到目前为止,科技公司还没有在生成式人工智能方面做到他们现在正在做的事情,即获取每个人的信息并将其输入到产品中,从而导致人们的职业过时,并以以前难以想象的方式彻底破坏他们的隐私。 ”。

在这里我要指出的是,aisafety.info 所做的事情与 Meta 或 Microsoft 等公司的工作有着根本的不同。一方面,他们在使用我的作品之前征求了我作为作者的许可。这非常有礼貌!

除此之外,aisafety.info 是一个非营利性研究小组,这意味着没有人会从我的工作提供的培训数据中赚钱。(我怀疑这一事实不会让我的出版商感到惊讶。) 聊天机器人 Stampy 将成为一种教育工具,作为 Vox 部门的负责人,该部门非常关心强大人工智能的风险,我很高兴我的工作可以在让机器人变得更聪明方面发挥一些小作用。

我们迫切需要有关人工智能风险的更可靠的信息来源。“我认为人们对人工智能一致性和安全性的普遍理解非常差,”aisafety.info 的罗伯特·迈尔斯告诉我。“我想说,人们比以前更加关心,但他们了解的并不多。”

经过正确源材料训练的聊天机器人可以成为出色的教育工具。人工智能导师可以根据学生的教育水平进行调整,并可以随时了解有关该学科的最新信息。此外,令人愉快的讽刺是,利用语言模型中的一些最新突破来创建一种教育工具,旨在帮助人们了解他们正在使用的技术的潜在危险。

什么是人工智能的“合理使用”?

我认为,在获得训练作品作者的明确许可的情况下,出于非营利性、教育目的训练聊天机器人似乎是可以的。但是像乔治·R·R·马丁或约翰·格里沙姆这样的小说家是否可以控告营利性公司在未经明确许可的情况下拿走他们的作品呢?

不幸的是,法律在这个问题上还很不明确。正如哈佛大学法学教授兼第一修正案专家丽贝卡·图什内特 (Rebecca Tushnet)在《哈佛公报》上发表的采访中解释的那样,数字公司通常能够采用合理使用的概念来捍卫现有知识产权的获取。她说:“如果不合理使用这些词来输出不复制的内容,我们今天所知道的互联网,包括谷歌、图像搜索和谷歌图书,就不会存在。”

考虑这个问题的一种方法是思考像我这样的人类如何写书。当我研究和撰写《末世》时,我借鉴并综合了数百位不同作者的现有作品。有时我会直接引用它们,尽管对于其他作者在合理使用下可以直接引用多少个人作品有具体的规则。(粗略的规则是,引用出版书籍时的字数为 300 字,引用简短的文章或论文时的字数约为 200 字。)

然而,更常见的是,我在研究中阅读和处理的内容在我的大脑中回响,与其他报告和推理相结合,并作为我自己的作品出现——我的作品是由我自己的消息来源提供的。或者,换句话说,是由我自己的个人训练数据集提供的信息。

就人工智能而言,差异在于规模。ChatGPT 在几秒钟内“阅读”的已发表单词数量比我几辈子所能阅读的还要多,而且与我不同的是,在我人类有限的短期记忆中,这些数据不会立即被我接下来想到的任何内容所取代。(棒球季后赛,如果我诚实的话。)法律学者可以借鉴数百年的版权法来确定在人类案件中该怎么做,但法律可以准确、公平地管理,甚至理解人工智能可以做什么相同的材料尚未编写。

正如 Tushnet 继续指出的那样,我们应该少关注那些根据现行法律可能无法回答的法律问题,而更多地关注从语言模型中塑造我们想要什么和不想要什么。是的,经过训练的聊天机器人是为了传播人工智能安全的福音。《权力的游戏》系列下一本书的人工智能编写版本可能不会那么多。

韭菜热线原创版权所有,发布者:风生水起,转载请注明出处:https://www.9crx.com/78206.html

(0)
打赏
风生水起的头像风生水起普通用户
上一篇 2023年11月6日 01:59
下一篇 2023年11月6日 02:09

相关推荐

  • 风险投资:互联网时代的教训

    纳斯达克 100 指数在 2002 年 10 月 10 日盘中交易中跌至谷底,较 2000 年 3 月 10 日的历史高点下跌 77%。估计有 1 亿个人投资者在股市损失了 5 万亿美元。这个以科技股为主的指数花了超过 15 年的时间才重回巅峰。 Webvan 和 eToys 这样的网络轰炸公司,以及 Theranos 和 FTX 这样的无人问津的初创公司,…

    2024年3月7日
    9300
  • AI 狂热推动标普 500 指数过去两年来自 dot-com 时代以来的最佳表现

    由 U.S.全球投资者的弗兰克·霍尔姆斯,1/6/25 股市在 2024 年反弹,连续第二年涨幅超过 20%,投资者因通胀降温、利率下降以及在第二任特朗普政府下企业税率可能降低而感到乐观。上一次标普 500 指数实现连续两年以上涨幅超过 20%还是在 1990 年代末期,当时互联网热潮推动市场乐观情绪。 就像那些高光时刻一样,2024 年科技股再次吸引了投资…

    2025年2月20日
    800
  • 拥有 23 万亿美元资产的量化分析师即使在犹豫不决的情况下也看到了人工智能的接管

    作者:Justina Lee 金融界热爱计算机的人群正在为人工智能驱动的新时代的到来做准备,但这并不意味着他们已经准备好完全接受这项技术。 在 Invesco 对管理着 22.5 万亿美元的系统投资者进行的一项调查中,62% 的人表示,十年后人工智能将与传统分析一样重要,而 13% 的人认为人工智能将更加重要。 然而,当被问及他们自己目前对该技术的使用情况时…

    2023年11月8日
    11500
  • 保护您信息安全的 7 种方法

    对于我们许多人来说,互联网是我们生活中不可或缺的一部分。 这是我们工作和与同事联系、与朋友和家人联系、获取新闻、购物、办理银行业务以及度过空闲时间的方式。 虽然数字革命有其好处——更广泛的访问、更快的沟通、灵活的工作选择——但它也带来了一个新的担忧:网络犯罪的兴起。 网络安全威胁在 2019 年和 2020 年合计激增 400% ,而且这一趋势可能才刚刚开始…

    2023年12月12日
    5200
  • 汤森路透以 6.5 亿美元现金收购人工智能法律科技初创公司 Casetext

    汤森路透已达成收购 Casetext 的最终协议,Casetext 是一家由 Y Combinator 支持的法律科技初创公司。该交易价值 6.5 亿美元现金,预计将于下半年完成…

    2023年6月27日
    21000

发表回复

登录后才能评论
客服
客服
关注订阅号
关注订阅号
分享本页
返回顶部