美AI巨头被控秘密“侵吞”数据

8个月前 来源:科技日报 观看:63

人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。u2w即热新闻——关注每天科技社会生活新变化gihot.com

据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。u2w即热新闻——关注每天科技社会生活新变化gihot.com

收集数据“走捷径”u2w即热新闻——关注每天科技社会生活新变化gihot.com

英国《泰晤士报》近日刊文指出,科技巨头一直在“走捷径”为其AI系统收集训练数据。OpenAI开发了一款名为Whisper的语音识别工具,可将YouTube视频中的音频文件转录为纯文本文档,从而创建一个口语对话数据源,帮助训练其下一代基于文本的GPT-4算法。u2w即热新闻——关注每天科技社会生活新变化gihot.com

美国《商业内幕》网报道称,YouTube在其官网明令禁止“独立”于其之外的应用程序使用其视频内容。而OpenAI的数据并非意外收集的。u2w即热新闻——关注每天科技社会生活新变化gihot.com

实际上,OpenAI员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格·布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的,最终获得了超过100万小时的转录视频。u2w即热新闻——关注每天科技社会生活新变化gihot.com

最大的谜团在于,OpenAI如何访问足够多的YouTube视频来完成这项工作。u2w即热新闻——关注每天科技社会生活新变化gihot.com

当OpenAI首席技术官米拉·穆拉蒂被问及该公司是否使用YouTube视频来训练Sora时,她表示并不确定。当再次被问及训练数据的来源时,她表示不会透露细节。u2w即热新闻——关注每天科技社会生活新变化gihot.com

《纽约时报》称,与OpenAI一样,谷歌也转录了YouTube视频,为其AI模型收集文本,这可能侵犯了视频创作者的版权。去年,谷歌还更改了其服务条款。此番动机意图明显,即允许AI对来自谷歌文档中公开可用文档的数据以及上传到谷歌地图的餐馆评论等其他材料进行训练。u2w即热新闻——关注每天科技社会生活新变化gihot.com

面临“数据瓶颈”u2w即热新闻——关注每天科技社会生活新变化gihot.com

对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、声音和视频,实现系统创新。u2w即热新闻——关注每天科技社会生活新变化gihot.com

但随着AI发展,现有互联网信息量的不足、高质量文本数据的匮乏以及科技巨头优质数据的垄断,都可能导致AI“养分不足”。即便谷歌和Meta拥有数十亿用户,每天都会产生搜索查询和社交媒体帖子,但这些数据在很大程度上受到隐私法和自身政策的限制,无法让AI利用这些内容。u2w即热新闻——关注每天科技社会生活新变化gihot.com

这些科技公司的处境似乎十分窘迫。据人工智能研究机构Epoch称,科技公司最快将于2026年耗尽互联网上的高质量数据。这些公司使用数据的速度超过了产生数据的速度。u2w即热新闻——关注每天科技社会生活新变化gihot.com

Meta同样也遇到了训练数据可用性限制。该公司打算采取一些措施,例如支付图书许可费用,甚至直接收购一家大型出版商。Meta也曾作出以隐私为中心的变革,因此它使用消费者数据的方式显然也受到了限制。u2w即热新闻——关注每天科技社会生活新变化gihot.com

在人类数据告急的情况下,不少公司甚至试图用AI“喂”AI。包括微软、OpenAI在内的公司正在把大模型生成的结果,也就是所谓的“合成数据”,“喂”给参数更小的模型。但有研究认为,合成数据最终将让AI“自食其果”。u2w即热新闻——关注每天科技社会生活新变化gihot.com

因版权被多方状告u2w即热新闻——关注每天科技社会生活新变化gihot.com

《纽约时报》去年起诉OpenAI和微软,称其在未经许可的情况下使用受版权保护的新闻文章来训练AI聊天机器人。OpenAI和微软回应称,这属于“合理使用”,或者说是版权法允许的,因为他们为了不同的目的而改造了这些作品。u2w即热新闻——关注每天科技社会生活新变化gihot.com

去年,超过1万个贸易团体、作者、公司和其他人士向美国版权局提交了有关AI模型使用创意作品的意见。u2w即热新闻——关注每天科技社会生活新变化gihot.com

生成式AI的迅速兴起引发了一场全球性的高质量数据竞赛。然而,在这个新领域中,关于什么是合法的、道德的,没有明确规定。u2w即热新闻——关注每天科技社会生活新变化gihot.com

《商业内幕》网称,目前,谷歌、OpenAI和其他科技公司正在辩解,认为将受版权保护的内容用于AI模型训练是合法的,但监管机构及法院尚未对此作出裁决。u2w即热新闻——关注每天科技社会生活新变化gihot.com

美国电影制作人、前演员及作家贾斯汀·贝特曼告诉版权局,AI模型在未经许可或付费的情况下获取了其作品内容。她称,“这是美国最大的盗窃案”。u2w即热新闻——关注每天科技社会生活新变化gihot.com

人工智能(AI)迅速发展离不开对模型的训练。然而,高质量数据短缺以及部分领域封闭式的数据生态似乎成为AI发展的掣肘。u2w即热新闻——关注每天科技社会生活新变化gihot.com

据多家外媒报道,OpenAI、谷歌和Meta等公司正寻求在线信息来训练最新的AI系统。但他们无视既定政策,蓄意改变规则,并试图规避版权法。u2w即热新闻——关注每天科技社会生活新变化gihot.com

收集数据“走捷径”u2w即热新闻——关注每天科技社会生活新变化gihot.com

英国《泰晤士报》近日刊文指出,科技巨头一直在“走捷径”为其AI系统收集训练数据。OpenAI开发了一款名为Whisper的语音识别工具,可将YouTube视频中的音频文件转录为纯文本文档,从而创建一个口语对话数据源,帮助训练其下一代基于文本的GPT-4算法。u2w即热新闻——关注每天科技社会生活新变化gihot.com

美国《商业内幕》网报道称,YouTube在其官网明令禁止“独立”于其之外的应用程序使用其视频内容。而OpenAI的数据并非意外收集的。u2w即热新闻——关注每天科技社会生活新变化gihot.com

实际上,OpenAI员工知道这样做会涉足法律灰色地带。OpenAI总裁格雷格·布罗克曼甚至亲自参与了所使用视频的收集。但OpenAI依然认为这是合理的,最终获得了超过100万小时的转录视频。u2w即热新闻——关注每天科技社会生活新变化gihot.com

最大的谜团在于,OpenAI如何访问足够多的YouTube视频来完成这项工作。u2w即热新闻——关注每天科技社会生活新变化gihot.com

当OpenAI首席技术官米拉·穆拉蒂被问及该公司是否使用YouTube视频来训练Sora时,她表示并不确定。当再次被问及训练数据的来源时,她表示不会透露细节。u2w即热新闻——关注每天科技社会生活新变化gihot.com

《纽约时报》称,与OpenAI一样,谷歌也转录了YouTube视频,为其AI模型收集文本,这可能侵犯了视频创作者的版权。去年,谷歌还更改了其服务条款。此番动机意图明显,即允许AI对来自谷歌文档中公开可用文档的数据以及上传到谷歌地图的餐馆评论等其他材料进行训练。u2w即热新闻——关注每天科技社会生活新变化gihot.com

面临“数据瓶颈”u2w即热新闻——关注每天科技社会生活新变化gihot.com

对于科技公司来说,庞大的数据“肥料”是生成式AI的核心养分,也是大模型发展的必争之地。唯有足够的数据才能指导技术即时生成与人类创作相似的文本、图像、声音和视频,实现系统创新。u2w即热新闻——关注每天科技社会生活新变化gihot.com

但随着AI发展,现有互联网信息量的不足、高质量文本数据的匮乏以及科技巨头优质数据的垄断,都可能导致AI“养分不足”。即便谷歌和Meta拥有数十亿用户,每天都会产生搜索查询和社交媒体帖子,但这些数据在很大程度上受到隐私法和自身政策的限制,无法让AI利用这些内容。u2w即热新闻——关注每天科技社会生活新变化gihot.com

这些科技公司的处境似乎十分窘迫。据人工智能研究机构Epoch称,科技公司最快将于2026年耗尽互联网上的高质量数据。这些公司使用数据的速度超过了产生数据的速度。u2w即热新闻——关注每天科技社会生活新变化gihot.com

Meta同样也遇到了训练数据可用性限制。该公司打算采取一些措施,例如支付图书许可费用,甚至直接收购一家大型出版商。Meta也曾作出以隐私为中心的变革,因此它使用消费者数据的方式显然也受到了限制。u2w即热新闻——关注每天科技社会生活新变化gihot.com

在人类数据告急的情况下,不少公司甚至试图用AI“喂”AI。包括微软、OpenAI在内的公司正在把大模型生成的结果,也就是所谓的“合成数据”,“喂”给参数更小的模型。但有研究认为,合成数据最终将让AI“自食其果”。u2w即热新闻——关注每天科技社会生活新变化gihot.com

因版权被多方状告u2w即热新闻——关注每天科技社会生活新变化gihot.com

《纽约时报》去年起诉OpenAI和微软,称其在未经许可的情况下使用受版权保护的新闻文章来训练AI聊天机器人。OpenAI和微软回应称,这属于“合理使用”,或者说是版权法允许的,因为他们为了不同的目的而改造了这些作品。u2w即热新闻——关注每天科技社会生活新变化gihot.com

去年,超过1万个贸易团体、作者、公司和其他人士向美国版权局提交了有关AI模型使用创意作品的意见。u2w即热新闻——关注每天科技社会生活新变化gihot.com

生成式AI的迅速兴起引发了一场全球性的高质量数据竞赛。然而,在这个新领域中,关于什么是合法的、道德的,没有明确规定。u2w即热新闻——关注每天科技社会生活新变化gihot.com

《商业内幕》网称,目前,谷歌、OpenAI和其他科技公司正在辩解,认为将受版权保护的内容用于AI模型训练是合法的,但监管机构及法院尚未对此作出裁决。u2w即热新闻——关注每天科技社会生活新变化gihot.com

美国电影制作人、前演员及作家贾斯汀·贝特曼告诉版权局,AI模型在未经许可或付费的情况下获取了其作品内容。她称,“这是美国最大的盗窃案”。u2w即热新闻——关注每天科技社会生活新变化gihot.com

本文链接:http://www.gihot.com/news-2-4382-0.html美AI巨头被控秘密“侵吞”数据

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

上一篇:单克隆抗体能减缓快速发展型帕金森病

下一篇:微型植入式脑刺激器仅豌豆大小

为你推荐
规避:白条额度最新套法,最佳步骤是怎么操作在这个科技飞速发展和金融创新层出不穷的时代,京东白条作为一种便捷的消费信贷工具,已经深入到了许多人的日常生活中。然而,近期越来...
08-12
微信分付套现技巧,6种方法可以秒到账微信近期推出的微信分付,在市场竞争中与花呗这位老牌巨头相比,显得尤为审慎和严谨。其开通条件并非对所有人开放,而是精挑细选,仅向信誉卓越...
08-06
明日复明日,明日何其多,我生待明日,万事成蹉跎。——文嘉《明日歌》 学而不思罔,思而不学则殆。  译:只学习却不思考就不会感到迷茫,只空想却不学习就会疲倦而没有收...
08-04
哪里有意志存在,哪里就会有出路。——德国 现在微信分付已经出来很久了,许多朋友在微信里面都已经看到了这个选项,我们只知道微信分付是腾讯推出的类似花呗的产品,...
08-04
9月26日午后,A股全面拉升走强,三大指数涨超3%。上证指数涨3.61%收复3000点大关,深证成指涨4.44%,创业板指涨4.42%。核心资产获大资金扫货,五粮液、中国中免、万科A等多只权重股涨...
09-26
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-8979可v可来电)(全年365天不掉线) 【抖音月付分付要怎样提现】【抖音Dou分期怎么刷出来】【抖...
09-07
电影《真实身份》的预告片已经发布,它以扣人心弦的悬疑和犯罪情节吸引了大量关注,展现了角色间高智商的激烈对决,激发了观众对主角及其背景的无限遐想。影片基...
10-08
预演;微信分付提现商家-秒到6种绝对技巧探索世界万象,普及科学、科技知识!从未见过你,但会更懂你。每天分享各种生活小窍门,一起享受生活。微信分付套现技巧是指通过使用微信的...
09-10
目录 七月份气候特点七月吃什么好七月份推荐食谱七月份怎样养生七月份饮食注意事项 七月份正值夏季比较炎热的时候,很多地方气温甚至会高达将近四十度左右,让人感到...
04-02
到了大雪的节气,天气非常的寒冷,所以人们一定要做好防寒保暖的工作,这样才能够预防一些疾病的发生,那么大雪节气防寒保暖的工作应该怎么做呢?下面小编就来给大家具体的介绍一下,想...
04-02
  大众网记者 刘佳琦 报道  “新”光璀璨,青春当“燃”。9月1日晚,济南市技师学院主校区2024级迎新晚会在孔子广场隆重举行,副院长、军训团政委肖自强,军训团团长崔鲁浩...
09-05
正值考研复试期间 4月2日,一则 “考研生成绩第一被备注不合格”的 消息引发关...
04-06
南昌风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
09-01
  上市险企中报披露在即。根据财报预约披露时间,A股五大上市险企中,中国平安本周将发布中报,其余...
08-21
金华风控花呗白条套取秒到账:【181 181 43671微信同号】万事达 、境外卡、微信分付、抖音月付、支付宝信用购取消实体商家当面刷,本地一手超低费用没有中间商赚差价,所有信息已...
08-31
现在网络鱼龙混杂,请认准靠谱八年商家,金牌小帮手——小创(137-1300-6106可v可来电)(全年365天不掉线) 【得物佳物分期购可以提现吗】【得物的分期购额度怎么套出来...
08-02
10月4日,商务部新闻发言人就欧盟投票通过电动汽车反补贴案终裁草案答记者问。问:据有关报道,10月4日,欧盟成员国代表投票通过了欧盟委员会提交...
10-05
  作为世界四大文明古国之一,埃及不仅有金字塔,更有卢克索一带神庙的世界,汇集了古埃及文明精华,被誉为地...
07-28
返回

点击右上角微信好友

朋友圈

点击浏览器下方“”分享微信好友Safari浏览器请点击“”按钮

点击右上角QQ

点击浏览器下方“”分享QQ好友Safari浏览器请点击“”按钮