How AI Models Steal Creative Work — and What to Do About It | Ed Newton-Rex | TED

27,085 views ・ 2025-03-19

TED


Haga doble clic en los subtítulos en inglés para reproducir el vídeo.

Traductor: Sebastian Betti
00:04
The technology and vision behind generative AI is amazing,
0
4301
5072
La tecnología y la visión detrás de la IA generativa son asombrosas,
00:09
but stealing the work of the world's creators to build it is not.
1
9373
3771
pero robar el trabajo de los creadores de todo el mundo para construirla no lo es.
00:14
There are three key things that AI companies need to build their models,
2
14078
4972
Hay tres cosas clave que las empresas de IA necesitan para construir sus modelos,
00:19
three key resources -- people, compute and data.
3
19083
4271
tres recursos clave: personas, computación y datos.
Es decir, ingenieros para crear los modelos,
00:24
That is, engineers to build the models,
4
24121
2937
GPUs para ejecutar el proceso de entrenamiento
00:27
GPUs to run the training process
5
27091
2102
y datos para entrenar los modelos.
00:29
and data to train the models on.
6
29226
2336
00:32
AI companies spend vast sums on the first two,
7
32696
5005
Las empresas de inteligencia artificial gastan enormes sumas en los dos primeros,
00:37
sometimes a million dollars per engineer
8
37735
2402
a veces un millón de dólares por ingeniero
y hasta mil millones de dólares por modelo.
00:40
and up to a billion dollars per model.
9
40137
3337
00:43
But they expect to take the third resource, training data, for free.
10
43507
5439
Sin embargo, esperan utilizar el tercer recurso,
los datos de formación, de forma gratuita.
00:48
Right now, many AI companies train on creative work they haven't paid for
11
48979
4772
Hoy, muchas empresas entrenan IA en trabajos creativos
por los que no han pagado
00:53
or even asked permission to use.
12
53784
1869
y ni ni siquiera han pedido permiso de uso.
00:56
This is unfair and unsustainable.
13
56320
2970
Esto es injusto e insostenible.
Pero si restablecemos y licenciamos nuestros datos de formación,
01:00
But if we reset, and license our training data,
14
60224
3270
01:03
we can build a better generative AI ecosystem that works for everyone,
15
63527
3704
podemos crear un ecosistema de IA generativa mejor que funcione para todos,
tanto para las propias empresas de IA como para los creadores,
01:07
both the AI companies themselves and the creators,
16
67264
3304
01:10
without whose work these models would not exist.
17
70601
2636
sin cuyo trabajo estos modelos no existirían.
01:14
Most AI companies today do not license the majority of their training data.
18
74271
4839
La mayoría de las empresas de IA
no licencian la mayoría de sus datos de formación.
Utilizan rastreadores web para buscar, descargar
01:19
They use web scrapers to find, download
19
79143
2402
01:21
and train on as much content as they can gather.
20
81579
3036
y aprender todo el contenido que pueden recopilar.
01:24
They're often pretty secretive about what they do train on,
21
84615
2870
Suelen ser bastante reservados sobre el entrenamiento,
01:27
but what's clear is that training on copyrighted work without a license
22
87485
4037
pero está claro que el entrenamiento
con obras protegidas por derechos de autor sin licencia
01:31
is rife.
23
91555
1268
está muy extendida.
01:32
For instance, when the Mozilla Foundation
24
92857
2569
Por ejemplo, cuando la Fundación Mozilla
01:35
looked at 47 large language models released between 2019 and 2023,
25
95459
5406
analizó 47 grandes modelos lingüísticos publicados entre 2019 y 2023,
01:40
they found that 64 percent of them were trained, in part, on Common Crawl,
26
100898
4905
descubrió que el 64 % había recibido entrenamiento
en parte, en Common Crawl,
01:45
a dataset that includes copyrighted works,
27
105836
3070
unos datos que incluyen obras protegidas por derechos de autor,
01:48
such as newspaper articles from major publications.
28
108939
2403
como artículos periodísticos de publicaciones importantes.
01:51
And a further 21 percent didn’t reveal enough information to know either way.
29
111375
5239
Y otro 21 % no reveló suficiente información
como para saberlo.
El entrenamiento con obras protegidas por derechos de autor sin licencia
01:57
Training on copyrighted work without a license
30
117982
2302
se ha vuelto rápidamente en algo habitual
02:00
has rapidly become standard across much of the generative AI industry.
31
120284
4404
en gran parte de la industria de la IA generativa.
02:04
But this training,
32
124722
1601
Sin embargo,
este entrenamiento sin licencia sobre el trabajo creativo,
02:06
this unlicensed training on creative work,
33
126357
2903
tiene graves consecuencias negativas
02:09
has serious negative consequences for the people behind that work.
34
129260
3603
para las personas que están detrás de ese trabajo.
02:12
And this is for the simple reason
35
132863
1969
Porque la IA generativa
02:14
that generative AI competes with its training data.
36
134832
3337
compite con sus datos de entrenamiento.
No es la narrativa que a las empresas de IA les gusta retratar.
02:18
This is not the narrative that AI companies like to portray.
37
138202
3270
Nos gusta hablar de democratización, de permitir que más personas sean creativas.
02:21
We like to talk about democratization, about letting more people be creative.
38
141505
3637
Pero el hecho de que la IA compita con sus datos de entrenamiento es ineludible.
02:25
But the fact that AI competes with its training data is inescapable.
39
145176
3870
Un gran modelo de lenguaje con base en historias cortas
02:30
A large language model trained on short stories
40
150080
2269
puede crear historias cortas que compitan entre sí.
02:32
can create competing short stories.
41
152383
1768
Un modelo de imagen basado en IA entrenado con imágenes de archivo
02:34
An AI image model trained on stock images can create competing stock images.
42
154185
3703
puede crear imágenes de archivo que compitan entre sí.
02:37
An AI music model trained on music that's licensed to TV shows
43
157888
3771
Un modelo musical basado en IA
especializado en música licenciada para programas de TV
02:41
can create competing music to license to TV shows.
44
161659
2836
puede crear música que compita con la licencia para programas de TV.
02:44
These models, however imperfect,
45
164528
3837
Estos modelos, por imperfectos que sean,
02:48
are so quick and easy to use that this competition is inevitable.
46
168399
3937
son tan rápidos y fáciles de usar que esta competencia es inevitable.
02:53
And this isn't just theoretical.
47
173270
1869
Y esto no es solo teórico.
02:55
Generative AI is still pretty new,
48
175172
2269
La IA generativa es todavía bastante nueva,
02:57
but we're already seeing exactly the sort of effects you'd expect
49
177474
3270
pero ya estamos viendo exactamente el tipo de efectos que cabría esperar
03:00
in a world in which generative AI competes with its training data.
50
180778
4237
en un mundo en el que la IA generativa compite con sus datos de entrenamiento.
03:05
For instance, the well-known filmmaker Ram Gopal Varma recently said
51
185049
4804
Por ejemplo, el conocido cineasta Ram Gopal Varma dijo recientemente
03:09
that he'll use AI music in all his projects going forward.
52
189853
3704
que utilizará música basada en la IA en todos sus proyectos futuros.
03:13
Indeed, there are multiple reports of people starting to listen to AI music
53
193591
4137
De hecho, hay múltiples informes de personas
que comienzan a escuchar música basada en la IA
03:17
in place of human-produced music,
54
197761
1635
en lugar de música producida por humanos,
03:19
and recently, an AI song hit number 48 in the German charts.
55
199430
5472
y recientemente, una canción de IA alcanzó el puesto 48
en las listas alemanas.
03:24
In all these cases, AI music is competing with the songs it was trained on.
56
204935
5205
En todos estos casos, la música de la IA
compite con las canciones con las que se entrenó.
03:30
Or take Kelly McKernan.
57
210174
2636
O tomemos a Kelly McKernan.
03:32
Kelly is an artist from Nashville.
58
212843
2770
Kelly es una artista de Nashville.
03:35
For 10 years, they made enough money selling their work
59
215646
4104
Durante 10 años, ganaron suficiente dinero vendiendo sus obras como para
03:39
that art was their full-time income.
60
219783
1836
que el arte fuera su ingreso a tiempo completo.
03:41
But in 2022, a dataset that included their works
61
221652
4104
Sin embargo, en 2022,
se utilizó un conjunto de datos que incluía sus obras
03:45
was used to train a popular AI image model.
62
225756
3837
para entrenar un popular modelo de imágenes de IA.
03:51
Their name was one of many used by huge numbers of people
63
231362
5038
Su nombre fue uno de los muchos utilizados por un gran número de personas
03:56
to create art in the style of specific human artists.
64
236433
4772
para crear arte al estilo de artistas humanos específicos.
04:01
Kelly's income fell by 33 percent almost overnight.
65
241238
3871
Los ingresos de Kelly cayeron un 33 % casi de la noche a la mañana.
04:05
Illustrators around the world report similar stories,
66
245109
3203
Ilustradores de todo el mundo reportan historias similares,
04:08
being outcompeted by AI models
67
248312
2569
siendo superados por modelos de IA
04:10
they have reason to believe were trained on their work.
68
250914
3571
que tienen motivos para creer que fueron entrenados para su trabajo.
04:14
The freelance platform Upwork wrote a white paper
69
254518
3337
La plataforma independiente Upwork escribió un libro blanco
04:17
in which they looked at the effects, that they've seen on the job market,
70
257888
4138
en el que analizaban los efectos que habían observado en el mercado laboral
de la IA generativa.
04:22
of generative AI.
71
262026
2002
Analizaron cómo han cambiado las ofertas de trabajo en su plataforma
04:24
They looked at how job postings on their platform have changed
72
264028
3136
desde la introducción de ChatGPT
04:27
since the introduction of ChatGPT,
73
267197
1669
04:28
and sure enough, they found exactly what you'd expect,
74
268866
2903
y descubrieron exactamente lo que cabría esperar:
04:31
that generative AI has reduced the demand for freelance writing tasks by 8 percent,
75
271769
4804
que la IA generativa ha reducido la demanda de tareas
de escritura independientes en un 8 %,
04:36
which increases to 18 percent
76
276607
2469
que aumenta hasta el 18 %
si solo nos fijamos en lo que denominan tareas de menor valor.
04:39
if you look at only what they term lower-value tasks.
77
279109
2836
04:41
So the initial data we have, plus the individual stories we hear,
78
281979
6373
Por lo tanto, los datos iniciales que tenemos,
más las historias individuales que escuchamos,
se alinean con la suposición lógica:
04:48
all align with the logical assumption:
79
288385
1835
«La IA generativa compite con el trabajo en el que está entrenada».
04:50
"Generative AI competes with the work it's trained on."
80
290254
2936
04:53
It's so quick and easy to use, it's inevitable,
81
293223
2803
Es tan rápida y fácil de usar que es inevitable
y compite con las personas que están detrás de ese trabajo.
04:56
and it competes with the people behind that work.
82
296060
2636
04:58
Now creators argue this training is illegal.
83
298729
3704
Ahora los creadores argumentan que esta formación es ilegal.
05:02
The legal framework of copyright
84
302433
1568
El marco legal del derecho de autor
otorga a los creadores el derecho exclusivo
05:04
affords creators the exclusive right to authorize copies of their work,
85
304034
4071
de autorizar copias de sus obras,
05:08
and AI training involves copying.
86
308138
3470
y el entrenamiento en IA implica copiar.
05:11
Here, in the US, many AI companies argue
87
311642
3170
Aquí, en EE. UU., muchas empresas de IA sostienen que
05:14
that training AI falls under the fair use copyright exception,
88
314845
4204
el entrenamiento de IA está exenta de derechos de autor por uso legítimo,
05:19
which allows unlicensed copying in a limited set of circumstances,
89
319083
4137
que permite copiar sin licencia en un conjunto limitado de circunstancias,
05:23
such as creating parodies of a work.
90
323253
2203
como la creación de parodias de una obra.
05:26
Creators and rights holders strongly disagree,
91
326523
3137
Los creadores y los titulares de derechos discrepan rotundamente
05:29
saying there's no way this narrow exception can be used
92
329693
3037
y afirman que no hay forma de utilizar esta excepción limitada
05:32
to legitimize the mass exploitation of creative work
93
332763
4905
para legitimar la explotación masiva de la obra creativa
05:37
to create automated competitors to that work.
94
337701
2102
para crear competidores automatizados para esa obra.
05:39
And for the record, I entirely agree.
95
339837
3436
Y para que conste, estoy totalmente de acuerdo.
Por supuesto, esta cuestión no ha sido examinada anteriormente en los tribunales,
05:43
Of course, this question is previously untested in the courts,
96
343307
3804
y actualmente hay alrededor de 30 demandas en curso
05:47
and there are currently around 30 ongoing lawsuits
97
347111
2535
05:49
brought by rights holders against AI companies,
98
349680
2769
interpuestas por titulares de derechos contra empresas de IA,
05:52
which will help to address this question.
99
352483
2569
lo que ayudará a abordar esta cuestión.
05:55
But this will take time, and creators are suffering
100
355085
2870
Sin embargo, esto llevará tiempo, y los creadores están
05:57
from what they see as unjust competition right now.
101
357988
3971
padeciendo lo que consideran una competencia injusta en este momento.
06:01
So they propose a solution that has been used and worked before --
102
361992
5205
Por eso proponen una solución que ya se ha utilizado
y que ha funcionado antes:
06:07
licensing.
103
367197
1569
la concesión de licencias.
06:08
If a commercial entity wants to use copyrighted work,
104
368799
3870
Si una entidad comercial quiere utilizar una obra protegida por derechos de autor,
06:12
be it for merchandise manufacturing or building a streaming service,
105
372669
3504
para fabricar productos o para crear un servicio de streaming,
concede una licencia a esa obra.
06:16
they license that work.
106
376206
1435
06:17
Now AI companies have a bunch of reasons why this shouldn’t apply to them.
107
377674
5306
Las empresas de IA tienen muchas razones
por las que esto no debería aplicarse a ellas.
06:23
There’s the fair use legal exception that I’ve already mentioned.
108
383013
5439
Existe la excepción legal de uso legítimo que ya he mencionado.
06:29
There's also the argument
109
389686
1469
También se argumenta que así como los humanos podemos capacitarnos
06:31
that since humans can train on copyrighted work without a license,
110
391188
4004
con obras protegidas por derechos de autor
sin necesidad de una licencia, también se debería permitir
06:35
AI should be allowed to, too.
111
395225
1569
06:36
But this is a very hard claim to justify.
112
396827
3270
que la IA lo haga.
Sin embargo, es una afirmación muy difícil de justificar.
06:40
Artists have been learning from each other for centuries.
113
400130
2736
Los artistas han estado aprendiendo unos de otros durante siglos.
06:42
When you create, you expect other people to learn from you.
114
402900
4304
Cuando creas, esperas que otras personas aprendan de ti.
06:47
You learn from a range of sources,
115
407237
1669
Aprendes de una variedad de fuentes,
06:48
from other art to textbooks to taking lessons.
116
408939
2870
desde otras obras de arte hasta libros y en clases.
06:51
Much of this you or someone else paid for,
117
411842
2169
Gran parte de esto lo pagaste tú o alguien más,
06:54
supporting the entire ecosystem.
118
414011
1768
para apoyar a todo el ecosistema.
06:55
In generative AI,
119
415813
2035
En el caso de la IA generativa,
06:57
commercial entities valued at millions or billions of dollars
120
417881
3137
las entidades comerciales valoradas en millones o miles de millones de dólares
recopilan el contenido que pueden,
07:01
scrape as much content as they can,
121
421018
2302
a menudo en contra de la voluntad de los creadores y sin pagar nada,
07:03
often against creators' will, without payment,
122
423353
2436
07:05
making multiple copies along the way --
123
425823
3103
haciendo varias copias a lo largo del proceso...
07:08
which are subject to copyright law --
124
428959
2369
sujetas a la ley de derechos de autor,
para crear un competidor altamente escalable
07:11
to create a highly scalable competitor to what they're copying.
125
431361
3270
con respecto a lo que están copiando.
07:14
So scalable, in fact, that there are AI image generators
126
434631
3170
Es tan escalable que hay generadores de imágenes con IA que se estima
07:17
estimated to be making 2.5 million images a day
127
437835
3470
que producen 2,5 millones de imágenes al día
y generadores de canciones con IA que generan 10 canciones por segundo.
07:21
and AI song generators outputting 10 songs a second.
128
441338
2736
07:24
To argue that human learning and AI training are the same
129
444107
2770
Argumentar que el aprendizaje humano y el entrenamiento de la IA son lo mismo
07:26
and should be treated the same
130
446910
1569
y deben tratarse de la misma manera es absurdo.
07:28
is preposterous.
131
448512
1268
Las empresas de inteligencia artificial también sostienen
07:31
AI companies also argue
132
451281
2203
07:33
that licensing their training data would be impractical.
133
453517
3103
que licenciar sus datos de formación no sería práctico.
07:36
They use so much training data, they say,
134
456620
2169
Afirman que utilizan tantos datos de entrenamiento
07:38
that individual payments to each creator behind the data would be small.
135
458789
4504
que los pagos individuales a cada creador de los datos serían pequeños.
Sin embargo, esto es cierto en muchos mercados de licencias de contenido.
07:43
But this is true of many content-licensing markets.
136
463327
3069
07:46
Creators still want to get paid, even if the payments are small.
137
466430
3036
Los creadores siguen queriendo que se les pague, aunque los pagos sean pequeños.
07:50
AI companies also argue that they simply use too much data
138
470234
3069
Las empresas de IA también argumentan que simplemente utilizan demasiados datos
07:53
for licensing to even be feasible.
139
473337
2435
para que la concesión de licencias sea factible.
07:56
But this is harder and harder to believe
140
476440
2102
Pero es cada vez más difícil de creer
07:58
in a world in which there is such a range of datasets
141
478575
3203
en un mundo en el que existe tal variedad de conjuntos de datos
08:01
that you can access with permission.
142
481812
3036
a los que se puede acceder con permiso.
08:04
You can license data from media companies.
143
484848
2069
Puedes licenciar datos de empresas de medios de comunicación.
08:06
There have been 27 major deals
144
486950
2436
Solo en el último año, se han celebrado 27 acuerdos importantes
08:09
between AI companies and rights holders in the last year alone,
145
489419
3204
entre empresas de IA y titulares de derechos,
08:12
and that's to say nothing of the smaller ones that don't get reported.
146
492656
3337
por no hablar de los más pequeños de los que no se informa.
Hay mercados de datos de formación en los que puedes obtener más datos.
08:16
There are marketplaces of training data where you can get more data.
147
496026
3203
08:19
You can expand this with data that's in the public domain --
148
499229
3203
Puedes ampliar esta información con datos de dominio público,
08:22
that is, in which no copyright exists,
149
502466
2202
sobre los que no existan derechos de autor,
08:24
like the 500-billion-word dataset Common Corpus.
150
504668
4338
como el conjunto de datos Common Corpus, de 500 000 millones de palabras.
08:29
You can expand this further with synthetic data,
151
509006
2903
Puedes ampliarlo aún más con datos sintéticos,
08:31
that is, data that's created itself by an AI model,
152
511942
3270
es decir, datos creados por sí mismos mediante un modelo de IA,
08:35
in which usually no copyright exists.
153
515212
2636
en el que normalmente no existen derechos de autor.
08:37
So there are multiple options available to you
154
517881
2236
Por lo tanto, tienes varias opciones a tu disposición
08:40
if you want to build your model without infringing copyright.
155
520150
3003
si quieres crear tu modelo sin infringir los derechos de autor.
Sin embargo, la prueba más sólida
08:44
But the strongest evidence
156
524321
1401
08:45
that it's possible to license all your data
157
525756
3170
de que es posible licenciar todos tus datos
08:48
is that there are multiple companies doing it already.
158
528926
2569
es que hay varias empresas que ya lo están haciendo.
08:51
I know, because I've done it myself.
159
531528
1735
Lo sé, porque lo he hecho yo mismo.
Llevo más de una década trabajando en lo que ahora llamamos IA generativa
08:53
I've worked in what we now call generative AI for over a decade,
160
533297
3336
08:56
and last September,
161
536667
1334
y, en septiembre pasado,
08:58
my team at Stability AI released an AI music model
162
538001
3938
mi equipo de Stability AI publicó un modelo musical basado en la IA
09:01
that trained on licensed music.
163
541972
2069
basado en música licenciada.
Otras empresas han hecho lo mismo,
09:06
A number of other companies have done the same thing,
164
546310
3103
09:09
and I founded Fairly Trained in order to highlight this fact,
165
549446
3704
y fundé Fairly Trained para destacar este hecho
y estas empresas.
09:13
and these companies.
166
553183
1602
Fairly Trained es una organización sin fines de lucro
09:15
Fairly Trained is a nonprofit that certifies generative AI companies
167
555586
4704
que certifica a las empresas de IA generativa
que no se capacitan en trabajos protegidos por derechos de autor sin una licencia.
09:20
that don't train on copyrighted work without a license.
168
560290
2770
09:23
We launched in January of this year, and we've already certified 18 companies.
169
563093
4071
La lanzamos en enero de este año y ya hemos certificado a 18 empresas.
Ahora, estas empresas adoptan diversos enfoques
09:27
Now these companies take a variety of approaches
170
567164
2436
09:29
to licensing their training data.
171
569633
1601
para licenciar sus datos de formación.
09:31
We have an AI voice model that's trained on individual voices it's licensed.
172
571234
5039
Tenemos un modelo de voz de IA
que se entrena con voces individuales y tiene licencia.
Tenemos un modelo musical basado en la IA
09:36
We have an AI music model that's licensed more than 40 music catalogs.
173
576306
4138
que ha licenciado más de 40 catálogos de música.
09:40
We have a large language model
174
580477
1535
Tenemos un gran modelo de lenguaje
09:42
that's trained only on data in the public domain,
175
582045
2403
que se basa en datos de dominio público,
09:44
mostly from government documents and records.
176
584481
2136
en su mayoría procedentes de documentos y registros gubernamentales.
09:46
We have companies who have paid upfront fees for their data.
177
586650
4871
Tenemos empresas que han pagado tarifas por adelantado por sus datos.
09:52
We have companies who share their revenue with their data providers.
178
592356
3470
Tenemos empresas que comparten sus ingresos con sus proveedores de datos.
09:55
There is no one answer to the exact specifics
179
595826
3570
No hay una respuesta única a los detalles exactos
09:59
of how one of these licensing deals has to work.
180
599396
2836
de cómo debe funcionar uno de estos acuerdos de licencia.
La belleza de la concesión de licencias es que las dos partes pueden unirse
10:02
The beauty of licensing is that the two parties can come together
181
602265
3270
10:05
and figure out what works for them.
182
605569
1735
y averiguar qué funciona para ellas.
10:07
And this is happening more and more now.
183
607337
1935
Esto ocurre cada vez más ahora.
10:09
You will hear that a requirement to license training data
184
609306
3470
Se enterarán de que el requisito de licenciar los datos de formación
10:12
somehow stifles innovation,
185
612809
2069
frena de alguna manera la innovación,
10:14
that it's only the big AI companies that can afford
186
614878
2503
y que solo las grandes empresas de IA pueden permitirse
10:17
these huge upfront licensing fees.
187
617414
1969
estos enormes costes iniciales de concesión de licencias.
10:19
But in reality, it's the smaller start-ups
188
619383
2902
Pero, en realidad, son las empresas emergentes más pequeñas
10:22
who are bothering to license all their data,
189
622319
2803
las que se molestan en licenciar todos sus datos, y lo hacen,
10:25
and they're doing so, often, without hefty upfront licensing fees,
190
625155
3136
a menudo, sin tener que pagar elevados derechos de licencia iniciales,
10:28
but using models such as revenue shares.
191
628325
3070
pero utilizando modelos como el reparto de ingresos.
10:32
And there's another major upside to licensing your training data.
192
632996
3070
Además, licenciar tus datos de entrenamiento tiene otra gran ventaja.
10:36
All of this training on copyrighted work
193
636099
3971
Toda esta formación sobre obras protegidas por derechos de autor
10:40
is forcing publishers to shut off access to their content.
194
640103
4138
está obligando a los editores a impedir el acceso a su contenido.
10:44
The Data Provenance Initiative
195
644274
1802
La Iniciativa sobre la procedencia de los datos
10:46
looked at 14,000 websites commonly used in AI training sets,
196
646109
4238
examinó 14 000 sitios web usados habitualmente en entrenamiento de IA
10:50
and they found that, over the course of a single year,
197
650347
2636
y descubrió que, en el transcurso de un solo año,
10:53
looking at only the domains of the highest value for AI training,
198
653016
4338
si analizaba únicamente los dominios de mayor valor para la formación en IA,
10:57
the number that was restricted via opt-outs or terms of service
199
657387
4004
el número de sitios restringidos mediante exclusiones o condiciones de servicio
aumentó del 3 % a entre el 20 y el 33 %.
11:01
increased from three percent to between 20 and 33 percent.
200
661391
4805
La web se está cerrando gradualmente debido a la formación sin licencia.
11:06
The web is being gradually closed due to unlicensed training.
201
666196
3637
Esto es malo para los nuevos modelos de IA,
11:09
Now this is bad for new AI models, for new entrants to the market,
202
669866
3170
para los nuevos participantes en el mercado,
pero también para todos los que se benefician de una Internet abierta:
11:13
but also for everyone --
203
673070
1601
11:14
researchers, consumers and more, who benefit from an open internet.
204
674705
4070
investigadores, consumidores y más.
No debería sorprendernos
que el público en general no esté de acuerdo con las empresas
11:20
It should come as no surprise
205
680510
1402
11:21
that the general public do not agree with AI companies
206
681945
3070
de IA en cuanto a los datos de entrenamiento.
En una encuesta del Instituto de Políticas de Inteligencia Artificial,
11:25
about what they can train their models on.
207
685048
2436
11:27
One poll from the AI Policy Institute, in April,
208
687517
3170
realizada en abril,
se preguntó a la gente sobre la política común entre las empresas
11:30
asked people about the common policy among AI companies
209
690721
3169
de IA de formar sobre la base de los datos disponibles públicamente.
11:33
of training on publicly available data.
210
693924
2969
11:36
This is data that is openly available online,
211
696927
3036
Se trata de datos que están disponibles abiertamente en línea y
11:39
which of course includes a lot of copyrighted work,
212
699996
2436
que, por supuesto, incluyen muchas obras protegidas por derechos de autor,
11:42
like news articles and, often, pirated media.
213
702466
3036
como artículos de noticias y, a menudo, medios pirateados.
11:45
60 percent of people said this should not be allowed
214
705535
3704
El 60 por ciento de las personas dijo que esto no debería permitirse,
11:49
versus only 19 percent who said it should.
215
709272
3037
frente a solo el 19 por ciento que dijo que sí.
11:52
The same poll went on to ask
216
712309
2402
La misma encuesta continuó preguntando
11:54
whether AI companies should compensate data providers.
217
714745
3970
si las empresas de IA deberían compensar a los proveedores de datos.
11:58
74 percent said yes, and only nine percent said no.
218
718749
5305
El 74 % dijo que sí y solo el 9 % dijo que no.
12:04
Time and time again, when we ask the public these questions,
219
724087
3671
Una y otra vez, cuando hacemos estas preguntas al público,
12:07
they show support for requirements around permission and payment,
220
727791
4972
muestran su apoyo a los requisitos relacionados con el permiso y el pago,
12:12
and a rejection of the notion
221
732796
1435
y rechazan la idea de que
12:14
that something being publicly available somehow makes it fair game.
222
734264
3470
porque es de acceso público eso de un modo lo vuelve un juego limpio.
12:19
And the people who make the art that society consumes feel the same way.
223
739336
4237
Y las personas que crean el arte que consume la sociedad opinan lo mismo.
12:23
Today, we launched a "Statement on AI Training,"
224
743607
3703
Hoy publicamos una «Declaración sobre el entrenamiento en IA»,
12:27
a short, simple open letter, which simply reads:
225
747310
4338
una carta abierta breve y sencilla, que simplemente dice: «El uso sin licencia
12:31
“The unlicensed use of creative works for training generative AI
226
751681
3571
de obras creativas para entrenar la IA generativa es una amenaza
importante e injusta para los medios de vida de las personas
12:35
is a major, unjust threat to the livelihoods
227
755285
2503
12:37
of the people behind those works,
228
757821
1735
que están detrás de esas obras,
12:39
and must not be permitted."
229
759589
2303
y no debe permitirse».
Ya la han firmado 11 000 creadores de todo el mundo,
12:42
This has already been signed by 11,000 and counting creators around the world,
230
762225
4638
y siguen sumando, incluidos autores ganadores
12:46
including Nobel-winning authors,
231
766897
2235
del Premio Nobel, actores ganadores
de premios de la Academia y compositores ganadores de un Óscar.
12:49
Academy Award-winning actors and Oscar-winning composers.
232
769132
2803
12:51
And if you agree with this sentiment,
233
771968
1869
Y si estás de acuerdo con este sentimiento,
12:53
I encourage you to sign it today at aitrainingstatement.org.
234
773870
2937
te animo a que lo firmes hoy mismo en aitrainingstatement.org.
12:56
What this statement and previous ones like it make abundantly clear
235
776840
3937
Lo que esta afirmación y otras anteriores dejan muy claro
13:00
is that these artists, these creators,
236
780811
2302
es que estos artistas, estos creadores,
13:03
view the unlicensed training on their work by generative AI models
237
783113
3370
consideran que la formación sin licencia de modelos de IA generativa
13:06
as totally unjust and potentially catastrophic to their professions.
238
786516
4571
para su trabajo es injusta y en potencia catastrófica para sus profesiones.
13:11
So if you are an advocate for unlicensed AI training,
239
791121
4004
Así que, si eres partidario de la formación en IA sin licencia,
13:15
just remember that the people who wrote the music that you are listening to
240
795158
4838
recuerda que las personas que escribieron la música que estás escuchando
13:20
and the books you’re reading
241
800030
1768
y los libros que estás leyendo probablemente no estén de acuerdo.
13:21
probably disagree.
242
801798
1468
13:24
So where does this leave us?
243
804634
1435
Entonces, ¿dónde nos deja esto?
13:26
Well, right now, many of the world's artists,
244
806102
2503
Bueno, ahora mismo, muchos de los artistas,
13:28
writers, musicians, creators
245
808605
2002
escritores, músicos y creadores del mundo odian
13:30
straight-up hate generative AI.
246
810607
2369
rotundamente la IA generativa.
13:32
And we know, from their own words, that one of the reasons for this
247
812976
3403
Y sabemos, por sus propias palabras, que una de las razones
13:36
is that we're training on their work without asking them.
248
816413
3003
es que nos formamos en su trabajo sin preguntarles nada.
13:39
But it doesn't have to be this way.
249
819449
2302
Pero no tiene por qué ser así.
13:41
The AI industry and the creative industries
250
821785
2069
La industria de la IA y las industrias creativas
13:43
can be and should be mutually beneficial.
251
823887
2369
pueden y deben ser mutuamente beneficiosas.
13:46
But for this mutually beneficial relationship to emerge,
252
826256
4204
Sin embargo, para que surja esta relación mutuamente beneficiosa,
13:50
we have to start from a position of respect
253
830460
2770
tenemos que partir de una posición de respeto
por el valor de las obras en las que se capacita
13:53
for the value of the works being trained on
254
833263
2102
13:55
and the rights of the people who made them.
255
835398
2803
y por los derechos de las personas que las han realizado.
No estoy argumentando que se deba detener todo el desarrollo de la IA.
13:59
I'm not arguing that all AI development should be halted.
256
839002
3270
No estoy argumentando que la IA no deba existir.
14:02
I'm not arguing that AI should not exist.
257
842305
2069
14:04
What I'm arguing is that the resources used to build generative AI
258
844374
4071
Lo que sostengo es que los recursos utilizados para crear una IA generativa
14:08
should be paid for.
259
848478
1502
deberían pagarse.
14:10
Licensing is hard work.
260
850413
2136
La concesión de licencias es un trabajo duro.
14:12
It will slow you down in the short term,
261
852549
1968
Lo ralentizará a corto plazo,
14:14
but you'll ultimately reach exactly the same point --
262
854551
2569
pero al final llegará exactamente al mismo punto...
14:17
models that are just as capable, just as powerful --
263
857153
2436
modelos que son igual de capaces e igual de poderosos...
14:19
and you'll do so without forcing the world's publishers
264
859623
4037
y lo hará sin obligar a las editoriales del mundo
14:23
to batten down the hatches and destroy the commons,
265
863693
3370
a cerrar las puertas y destruir los bienes comunes,
14:27
and without pitting the world's creators against you.
266
867063
3571
y sin poner a los creadores del mundo en su contra.
14:30
So I hope that more AI companies will follow the example
267
870667
4404
Así que espero que más empresas de IA sigan el ejemplo
14:35
set by those we've certified at Fairly Trained,
268
875105
2369
de las que hemos certificado en Fairly Trained
14:37
and license all their training data.
269
877507
1835
y licencien todos sus datos de formación.
14:39
I hope that employees at these companies will demand this of their employers.
270
879376
4037
Espero que los empleados de estas empresas exijan esto a sus empleadores.
14:43
And I hope that everyone who uses generative AI
271
883446
3204
Y espero que todos los que utilizan la IA generativa
14:46
will ask what their favorite models were trained on.
272
886683
2703
se pregunten en qué se han formado sus modelos favoritos.
14:49
There is a future in which generative AI and human creativity can coexist,
273
889419
5939
Hay un futuro en el que la IA generativa y la creatividad humana puedan coexistir,
14:55
not just peacefully, but symbiotically.
274
895358
2670
no solo de forma pacífica, sino simbiótica.
14:59
It's been a rough start,
275
899029
1668
Ha sido un comienzo difícil,
15:00
but it's not too late to change course.
276
900730
1902
pero no es demasiado tarde para cambiar de rumbo.
15:03
Thank you.
277
903433
1168
Gracias.
15:04
(Applause)
278
904601
2302
(Aplausos)
Acerca de este sitio web

Este sitio le presentará vídeos de YouTube útiles para aprender inglés. Verá lecciones de inglés impartidas por profesores de primera categoría de todo el mundo. Haz doble clic en los subtítulos en inglés que aparecen en cada página de vídeo para reproducir el vídeo desde allí. Los subtítulos se desplazan en sincronía con la reproducción del vídeo. Si tiene algún comentario o petición, póngase en contacto con nosotros mediante este formulario de contacto.

https://forms.gle/WvT1wiN1qDtmnspy7