How AI Models Steal Creative Work — and What to Do About It | Ed Newton-Rex | TED

27,085 views ・ 2025-03-19

TED


يرجى النقر نقرًا مزدوجًا فوق الترجمة الإنجليزية أدناه لتشغيل الفيديو.

المترجم: Hani Eldalees
00:04
The technology and vision behind generative AI is amazing,
0
4301
5072
إن التكنولوجيا والرؤية الكامنة وراء الذكاء الاصطناعي التوليدي مذهلة،
00:09
but stealing the work of the world's creators to build it is not.
1
9373
3771
لكن سرقة عمل المبدعين في العالم لبنائه ليست كذلك.
00:14
There are three key things that AI companies need to build their models,
2
14078
4972
هناك ثلاثة أشياء رئيسية تحتاجها شركات الذكاء الاصطناعي لبناء نماذجها،
00:19
three key resources -- people, compute and data.
3
19083
4271
وثلاثة موارد رئيسية - الأشخاص والحوسبة والبيانات.
00:24
That is, engineers to build the models,
4
24121
2937
أي المهندسين لبناء النماذج ووحدات
00:27
GPUs to run the training process
5
27091
2102
معالجة الرسومات لتشغيل عملية التدريب
00:29
and data to train the models on.
6
29226
2336
والبيانات لتدريب النماذج عليها.
00:32
AI companies spend vast sums on the first two,
7
32696
5005
تنفق شركات الذكاء الاصطناعي مبالغ هائلة على الأولين،
00:37
sometimes a million dollars per engineer
8
37735
2402
وأحيانًا مليون دولار لكل مهندس
00:40
and up to a billion dollars per model.
9
40137
3337
وما يصل إلى مليار دولار لكل نموذج.
00:43
But they expect to take the third resource, training data, for free.
10
43507
5439
لكنهم يتوقعون أخذ المورد الثالث، بيانات التدريب، مجانًا.
00:48
Right now, many AI companies train on creative work they haven't paid for
11
48979
4772
حاليا، تتدرب العديد من شركات الذكاء الاصطناعي على العمل الإبداعي لم تدفع ثمنه
00:53
or even asked permission to use.
12
53784
1869
أو حتى تطلب الإذن باستخدامه.
00:56
This is unfair and unsustainable.
13
56320
2970
هذا غير عادل وغير مستدام.
01:00
But if we reset, and license our training data,
14
60224
3270
ولكن إذا قمنا بإعادة ضبط بيانات التدريب الخاصة بنا
01:03
we can build a better generative AI ecosystem that works for everyone,
15
63527
3704
وترخيصها، فيمكننا بناء نظام بيئي أفضل للذكاء الاصطناعي يعمل للجميع،
01:07
both the AI companies themselves and the creators,
16
67264
3304
سواء شركات الذكاء الاصطناعي نفسها أو المبدعين، الذين
01:10
without whose work these models would not exist.
17
70601
2636
بدون عملهم لن توجد هذه النماذج.
01:14
Most AI companies today do not license the majority of their training data.
18
74271
4839
لا ترخص معظم شركات الذكاء الاصطناعي اليوم غالبية بيانات التدريب الخاصة بها.
01:19
They use web scrapers to find, download
19
79143
2402
يستخدمون كاشطات الويب للعثور
01:21
and train on as much content as they can gather.
20
81579
3036
على أكبر قدر ممكن من المحتوى وتنزيله والتدريب عليه.
01:24
They're often pretty secretive about what they do train on,
21
84615
2870
غالبًا ما يكونون سريين جدًا بشأن ما يتدربون عليه،
01:27
but what's clear is that training on copyrighted work without a license
22
87485
4037
ولكن ما هو واضح هو أن التدريب على العمل المحمي بحقوق الطبع والنشر بدون ترخيص
01:31
is rife.
23
91555
1268
منتشر.
01:32
For instance, when the Mozilla Foundation
24
92857
2569
على سبيل المثال، عندما
01:35
looked at 47 large language models released between 2019 and 2023,
25
95459
5406
نظرت مؤسسة Mozilla في 47 نموذجًا لغويًا كبيرًا تم إصدارها بين عامي 2019 و 2023،
01:40
they found that 64 percent of them were trained, in part, on Common Crawl,
26
100898
4905
وجدوا أن 64 بالمائة منهم تم تدريبهم، جزئيًا، على Common Crawl،
01:45
a dataset that includes copyrighted works,
27
105836
3070
وهي مجموعة بيانات تتضمن أعمالًا محمية بحقوق الطبع والنشر،
01:48
such as newspaper articles from major publications.
28
108939
2403
مثل مقالات الصحف من المنشورات الرئيسية.
01:51
And a further 21 percent didn’t reveal enough information to know either way.
29
111375
5239
ولم تكشف نسبة 21 بالمائة أخرى عن معلومات كافية لمعرفة أي من الطريقتين.
01:57
Training on copyrighted work without a license
30
117982
2302
أصبح التدريب على حقوق الطبع والنشر بدون ترخيص
02:00
has rapidly become standard across much of the generative AI industry.
31
120284
4404
معيارًا سريعًا في معظم صناعة الذكاء الاصطناعي التوليدية.
02:04
But this training,
32
124722
1601
لكن هذا التدريب،
02:06
this unlicensed training on creative work,
33
126357
2903
هذا التدريب غير المرخص على العمل الإبداعي،
02:09
has serious negative consequences for the people behind that work.
34
129260
3603
له عواقب سلبية خطيرة على الأشخاص الذين يقفون وراء هذا العمل.
02:12
And this is for the simple reason
35
132863
1969
وهذا لسبب بسيط هو
02:14
that generative AI competes with its training data.
36
134832
3337
أن الذكاء الاصطناعي التوليدي ينافس بيانات التدريب الخاصة به.
02:18
This is not the narrative that AI companies like to portray.
37
138202
3270
هذه ليست الرواية التي تحب شركات الذكاء الاصطناعي تصويرها.
02:21
We like to talk about democratization, about letting more people be creative.
38
141505
3637
نحب أن نتحدث عن الديمقراطية، عن السماح لمزيد من الناس بالإبداع.
02:25
But the fact that AI competes with its training data is inescapable.
39
145176
3870
لكن حقيقة أن الذكاء الاصطناعي يتنافس مع بيانات التدريب الخاصة به أمر لا مفر منه.
02:30
A large language model trained on short stories
40
150080
2269
يمكن لنموذج اللغة الكبير المدرب على القصص
02:32
can create competing short stories.
41
152383
1768
القصيرة إنشاء قصص قصيرة منافسة.
02:34
An AI image model trained on stock images can create competing stock images.
42
154185
3703
يمكن لنموذج صور AI المدرب على الصور المخزنة إنشاء صور مخزون منافسة.
02:37
An AI music model trained on music that's licensed to TV shows
43
157888
3771
يمكن لنموذج موسيقى AI المدرب على الموسيقى المرخصة للبرامج التلفزيونية
02:41
can create competing music to license to TV shows.
44
161659
2836
إنشاء موسيقى منافسة لترخيص البرامج التلفزيونية.
02:44
These models, however imperfect,
45
164528
3837
هذه النماذج، مهما كانت غير كاملة،
02:48
are so quick and easy to use that this competition is inevitable.
46
168399
3937
سريعة وسهلة الاستخدام لدرجة أن هذه المنافسة أمر لا مفر منه.
02:53
And this isn't just theoretical.
47
173270
1869
وهذا ليس مجرد نظرية.
02:55
Generative AI is still pretty new,
48
175172
2269
لا يزال الذكاء الاصطناعي التوليدي جديدًا جدًا،
02:57
but we're already seeing exactly the sort of effects you'd expect
49
177474
3270
لكننا نرى بالفعل نوع التأثيرات التي تتوقعها بالضبط
03:00
in a world in which generative AI competes with its training data.
50
180778
4237
في عالم يتنافس فيه الذكاء الاصطناعي التوليدي مع بيانات التدريب الخاصة به.
03:05
For instance, the well-known filmmaker Ram Gopal Varma recently said
51
185049
4804
على سبيل المثال، قال المخرج الشهير رام جوفال فارما مؤخرًا
03:09
that he'll use AI music in all his projects going forward.
52
189853
3704
إنه سيستخدم موسيقى الذكاء الاصطناعي في جميع مشاريعه في المستقبل.
03:13
Indeed, there are multiple reports of people starting to listen to AI music
53
193591
4137
في الواقع، هناك تقارير متعددة عن أشخاص بدأوا
03:17
in place of human-produced music,
54
197761
1635
في الاستماع لموسيقى الذكاء الاصطناعي بدلاً من التي ينتجها الإنسان،
03:19
and recently, an AI song hit number 48 in the German charts.
55
199430
5472
ومؤخرًا، وصلت أغنية AI إلى رقم 48 في الرسوم البيانية الألمانية.
03:24
In all these cases, AI music is competing with the songs it was trained on.
56
204935
5205
في كل هذه الحالات، تتنافس موسيقى الذكاء الاصطناعي مع الأغاني تم التدريب عليها.
03:30
Or take Kelly McKernan.
57
210174
2636
أو خذ كيلي ماكرنان.
03:32
Kelly is an artist from Nashville.
58
212843
2770
كيلي فنانة من ناشفيل.
03:35
For 10 years, they made enough money selling their work
59
215646
4104
لمدة 10 سنوات، كسبوا ما يكفي من المال من بيع أعمالهم
03:39
that art was their full-time income.
60
219783
1836
بحيث كان الفن هو دخلهم بدوام كامل.
03:41
But in 2022, a dataset that included their works
61
221652
4104
ولكن في عام 2022،
03:45
was used to train a popular AI image model.
62
225756
3837
تم استخدام مجموعة بيانات تضمنت أعمالهم لتدريب نموذج صور الذكاء الاصطناعي الشهير.
03:51
Their name was one of many used by huge numbers of people
63
231362
5038
كان اسمهم واحدًا من العديد من الأسماء التي استخدمها عدد كبير من الأشخاص
03:56
to create art in the style of specific human artists.
64
236433
4772
لإنشاء فن بأسلوب فنانين بشريين محددين.
04:01
Kelly's income fell by 33 percent almost overnight.
65
241238
3871
انخفض دخل كيلي بنسبة 33 في المائة بين عشية وضحاها تقريبًا.
04:05
Illustrators around the world report similar stories,
66
245109
3203
يروي الرسامون في جميع أنحاء العالم قصصًا مماثلة،
04:08
being outcompeted by AI models
67
248312
2569
حيث تتفوق عليهم نماذج الذكاء الاصطناعي
04:10
they have reason to believe were trained on their work.
68
250914
3571
التي لديهم سبب للاعتقاد بأنهم تلقوا تدريبًا على عملهم.
04:14
The freelance platform Upwork wrote a white paper
69
254518
3337
كتبت منصة Upwork المستقلة ورقة بيضاء نظروا
04:17
in which they looked at the effects, that they've seen on the job market,
70
257888
4138
فيها إلى التأثيرات التي رأوها في سوق العمل للذكاء الاصطناعي
04:22
of generative AI.
71
262026
2002
التوليدي.
04:24
They looked at how job postings on their platform have changed
72
264028
3136
لقد نظروا في كيفية تغير إعلانات الوظائف على منصتهم
04:27
since the introduction of ChatGPT,
73
267197
1669
منذ إدخال ChatGPT،
04:28
and sure enough, they found exactly what you'd expect,
74
268866
2903
ومن المؤكد أنهم وجدوا ما تتوقعه بالضبط، وهو أن
04:31
that generative AI has reduced the demand for freelance writing tasks by 8 percent,
75
271769
4804
الذكاء الاصطناعي التوليدي قد قلل الطلب على مهام الكتابة المستقلة بنسبة 8 في المائة،
04:36
which increases to 18 percent
76
276607
2469
والتي ترتفع إلى 18 في المائة
04:39
if you look at only what they term lower-value tasks.
77
279109
2836
إذا نظرت فقط إلى ما يسمونه المهام الأقل قيمة.
04:41
So the initial data we have, plus the individual stories we hear,
78
281979
6373
لذا فإن البيانات الأولية لدينا، بالإضافة إلى القصص الفردية التي نسمعها، تتوافق
04:48
all align with the logical assumption:
79
288385
1835
جميعها مع الافتراض المنطقي:
04:50
"Generative AI competes with the work it's trained on."
80
290254
2936
«الذكاء الاصطناعي التوليدي ينافس العمل الذي تم التدريب عليه».
04:53
It's so quick and easy to use, it's inevitable,
81
293223
2803
إنه سريع جدًا وسهل الاستخدام، وهو أمر لا مفر منه،
04:56
and it competes with the people behind that work.
82
296060
2636
ويتنافس مع الأشخاص الذين يقفون وراء هذا العمل.
04:58
Now creators argue this training is illegal.
83
298729
3704
يجادل المبدعون الآن بأن هذا التدريب غير قانوني.
05:02
The legal framework of copyright
84
302433
1568
يمنح الإطار القانوني لحقوق
05:04
affords creators the exclusive right to authorize copies of their work,
85
304034
4071
الطبع والنشر المبدعين الحق الحصري في ترخيص نسخ من أعمالهم،
05:08
and AI training involves copying.
86
308138
3470
ويتضمن تدريب الذكاء الاصطناعي النسخ.
05:11
Here, in the US, many AI companies argue
87
311642
3170
هنا، في الولايات المتحدة، تجادل العديد من شركات الذكاء الاصطناعي
05:14
that training AI falls under the fair use copyright exception,
88
314845
4204
بأن التدريب على الذكاء الاصطناعي يندرج تحت استثناء حقوق النشر للاستخدام العادل،
05:19
which allows unlicensed copying in a limited set of circumstances,
89
319083
4137
والذي يسمح بالنسخ غير المرخص في مجموعة محدودة من الظروف،
05:23
such as creating parodies of a work.
90
323253
2203
مثل إنشاء محاكاة ساخرة للعمل.
05:26
Creators and rights holders strongly disagree,
91
326523
3137
يختلف المبدعون وأصحاب الحقوق بشدة، حيث
05:29
saying there's no way this narrow exception can be used
92
329693
3037
يقولون لا توجد طريقة يمكن من خلالها استخدام هذا الاستثناء الضيق
05:32
to legitimize the mass exploitation of creative work
93
332763
4905
لإضفاء الشرعية على الاستغلال الجماعي للعمل الإبداعي
05:37
to create automated competitors to that work.
94
337701
2102
لإنشاء منافسين آليين لهذا العمل.
05:39
And for the record, I entirely agree.
95
339837
3436
وللعلم، أوافق تمامًا.
05:43
Of course, this question is previously untested in the courts,
96
343307
3804
بالطبع، لم يتم اختبار هذا السؤال سابقًا في المحاكم،
05:47
and there are currently around 30 ongoing lawsuits
97
347111
2535
وهناك حاليًا حوالي 30 دعوى قضائية جارية
05:49
brought by rights holders against AI companies,
98
349680
2769
رفعها أصحاب الحقوق ضد شركات الذكاء الاصطناعي،
05:52
which will help to address this question.
99
352483
2569
مما سيساعد في معالجة هذا السؤال.
05:55
But this will take time, and creators are suffering
100
355085
2870
لكن هذا سيستغرق بعض الوقت،
05:57
from what they see as unjust competition right now.
101
357988
3971
ويعاني المبدعون مما يعتبرونه منافسة غير عادلة في الوقت الحالي.
06:01
So they propose a solution that has been used and worked before --
102
361992
5205
لذلك يقترحون حلاً تم استخدامه وعمله من قبل -
06:07
licensing.
103
367197
1569
الترخيص.
06:08
If a commercial entity wants to use copyrighted work,
104
368799
3870
إذا أراد كيان تجاري استخدام عمل محمي بحقوق الطبع والنشر،
06:12
be it for merchandise manufacturing or building a streaming service,
105
372669
3504
سواء كان ذلك لتصنيع البضائع أو بناء خدمة بث، فإنه
06:16
they license that work.
106
376206
1435
يرخص هذا العمل.
06:17
Now AI companies have a bunch of reasons why this shouldn’t apply to them.
107
377674
5306
لدى شركات الذكاء الاصطناعي الآن مجموعة من الأسباب التي تجعل هذا لا ينطبق عليها.
06:23
There’s the fair use legal exception that I’ve already mentioned.
108
383013
5439
هناك الاستثناء القانوني للاستخدام العادل الذي ذكرته بالفعل.
06:29
There's also the argument
109
389686
1469
هناك أيضًا حجة مفادها
06:31
that since humans can train on copyrighted work without a license,
110
391188
4004
لأن البشر يمكنهم التدريب على العمل المحمي بحقوق الطبع والنشر دون ترخيص،
06:35
AI should be allowed to, too.
111
395225
1569
فيجب السماح للذكاء الاصطناعي بذلك.
06:36
But this is a very hard claim to justify.
112
396827
3270
لكن هذا ادعاء يصعب تبريره.
06:40
Artists have been learning from each other for centuries.
113
400130
2736
يتعلم الفنانون من بعضهم البعض منذ قرون.
06:42
When you create, you expect other people to learn from you.
114
402900
4304
عند الإنشاء، تتوقع أن يتعلم الآخرون منك.
06:47
You learn from a range of sources,
115
407237
1669
تتعلم من مجموعة من المصادر،
06:48
from other art to textbooks to taking lessons.
116
408939
2870
من الفنون الأخرى إلى الكتب المدرسية إلى أخذ الدروس.
06:51
Much of this you or someone else paid for,
117
411842
2169
الكثير من هذا المبلغ دفعت أنت أو أي شخص آخر ثمنه،
06:54
supporting the entire ecosystem.
118
414011
1768
مما يدعم النظام البيئي بأكمله.
06:55
In generative AI,
119
415813
2035
في الذكاء الاصطناعي التوليدي، تقوم الكيانات
06:57
commercial entities valued at millions or billions of dollars
120
417881
3137
التجارية التي تقدر قيمتها بملايين أو مليارات الدولارات
07:01
scrape as much content as they can,
121
421018
2302
باستخراج أكبر قدر ممكن من المحتوى،
07:03
often against creators' will, without payment,
122
423353
2436
غالبًا ضد إرادة المبدعين، دون مقابل، وتقوم
07:05
making multiple copies along the way --
123
425823
3103
بعمل نسخ متعددة على طول الطريق -
07:08
which are subject to copyright law --
124
428959
2369
والتي تخضع لقانون حقوق النشر -
07:11
to create a highly scalable competitor to what they're copying.
125
431361
3270
لإنشاء منافس قابل للتطوير بدرجة كبيرة لما ينسخه.
07:14
So scalable, in fact, that there are AI image generators
126
434631
3170
قادرة، لدرجة أن هناك مولدات صور بالذكاء الاصطناعي
07:17
estimated to be making 2.5 million images a day
127
437835
3470
تُقدر بأنها تنتج 2.5 مليون صورة يوميًا
07:21
and AI song generators outputting 10 songs a second.
128
441338
2736
ومولدات أغاني بالذكاء الاصطناعي تنتج 10 أغنيات في الثانية.
07:24
To argue that human learning and AI training are the same
129
444107
2770
القول بأن التعلم البشري والتدريب على الذكاء الاصطناعي نفس الشيء
07:26
and should be treated the same
130
446910
1569
ويجب التعامل معه بنفس الطريقة
07:28
is preposterous.
131
448512
1268
أمر مناف للعقل.
07:31
AI companies also argue
132
451281
2203
تجادل شركات الذكاء الاصطناعي أيضًا
07:33
that licensing their training data would be impractical.
133
453517
3103
بأن ترخيص بيانات التدريب الخاصة بها سيكون غير عملي.
07:36
They use so much training data, they say,
134
456620
2169
إنهم يستخدمون الكثير من بيانات التدريب،
07:38
that individual payments to each creator behind the data would be small.
135
458789
4504
بحيث تكون المدفوعات الفردية لكل منشئ البيانات صغيرة.
07:43
But this is true of many content-licensing markets.
136
463327
3069
ولكن هذا ينطبق على العديد من أسواق ترخيص المحتوى.
07:46
Creators still want to get paid, even if the payments are small.
137
466430
3036
لا يزال منشئو المحتوى يرغبون في الحصول على أموال، حتى لو كانت قليلة.
تجادل شركات الذكاء الاصطناعي بأنها ببساطة تستخدم الكثير من البيانات
07:50
AI companies also argue that they simply use too much data
138
470234
3069
07:53
for licensing to even be feasible.
139
473337
2435
حتى يكون الترخيص ممكنًا.
07:56
But this is harder and harder to believe
140
476440
2102
ولكن من الصعب جدًا تصديق ذلك
07:58
in a world in which there is such a range of datasets
141
478575
3203
في عالم توجد فيه مجموعة من مجموعات البيانات
08:01
that you can access with permission.
142
481812
3036
التي يمكنك الوصول إليها بإذن.
08:04
You can license data from media companies.
143
484848
2069
يمكنك ترخيص البيانات من الشركات الإعلامية.
08:06
There have been 27 major deals
144
486950
2436
كانت هناك 27 صفقة رئيسية
08:09
between AI companies and rights holders in the last year alone,
145
489419
3204
بين شركات الذكاء الاصطناعي وأصحاب الحقوق في العام الماضي وحده،
08:12
and that's to say nothing of the smaller ones that don't get reported.
146
492656
3337
وهذا ناهيك عن الشركات الصغيرة التي لا يتم الإبلاغ عنها.
08:16
There are marketplaces of training data where you can get more data.
147
496026
3203
هناك أسواق لبيانات التدريب حيث يمكنك الحصول على المزيد من البيانات.
08:19
You can expand this with data that's in the public domain --
148
499229
3203
يمكنك توسيع هذا باستخدام البيانات الموجودة في المجال العام -- أي
08:22
that is, in which no copyright exists,
149
502466
2202
التي لا توجد فيها حقوق نشر،
08:24
like the 500-billion-word dataset Common Corpus.
150
504668
4338
مثل مجموعة بيانات Common Corpus المكونة من 500 مليار كلمة.
08:29
You can expand this further with synthetic data,
151
509006
2903
يمكنك توسيع هذا الأمر بشكل أكبر باستخدام البيانات الاصطناعية،
08:31
that is, data that's created itself by an AI model,
152
511942
3270
أي البيانات التي تم إنشاؤها بنفسها بواسطة نموذج الذكاء الاصطناعي،
08:35
in which usually no copyright exists.
153
515212
2636
والتي لا توجد فيها عادةً حقوق نشر.
08:37
So there are multiple options available to you
154
517881
2236
لذلك هناك العديد من الخيارات المتاحة لك
08:40
if you want to build your model without infringing copyright.
155
520150
3003
إذا كنت ترغب في إنشاء نموذجك دون انتهاك حقوق الطبع والنشر.
08:44
But the strongest evidence
156
524321
1401
لكن أقوى دليل على
08:45
that it's possible to license all your data
157
525756
3170
إمكانية ترخيص جميع بياناتك
08:48
is that there are multiple companies doing it already.
158
528926
2569
هو أن هناك العديد من الشركات التي تقوم بذلك بالفعل.
08:51
I know, because I've done it myself.
159
531528
1735
أعلم، لأنني فعلت ذلك بنفسي.
08:53
I've worked in what we now call generative AI for over a decade,
160
533297
3336
لقد عملت في ما نسميه الآن الذكاء الاصطناعي التوليدي لأكثر من عقد،
08:56
and last September,
161
536667
1334
وفي سبتمبر الماضي،
08:58
my team at Stability AI released an AI music model
162
538001
3938
أصدر فريقي في Stability AI نموذجًا موسيقيًا للذكاء الاصطناعي
09:01
that trained on licensed music.
163
541972
2069
تم تدريبه على الموسيقى المرخصة.
09:06
A number of other companies have done the same thing,
164
546310
3103
قام عدد من الشركات الأخرى بنفس الشيء،
09:09
and I founded Fairly Trained in order to highlight this fact,
165
549446
3704
وقمت بتأسيس Fairly Trained من أجل تسليط الضوء على هذه الحقيقة
09:13
and these companies.
166
553183
1602
وهذه الشركات.
09:15
Fairly Trained is a nonprofit that certifies generative AI companies
167
555586
4704
Fairly Trained هي منظمة غير ربحية تصادق على شركات الذكاء الاصطناعي المولدة
09:20
that don't train on copyrighted work without a license.
168
560290
2770
لا تتدرب على العمل المحمي بحقوق الطبع والنشر بدون ترخيص.
09:23
We launched in January of this year, and we've already certified 18 companies.
169
563093
4071
أطلقنا في يناير من هذا العام، وقمنا بالفعل باعتماد 18 شركة.
09:27
Now these companies take a variety of approaches
170
567164
2436
الآن تتخذ هذه الشركات مجموعة متنوعة من الأساليب
09:29
to licensing their training data.
171
569633
1601
لترخيص بيانات التدريب الخاصة بها.
09:31
We have an AI voice model that's trained on individual voices it's licensed.
172
571234
5039
لدينا نموذج صوتي بتقنية الذكاء الاصطناعي تم تدريبه على الأصوات الفردية المرخصة.
09:36
We have an AI music model that's licensed more than 40 music catalogs.
173
576306
4138
لدينا نموذج موسيقى بتقنية الذكاء الاصطناعي مرخص بأكثر من 40 كتالوجًا موسيقيًا.
09:40
We have a large language model
174
580477
1535
لدينا نموذج لغوي كبير
09:42
that's trained only on data in the public domain,
175
582045
2403
يتم تدريبه فقط على البيانات في المجال العام،
09:44
mostly from government documents and records.
176
584481
2136
ومعظمها من الوثائق والسجلات الحكومية.
09:46
We have companies who have paid upfront fees for their data.
177
586650
4871
لدينا شركات دفعت رسومًا مقدمة مقابل بياناتها.
09:52
We have companies who share their revenue with their data providers.
178
592356
3470
لدينا شركات تشارك إيراداتها مع مزودي البيانات.
09:55
There is no one answer to the exact specifics
179
595826
3570
لا توجد إجابة واحدة على التفاصيل
09:59
of how one of these licensing deals has to work.
180
599396
2836
الدقيقة لكيفية عمل إحدى صفقات الترخيص هذه.
10:02
The beauty of licensing is that the two parties can come together
181
602265
3270
يكمن جمال الترخيص في أنه يمكن للطرفين الاجتماع معًا
10:05
and figure out what works for them.
182
605569
1735
ومعرفة ما يناسبهما.
10:07
And this is happening more and more now.
183
607337
1935
وهذا يحدث أكثر فأكثر الآن.
10:09
You will hear that a requirement to license training data
184
609306
3470
سوف تسمع أن شرط ترخيص بيانات التدريب يخنق الابتكار
10:12
somehow stifles innovation,
185
612809
2069
بطريقة ما، وأن شركات
10:14
that it's only the big AI companies that can afford
186
614878
2503
الذكاء الاصطناعي الكبرى فقط هي التي يمكنها تحمل رسوم
10:17
these huge upfront licensing fees.
187
617414
1969
الترخيص الأولية الضخمة هذه.
10:19
But in reality, it's the smaller start-ups
188
619383
2902
ولكن في الواقع، فإن الشركات الناشئة الصغيرة هي
10:22
who are bothering to license all their data,
189
622319
2803
التي تكلف نفسها عناء ترخيص جميع بياناتها،
10:25
and they're doing so, often, without hefty upfront licensing fees,
190
625155
3136
وهي تفعل ذلك، في كثير من الأحيان، دون رسوم ترخيص مسبقة باهظة،
10:28
but using models such as revenue shares.
191
628325
3070
ولكن باستخدام نماذج مثل حصص الإيرادات.
10:32
And there's another major upside to licensing your training data.
192
632996
3070
وهناك جانب رئيسي آخر لترخيص بيانات التدريب الخاصة بك.
10:36
All of this training on copyrighted work
193
636099
3971
كل هذا التدريب على العمل
10:40
is forcing publishers to shut off access to their content.
194
640103
4138
المحمي بحقوق الطبع والنشر يجبر الناشرين على إيقاف الوصول إلى المحتوى الخاص بهم.
10:44
The Data Provenance Initiative
195
644274
1802
نظرت مبادرة مصدر البيانات في
10:46
looked at 14,000 websites commonly used in AI training sets,
196
646109
4238
14,000 موقع إلكتروني شائع الاستخدام في مجموعات التدريب على الذكاء
10:50
and they found that, over the course of a single year,
197
650347
2636
الاصطناعي، ووجدوا أنه على مدار عام واحد، وبالنظر فقط إلى
10:53
looking at only the domains of the highest value for AI training,
198
653016
4338
المجالات ذات القيمة الأعلى للتدريب على الذكاء الاصطناعي، ارتفع
10:57
the number that was restricted via opt-outs or terms of service
199
657387
4004
العدد الذي تم تقييده عن طريق إلغاء الاشتراك أو شروط الخدمة
11:01
increased from three percent to between 20 and 33 percent.
200
661391
4805
من ثلاثة بالمائة إلى ما بين 20 و 33 بالمائة.
11:06
The web is being gradually closed due to unlicensed training.
201
666196
3637
يتم إغلاق الويب تدريجيًا بسبب التدريب غير المرخص.
11:09
Now this is bad for new AI models, for new entrants to the market,
202
669866
3170
هذا سيئ لنماذج الذكاء الاصطناعي الجديدة، للوافدين الجدد إلى السوق،
11:13
but also for everyone --
203
673070
1601
ولكن أيضًا للجميع -
11:14
researchers, consumers and more, who benefit from an open internet.
204
674705
4070
الباحثين والمستهلكين وغيرهم، الذين يستفيدون من الإنترنت المفتوح.
11:20
It should come as no surprise
205
680510
1402
لا ينبغي أن يكون مفاجئًا
11:21
that the general public do not agree with AI companies
206
681945
3070
أن عامة الناس لا يتفقون مع شركات الذكاء الاصطناعي
11:25
about what they can train their models on.
207
685048
2436
حول ما يمكنهم تدريب نماذجهم عليه.
11:27
One poll from the AI Policy Institute, in April,
208
687517
3170
استطلاع واحد من معهد سياسة الذكاء الاصطناعي، في أبريل،
11:30
asked people about the common policy among AI companies
209
690721
3169
سأل الناس عن السياسة المشتركة بين شركات
11:33
of training on publicly available data.
210
693924
2969
الذكاء الاصطناعي للتدريب على البيانات المتاحة للجمهور.
11:36
This is data that is openly available online,
211
696927
3036
هذه هي البيانات المتاحة بشكل مفتوح عبر الإنترنت،
11:39
which of course includes a lot of copyrighted work,
212
699996
2436
تتضمن الكثير من الأعمال المحمية بحقوق الطبع والنشر،
11:42
like news articles and, often, pirated media.
213
702466
3036
مثل المقالات الإخبارية، والوسائط المقرصنة في كثير من الأحيان.
11:45
60 percent of people said this should not be allowed
214
705535
3704
قال 60 في المائة من الأشخاص إنه لا ينبغي السماح بذلك
11:49
versus only 19 percent who said it should.
215
709272
3037
مقابل 19 في المائة فقط قالوا إنه ينبغي السماح بذلك.
11:52
The same poll went on to ask
216
712309
2402
استمر الاستطلاع نفسه في التساؤل عما
11:54
whether AI companies should compensate data providers.
217
714745
3970
إذا كان يجب على شركات الذكاء الاصطناعي تعويض مزودي البيانات.
11:58
74 percent said yes, and only nine percent said no.
218
718749
5305
74 في المئة قالوا نعم، و9 في المئة فقط قالوا لا.
12:04
Time and time again, when we ask the public these questions,
219
724087
3671
مرارًا وتكرارًا، عندما نطرح هذه الأسئلة على الجمهور،
12:07
they show support for requirements around permission and payment,
220
727791
4972
فإنهم يظهرون دعمًا للمتطلبات المتعلقة بالإذن
12:12
and a rejection of the notion
221
732796
1435
والدفع، ورفضًا لفكرة
12:14
that something being publicly available somehow makes it fair game.
222
734264
3470
أن شيئًا ما متاحًا للجمهور بطريقة ما يجعله لعبة عادلة.
12:19
And the people who make the art that society consumes feel the same way.
223
739336
4237
والأشخاص الذين يصنعون الفن الذي يستهلكه المجتمع يشعرون بنفس الطريقة.
12:23
Today, we launched a "Statement on AI Training,"
224
743607
3703
أطلقنا اليوم «بيانًا حول التدريب على الذكاء الاصطناعي»، وهو
12:27
a short, simple open letter, which simply reads:
225
747310
4338
عبارة عن رسالة مفتوحة قصيرة وبسيطة تنص ببساطة على ما يلي:
12:31
“The unlicensed use of creative works for training generative AI
226
751681
3571
«الاستخدام غير المرخص للأعمال الإبداعية لتدريب الذكاء الاصطناعي التوليدي
12:35
is a major, unjust threat to the livelihoods
227
755285
2503
يمثل تهديدًا كبيرًا وغير عادل لسبل عيش
12:37
of the people behind those works,
228
757821
1735
الأشخاص يقفون وراء هذه الأعمال،
12:39
and must not be permitted."
229
759589
2303
ويجب عدم السماح به».
12:42
This has already been signed by 11,000 and counting creators around the world,
230
762225
4638
تم التوقيع على هذا بالفعل من قبل 11000 من المبدعين في جميع أنحاء العالم،
12:46
including Nobel-winning authors,
231
766897
2235
بما في ذلك المؤلفين الحائزين على جائزة نوبل
12:49
Academy Award-winning actors and Oscar-winning composers.
232
769132
2803
والممثلين والملحنين الحائزين على الأوسكار.
12:51
And if you agree with this sentiment,
233
771968
1869
وإذا كنت توافق على هذا الشعور،
12:53
I encourage you to sign it today at aitrainingstatement.org.
234
773870
2937
أشجعك على التوقيع عليه اليوم على aitrainingstatement.org.
12:56
What this statement and previous ones like it make abundantly clear
235
776840
3937
ما يوضحه هذا البيان وما سبقه من تصريحات
13:00
is that these artists, these creators,
236
780811
2302
هو أن هؤلاء الفنانين، هؤلاء المبدعين،
13:03
view the unlicensed training on their work by generative AI models
237
783113
3370
ينظرون لتدريب غير مرخص على أعمالهم من نماذج الذكاء الاصطناعي التوليدية
13:06
as totally unjust and potentially catastrophic to their professions.
238
786516
4571
على أنه غير عادل تمامًا ويحتمل أن يكون كارثيًا لمهنهم.
13:11
So if you are an advocate for unlicensed AI training,
239
791121
4004
لذلك إذا كنت من المدافعين عن التدريب غير المرخص للذكاء الاصطناعي، فتذكر
13:15
just remember that the people who wrote the music that you are listening to
240
795158
4838
فقط أن الأشخاص الذين كتبوا الموسيقى التي تستمع إليها
13:20
and the books you’re reading
241
800030
1768
والكتب التي تقرأها
13:21
probably disagree.
242
801798
1468
ربما يختلفون.
13:24
So where does this leave us?
243
804634
1435
إذن أين يتركنا هذا؟
حسنًا، في الوقت الحالي، يكره العديد من الفنانين والكتاب
13:26
Well, right now, many of the world's artists,
244
806102
2503
13:28
writers, musicians, creators
245
808605
2002
والموسيقيين والمبدعين في العالم الذكاء الاصطناعي التوليدي
13:30
straight-up hate generative AI.
246
810607
2369
بشكل مباشر.
13:32
And we know, from their own words, that one of the reasons for this
247
812976
3403
ونعلم، بكلماتهم الخاصة، أن أحد أسباب ذلك
13:36
is that we're training on their work without asking them.
248
816413
3003
هو أننا نتدرب على عملهم دون سؤالهم.
13:39
But it doesn't have to be this way.
249
819449
2302
لكن لا يجب أن يكون الأمر بهذه الطريقة.
13:41
The AI industry and the creative industries
250
821785
2069
يمكن أن تكون صناعة الذكاء الاصطناعي
13:43
can be and should be mutually beneficial.
251
823887
2369
والصناعات الإبداعية مفيدة ويجب أن تكون كذلك.
13:46
But for this mutually beneficial relationship to emerge,
252
826256
4204
ولكن لكي تظهر هذه العلاقة ذات المنفعة المتبادلة،
13:50
we have to start from a position of respect
253
830460
2770
علينا أن نبدأ من موقف
13:53
for the value of the works being trained on
254
833263
2102
احترام قيمة الأعمال التي يتم التدريب عليها
13:55
and the rights of the people who made them.
255
835398
2803
وحقوق الأشخاص الذين صنعوها.
أنا لا أجادل في أنه يجب إيقاف جميع عمليات تطوير الذكاء الاصطناعي.
13:59
I'm not arguing that all AI development should be halted.
256
839002
3270
أنا لا أجادل في أن الذكاء الاصطناعي لا يكون موجودًا.
14:02
I'm not arguing that AI should not exist.
257
842305
2069
14:04
What I'm arguing is that the resources used to build generative AI
258
844374
4071
ما أجادله هو أن الموارد المستخدمة لبناء الذكاء الاصطناعي التوليدي
14:08
should be paid for.
259
848478
1502
يجب دفع ثمنها.
14:10
Licensing is hard work.
260
850413
2136
الترخيص هو عمل شاق.
14:12
It will slow you down in the short term,
261
852549
1968
سيؤدي ذلك إلى إبطائك على المدى القصير،
14:14
but you'll ultimately reach exactly the same point --
262
854551
2569
لكنك ستصل في النهاية إلى نفس النقطة بالضبط -
14:17
models that are just as capable, just as powerful --
263
857153
2436
نماذج تتمتع بنفس القدرة
14:19
and you'll do so without forcing the world's publishers
264
859623
4037
والقوة - وستفعل ذلك دون
14:23
to batten down the hatches and destroy the commons,
265
863693
3370
إجبار الناشرين في العالم على هدم البوابات وتدمير المشاعات،
14:27
and without pitting the world's creators against you.
266
867063
3571
ودون تأليب مبدعي العالم ضدك.
14:30
So I hope that more AI companies will follow the example
267
870667
4404
لذلك آمل أن تحذو المزيد من شركات الذكاء الاصطناعي حذو تلك التي
14:35
set by those we've certified at Fairly Trained,
268
875105
2369
اعتمدناها في Fairly Trained،
14:37
and license all their training data.
269
877507
1835
وأن ترخص جميع بيانات التدريب لها.
14:39
I hope that employees at these companies will demand this of their employers.
270
879376
4037
آمل أن يطلب الموظفون في هذه الشركات ذلك من أصحاب العمل.
14:43
And I hope that everyone who uses generative AI
271
883446
3204
وآمل أن يسأل كل من يستخدم الذكاء الاصطناعي
14:46
will ask what their favorite models were trained on.
272
886683
2703
التوليدي عن النماذج المفضلة لديهم التي تم التدريب عليها.
14:49
There is a future in which generative AI and human creativity can coexist,
273
889419
5939
هناك مستقبل يمكن أن يتعايش فيه الذكاء الاصطناعي التوليدي والإبداع البشري،
14:55
not just peacefully, but symbiotically.
274
895358
2670
ليس فقط بشكل سلمي، ولكن بشكل تكافلي.
14:59
It's been a rough start,
275
899029
1668
لقد كانت بداية صعبة،
15:00
but it's not too late to change course.
276
900730
1902
ولكن لم يفت الأوان بعد لتغيير المسار.
15:03
Thank you.
277
903433
1168
شكرًا لكم.
15:04
(Applause)
278
904601
2302
(تصفيق)
حول هذا الموقع

سيقدم لك هذا الموقع مقاطع فيديو YouTube المفيدة لتعلم اللغة الإنجليزية. سترى دروس اللغة الإنجليزية التي يتم تدريسها من قبل مدرسين من الدرجة الأولى من جميع أنحاء العالم. انقر نقرًا مزدوجًا فوق الترجمة الإنجليزية المعروضة على كل صفحة فيديو لتشغيل الفيديو من هناك. يتم تمرير الترجمات بالتزامن مع تشغيل الفيديو. إذا كان لديك أي تعليقات أو طلبات ، يرجى الاتصال بنا باستخدام نموذج الاتصال هذا.

https://forms.gle/WvT1wiN1qDtmnspy7