How we teach computers to understand pictures | Fei Fei Li

1,162,036 views ・ 2015-03-23

TED


يرجى النقر نقرًا مزدوجًا فوق الترجمة الإنجليزية أدناه لتشغيل الفيديو.

المترجم: Ibrahim Alsaafin المدقّق: Tamer Mekhimar
00:14
Let me show you something.
0
14366
3738
دعوني أريكم شيئًا
00:18
(Video) Girl: Okay, that's a cat sitting in a bed.
1
18104
4156
(فيديو) طفلة: حسنًا، هذه قطة تجلس في السرير
00:22
The boy is petting the elephant.
2
22260
4040
الولد يداعب الفيل
00:26
Those are people that are going on an airplane.
3
26300
4354
هؤلاء أناس سيسافرون على متن الطائرة
00:30
That's a big airplane.
4
30654
2810
تلك طائرة كبيرة
00:33
Fei-Fei Li: This is a three-year-old child
5
33464
2206
فاي-فاي لِي: هذه طفلة عمرها ثلاثة أعوام
00:35
describing what she sees in a series of photos.
6
35670
3679
تصف ما تراه في مجموعة من الصور
00:39
She might still have a lot to learn about this world,
7
39349
2845
ربما لا يزال أمامها الكثير لتتعلمه عن هذا العالم
00:42
but she's already an expert at one very important task:
8
42194
4549
لكنها بالفعل خبيرة في مهمة ضرورية جدًا
00:46
to make sense of what she sees.
9
46743
2846
أن تعي وتعقل ما تراه
00:50
Our society is more technologically advanced than ever.
10
50229
4226
مجتمعنا متقدمٌ تكنولوجيًا بشكل لم يسبق له مثيل
00:54
We send people to the moon, we make phones that talk to us
11
54455
3629
نُرسل أناسًا إلى القمر أونجعل هواتفنا تتحدث إلينا
00:58
or customize radio stations that can play only music we like.
12
58084
4946
أو نخصص محطات إذاعية تستطيع أن تعزف الموسيقى التي نحبها فقط
01:03
Yet, our most advanced machines and computers
13
63030
4055
لكن، آلاتنا وأجهزة الكمبيوتر الأكثر تطورًا
01:07
still struggle at this task.
14
67085
2903
لا تزال تشق طريقها جاهدةً لتنفيذ هذه المهمة
01:09
So I'm here today to give you a progress report
15
69988
3459
لذلك جئت اليوم لأعطيكم تقريرًا مرحليًا
01:13
on the latest advances in our research in computer vision,
16
73447
4047
عن آخر التطورات في أبحاثنا في مجال الإبصار الحاسوبي،
01:17
one of the most frontier and potentially revolutionary
17
77494
4161
وهو أحد التقنيات الرائدة بل وربما الثورية
01:21
technologies in computer science.
18
81655
3206
في مجال علوم الحاسوب
01:24
Yes, we have prototyped cars that can drive by themselves,
19
84861
4551
نعم، لقد صنعنا نماذج لسيارات تستطيع أن تقود نفسها بنفسها
01:29
but without smart vision, they cannot really tell the difference
20
89412
3853
لكن بدون إبصار ذكي لن تستطيع تلك السيارات أن تميز الفرق بدقة
01:33
between a crumpled paper bag on the road, which can be run over,
21
93265
3970
بين كيس ورقي متكوّم على الطريق بحيث يمكنها أن تمر فوقه
01:37
and a rock that size, which should be avoided.
22
97235
3340
وبين صخرة بنفس الحجم ينبغي عليها تجاوزها
01:41
We have made fabulous megapixel cameras,
23
101415
3390
لقد صنعنا كاميرات رائعة تقاس دقتها بالميجا بكسل
01:44
but we have not delivered sight to the blind.
24
104805
3135
لكننا لم نمنح الأعمى بصرًا
01:48
Drones can fly over massive land,
25
108420
3305
تستطيع الطائرات بدون طيار أن تحلق فوق مساحات شاسعة
01:51
but don't have enough vision technology
26
111725
2134
لكنها لا تملك تقنية إبصار كافية
01:53
to help us to track the changes of the rainforests.
27
113859
3461
لتعيننا على تتبع التغيرات في الغابات المطيرة
01:57
Security cameras are everywhere,
28
117320
2950
كاميرات المراقبة أصبحت في كل مكان
02:00
but they do not alert us when a child is drowning in a swimming pool.
29
120270
5067
لكنها لا تنبهنا عندما يوشك طفل على الغرق في بركة سباحة
02:06
Photos and videos are becoming an integral part of global life.
30
126167
5595
الصور والفيديوهات أصبحت جزءًا متكاملا مع الحياة على مستوى العالم
02:11
They're being generated at a pace that's far beyond what any human,
31
131762
4087
لقد أصبحت تتدفق بوتيرة أسرع بكثير مما كان أي إنسان
02:15
or teams of humans, could hope to view,
32
135849
2783
أو مجموعة من البشر يأمل في رؤيته
02:18
and you and I are contributing to that at this TED.
33
138632
3921
وأنا وأنت نساهم في ذلك في مؤتمر TED هذا
02:22
Yet our most advanced software is still struggling at understanding
34
142553
5232
لكن ما تزال أكثر برامجنا تطورًا تواجه مشكلة في استيعاب
02:27
and managing this enormous content.
35
147785
3876
وإدارة هذا المحتوى الهائل
02:31
So in other words, collectively as a society,
36
151661
5272
لذلك، وبكلمات أخرى نحن كمجتمع، بصورة جمعية
02:36
we're very much blind,
37
156933
1746
فاقدون للبصر بشدة
02:38
because our smartest machines are still blind.
38
158679
3387
لأن أذكى آلاتنا لا تزال عمياء
02:43
"Why is this so hard?" you may ask.
39
163526
2926
يمكنك أن تسأل "لِمَ ذلك من الصعوبة بمكان؟"
02:46
Cameras can take pictures like this one
40
166452
2693
تستطيع الكاميرات أن تلتقط صورًا كهذه
02:49
by converting lights into a two-dimensional array of numbers
41
169145
3994
عن طريق تحويل الضوء إلى مصفوفة أرقام ثنائية البعد
02:53
known as pixels,
42
173139
1650
تعرف باسم البكسل
02:54
but these are just lifeless numbers.
43
174789
2251
لكنها مجرد أرقام خالية من الحياة
02:57
They do not carry meaning in themselves.
44
177040
3111
لا تحمل في ذاتها أي معنى
03:00
Just like to hear is not the same as to listen,
45
180151
4343
تمامًا كما أن السّمْع يختلف عن الإصغاء
03:04
to take pictures is not the same as to see,
46
184494
4040
فإن التقاط الصور يختلف عن الإبصار
03:08
and by seeing, we really mean understanding.
47
188534
3829
فبالإبصار، فإننا في الحقيقة نعني الفهم
03:13
In fact, it took Mother Nature 540 million years of hard work
48
193293
6177
في الواقع، فإن الأمر استغرق الطبيعة الأم 540 مليون سنة من العمل المُضني
03:19
to do this task,
49
199470
1973
لتنجز هذه المهمة
03:21
and much of that effort
50
201443
1881
ومعظم ذلك الجهد
03:23
went into developing the visual processing apparatus of our brains,
51
203324
5271
ذهب في سبيل تطوير جهاز معالجة بصرية في أدمغتنا
03:28
not the eyes themselves.
52
208595
2647
وليس العين بحد ذاتها
03:31
So vision begins with the eyes,
53
211242
2747
إذن، تبدأ الرؤية في العين
03:33
but it truly takes place in the brain.
54
213989
3518
لكنها حقيقة تحدث في الدماغ
03:38
So for 15 years now, starting from my Ph.D. at Caltech
55
218287
5060
منذ 15 عامًا وحتى الآن بدأتها منذ كنت أحضر الدكتوراه في معهد كاليفورنيا للتكنولوجيا
03:43
and then leading Stanford's Vision Lab,
56
223347
2926
وبعد ذلك عندما كنت أقود مختبر الإبصار في ستانفورد
03:46
I've been working with my mentors, collaborators and students
57
226273
4396
كنت أعمل مع أساتذتي ومعاونيّ وتلامذتي
03:50
to teach computers to see.
58
230669
2889
على تعليم الحواسيب لكي تبصر
03:54
Our research field is called computer vision and machine learning.
59
234658
3294
مجال بحثنا يسمى الإبصار الحاسوبي وتعليم الحواسيب
03:57
It's part of the general field of artificial intelligence.
60
237952
3878
وهو جزء من المجال العام في الذكاء الصناعي
04:03
So ultimately, we want to teach the machines to see just like we do:
61
243000
5493
ما نريد الوصول إليه هو أن نُعَلّم الآلات لكي تبصر مثلنا تمامًا
04:08
naming objects, identifying people, inferring 3D geometry of things,
62
248493
5387
تُسمي الأشياء بأسمائها وتتعرف على الأشخاص وتستدل على الأبعاد الثلاثية للأسطح
04:13
understanding relations, emotions, actions and intentions.
63
253880
5688
تفهم العلاقات والعواطف والأفعال والنوايا
04:19
You and I weave together entire stories of people, places and things
64
259568
6153
أنت وأنا ننسج معا قصصًا كاملة عن الناس والأماكن والأشياء
04:25
the moment we lay our gaze on them.
65
265721
2164
في اللحظة التي تقع فيها أبصارنا عليهم
04:28
The first step towards this goal is to teach a computer to see objects,
66
268955
5583
أول خطوة في سبيل تحقيق هذا الهدف هي أن نلقن الحاسوب كيف يرى الأشياء
04:34
the building block of the visual world.
67
274538
3368
اللبِنة الأساسية للعالم المرئي
04:37
In its simplest terms, imagine this teaching process
68
277906
4434
بأبسط العبارات، تخيل هذه العملية التلقينية
04:42
as showing the computers some training images
69
282340
2995
كأن نُري الحواسيب بعض الصور التدريبية
04:45
of a particular object, let's say cats,
70
285335
3321
لشيء معين، لنفترض قطة
04:48
and designing a model that learns from these training images.
71
288656
4737
ونصمم نموذجا يمكنه أن يتعلم من هذه الصور التدريبية
04:53
How hard can this be?
72
293393
2044
ما هو مبلغ الصعوبة في ذلك؟
04:55
After all, a cat is just a collection of shapes and colors,
73
295437
4052
ففي النهاية، ما القطة إلا مجموعة أشكال وألوان
04:59
and this is what we did in the early days of object modeling.
74
299489
4086
وهذا ما فعلناه في الأيام الأولى لعملية نَمْذجة الأشياء
05:03
We'd tell the computer algorithm in a mathematical language
75
303575
3622
كنا نلقن خوارزمية الحاسوب بلغة رياضية
05:07
that a cat has a round face, a chubby body,
76
307197
3343
أن القطة لها وجه مُدوّر وجسم مُكْتَنِز
05:10
two pointy ears, and a long tail,
77
310540
2299
وأذنان مدببتان وذيل طويل
05:12
and that looked all fine.
78
312839
1410
وبدا ذلك مما لا بأس فيه
05:14
But what about this cat?
79
314859
2113
لكن ماذا عن هذه القطة؟
05:16
(Laughter)
80
316972
1091
(ضحك)
05:18
It's all curled up.
81
318063
1626
أنها ملتفة حول نفسها
05:19
Now you have to add another shape and viewpoint to the object model.
82
319689
4719
الآن عليك أن تضيف شكلًا ومنظورًا آخرين للنموذج
05:24
But what if cats are hidden?
83
324408
1715
لكن ماذا لو كانت القطط مخفية؟
05:27
What about these silly cats?
84
327143
2219
ماذا عن هذه القطط المُضحكة؟
05:31
Now you get my point.
85
331112
2417
لقد فهمتم الآن ما أعنيه
05:33
Even something as simple as a household pet
86
333529
3367
حتى بالنسبة لشيء بسيط كحيوان أليف
05:36
can present an infinite number of variations to the object model,
87
336896
4504
يمكن أن يقدم عددا لا نهائي من المتغيرات للنموذج
05:41
and that's just one object.
88
341400
2233
وهذا مجرد شيء واحد فحسب
05:44
So about eight years ago,
89
344573
2492
لذا منذ حوالي ثمان سنوات
05:47
a very simple and profound observation changed my thinking.
90
347065
5030
ملاحظة بسيطة ومتعمقة غيرت تفكيري
05:53
No one tells a child how to see,
91
353425
2685
لا أحد يُعَلّم الطفل كيف يبصر
05:56
especially in the early years.
92
356110
2261
خصوصًا في السنوات الأولى
05:58
They learn this through real-world experiences and examples.
93
358371
5000
هم يتعلمون من خلال التجارب والأمثلة في العالم الحقيقي
06:03
If you consider a child's eyes
94
363371
2740
إذا أخذت في الاعتبار عيني طفل
06:06
as a pair of biological cameras,
95
366111
2554
كزوج من الكاميرات الحيوية
06:08
they take one picture about every 200 milliseconds,
96
368665
4180
فإنها تلتقط صورة واحدة كل 200 ميللي ثانية تقريبًا
06:12
the average time an eye movement is made.
97
372845
3134
وهو متوسط الوقت الذي تستغرقه حركة العين
06:15
So by age three, a child would have seen hundreds of millions of pictures
98
375979
5550
إذن ففي الثالثة من العمر يكون الطفل قد رأى مئات الملايين من الصور
06:21
of the real world.
99
381529
1834
للعالم الحقيقي
06:23
That's a lot of training examples.
100
383363
2280
هذا يشكل كمًا كبيرًا من الأمثلة التدريبية
06:26
So instead of focusing solely on better and better algorithms,
101
386383
5989
ولذلك فبدلا من التركيز على تحسين الخوارزميات لوحدها
06:32
my insight was to give the algorithms the kind of training data
102
392372
5272
فَطِنْت لأن أعطي الخوارزميات نفس النوع من البيانات التدريبية
06:37
that a child was given through experiences
103
397644
3319
التي يحصل عليها الطفل من خلال التجارب
06:40
in both quantity and quality.
104
400963
3878
من حيث الكمّ والنوع
06:44
Once we know this,
105
404841
1858
طالما أننا نعرف ذلك
06:46
we knew we needed to collect a data set
106
406699
2971
فقد عرفنا أننا نحتاج أن نجمع مجموعة بيانات
06:49
that has far more images than we have ever had before,
107
409670
4459
تحتوي على صور أكثر بكثير مما كنا قد حصلنا عليه من قبل
06:54
perhaps thousands of times more,
108
414129
2577
ربما أكثر بآلاف المرات
06:56
and together with Professor Kai Li at Princeton University,
109
416706
4111
وبالتعاون مع البروفيسور كاي لي من جامعة برينستون
07:00
we launched the ImageNet project in 2007.
110
420817
4752
أطلقنا في العام 2007 مشروع ImageNet
07:05
Luckily, we didn't have to mount a camera on our head
111
425569
3838
لحسن الحظ، لم يتعين علينا أن نَنْصِب كاميرا فوق رؤوسنا
07:09
and wait for many years.
112
429407
1764
ثم ننتظر لسنوات عديدة
07:11
We went to the Internet,
113
431171
1463
لقد اتجهنا للإنترنت
07:12
the biggest treasure trove of pictures that humans have ever created.
114
432634
4436
حيث يقبع أكبر كنز من الصور أنتجته البشرية على الإطلاق
07:17
We downloaded nearly a billion images
115
437070
3041
لقد قمنا بتحميل ما يقارب المليار صورة
07:20
and used crowdsourcing technology like the Amazon Mechanical Turk platform
116
440111
5880
واستخدمنا تقنية "التعهيد الجماعي" كتلك التي توفرها منصة "أمازون ميكنيكال تورك" ـ
07:25
to help us to label these images.
117
445991
2339
لتساعدنا في تصنيف تلك الصور
07:28
At its peak, ImageNet was one of the biggest employers
118
448330
4900
كان مشروع ImageNet في ذروته واحدًا من أكبر المُشَغّلين
07:33
of the Amazon Mechanical Turk workers:
119
453230
2996
للعاملين على منصة أمازون تلك
07:36
together, almost 50,000 workers
120
456226
3854
معًا، كانوا 50,000 عامل تقريبًا
07:40
from 167 countries around the world
121
460080
4040
من 167 دولة حول العالم
07:44
helped us to clean, sort and label
122
464120
3947
ساعدونا في ترتيب وفرز وتصنيف
07:48
nearly a billion candidate images.
123
468067
3575
ما يقرب من مليار صورة مُرَشّحة
07:52
That was how much effort it took
124
472612
2653
هذا يبين مقدار الجهد المُسْتغرق
07:55
to capture even a fraction of the imagery
125
475265
3900
لالتقاط مجرد جزء صغير من الصور
07:59
a child's mind takes in in the early developmental years.
126
479165
4171
التي يستوعبها عقل طفل في سنوات تطوره الأولى
08:04
In hindsight, this idea of using big data
127
484148
3902
في لفتة متأخرة، فإن فكرة استخدام الـ"بيانات كبيرة" (big data)
08:08
to train computer algorithms may seem obvious now,
128
488050
4550
لتدريب خوارزميات الحواسيب قد تبدو واضحة الآن
08:12
but back in 2007, it was not so obvious.
129
492600
4110
لكنها في العام 2007، لم تكن بهذا الوضوح
08:16
We were fairly alone on this journey for quite a while.
130
496710
3878
لقد كنا لوحدنا تمامًا في هذه الرحلة لوهلة من الزمن
08:20
Some very friendly colleagues advised me to do something more useful for my tenure,
131
500588
5003
نصحني بعض زملائي المقربين بأن أقوم بشيء أكثر ملاءمة لمركزي
08:25
and we were constantly struggling for research funding.
132
505591
4342
وحينها كنا نعني باستمرار لتوفير التمويل لأبحاثنا
08:29
Once, I even joked to my graduate students
133
509933
2485
مرةً، مازحت طلاب الدراسات العليا الذين كنت أشرف عليهم
08:32
that I would just reopen my dry cleaner's shop to fund ImageNet.
134
512418
4063
بأنني مستعدة لأفتتح مصبغة الملابس التي أمتلكها من جديد لتمويل ImageNet
08:36
After all, that's how I funded my college years.
135
516481
4761
على كلٍ، كانت هذه هي الطريقة التي مولت بها نفسي خلال دراستي الجامعية
08:41
So we carried on.
136
521242
1856
وهكذا تابعنا عملنا
08:43
In 2009, the ImageNet project delivered
137
523098
3715
في 2009، تم إنجاز مشروع ImageNet
08:46
a database of 15 million images
138
526813
4042
قاعدة بيانات ذات 15 مليون صورة
08:50
across 22,000 classes of objects and things
139
530855
4805
ونحو 22,000 رُتبة للأشياء
08:55
organized by everyday English words.
140
535660
3320
مرتبة بكلمات اللغة الإنجليزية المستعملة يوميًا
08:58
In both quantity and quality,
141
538980
2926
حسب كل من الكمية والنوعية
09:01
this was an unprecedented scale.
142
541906
2972
لقد كان هذا مستوًى غير مسبوق
09:04
As an example, in the case of cats,
143
544878
3461
كمثال، في حالة القطط
09:08
we have more than 62,000 cats
144
548339
2809
لدينا أكثر من 62,000 قطة
09:11
of all kinds of looks and poses
145
551148
4110
من كل الأنواع وبكل الوضعيات
09:15
and across all species of domestic and wild cats.
146
555258
5223
ومن كل فصائل القطط الأليفة منها والبرية
09:20
We were thrilled to have put together ImageNet,
147
560481
3344
لقد كنا مغتبطين لأننا تمكنا من جمع شتات ImageNet
09:23
and we wanted the whole research world to benefit from it,
148
563825
3738
وأردنا أن يستفيد المجتمع البحثي بأكمله من هذا المشروع
09:27
so in the TED fashion, we opened up the entire data set
149
567563
4041
فلذلك في مؤتمر TED fashion وفرنا قاعدة البيانات كاملة
09:31
to the worldwide research community for free.
150
571604
3592
بالمجان للمجتمع البحثي حول العالم
(تصفيق)
09:36
(Applause)
151
576636
4000
09:41
Now that we have the data to nourish our computer brain,
152
581416
4538
والآن وقد امتلكنا البيانات لنغذي عقل حاسوبنا
09:45
we're ready to come back to the algorithms themselves.
153
585954
3737
أصبحنا جاهزين لنعود للخوارزميات ذاتها
09:49
As it turned out, the wealth of information provided by ImageNet
154
589691
5178
وكما تبين لاحقًا، فإن ثراء المعلومات التي وفرها ImageNet
09:54
was a perfect match to a particular class of machine learning algorithms
155
594869
4806
كان متناغمًا بشكل كامل مع طراز معين من خوارزميات تعليم الحواسيب
09:59
called convolutional neural network,
156
599675
2415
يُسمى الشبكة العصبية الملتفّة
10:02
pioneered by Kunihiko Fukushima, Geoff Hinton, and Yann LeCun
157
602090
5248
أسسها كونيهيكو فوكوشيما وجيف هينتون ويان لي كًن
10:07
back in the 1970s and '80s.
158
607338
3645
وذلك في السبعينات والثمانينات من القرن الماضي
10:10
Just like the brain consists of billions of highly connected neurons,
159
610983
5619
تمامًا كما أن الدماغ يتكون من مليارات الأعصاب المتصلة بقوة
10:16
a basic operating unit in a neural network
160
616602
3854
فإن الوحدة التشغيلية الأساسية في الشبكة العصبية
10:20
is a neuron-like node.
161
620456
2415
هي العقدة العصبية
10:22
It takes input from other nodes
162
622871
2554
هذه العقدة تأخذ مدخلاتها من عُقَد أخرى
10:25
and sends output to others.
163
625425
2718
وترسل مخرجاتها لعُقَد أخرى
10:28
Moreover, these hundreds of thousands or even millions of nodes
164
628143
4713
أيضًا، فإن مئات الآلاف أو حتى الملايين من هذه العُقَد
10:32
are organized in hierarchical layers,
165
632856
3227
مرتبة في طبقات هرمية
10:36
also similar to the brain.
166
636083
2554
شبيهة جدا بالدماغ
10:38
In a typical neural network we use to train our object recognition model,
167
638637
4783
في الشبكة العصبية النمطية، اعتدنا أن ندرب نموذج التعرف على الأشياء الخاص بنا
10:43
it has 24 million nodes,
168
643420
3181
والذي لديه 24 مليون عقدة
10:46
140 million parameters,
169
646601
3297
و140 مليون متغير
10:49
and 15 billion connections.
170
649898
2763
و15 مليار وصلة
10:52
That's an enormous model.
171
652661
2415
هذا نموذج ضخم
10:55
Powered by the massive data from ImageNet
172
655076
3901
مدعوم بكم هائل من البيانات من ImageNet
10:58
and the modern CPUs and GPUs to train such a humongous model,
173
658977
5433
ووحدات مركزية حديثة لمعالجة البيانات والصور لتدريب نموذج ضخم كهذا
11:04
the convolutional neural network
174
664410
2369
الشبكة العصبية الملتفّة
11:06
blossomed in a way that no one expected.
175
666779
3436
تطورت بشكل لم يتوقعه أحد
11:10
It became the winning architecture
176
670215
2508
وأصبحت هي المعمار الحاسوبي المتألق
11:12
to generate exciting new results in object recognition.
177
672723
5340
في إنتاج نتائج جديدة ومثيرة في مجال التعرف على الأشياء
11:18
This is a computer telling us
178
678063
2810
هذا حاسوب يخبرنا
11:20
this picture contains a cat
179
680873
2300
بأن هذه الصورة تتضمن قطة
11:23
and where the cat is.
180
683173
1903
وأين هي القطة تحديدًا
11:25
Of course there are more things than cats,
181
685076
2112
طبعًا فإن هناك أشياء أخرى عدا القطط
11:27
so here's a computer algorithm telling us
182
687188
2438
فهذه خوارزمية حاسوب تخبرنا
11:29
the picture contains a boy and a teddy bear;
183
689626
3274
بأن هذه الصورة تحتوي على ولد ودبدوب
11:32
a dog, a person, and a small kite in the background;
184
692900
4366
كلب وشخص وطائرة ورقية صغيرة في الخلفية
11:37
or a picture of very busy things
185
697266
3135
أو صورة مليئة جدًا بالأشياء
11:40
like a man, a skateboard, railings, a lampost, and so on.
186
700401
4644
مثل رَجُل ولوح تزلج ودرابزين وعمود إنارة وهلم جرًا
11:45
Sometimes, when the computer is not so confident about what it sees,
187
705045
5293
أحيانًا، عندما لا يكون الحاسوب متأكدًا جدًا حيال ما يراه
11:51
we have taught it to be smart enough
188
711498
2276
علمناه أن يكون ذكيًا بقدرٍ كافٍ
11:53
to give us a safe answer instead of committing too much,
189
713774
3878
ليعطي إجابة آمنة بدلًا من أن يرهق نفسه زيادة عن اللزوم
11:57
just like we would do,
190
717652
2811
تماما كما قد نفعل نحن
12:00
but other times our computer algorithm is remarkable at telling us
191
720463
4666
لكن في أحيان أخرى تكون خوارزميتنا مميزة في إخبارنا
12:05
what exactly the objects are,
192
725129
2253
عن ماهية الأشياء بدقة
12:07
like the make, model, year of the cars.
193
727382
3436
كالشركة المصنعة لسيارة وطرازها وسنة صنعها
12:10
We applied this algorithm to millions of Google Street View images
194
730818
5386
لقد طبقنا هذه الخوارزمية على ملايين الصور في Google Street View
12:16
across hundreds of American cities,
195
736204
3135
عبر مئات المدن الأمريكية
12:19
and we have learned something really interesting:
196
739339
2926
وتعلمنا شيئًا مثيرًا للاهتمام حقًا
12:22
first, it confirmed our common wisdom
197
742265
3320
أولًا، لقد أكدت لنا حِسّنا السليم
12:25
that car prices correlate very well
198
745585
3290
حيث كان هناك علاقة وثيقة بين أسعار السيارات
12:28
with household incomes.
199
748875
2345
ومستويات الدّخل
12:31
But surprisingly, car prices also correlate well
200
751220
4527
لكن المفاجأة كانت أن أسعار السيارات ترتبط أيضًا بعلاقة وثيقة
12:35
with crime rates in cities,
201
755747
2300
مع معدلات الجريمة في المدن
12:39
or voting patterns by zip codes.
202
759007
3963
أو مع أنماط التصويت حسب الأحياء والضواحي
12:44
So wait a minute. Is that it?
203
764060
2206
فلتنتظروا لحظة. هل هذا كل ما في الأمر؟
12:46
Has the computer already matched or even surpassed human capabilities?
204
766266
5153
هل وصلت قدرات الحواسيب لقدرات البشر أو تجاوزتها حتى؟
12:51
Not so fast.
205
771419
2138
ليس بهذه السرعة
12:53
So far, we have just taught the computer to see objects.
206
773557
4923
حتى الآن، فقط علمنا الحاسوب كيف يرى الأشياء
12:58
This is like a small child learning to utter a few nouns.
207
778480
4644
وهو في ذلك يشبه طفلًا صغيرا يتعلم كيف ينطق بعض الكلمات
13:03
It's an incredible accomplishment,
208
783124
2670
إنه إنجاز لا يصدَّق
13:05
but it's only the first step.
209
785794
2460
لكنها مجرد خطوة أولى
13:08
Soon, another developmental milestone will be hit,
210
788254
3762
قريبا سننجز مرحلة تطورية أخرى
13:12
and children begin to communicate in sentences.
211
792016
3461
والأطفال سيبدؤون بالتواصل عن طريق جُمَل
13:15
So instead of saying this is a cat in the picture,
212
795477
4224
وهكذا فبدلًا من القول بأن ما في الصورة هو قطة
13:19
you already heard the little girl telling us this is a cat lying on a bed.
213
799701
5202
لقد سمعتم بالفعل تلك الفتاة الصغيرة وهي تخبرنا أن تلك هي قطة تستلقي على السرير
13:24
So to teach a computer to see a picture and generate sentences,
214
804903
5595
فإذن لنعلم حاسوبًا ليرى صورة ويولّد منها جملة
13:30
the marriage between big data and machine learning algorithm
215
810498
3948
فإن الزواج بين "البيانات الكبيرة" وخوارزميات تعليم الحواسيب
13:34
has to take another step.
216
814446
2275
يجب أن يخطو خطوة أخرى
13:36
Now, the computer has to learn from both pictures
217
816721
4156
الآن، على الحاسوب أن يتعلم من الصور
13:40
as well as natural language sentences
218
820877
2856
وكذلك جُمَل اللّغة الطبيعية
13:43
generated by humans.
219
823733
3322
التي أحدثها البشر
13:47
Just like the brain integrates vision and language,
220
827055
3853
تمامًا كما يُكامل الدماغ بين الرؤية واللغة
13:50
we developed a model that connects parts of visual things
221
830908
5201
طورنا نموذجًا يربط أجزاءً من الأشياء المرئيَة
13:56
like visual snippets
222
836109
1904
كالقصاصات المرئية مثلًا
13:58
with words and phrases in sentences.
223
838013
4203
مع كلمات وعبارات في جُمل
14:02
About four months ago,
224
842216
2763
منذ حوالي أربعة أشهر
14:04
we finally tied all this together
225
844979
2647
ربطنا أخيرًا بين كل هذه الأجزاء
14:07
and produced one of the first computer vision models
226
847626
3784
وأنتجنا واحدًا من أوائل نماذج الإبصار الحاسوبية
14:11
that is capable of generating a human-like sentence
227
851410
3994
القادرة على توليد جُمل مقاربة للغة البشر
14:15
when it sees a picture for the first time.
228
855404
3506
عندما ترى صورة للمرة الأولى
14:18
Now, I'm ready to show you what the computer says
229
858910
4644
الآن، أنا مستعدة لأريك ما يقول الحاسوب
14:23
when it sees the picture
230
863554
1975
عندما يرى الصورة
14:25
that the little girl saw at the beginning of this talk.
231
865529
3830
التي رأتها تلك الفتاة الصغيرة في أول هذه المحادثة
(فيديو) الحاسوب: رجلٌ يقف إلى جانب فيل
14:31
(Video) Computer: A man is standing next to an elephant.
232
871519
3344
14:36
A large airplane sitting on top of an airport runway.
233
876393
3634
طائرة كبيرة تقبع على رأس مَدْرج مطار
14:41
FFL: Of course, we're still working hard to improve our algorithms,
234
881057
4212
فاي-فاي لي: طبعًا، لا نزال نعمل باجتهاد لنطور خوارزميتنا
14:45
and it still has a lot to learn.
235
885269
2596
ولا يزال أمامها الكثير لتتعلمه
14:47
(Applause)
236
887865
2291
(تصفيق)
14:51
And the computer still makes mistakes.
237
891556
3321
ولا يزال الحاسوب يقع في أخطاء
14:54
(Video) Computer: A cat lying on a bed in a blanket.
238
894877
3391
(فيديو) الحاسوب: قطة تستلقي في بطانية على سرير
14:58
FFL: So of course, when it sees too many cats,
239
898268
2553
فاي-فاي لي: وهكذا بالطبع، فعندما يرى الكثير من القطط
15:00
it thinks everything might look like a cat.
240
900821
2926
يظن أن كل شيء قد يبدو مثل قطة
15:05
(Video) Computer: A young boy is holding a baseball bat.
241
905317
2864
(فيديو) الحاسوب: طفل صغير يحمل مضرب بيسبول
15:08
(Laughter)
242
908181
1765
(ضحك)
15:09
FFL: Or, if it hasn't seen a toothbrush, it confuses it with a baseball bat.
243
909946
4583
فاي-فاي لي: أو إن لم يكن رأى فرشاة أسنان من قبل فقد يخلط بينها وبين مضرب بيسبول
15:15
(Video) Computer: A man riding a horse down a street next to a building.
244
915309
3434
(فيديو) الحاسوب: رَجل يمتطي حصانًا في آخر الشارع بجانب مبنًى
15:18
(Laughter)
245
918743
2023
(ضحك)
15:20
FFL: We haven't taught Art 101 to the computers.
246
920766
3552
فاي-فاي لي: لم نشرح للحواسيب درس مبادئ الفن
15:25
(Video) Computer: A zebra standing in a field of grass.
247
925768
2884
(فيديو) الحاسوب: حمار وحشي يقف في حقل من العشب
15:28
FFL: And it hasn't learned to appreciate the stunning beauty of nature
248
928652
3367
فاي-فاي لي: ولم يتعلم كذلك كيف يُقَدّر جمال الطبيعة الساحر
15:32
like you and I do.
249
932019
2438
كما تُقَدّره أنت وأنا
15:34
So it has been a long journey.
250
934457
2832
إذن فقد كانت رحلة طويلة
15:37
To get from age zero to three was hard.
251
937289
4226
الانتقال من عمر صفر إلى عمر ثلاث سنوات هو عمل شاق
15:41
The real challenge is to go from three to 13 and far beyond.
252
941515
5596
التحدي الحقيقي هو أن تنتقل من 3 سنوات إلى 13 سنة وأبعد من ذلك
15:47
Let me remind you with this picture of the boy and the cake again.
253
947111
4365
دعوني أذكركم بهذه الصورة للطفل والكعكة مرة أخرى
15:51
So far, we have taught the computer to see objects
254
951476
4064
حتى الآن، علمنا الحاسوب أن يبصر الأشياء
15:55
or even tell us a simple story when seeing a picture.
255
955540
4458
أو أن يحكي لنا قصة بسيطة عندما يرى صورة
15:59
(Video) Computer: A person sitting at a table with a cake.
256
959998
3576
(فيديو) الحاسوب: شخص يجلس إلى مائدة مع كعكة
16:03
FFL: But there's so much more to this picture
257
963574
2630
فاي-فاي لي: لكن هناك المزيد والمزيد في هذه الصورة
16:06
than just a person and a cake.
258
966204
2270
أكثر من مجرد شخص وكعكة
16:08
What the computer doesn't see is that this is a special Italian cake
259
968474
4467
ما لا يراه الحاسوب أن تلك هي كعكة إيطالية مميزة
16:12
that's only served during Easter time.
260
972941
3217
تُقَدّم فقط بمناسبة عيد الفِصْح
16:16
The boy is wearing his favorite t-shirt
261
976158
3205
الولد يرتدي قميصه المفضّل
16:19
given to him as a gift by his father after a trip to Sydney,
262
979363
3970
الذي أعطاه إياه والده كهدية بعد رحلة إلى سيدني
16:23
and you and I can all tell how happy he is
263
983333
3808
وجميعنا نرى كم هو سعيد
16:27
and what's exactly on his mind at that moment.
264
987141
3203
ونستطيع أن نخمن ما يدور في خَلَده في تلك اللحظة
16:31
This is my son Leo.
265
991214
3125
هذا هو ابني ليو
16:34
On my quest for visual intelligence,
266
994339
2624
أثناء بحثي عن الذكاء البصري
16:36
I think of Leo constantly
267
996963
2391
كنت أفكر في ليو باستمرار
16:39
and the future world he will live in.
268
999354
2903
وعن عالم المستقبل الذي سيعيش فيه
16:42
When machines can see,
269
1002257
2021
عندما ستتمكن الحواسيب من الإبصار
16:44
doctors and nurses will have extra pairs of tireless eyes
270
1004278
4712
الأطباء والممرضات سيحظون بأزواج إضافية من العيون التي لا تَكِلّ
16:48
to help them to diagnose and take care of patients.
271
1008990
4092
لتعينهم على تشخيص المرضى والعناية بهم
16:53
Cars will run smarter and safer on the road.
272
1013082
4383
ستسير السيارات على الطرقات بشكل أذكى وأكثر أمانًا
16:57
Robots, not just humans,
273
1017465
2694
الرجال الآليون وليس البشر فحسب
17:00
will help us to brave the disaster zones to save the trapped and wounded.
274
1020159
4849
سيساعدوننا في مواجهة نطاقات الكوارث لينقذوا المحتجزين والجرحى
17:05
We will discover new species, better materials,
275
1025798
3796
سنكتشف أنواع مخلوقات جديدة ومواد أفضل
17:09
and explore unseen frontiers with the help of the machines.
276
1029594
4509
وسنستكشف الأبعاد غير المرئية بمساعدة الحواسيب
17:15
Little by little, we're giving sight to the machines.
277
1035113
4167
شيئًا فشيئًا، نحن نمنح حاسة البصر للحواسيب
17:19
First, we teach them to see.
278
1039280
2798
في البداية نعلمها كيف ترى
17:22
Then, they help us to see better.
279
1042078
2763
ثم ستساعدنا لنرى بشكل أفضل
17:24
For the first time, human eyes won't be the only ones
280
1044841
4165
لأول مرة، لن تكون عيون البشر هي الوحيدة
17:29
pondering and exploring our world.
281
1049006
2934
التي تتأمل وتستكشف عالمنا
17:31
We will not only use the machines for their intelligence,
282
1051940
3460
لن يقتصر استخدامنا للحواسيب لأجل ذكائها
17:35
we will also collaborate with them in ways that we cannot even imagine.
283
1055400
6179
بل سوف نتعاون معها بطرق لا يمكننا حتى تخيلها
17:41
This is my quest:
284
1061579
2161
هذا هو أملي
17:43
to give computers visual intelligence
285
1063740
2712
أن أعطي الحواسيب ذكاءً بصريًا
17:46
and to create a better future for Leo and for the world.
286
1066452
5131
وأن أخلق مستقبلًا أفضل من أجل ليو ومن أجل العالم
17:51
Thank you.
287
1071583
1811
شكرًا
17:53
(Applause)
288
1073394
3785
(تصفيق)
حول هذا الموقع

سيقدم لك هذا الموقع مقاطع فيديو YouTube المفيدة لتعلم اللغة الإنجليزية. سترى دروس اللغة الإنجليزية التي يتم تدريسها من قبل مدرسين من الدرجة الأولى من جميع أنحاء العالم. انقر نقرًا مزدوجًا فوق الترجمة الإنجليزية المعروضة على كل صفحة فيديو لتشغيل الفيديو من هناك. يتم تمرير الترجمات بالتزامن مع تشغيل الفيديو. إذا كان لديك أي تعليقات أو طلبات ، يرجى الاتصال بنا باستخدام نموذج الاتصال هذا.

https://forms.gle/WvT1wiN1qDtmnspy7