Ben Wellington: How we found the worst place to park in New York City — using big data

80,125 views ・ 2015-02-26

TED


वीडियो चलाने के लिए कृपया नीचे दिए गए अंग्रेजी उपशीर्षक पर डबल-क्लिक करें।

Translator: Shobha Rana Grover Reviewer: Arvind Patil
00:12
Six thousand miles of road,
0
12711
2820
छह हजार मील की सड़क,
00:15
600 miles of subway track,
1
15531
2203
६०० मील का भूमिगत मार्ग,
00:17
400 miles of bike lanes
2
17734
1644
४०० मील लंबे मार्ग बाइकों के लिए
00:19
and a half a mile of tram track,
3
19378
1821
और आधा मील लम्बा ट्रैम का मार्ग,
00:21
if you've ever been to Roosevelt Island.
4
21199
1953
अगर आप कभी रूजवेल्ट आइलैंड गए हों।
00:23
These are the numbers that make up the infrastructure of New York City.
5
23152
3334
ये वो संख्याएँ हैं जो न्यूयाॅर्क सिटी के बुनियादी ढांचे को बनातीं हैं।
00:26
These are the statistics of our infrastructure.
6
26486
2619
ये हमारे बुनियादी ढांचे के आंकड़े हैं।
ये वो संख्याएँ हैं जो आप शहरी एजेंसियों द्वारा जारी रिपोर्टों में पा सकते हैं।
00:29
They're the kind of numbers you can find released in reports by city agencies.
7
29105
3706
00:32
For example, the Department of Transportation will probably tell you
8
32811
3199
उदाहरण के तौर पर, परिवहन विभाग शायद आपको बता देगा
कि वो कितनी मील सड़क की देखभाल करते हैं।
00:36
how many miles of road they maintain.
9
36010
1781
एमटीए भूमिगत मार्ग की लंबाई की डींग हाँकेगा।
00:37
The MTA will boast how many miles of subway track there are.
10
37791
2821
अधिकतर शहरी एजेंसियाँं आँकड़े देते हैं।
00:40
Most city agencies give us statistics.
11
40612
1807
ये इस साल की रिपोर्ट में है,
00:42
This is from a report this year
12
42419
1483
00:43
from the Taxi and Limousine Commission,
13
43902
1892
टैक्सी और लिमोजीन कमीशन की,
00:45
where we learn that there's about 13,500 taxis here in New York City.
14
45794
3276
कि यहाँ न्यूयाॅर्क सिटी में 13,500 टैक्सियाँ हैं,
00:49
Pretty interesting, right?
15
49070
1290
बहुत दिलचस्प है, है ना?
00:50
But did you ever think about where these numbers came from?
16
50360
2784
पर कभी आपने सोचा कि ये संख्याएँ आईं कहाँ से?
00:53
Because for these numbers to exist, someone at the city agency
17
53144
2903
क्योंकि इन संख्याओं के लिए, शहरी एजेंसी में किसी को
00:56
had to stop and say, hmm, here's a number that somebody might want want to know.
18
56047
3880
रुक कर कहना पड़ता, हाँ, ये संख्या शायद कोई जानना चाहता हो।
00:59
Here's a number that our citizens want to know.
19
59927
2250
ये एक संख्या है जो हमारे नागरिक जानना चाहते हों।
01:02
So they go back to their raw data,
20
62177
1830
वो अपने कच्चे आंकड़ों पर वापस आते हैं,
01:04
they count, they add, they calculate,
21
64007
1797
गिनते, जोड़ते, हिसाब लगाते हैं,
01:05
and then they put out reports,
22
65804
1467
और फिर रिपोर्ट जारी करते हैं,
01:07
and those reports will have numbers like this.
23
67271
2177
और उन रिपोर्टों में ऐसी संख्याएँ होंगी।
01:09
The problem is, how do they know all of our questions?
24
69448
2540
समस्या ये है कि उन्हें हमारे सारे सवाल पता कैसे हैं?
01:11
We have lots of questions.
25
71988
1243
हमारे बहुत सारे सवाल हैं।
01:13
In fact, in some ways there's literally an infinite number of questions
26
73231
3340
वास्तव में, कुछ मायनों में सवालों की एक अनंत संख्या है जिन्हें
01:16
that we can ask about our city.
27
76571
1649
हम अपने शहर के बारे में पूछ सकते हैं।
01:18
The agencies can never keep up.
28
78220
1475
एजेंसियाँ सभी जवाब नहीं दे सकतीं।
01:19
So the paradigm isn't exactly working, and I think our policymakers realize that,
29
79695
4056
तो प्रतिमान बिल्कुल काम नहीं कर रहा है, और शायद नीति निर्धारकों को ये एहसास है,
01:23
because in 2012, Mayor Bloomberg signed into law what he called
30
83751
3959
क्योंकि 2012 में महापौर ब्लूमबर्ग ने एक कानून पर हस्ताक्षर किए, जिसे उन्होंने
01:27
the most ambitious and comprehensive open data legislation in the country.
31
87710
3837
देश का सबसे महत्वाकांक्षी और व्यापक खुला डेटा विधान बताया।
01:31
In a lot of ways, he's right.
32
91547
1573
कई मायनों में वो सही हैं।
01:33
In the last two years, the city has released 1,000 datasets
33
93120
2861
पिछले दो वर्षों में शहर ने १,००० डेटा सेट जारी किए हैं
01:35
on our open data portal,
34
95981
1610
हमारे खुले डेटा पोर्टल पर,
01:37
and it's pretty awesome.
35
97591
1764
और ये बहुत विष्मयकारी है।
01:39
So you go and look at data like this,
36
99355
1968
तो आप डेटा कुछ इस तरह देखते हैं,
01:41
and instead of just counting the number of cabs,
37
101323
2289
और टैक्सियों की गिनती की जगह,
01:43
we can start to ask different questions.
38
103612
1943
हम अलग सवाल पूछना शुरु कर सकते हैं।
01:45
So I had a question.
39
105555
1200
तो मेरा एक सवाल था,
01:46
When's rush hour in New York City?
40
106755
1701
न्यूयाॅर्क सिटी में व्यस्त समय कब होता है?
01:48
It can be pretty bothersome. When is rush hour exactly?
41
108456
2581
ये झंझटपूर्ण भी हो सकता है, व्यस्त समय असल में है क्या?
01:51
And I thought to myself, these cabs aren't just numbers,
42
111037
2625
और मैंने सोचा, टैक्सियाँ केवल संख्याएँ नहीं है,
01:53
these are GPS recorders driving around in our city streets
43
113662
2711
हमारे शहर की सड़कों पर चलते हुए जीपीएस रिकाॅर्डर हैं,
01:56
recording each and every ride they take.
44
116373
1913
जो अपनी हर सवारी दर्ज करते हैं।
01:58
There's data there, and I looked at that data,
45
118286
2322
वहाँ डेटा है, और मैंने उस डेटा की तरफ देखा,
02:00
and I made a plot of the average speed of taxis in New York City throughout the day.
46
120608
3961
और मैंने न्यूयाॅर्क सिटी में दिन भर चलती टैक्सियों की औसत गति की रूपरेखा बनाई।
02:04
You can see that from about midnight to around 5:18 in the morning,
47
124569
3412
आप देख सकते हैं कि आधी रात से सुबह लगभग ०५:१८ तक
02:07
speed increases, and at that point, things turn around,
48
127981
3563
गति बढ़ जाती है, उस बिंदु पर कायापलट हो जाता है,
02:11
and they get slower and slower and slower until about 8:35 in the morning,
49
131544
3962
और वो सुबह लगभग ०८:३५ तक बहुत धीमी हो जाती हैं,
02:15
when they end up at around 11 and a half miles per hour.
50
135506
2693
और लगभग ११.५ मील प्रति घंटे पर इनका सफर खत्म होता है।
02:18
The average taxi is going 11 and a half miles per hour on our city streets,
51
138199
3562
औसत टैक्सी ११.५ मील प्रति घंटे की गति से हमारी सड़कों पर दौड़ती है,
02:21
and it turns out it stays that way
52
141761
1987
और ये पता चला है कि ये पूरे दिन
02:23
for the entire day.
53
143748
3368
ऐसा ही रहता है।
02:27
(Laughter)
54
147116
1373
(हँसी)
02:28
So I said to myself, I guess there's no rush hour in New York City.
55
148489
3180
तो मैंने खुद से कहा, शायद न्यूयॅार्क सिटी में वयस्त समय नहीं है।
02:31
There's just a rush day.
56
151669
1537
शायद केवल एक वयस्त दिन है।
02:33
Makes sense. And this is important for a couple of reasons.
57
153206
2850
सही भी है। और ये दो कारणों से महत्वपूर्ण भी है।
02:36
If you're a transportation planner, this might be pretty interesting to know.
58
156056
3637
अगर आप परिवहन योजनाकार हैं, तो आपके लिए ये बहुत दिलचस्प हो सकता है।
02:39
But if you want to get somewhere quickly,
59
159693
1975
पर अगर आप कहीं जल्द पहुँचना चाहते हैं,
02:41
you now know to set your alarm for 4:45 in the morning and you're all set.
60
161668
3468
अब आप जानते हैं कि सुबह ०४:४५ का अलार्म लगाना है और आप तैयार हैं।
02:45
New York, right?
61
165136
1044
न्यूयॉर्क, है ना?
02:46
But there's a story behind this data.
62
166180
1762
पर इस डेटा के पीछे एक कहानी है।
02:47
This data wasn't just available, it turns out.
63
167942
2185
ये डेटा ऐसे ही उपलब्ध नहीं था, ऐसा पता चलता है।
02:50
It actually came from something called a Freedom of Information Law Request,
64
170127
3619
ये सूचना कानून अनुरोध की स्वतंत्रता नामक वस्तु से आया,
02:53
or a FOIL Request.
65
173746
1076
या "फोयल" अनुरोध।
02:54
This is a form you can find on the Taxi and Limousine Commission website.
66
174822
3466
इस प्रपत्र को आप टैक्सी और लीमोजीन निगम की वेबसाइट पर पा सकते हैं।
इस डेटा तक पहुँचने के लिए आपको ये प्रपत्र चाहिए,
02:58
In order to access this data, you need to go get this form,
67
178288
2826
इसे भर दीजिए, और वे आपको सूचित करेंगे,
03:01
fill it out, and they will notify you,
68
181114
1846
03:02
and a guy named Chris Whong did exactly that.
69
182960
2130
और क्रिस व्होंग नामक एक वयक्ति ने यही किया।
03:05
Chris went down, and they told him,
70
185090
1890
क्रिस वहाँ गया और उन्होंने उससे कहा,
03:06
"Just bring a brand new hard drive down to our office,
71
186980
2827
"एक बिल्कुल नई हार्ड ड्राइव हमारे कार्यालय ले कर आईए,
03:09
leave it here for five hours, we'll copy the data and you take it back."
72
189807
3424
उसे यहाँ पाँच घंटे के लिए छोड़ दीजिए हम डेटा काॅपी कर देंगे
और आप उसे वापस ले जाईए।"
03:13
And that's where this data came from.
73
193231
2032
और ये डेटा यहाँ से आया।
03:15
Now, Chris is the kind of guy who wants to make the data public,
74
195263
3005
अब क्रिस ऐसा व्यक्ति है जो डेटा सार्वजनिक करना चाहता है,
03:18
and so it ended up online for all to use, and that's where this graph came from.
75
198268
3784
तो ये सभी के उपयोग के लिए ऑनलाइन हो गया, और ये ग्राफ भी यहीं से आया।
03:22
And the fact that it exists is amazing. These GPS recorders -- really cool.
76
202052
3518
इसका अस्तित्व सच में अदभुत है। ये जीपीएस रिकाॅर्डर--सच में अच्छे हैं।
03:25
But the fact that we have citizens walking around with hard drives
77
205570
3118
पर ये सच की हमारे नागरिक हार्ड ड्राइव लिए चारों ओर घूम रहे हैं,
03:28
picking up data from city agencies to make it public --
78
208688
2582
शहर एजेंसियों से डेटा लेकर सार्वजनिक करते हुए
ये पहलेसे ही एक तरह से सार्वजनिक था
03:31
it was already kind of public, you could get to it,
79
211270
2390
आप इस तक पहुँच सकते थे
पर ये "सार्वजनिक" था,
03:33
but it was "public," it wasn't public.
80
213660
1812
ये सार्वजनिक नहीं था।
03:35
And we can do better than that as a city.
81
215472
1962
हम इससे बेहतर कर सकते हैं।
03:37
We don't need our citizens walking around with hard drives.
82
217434
2756
हमारे नागरिकों को हार्ड ड्राइव ले कर घूमने की जरुरत नहीं है।
03:40
Now, not every dataset is behind a FOIL Request.
83
220190
2337
हर डेटा सेट "फोयल" अनुरोध के पीछे नहीं है।
03:42
Here is a map I made with the most dangerous intersections in New York City
84
222527
3802
मैंने न्यूयॉर्क सिटी के सबसे खतरनाक चौराहों का एक नक्शा तैयार किया है,
03:46
based on cyclist accidents.
85
226329
1878
साइकिल चालक दुर्घटनाओं के आधार पर।
03:48
So the red areas are more dangerous.
86
228207
1939
तो ये लाल क्षेत्र अधिक खतरनाक हैं।
03:50
And what it shows is first the East side of Manhattan,
87
230146
2553
ये पहले मैनहैटन का पूर्वी क्षेत्र दिखाता है,
03:52
especially in the lower area of Manhattan, has more cyclist accidents.
88
232699
3611
मैनहैटन के निचले हिस्सों में विशेष रुप से साइकिल चालक दुर्घटनाएं होती हैं,
03:56
That might make sense
89
236310
1019
ये शायद समझ में आता है
03:57
because there are more cyclists coming off the bridges there.
90
237329
2896
क्योंकि वहाँ और साइकिल चालक पुल से नीचे आ रहे हैं।
04:00
But there's other hotspots worth studying.
91
240225
2014
पर और भी अध्ययन करने लायक जगहें हैं।
04:02
There's Williamsburg. There's Roosevelt Avenue in Queens.
92
242239
2669
विलियम्सबर्ग है। क्वींस में रूजवेल्ट एवेन्यू है।
04:04
And this is exactly the kind of data we need for Vision Zero.
93
244908
2852
ये उसी तरह का डेटा है जैसा हमें विजन जीरो के लिए चाहिए।
04:07
This is exactly what we're looking for.
94
247760
1990
ये वास्तव में वही है जैसा हमें चाहिए।
04:09
But there's a story behind this data as well.
95
249750
2135
पर इस डेटा के पीछे भी एक कहानी है।
04:11
This data didn't just appear.
96
251885
2067
ये डेटा कहीं से यूं ही प्रकट नहीं हो गया।
04:13
How many of you guys know this logo?
97
253952
2391
आप में से कितने लोग ये लोगो पहचानते हैं?
04:16
Yeah, I see some shakes.
98
256343
1352
मैं कुछ हिलना-डुलना देख रहा हूँ।
04:17
Have you ever tried to copy and paste data out of a PDF
99
257695
2655
क्या कभी आपने पीडीएफ से डेटा काॅपी और पेस्ट कर
04:20
and make sense of it?
100
260350
1357
उसे समझने की कोशिश की है?
04:21
I see more shakes.
101
261707
1060
मैं और सिर हिलते देख रहा हूँ।
04:22
More of you tried copying and pasting than knew the logo. I like that.
102
262767
3345
लोगो जानने वालों से ज़्यादा ने काॅपी पेस्ट किया है। मुझे ये पसंद है
04:26
So what happened is, the data that you just saw was actually on a PDF.
103
266112
3510
तो हुआ ये है कि जो डेटा आपने अभी देखा वो वास्तव में पीडीएफ पर था।
04:29
In fact, hundreds and hundreds and hundreds of pages of PDF
104
269622
3105
वास्तव में, पीडीएफ के सैकड़ों पन्ने
04:32
put out by our very own NYPD,
105
272727
2159
हमारे अपने एनवायपीडी के निकाले हुए,
04:34
and in order to access it, you would either have to copy and paste
106
274886
3152
और उस तक पहुँचने कि लिए या तो आपको काॅपी पेस्ट करना होगा,
04:38
for hundreds and hundreds of hours,
107
278038
1726
सैकड़ों और सैकड़ों घंटों के लिए,
04:39
or you could be John Krauss.
108
279764
1344
या आप जाॅन क्रॉस हो सकते हैं।
04:41
John Krauss was like,
109
281108
1043
जाॅन क्रॉस ऐसा था,
04:42
I'm not going to copy and paste this data. I'm going to write a program.
110
282151
3413
मैं ये डेटा काॅपी पेस्ट नहीं करुँगा। मैं एक प्रोग्राम लिखुंगा।
04:45
It's called the NYPD Crash Data Band-Aid,
111
285564
2288
इसे एनवायपीडी क्रैश डेटा बैंड-एड कहा जाता है,
04:47
and it goes to the NYPD's website and it would download PDFs.
112
287852
3032
ये एनवायपीडी की वेबसाईट पर जाता है, पीडीएफ डाउनलोड करने के लिए।
04:50
Every day it would search; if it found a PDF, it would download it
113
290884
3126
ये हर दिन खोजे; और अगर एक पीडीएफ मिले
तो उसे डाउनलोड कर ले और फिर कुछ
04:54
and then it would run some PDF-scraping program,
114
294010
2250
पीडीएफ स्क्रैपिंग प्रोग्राम चलाए,
04:56
and out would come the text,
115
296260
1336
और लिखा हुआ बाहर आ जाएगा,
04:57
and it would go on the Internet, and then people could make maps like that.
116
297596
3565
और ये इंटरनेट पर चला जाएगा, और फिर लोग उस तरह नक्शे तैयार करेंगे।
05:01
And the fact that the data's here, the fact that we have access to it --
117
301161
3429
और ये सच की डेटा यहाँ है, ये सच की हमारी उस तक पहुँच है--
05:04
Every accident, by the way, is a row in this table.
118
304590
2450
वैसे हर दुर्घटना इस तालिका में एक पंक्ति है।
05:07
You can imagine how many PDFs that is.
119
307040
1836
आप सोच सकते हैं कि ये कितने पीडीएफ हैं।
05:08
The fact that we have access to that is great,
120
308876
2207
हमारी उस तक पहुँच सच में बड़ी बात है,
05:11
but let's not release it in PDF form,
121
311083
2110
पर हम इसे पीडीएफ के रुप में जारी न करें,
05:13
because then we're having our citizens write PDF scrapers.
122
313193
2739
क्योंकि तब हम हमारे नागरिक पीडीएफ स्क्रैपर लिखते हैं।
05:15
It's not the best use of our citizens' time,
123
315932
2076
ये हमारे नागरिकों के समय का बेहतरीन
उपयोग नहीं है,
05:18
and we as a city can do better than that.
124
318008
2004
हम एक शहर के तौर पर इससे बेहतर कर सकते हैं।
05:20
Now, the good news is that the de Blasio administration
125
320012
2736
अबअच्छी खबर ये है कि डी ब्लासियो प्रशासन
05:22
actually recently released this data a few months ago,
126
322748
2532
ने ये डेटा कुछ महीने पहले जारी किया,
05:25
and so now we can actually have access to it,
127
325280
2158
इसलिए अब हम उस तक पहुँच सकते हैं,
05:27
but there's a lot of data still entombed in PDF.
128
327438
2536
पर अभी भी बहुत सा डेटा पीडीएफ में दफन है।
05:29
For example, our crime data is still only available in PDF.
129
329974
3197
उदाहरण के लिए, हमारा अपराध डेटा अभी पीडीएफ में ही उपलब्ध है।
05:33
And not just our crime data, our own city budget.
130
333171
3755
केवल हमारा अपराध डेटा ही नहीं, हमारे शहर का बजट भी।
05:36
Our city budget is only readable right now in PDF form.
131
336926
3729
हमारे शहर का बजट अभी केवल पीडीएफ के रुप में ही पढ़ा जा सकता है।
05:40
And it's not just us that can't analyze it --
132
340655
2141
और न केवल हम ही इसकी समीक्षा नहीं कर सकते--
05:42
our own legislators who vote for the budget
133
342796
2955
हमारे अपने विधायक जो बजट पर अपना मत देते हैं,
05:45
also only get it in PDF.
134
345751
1943
उन्हें भी ये पीडीएफ में ही मिलता है।
05:47
So our legislators cannot analyze the budget that they are voting for.
135
347694
3844
तो हमारे विधायक उस बजट की समीक्षा नहीं कर सकते जिस पर वो अपना मत देते हैं।
05:51
And I think as a city we can do a little better than that as well.
136
351538
3608
और मैं समझता हूँ कि एक शहर के तौर पर हम इससे कुछ बेहतर कर सकते हैं।
05:55
Now, there's a lot of data that's not hidden in PDFs.
137
355146
2488
अब बहुत सा डेटा है जो पीडीएफ के भीतर नहीं छुपा है।
05:57
This is an example of a map I made,
138
357634
1700
ये मेरे द्वारा बने एक नक्शे का नमूना है,
05:59
and this is the dirtiest waterways in New York City.
139
359334
2926
और ये न्यूयॉर्क सिटी के सबसे मलिन जलमार्ग हैं।
06:02
Now, how do I measure dirty?
140
362260
1509
अब मैं गंदगी का आकलन कैसे करुँ।
06:03
Well, it's kind of a little weird,
141
363769
1857
खैर, ये थोड़ा अजीब है,
06:05
but I looked at the level of fecal coliform,
142
365626
2113
पर मैंने मल कोलिफॉर्म के स्तर को देखा,
06:07
which is a measurement of fecal matter in each of our waterways.
143
367739
3506
जो हमारे हर जलमार्ग में मल पदार्थ का माप है।
06:11
The larger the circle, the dirtier the water,
144
371245
3274
जितना बड़ा वृत्त, उतना गंदा पानी,
06:14
so the large circles are dirty water, the small circles are cleaner.
145
374519
3357
तो बड़े वृत्त का अर्थ है गंदा पानी, छोटे वृत्त अपेक्षाकृत साफ हैं।
06:17
What you see is inland waterways.
146
377876
1644
आप अंतर्देशीय जलमार्ग देख रहे हैं।
06:19
This is all data that was sampled by the city over the last five years.
147
379520
3404
ये वो डेटा है जिसका शहर ने पिछले पाँच वर्षों में नमूना लिया था।
06:22
And inland waterways are, in general, dirtier.
148
382924
2694
और अंतर्देशीय जलमार्ग, सामान्यत: अधिक गंदे होते हैं।
06:25
That makes sense, right?
149
385618
1218
ये समझ में आता है, ठीक?
06:26
And the bigger circles are dirty. And I learned a few things from this.
150
386836
3374
और बड़े वृत्त गंदे हैं। और मुझे इससे कुछ बातें पता चलीं।
06:30
Number one: Never swim in anything that ends in "creek" or "canal."
151
390210
3164
पहली: कभी उसमें न तैरैं जो "छोटी नदी" या "नहर" में खत्म होती है।
06:33
But number two: I also found the dirtiest waterway in New York City,
152
393374
4318
पर दूसरी: मैंने न्यूयॉर्क सिटी का सबसे मलिन जलमार्ग भी ढूंढ़ निकाला,
06:37
by this measure, one measure.
153
397692
1834
इस आकलन से, एक आकलन से।
06:39
In Coney Island Creek, which is not the Coney Island you swim in, luckily.
154
399526
3648
कौने आइलैंड क्रीक में, ये वो कौने आइलैंड नहीं है जिसमें आप तैरते हैं, भाग्यवश।
06:43
It's on the other side.
155
403174
1158
ये दूसरी तरफ है।
06:44
But Coney Island Creek, 94 percent of samples taken over the last five years
156
404332
3878
पर कौने आइलैंड क्रीक में पिछले पाँच सालों में 94 % नमूनों में
06:48
have had fecal levels so high
157
408210
2157
मल स्तर इतने अधिक थे
06:50
that it would be against state law to swim in the water.
158
410367
3093
कि पानी में तैरना राज्य के कानून के खिलाफ होता।
06:53
And this is not the kind of fact that you're going to see
159
413460
2729
और इस तरह के तथ्य आप शहरी रिपोर्ट में शेखी
06:56
boasted in a city report, right?
160
416189
1537
बघारते हुए नहीं पाएँगे, ठीक?
06:57
It's not going to be the front page on nyc.gov.
161
417726
2250
ये nyc.gov. के पहले पन्ने पर नहीं होगा।
06:59
You're not going to see it there,
162
419976
1580
आप इसे वहाँ नहीं देख पाएँगे,
07:01
but the fact that we can get to that data is awesome.
163
421556
2518
पर ये अच्छी बात है कि हम उस डेटा तक पहुँच सकते हैं।
07:04
But once again, it wasn't super easy,
164
424074
1773
पर एक बार फिर, ये बहुत आसान नहीं था
07:05
because this data was not on the open data portal.
165
425847
2358
क्योंकि ये डेटा खुले डेटा पोर्टल पर नहीं था।
07:08
If you were to go to the open data portal,
166
428205
2013
अगर आप खुले डेटा पोर्टल पर जाते,
07:10
you'd see just a snippet of it, a year or a few months.
167
430218
2613
तो आप एक टुकड़ा ही देखते, एक साल या कुछ महीनों का।
07:12
It was actually on the Department of Environmental Protection's website.
168
432831
3390
ये असल में पर्यावरण संरक्षण विभाग की वेबसाइट पर था।
07:16
And each one of these links is an Excel sheet, and each Excel sheet is different.
169
436221
3878
और इसमें से हर लिंक एक एक्सेल शीट है, और हर एक्सेल शीट अलग है।
हर शीर्षक अलग है: आप काॅपी, पेस्ट और फिर ठीक करते हैं।
07:20
Every heading is different: you copy, paste, reorganize.
170
440099
2630
07:22
When you do you can make maps and that's great, but once again,
171
442729
2952
जब आप करते हैं तो नक्शे बना सकते हैं और ये अच्छा है, पर
07:25
we can do better than that as a city, we can normalize things.
172
445681
2969
हम बेहतर कर सकते हैं, चीजें सामान्य कर सकते हैं।
07:28
And we're getting there, because there's this website that Socrata makes
173
448650
3384
और हम वहाँ पहुँच रहे हैं क्योंकि यहाँ ये वेबसाइट है जो सोक्रेटा बनाता है
जिसे ओपन डेटा पोर्टल एनवाईसी कहते हैं।
07:32
called the Open Data Portal NYC.
174
452034
1541
यहाँ १,१०० डेटा सेट उनसे ग्रस्त नहीं है
07:33
This is where 1,100 data sets that don't suffer
175
453575
2257
जिनके बारे में मैंने अभी आपको बताया
07:35
from the things I just told you live,
176
455832
1781
और ये संख्या बढ़ रही है, और ये काफी अच्छा है।
07:37
and that number is growing, and that's great.
177
457613
2148
आप किसी भी प्रारूप में डेटा डाउनलोड कर सकते हैं, सीएसवी, पीडीएफ या एक्सेल।
07:39
You can download data in any format, be it CSV or PDF or Excel document.
178
459761
3412
जिस तरह चाहें आप डाउनलोड कर सकते हैं।
07:43
Whatever you want, you can download the data that way.
179
463173
2547
07:45
The problem is, once you do,
180
465720
1352
समस्या ये है कि जब आप ने कर लिया,
07:47
you will find that each agency codes their addresses differently.
181
467072
3686
आप पाएँगे कि हर एजेंसी अपना पता अलग तरह से संकेत करती है।
07:50
So one is street name, intersection street,
182
470758
2141
तो एक सड़का का नाम है, चौराहा,
07:52
street, borough, address, building, building address.
183
472899
2491
सड़क, नगर, पता, इमारत, इमारत का पता।
07:55
So once again, you're spending time, even when we have this portal,
184
475390
3180
तो एक बार फिर आप समय व्यय कर रहे हैं, जबकि हमारे पास ये पोर्टल है,
07:58
you're spending time normalizing our address fields.
185
478570
2606
आप पते की जगहों को सामान्य बनाने में समय व्यय कर रहे हैं।
08:01
And that's not the best use of our citizens' time.
186
481176
2423
और ये हमारे नागरिकों के समय का बेहतरीन उपयोग नहीं है।
08:03
We can do better than that as a city.
187
483599
1796
हम एक शहर के तौर पर बेहतर कर सकते है।
08:05
We can standardize our addresses,
188
485395
1645
हम अपने पते मानकीकृत कर सकते है,
और अगर हम करे, तो हमें ऐसे और नक्शे मिल सकते है।
08:07
and if we do, we can get more maps like this.
189
487040
2185
08:09
This is a map of fire hydrants in New York City,
190
489225
2285
ये न्यूयाॅर्क सिटी के अग्नि हाईड्रेंट का एक नक्शा है,
08:11
but not just any fire hydrants.
191
491510
1531
पर किसी भी अग्नि हाईड्रेंट का नहीं।
08:13
These are the top 250 grossing fire hydrants in terms of parking tickets.
192
493041
4726
ये २५० सबसे ज्यादा कमाई करने वाले अग्नि हाईड्रेंट हैं, पार्किंग टिकट के मामले में।
08:17
(Laughter)
193
497767
1986
(हँसी)
08:19
So I learned a few things from this map, and I really like this map.
194
499753
3358
तो मैंने इस नक्शे से कई चीज़ें सीखीं, और मुझे ये नक्शा सचमुच पसंद है।
08:23
Number one, just don't park on the Upper East Side.
195
503111
2402
पहली, अपर ईस्ट साईड में पार्क न करें।
08:25
Just don't. It doesn't matter where you park, you will get a hydrant ticket.
196
505513
3587
बिल्कुल भी नहीं, जहाँ भी पार्क करेंगे, आपको हाईड्रेंट टिकट मिल जाएगा।
08:29
Number two, I found the two highest grossing hydrants in all of New York City,
197
509100
4153
दूसरी, मुझे पूरी न्यूयाॅर्क सिटी में सबसे ज्यादा कमाई करने वाले दो हाईड्रेंट मिले,
08:33
and they're on the Lower East Side,
198
513253
1886
और वो लोअर ईस्ट साईड में मिले,
08:35
and they were bringing in over 55,000 dollars a year in parking tickets.
199
515139
5098
और वो हर साल पार्किंग टिकट के रुप में ५५,००० डाॅलर ला रहे हैं।
और मुझे ये थोड़ा अजीब लगा जब मैंने इसकी ओर ध्यान दिया,
08:40
And that seemed a little strange to me when I noticed it,
200
520237
2738
08:42
so I did a little digging and it turns out what you had is a hydrant
201
522975
3269
तो मैंने थोड़ी खोजबीन की और पता चला कि ये तो हाईड्रेंट है।
08:46
and then something called a curb extension,
202
526244
1996
और फिर ऐसा जिसे कर्ब एक्सटेंशन कहा जाता है,
08:48
which is like a seven-foot space to walk on,
203
528240
2059
जो चलने के लिए एक सात फुट की जगह की तरह है
08:50
and then a parking spot.
204
530299
1156
और फिर पार्किंग की एक जगह।
08:51
And so these cars came along, and the hydrant --
205
531455
2254
और इसलिए ये कारें साथ आईं, और हाईड्रेन्ट --
08:53
"It's all the way over there, I'm fine,"
206
533709
1911
"ये पूरा वहाँ तक है, मै ठीक हूँ,"
08:55
and there was actually a parking spot painted there beautifully for them.
207
535620
3474
और वहाँ सच में उनके लिए खूबसूरती से रंगा एक पार्किंग स्थल था।
वो वहाँ पार्क करते, और एनवायपीडी इस प्रयोजन से सहमत नहीं था
08:59
They would park there, and the NYPD disagreed with this designation
208
539094
3155
और उन्हें टिकट थमा देता।
09:02
and would ticket them.
209
542249
1058
और सिर्फ मुझे ही पार्किंग टिकट नहीं मिला,
09:03
And it wasn't just me who found a parking ticket.
210
543307
2344
09:05
This is the Google Street View car driving by
211
545651
2146
ये गूगल स्ट्रीट व्यू कार चल रही है
09:07
finding the same parking ticket.
212
547797
1617
जिसे वही पार्किंग टिकट मिला है।
09:09
So I wrote about this on my blog, on I Quant NY, and the DOT responded,
213
549414
4504
तो मैंने इस बारे में अपने ब्लॉग पर लिखा, आई क्वांट एनवाय पर, और डीओटी ने जवाब दिया,
09:13
and they said,
214
553918
1020
और उन्होंने कहा,
09:14
"While the DOT has not received any complaints about this location,
215
554938
3410
"हालांकि डीओटी को इस स्थान के बारे में कोई शिकायत नहीं मिली है,
09:18
we will review the roadway markings and make any appropriate alterations."
216
558348
4542
हम सड़क चिह्नों की समीक्षा करेंगे और उचित परिवर्तन करेंगे।"
09:22
And I thought to myself, typical government response,
217
562890
2959
और मैंने सोचा, ठेठ सरकारी प्रतिक्रिया,
09:25
all right, moved on with my life.
218
565849
1881
ठीक है, मैं आगे बढ़ा।
09:27
But then, a few weeks later, something incredible happened.
219
567730
3970
पर फिर, कुछ सप्ताह बाद, कुछ अविश्वसनीय हुआ।
09:31
They repainted the spot,
220
571700
2520
उन्होंने उस स्थान को फिर रंग दिया,
09:34
and for a second I thought I saw the future of open data,
221
574220
2690
और मैंने सोचा कि मैंने खुले डेटा का भविष्य देखा है,
09:36
because think about what happened here.
222
576910
2000
क्योंकि जरा सोचिए कि यहाँ क्या हुआ है।
09:38
For five years, this spot was being ticketed, and it was confusing,
223
578910
5100
पाँच साल से यहाँ टिकट जारी किए जा रहे थे, और ये भ्रामक था,
09:44
and then a citizen found something, they told the city, and within a few weeks
224
584010
4306
और फिर एक नागरिक को कुछ मिला, उसने शहर को बता दिया, और कुछ ही सप्ताह में
09:48
the problem was fixed.
225
588316
1294
समस्या सुलझा ली गई।
09:49
It's amazing. And a lot of people see open data as being a watchdog.
226
589610
3200
ये आश्चर्यजनक है। और बहुत लोग खुले डेटा को एक प्रहरी की तरह देखते हैं।
09:52
It's not, it's about being a partner.
227
592810
1772
ऐसा नहीं है, ये सहभागी होने की बात है।
09:54
We can empower our citizens to be better partners for government,
228
594582
3138
हम अपने नागरिकों को सरकार का बेहतर भागीदार बनाने के लिए सशक्त
09:57
and it's not that hard.
229
597720
1881
कर सकते हैं, ये उतना मुश्किल नहीं है।
09:59
All we need are a few changes.
230
599601
1459
हमें कुछ चाहिए तो बस बदलाव।
10:01
If you're FOILing data,
231
601060
1107
अगर आप डेटा "फोयल" कर रहे हैं,
10:02
if you're seeing your data being FOILed over and over again,
232
602167
2867
अगर आप अपना डेटा बार-बार "फोयल" होता देख रहे है,
10:05
let's release it to the public, that's a sign that it should be made public.
233
605034
3574
इसे लोगों के लिए जारी कर दें, ये संकेत है कि इसे सार्वजनिक कर दिया जाए।
10:08
And if you're a government agency releasing a PDF,
234
608608
2482
अगर आप पीडीएफ जारी करती एक सरकारी एजेंसी हैं,
10:11
let's pass legislation that requires you to post it with the underlying data,
235
611090
3649
तो ऐसा कानून पारित करें जिससे आप इसे अंतर्निहित डेटा के साथ जारी कर सकें,
10:14
because that data is coming from somewhere.
236
614739
2028
क्योंकि ये डेटा कहीं से आ रहा है।
10:16
I don't know where, but it's coming from somewhere,
237
616767
2482
मैं नहीं जानता कहाँ से, पर कहीं से आ रहा है
आप इसे पीडीएफ में जारी कर सकते हैं।
10:19
and you can release it with the PDF.
238
619249
1725
10:20
And let's adopt and share some open data standards.
239
620974
2411
और चलो कुछ खुले डेटा मानकों को अपनाएँ और साझा करें।
10:23
Let's start with our addresses here in New York City.
240
623385
2481
यहाँ न्यूयाॅर्क सिटी के पतों से शुरु करें।
10:25
Let's just start normalizing our addresses.
241
625866
2074
अपने पतों को सामान्य बनाना शुरु करें।
10:27
Because New York is a leader in open data.
242
627940
2062
क्योंकि न्यूयाॅर्क खुले डेटा में अग्रणी है।
इस सब के बावजूद, हम खुले डेटा में पूर्ण रुप से अग्रणी हैं,
10:30
Despite all this, we are absolutely a leader in open data,
243
630002
2789
10:32
and if we start normalizing things, and set an open data standard,
244
632791
3121
और यदि हम चीजें सामान्य करना शुरु करें, और खुला डेटा
मानक निर्धारित करें,
10:35
others will follow. The state will follow, and maybe the federal government,
245
635912
3634
दूसरे पीछे आएँगे। राज्य और शायद संघीय सरकार भी,
10:39
Other countries could follow,
246
639546
1445
दूसरे देश अनुसरण कर सकते हैं,
10:40
and we're not that far off from a time where you could write one program
247
640991
3411
और वो समय दूर नहीं जब हम एक प्रोग्राम और नक्शे की जानकारी
10:44
and map information from 100 countries.
248
644402
1890
१०० देशों से लिख सकें।
10:46
It's not science fiction. We're actually quite close.
249
646292
2487
ये काल्पनिक विज्ञान नहीं है। हम असल में बहुत करीब है।
10:48
And by the way, who are we empowering with this?
250
648779
2240
और हाँ, इससे हम किसे सशक्त बना रहे हैें?
10:51
Because it's not just John Krauss and it's not just Chris Whong.
251
651019
3005
क्योंकि ये सिर्फ जाॅन क्रोस या क्रिस व्होंग नहीं है।
10:54
There are hundreds of meetups going on in New York City right now,
252
654024
3095
न्यूयाॅर्क सि़टी में इस वक्त सैकड़ों समागम चल रहे हैं,
सक्रिय समागम।
10:57
active meetups.
253
657119
1025
10:58
There are thousands of people attending these meetups.
254
658144
2572
हजारों लोग इन समागमों में भाग ले रहे हैं।
11:00
These people are going after work and on weekends,
255
660716
2368
ये लोग काम के बाद और सप्ताहांत में जाते हैं,
11:03
and they're attending these meetups to look at open data
256
663084
2636
ये इन समागमों में खुले डेटा को समझने के लिए भाग लेते हैं
11:05
and make our city a better place.
257
665720
1640
ताकि हमारा शहर एक बेहतर स्थान बने।
11:07
Groups like BetaNYC, who just last week released something called citygram.nyc
258
667360
4073
बीटा एनवायसी जैसे समूह, जिसने पिछले हफ्ते citygram.nyc जारी किया
11:11
that allows you to subscribe to 311 complaints
259
671433
2147
जो आपको ३११ शिकायतों का अनुमोदन करने देता है,
11:13
around your own home, or around your office.
260
673580
2068
आपके घर या कार्यालय के आसपास।
11:15
You put in your address, you get local complaints.
261
675648
2427
आप अपना पता लिखते है, आपको स्थानीय शिकायतें मिलतीं है।
11:18
And it's not just the tech community that are after these things.
262
678075
3374
और सिर्फ तकनीकी समुदाय ही इन सब चीजों के पीछे नहीं है।
11:21
It's urban planners like the students I teach at Pratt.
263
681449
2622
शहरी योजनाकार भी हैं जिन्हें मैं प्रैट में पढ़ाता हूँ।
11:24
It's policy advocates, it's everyone,
264
684071
1919
नीति अधिवक्ता भी हैं, सभी हैं,
11:25
it's citizens from a diverse set of backgrounds.
265
685990
2563
अलग-अलग पृष्ठभूमि के नागरिक हैं।
11:28
And with some small, incremental changes,
266
688553
2786
और कुछ छोटे, वृद्धिशील परिवर्तनों के साथ
11:31
we can unlock the passion and the ability of our citizens
267
691339
3225
हम अपने नागरिकों के उत्साह और क्षमता का ताला खोल सकते हैं
11:34
to harness open data and make our city even better,
268
694564
3156
खुले डेटा के उपयोग के लिए जिससे हमारा शहर और बेहतर हो सके,
11:37
whether it's one dataset, or one parking spot at a time.
269
697720
3626
चाहे वो एक बार में एक डेटा सेट या एक पार्किंग स्थल हो।
11:41
Thank you.
270
701346
2322
धन्यवाद।
11:43
(Applause)
271
703668
3305
(तालियाँ)
इस वेबसाइट के बारे में

यह साइट आपको YouTube वीडियो से परिचित कराएगी जो अंग्रेजी सीखने के लिए उपयोगी हैं। आप दुनिया भर के शीर्षस्थ शिक्षकों द्वारा पढ़ाए जाने वाले अंग्रेजी पाठ देखेंगे। वहां से वीडियो चलाने के लिए प्रत्येक वीडियो पृष्ठ पर प्रदर्शित अंग्रेजी उपशीर्षक पर डबल-क्लिक करें। उपशीर्षक वीडियो प्लेबैक के साथ सिंक में स्क्रॉल करते हैं। यदि आपकी कोई टिप्पणी या अनुरोध है, तो कृपया इस संपर्क फ़ॉर्म का उपयोग करके हमसे संपर्क करें।

https://forms.gle/WvT1wiN1qDtmnspy7