Ben Wellington: How we found the worst place to park in New York City — using big data

80,125 views ・ 2015-02-26

TED


Vui lòng nhấp đúp vào phụ đề tiếng Anh bên dưới để phát video.

Translator: Phuong Quach Reviewer: Thu Pham
00:12
Six thousand miles of road,
0
12711
2820
Sáu nghìn dặm đường,
600 dặm đường ngầm,
00:15
600 miles of subway track,
1
15531
2203
00:17
400 miles of bike lanes
2
17734
1644
400 dặm đường xe đạp
00:19
and a half a mile of tram track,
3
19378
1821
và nửa dặm xe điện,
00:21
if you've ever been to Roosevelt Island.
4
21199
1953
nếu bạn đã từng đến đảo Roosevelt.
00:23
These are the numbers that make up the infrastructure of New York City.
5
23152
3334
Đây là những con số tạo nên cơ sở hạ tầng của New York.
00:26
These are the statistics of our infrastructure.
6
26486
2619
Đây là thống kê cơ sở hạ tầng.
Những con số tìm thấy trong báo cáo của cơ quan thành phố.
00:29
They're the kind of numbers you can find released in reports by city agencies.
7
29105
3706
Ví dụ, Sở Giao thông vận tải sẽ cho biết
00:32
For example, the Department of Transportation will probably tell you
8
32811
3199
có bao nhiêu dặm đường được bảo trì.
Cơ quan giao thông đô thị khoe về số dặm đường ngầm.
00:36
how many miles of road they maintain.
9
36010
1781
00:37
The MTA will boast how many miles of subway track there are.
10
37791
2821
Hầu hết các cơ quan thành phố cho ta thống kê.
00:40
Most city agencies give us statistics.
11
40612
1807
Báo cáo năm nay
00:42
This is from a report this year
12
42419
1483
từ Uỷ ban taxi và xe Limousine,
00:43
from the Taxi and Limousine Commission,
13
43902
1892
cho ta biết có khoảng 13,500 taxi ở thành phố New York.
00:45
where we learn that there's about 13,500 taxis here in New York City.
14
45794
3276
Khá thú vị, đúng không?
00:49
Pretty interesting, right?
15
49070
1290
00:50
But did you ever think about where these numbers came from?
16
50360
2784
Nhưng bạn có từng nghĩ những con số này đến từ đâu?
Bởi vì để có những con số này, ai đó ở cơ quan thành phố
00:53
Because for these numbers to exist, someone at the city agency
17
53144
2903
00:56
had to stop and say, hmm, here's a number that somebody might want want to know.
18
56047
3880
phải dừng và nói, hmm, đây là con số mà ai đó rất muốn biết.
00:59
Here's a number that our citizens want to know.
19
59927
2250
Đây là một con số mà công dân muốn biết.
Vì thế, họ tìm lại những dữ liệu gốc,
01:02
So they go back to their raw data,
20
62177
1830
họ đếm, họ cộng, họ tính toán,
01:04
they count, they add, they calculate,
21
64007
1797
và họ đưa ra những báo cáo,
01:05
and then they put out reports,
22
65804
1467
và những báo cáo đó sẽ chứa những con số thế này.
01:07
and those reports will have numbers like this.
23
67271
2177
Vấn đề là làm thế nào để họ biết tất cả các câu hỏi?
01:09
The problem is, how do they know all of our questions?
24
69448
2540
01:11
We have lots of questions.
25
71988
1243
Chúng ta có rất nhiều câu hỏi.
01:13
In fact, in some ways there's literally an infinite number of questions
26
73231
3340
Trên thực tế, theo cách nào đó chúng ta có vô số câu hỏi
01:16
that we can ask about our city.
27
76571
1649
về thành phố của chính mình.
Những cơ quan không bao giờ có thể theo kịp.
01:18
The agencies can never keep up.
28
78220
1475
01:19
So the paradigm isn't exactly working, and I think our policymakers realize that,
29
79695
4056
Vì thế, mô thức này không hiệu quả, tôi nghĩ những nhà chính sách nhận ra,
01:23
because in 2012, Mayor Bloomberg signed into law what he called
30
83751
3959
bởi vì vào năm 2012, Mayor Bloomberg đã thông qua điều luật mà ông ấy gọi là
01:27
the most ambitious and comprehensive open data legislation in the country.
31
87710
3837
điều luật về dữ liệu mở tham vọng và toàn diện nhất cả nước.
01:31
In a lot of ways, he's right.
32
91547
1573
Ở nhiều phương diện, ông đã đúng.
01:33
In the last two years, the city has released 1,000 datasets
33
93120
2861
Trong hai năm qua, thành phố đưa ra 1,000 tập dữ liệu
01:35
on our open data portal,
34
95981
1610
trên cổng dữ liệu mở,
01:37
and it's pretty awesome.
35
97591
1764
và điều đấy khá là tuyệt vời.
01:39
So you go and look at data like this,
36
99355
1968
Bạn đi và nhìn những dữ liệu thế này,
01:41
and instead of just counting the number of cabs,
37
101323
2289
thay vì chỉ đếm số lượng xe taxi,
01:43
we can start to ask different questions.
38
103612
1943
ta có thể bắt đầu hỏi nhiều thứ khác nhau.
01:45
So I had a question.
39
105555
1200
Vì vậy tôi muốn hỏi.
01:46
When's rush hour in New York City?
40
106755
1701
Khi nào là giờ cao điểm ở New York?
01:48
It can be pretty bothersome. When is rush hour exactly?
41
108456
2581
Vấn đề này khá phiền phức. Khi nào mới đúng là giờ cao điểm?
01:51
And I thought to myself, these cabs aren't just numbers,
42
111037
2625
Và tôi tự ngẫm, những chiếc taxi không chỉ là con số,
01:53
these are GPS recorders driving around in our city streets
43
113662
2711
mà còn là những máy ghi dữ liệu GPS di chuyển trong thành phố
01:56
recording each and every ride they take.
44
116373
1913
ghi lại mỗi và mọi chặng đường của chúng.
01:58
There's data there, and I looked at that data,
45
118286
2322
Dữ liệu có ở đây, và tôi nhìn vào dữ liệu đó,
02:00
and I made a plot of the average speed of taxis in New York City throughout the day.
46
120608
3961
và phác hoạ tốc độ trung bình của những chiếc taxi ở New York trong ngày.
Bạn có thể thấy từ nửa đêm đến khoảng 5:18 sáng,
02:04
You can see that from about midnight to around 5:18 in the morning,
47
124569
3412
02:07
speed increases, and at that point, things turn around,
48
127981
3563
tốc độ tăng, và tại thời điểm đấy, mọi thứ quay ngược lại,
02:11
and they get slower and slower and slower until about 8:35 in the morning,
49
131544
3962
chúng càng ngày càng chậm lại đến khoảng 8:35 sáng,
02:15
when they end up at around 11 and a half miles per hour.
50
135506
2693
khi chúng dừng hẳn ở khoảng 11,5 dặm mỗi giờ.
02:18
The average taxi is going 11 and a half miles per hour on our city streets,
51
138199
3562
Một chiếc xe taxi trung bình đi 11,5 dặm mỗi giờ trên phố
02:21
and it turns out it stays that way
52
141761
1987
và hoá ra là nó không thay đổi
02:23
for the entire day.
53
143748
3368
trong suốt cả ngày.
(Cười)
02:27
(Laughter)
54
147116
1373
02:28
So I said to myself, I guess there's no rush hour in New York City.
55
148489
3180
Vì thế tôi tự nhủ, không có giờ cao điểm ở New York.
02:31
There's just a rush day.
56
151669
1537
Chỉ có một ngày chen lấn mà thôi.
02:33
Makes sense. And this is important for a couple of reasons.
57
153206
2850
Có lý. Và điều này quan trọng vì một số lý do.
02:36
If you're a transportation planner, this might be pretty interesting to know.
58
156056
3637
Nếu bạn là một nhà hoạch định giao thông, điều này có thể rất thú vị.
02:39
But if you want to get somewhere quickly,
59
159693
1975
Nhưng nếu bạn muốn đến một nơi thật nhanh,
02:41
you now know to set your alarm for 4:45 in the morning and you're all set.
60
161668
3468
giờ bạn biết phải đặt báo thức lúc 4:45 sáng và sẵn sàng.
New York đúng không?
02:45
New York, right?
61
165136
1044
Nhưng có câu chuyện sau những dữ liệu này.
02:46
But there's a story behind this data.
62
166180
1762
02:47
This data wasn't just available, it turns out.
63
167942
2185
Hóa ra dữ liệu không có sẵn.
Thật ra có một thứ gọi là yêu cầu quyền tự do thông tin pháp luật,
02:50
It actually came from something called a Freedom of Information Law Request,
64
170127
3619
02:53
or a FOIL Request.
65
173746
1076
hay là yêu cầu FOIL.
02:54
This is a form you can find on the Taxi and Limousine Commission website.
66
174822
3466
Đây là một tờ đơn tìm thấy trên web của Uỷ ban taxi và xe Limousine.
Để truy cập dữ liệu này, bạn cần lấy được tờ đơn này,
02:58
In order to access this data, you need to go get this form,
67
178288
2826
điền vào và họ sẽ thông báo bạn,
03:01
fill it out, and they will notify you,
68
181114
1846
03:02
and a guy named Chris Whong did exactly that.
69
182960
2130
và một anh chàng tên Chris Whong đã làm chính xác như thế.
03:05
Chris went down, and they told him,
70
185090
1890
Chris đi đến và họ bảo anh ta,
03:06
"Just bring a brand new hard drive down to our office,
71
186980
2827
"Chỉ cần mang một ổ cứng mới đến văn phòng của chúng tôi,
03:09
leave it here for five hours, we'll copy the data and you take it back."
72
189807
3424
để ở đây trong vòng 5 tiếng, chúng tôi sẽ chép dữ liệu và bạn đến lấy về."
03:13
And that's where this data came from.
73
193231
2032
Và dữ liệu này đến từ đấy.
03:15
Now, Chris is the kind of guy who wants to make the data public,
74
195263
3005
Chris là kiểu người muốn công khai mọi dữ liệu,
và vì thế, mọi người đều có thể sử dụng nó và đấy là lý do có biểu đồ này.
03:18
and so it ended up online for all to use, and that's where this graph came from.
75
198268
3784
Và sự tồn tại của nó thật tuyệt vời. Những người ghi GPS - vô cùng tuyệt.
03:22
And the fact that it exists is amazing. These GPS recorders -- really cool.
76
202052
3518
03:25
But the fact that we have citizens walking around with hard drives
77
205570
3118
Nhưng thực tế có những công dân mang theo những ổ cứng
thu thập dữ liệu từ cơ quan để công khai chúng -
03:28
picking up data from city agencies to make it public --
78
208688
2582
nó đã là của chung, bạn có thể tiếp cận chúng,
03:31
it was already kind of public, you could get to it,
79
211270
2390
nhưng nó là chung, không công khai.
03:33
but it was "public," it wasn't public.
80
213660
1812
03:35
And we can do better than that as a city.
81
215472
1962
Và ta có thể làm tốt hơn thế.
Dân chúng không cần phải đi khắp nơi với những chiếc ổ cứng
03:37
We don't need our citizens walking around with hard drives.
82
217434
2756
Giờ thì, không phải mẫu dữ liệu nào phù hợp yêu cầu FOIL.
03:40
Now, not every dataset is behind a FOIL Request.
83
220190
2337
03:42
Here is a map I made with the most dangerous intersections in New York City
84
222527
3802
Đây là bản đồ những nút giao nguy hiểm nhất ở thành phố New York mà tôi đã làm.
03:46
based on cyclist accidents.
85
226329
1878
dựa trên số vụ tai nạn xe đạp.
03:48
So the red areas are more dangerous.
86
228207
1939
Những vùng màu đỏ là vùng nguy hiểm.
03:50
And what it shows is first the East side of Manhattan,
87
230146
2553
Và đầu tiên là phía đông của Manhattan,
03:52
especially in the lower area of Manhattan, has more cyclist accidents.
88
232699
3611
đặc biệt là vùng thấp hơn, số tai nạn xe đạp xảy ra cao hơn.
03:56
That might make sense
89
236310
1019
Điều này hợp lý
03:57
because there are more cyclists coming off the bridges there.
90
237329
2896
vì có nhiều xe đạp phóng xuống cầu ở đây.
04:00
But there's other hotspots worth studying.
91
240225
2014
Còn một địa điểm nữa rất đáng nghiên cứu.
Khu Williamsburg. Khu Roosevelt Avenue ở Queens.
04:02
There's Williamsburg. There's Roosevelt Avenue in Queens.
92
242239
2669
04:04
And this is exactly the kind of data we need for Vision Zero.
93
244908
2852
Và đây chính xác là dữ liệu cần cho Vision Zero.
04:07
This is exactly what we're looking for.
94
247760
1990
Đây chính xác là thứ chúng ta đang tìm kiếm.
04:09
But there's a story behind this data as well.
95
249750
2135
Nhưng lại có một câu chuyện ẩn sau nó.
04:11
This data didn't just appear.
96
251885
2067
Dữ liệu này không chỉ thế mà biến mất.
04:13
How many of you guys know this logo?
97
253952
2391
Bao nhiêu thính giả ngồi đây biết đến logo này ạ?
04:16
Yeah, I see some shakes.
98
256343
1352
Vâng, tôi thấy vài cái lắc đầu.
04:17
Have you ever tried to copy and paste data out of a PDF
99
257695
2655
Các bạn có bao giờ cố gắng sao và chép dữ liệu từ một bản PDF
04:20
and make sense of it?
100
260350
1357
và cắt nghĩa nó?
04:21
I see more shakes.
101
261707
1060
Nhiều người lắc đầu hơn rồi.
04:22
More of you tried copying and pasting than knew the logo. I like that.
102
262767
3345
Nhiều người thà sao chép hơn là biết về cái logo này. Tôi thích.
Chuyện là, dữ liệu các bạn vừa thấy thực ra là từ một file PDF.
04:26
So what happened is, the data that you just saw was actually on a PDF.
103
266112
3510
04:29
In fact, hundreds and hundreds and hundreds of pages of PDF
104
269622
3105
Thực tế, hàng trăm trăm trang PDF
04:32
put out by our very own NYPD,
105
272727
2159
ra đời từ chính Cục cảnh sát Hoa Kỳ,
04:34
and in order to access it, you would either have to copy and paste
106
274886
3152
để tiếp cận với nó, bạn sẽ phải chép hoặc dán
trong hàng trăm và hàng trăm giờ
04:38
for hundreds and hundreds of hours,
107
278038
1726
04:39
or you could be John Krauss.
108
279764
1344
hoặc bạn có thể là John Krauss.
04:41
John Krauss was like,
109
281108
1043
John Krauss đại khái là,
04:42
I'm not going to copy and paste this data. I'm going to write a program.
110
282151
3413
tôi sẽ không sao chép lại dữ liệu này. Tôi sẽ viết một chương trình.
04:45
It's called the NYPD Crash Data Band-Aid,
111
285564
2288
Nó tên là Ban hỗ trợ sự cố về dữ liệu của Cục cảnh sát Hoa Kỳ
04:47
and it goes to the NYPD's website and it would download PDFs.
112
287852
3032
ban này sẽ đăng nhập trang web của NYPD, và tải về các tệp PDF.
04:50
Every day it would search; if it found a PDF, it would download it
113
290884
3126
Công việc mỗi ngày là tìm kiếm và tải về bất cứ tệp PDF nào xuất hiện
sau đó, ban này sẽ chạy chương trình xuất thông tin
04:54
and then it would run some PDF-scraping program,
114
294010
2250
04:56
and out would come the text,
115
296260
1336
và trả dữ liệu về dạng văn bản,
04:57
and it would go on the Internet, and then people could make maps like that.
116
297596
3565
dữ liệu này sẽ được đăng lên mạng, và ta có thể vẽ bản đồ bằng cách này.
05:01
And the fact that the data's here, the fact that we have access to it --
117
301161
3429
Thực tế những dữ liệu mà chúng ta tiếp cận -
05:04
Every accident, by the way, is a row in this table.
118
304590
2450
Mỗi vụ tai nạn, nhân tiện đây, là một hàng trong bảng này.
05:07
You can imagine how many PDFs that is.
119
307040
1836
Bạn có thể tưởng tượng số lượng tệp PDF nhiều thế nào.
05:08
The fact that we have access to that is great,
120
308876
2207
Việc mà chúng ta được tiếp cận với nguồn dữ liệu đó là một điều tuyệt vời,
05:11
but let's not release it in PDF form,
121
311083
2110
nhưng đừng xuất nó ra dưới định dạng PDF,
05:13
because then we're having our citizens write PDF scrapers.
122
313193
2739
vì sau đó dân chúng sẽ viết chương trình xuất file PDF.
05:15
It's not the best use of our citizens' time,
123
315932
2076
Điều này lãng phí thời gian,
chúng ta hay cả thành phố có thể làm tốt hơn thế.
05:18
and we as a city can do better than that.
124
318008
2004
Và bây giờ, đáng mừng là thị trưởng thành phố, ông Blasio
05:20
Now, the good news is that the de Blasio administration
125
320012
2736
05:22
actually recently released this data a few months ago,
126
322748
2532
vừa mới phát hành những dữ liệu này khoảng vài tháng trước,
05:25
and so now we can actually have access to it,
127
325280
2158
và vì vậy chúng ta mới có thể tham khảo nó,
05:27
but there's a lot of data still entombed in PDF.
128
327438
2536
nhưng vẫn còn rất nhiều thông tin bị chôn vùi dưới dạng PDF
05:29
For example, our crime data is still only available in PDF.
129
329974
3197
Ví dụ, dữ liệu về tội phạm mới chỉ có dưới dạng PDF.
05:33
And not just our crime data, our own city budget.
130
333171
3755
và không chỉ có thế, còn có ngân sách thành phố chúng ta.
05:36
Our city budget is only readable right now in PDF form.
131
336926
3729
Ngân sách thành phố hiện tại chỉ đọc được ở dạng PDF.
05:40
And it's not just us that can't analyze it --
132
340655
2141
Và không chỉ có mỗi chúng ta không thể phân tích được -
05:42
our own legislators who vote for the budget
133
342796
2955
mà cả những nhà lập pháp người mà ủng hộ cho bản ngân sách
05:45
also only get it in PDF.
134
345751
1943
cũng chỉ có được bản PDF của nó thôi.
05:47
So our legislators cannot analyze the budget that they are voting for.
135
347694
3844
Vì thế những nhà lập pháp không thể phân tích bản ngân sách mà họ bầu cử.
05:51
And I think as a city we can do a little better than that as well.
136
351538
3608
Và tôi nghĩ rằng thành phố chúng ta cũng chỉ làm tốt hơn một chút thôi.
05:55
Now, there's a lot of data that's not hidden in PDFs.
137
355146
2488
Giờ có rất nhiều dữ liệu không còn ở dạng PDF.
05:57
This is an example of a map I made,
138
357634
1700
Đây là mẫu bản đồ mà tôi đã vẽ,
05:59
and this is the dirtiest waterways in New York City.
139
359334
2926
và đây là những đường thuỷ bẩn nhất tại thành phố New York.
06:02
Now, how do I measure dirty?
140
362260
1509
Vậy tôi đã đo độ bẩn này như thế nào?
06:03
Well, it's kind of a little weird,
141
363769
1857
Thực ra thì cách này khá là kì lạ,
06:05
but I looked at the level of fecal coliform,
142
365626
2113
nhưng mà tôi đã nhìn vào mức độ nhiễm trực khuẩn ruột,
06:07
which is a measurement of fecal matter in each of our waterways.
143
367739
3506
chính là đo lượng phân có trong mỗi đường thuỷ này
06:11
The larger the circle, the dirtier the water,
144
371245
3274
Vòng tròn càng lớn, mức độ bẩn càng cao,
06:14
so the large circles are dirty water, the small circles are cleaner.
145
374519
3357
các vòng tròn to là vùng nước bẩn vòng tròn bé là vùng nước sạch hơn.
06:17
What you see is inland waterways.
146
377876
1644
Thứ các bạn thấy là đường thuỷ nội địa
06:19
This is all data that was sampled by the city over the last five years.
147
379520
3404
Đây là toàn bộ dữ liệu mẫu của thành phố trong vòng 5 năm tới.
06:22
And inland waterways are, in general, dirtier.
148
382924
2694
Và thường thì các đường thuỷ nội địa sẽ bẩn hơn.
06:25
That makes sense, right?
149
385618
1218
Điều này dễ hiểu, đúng không?
06:26
And the bigger circles are dirty. And I learned a few things from this.
150
386836
3374
Vòng tròn to hơn là bẩn. Tôi cũng học được vài điều.
Thứ nhất: Không bao giờ bơi ở bất cứ nơi nào có chữ "lạch" hay "kênh".
06:30
Number one: Never swim in anything that ends in "creek" or "canal."
151
390210
3164
06:33
But number two: I also found the dirtiest waterway in New York City,
152
393374
4318
Nhưng thứ hai: tôi cũng tìm ra đường thuỷ bẩn nhất thành phố New York,
06:37
by this measure, one measure.
153
397692
1834
bằng chính phương pháp này, bằng cách này.
06:39
In Coney Island Creek, which is not the Coney Island you swim in, luckily.
154
399526
3648
Ở con lạch Coney Island, may mắn không phải Coney Island các bạn hay bơi.
Mà là ở bờ bên kia.
06:43
It's on the other side.
155
403174
1158
Nhưng con lạch này, 94% các mẫu thử được lấy trong vòng 5 năm nay
06:44
But Coney Island Creek, 94 percent of samples taken over the last five years
156
404332
3878
06:48
have had fecal levels so high
157
408210
2157
có mức nhiễm khuẩn cao đến mức
06:50
that it would be against state law to swim in the water.
158
410367
3093
con người không được phép bơi tại đây theo điều luật của bang.
06:53
And this is not the kind of fact that you're going to see
159
413460
2729
Và đây không phải là thứ bạn sẽ được thấy
06:56
boasted in a city report, right?
160
416189
1537
trong báo cáo của thành phố, đúng chứ?
06:57
It's not going to be the front page on nyc.gov.
161
417726
2250
Điều này sẽ không được đăng trên trang nhất của nyc.gov.
06:59
You're not going to see it there,
162
419976
1580
Chúng ta sẽ không biết,
nhưng thật ra có được dữ liệu này là điều vô cùng tuyệt diệu.
07:01
but the fact that we can get to that data is awesome.
163
421556
2518
Nhưng phải nhắc lại lần nữa, chuyện đó không dễ chút nào,
07:04
But once again, it wasn't super easy,
164
424074
1773
07:05
because this data was not on the open data portal.
165
425847
2358
vì đó không phải dữ liệu mở trong cổng thông tin.
Nếu bạn định truy cập,
07:08
If you were to go to the open data portal,
166
428205
2013
bạn sẽ chỉ tìm thấy vài mẩu thông tin trong vòng một năm hay vài tháng.
07:10
you'd see just a snippet of it, a year or a few months.
167
430218
2613
Những thông tin này là từ web của Cục bảo vệ Môi trường.
07:12
It was actually on the Department of Environmental Protection's website.
168
432831
3390
Và mỗi link này là một bảng excel, mỗi trang excel cũng khác nhau.
07:16
And each one of these links is an Excel sheet, and each Excel sheet is different.
169
436221
3878
Mỗi đầu đề cũng khác: bạn sao, chép, sắp xếp lại.
07:20
Every heading is different: you copy, paste, reorganize.
170
440099
2630
Khi đó, bạn có thể vẽ bản đồ và điều này thật tuyệt, nhưng lần nữa,
07:22
When you do you can make maps and that's great, but once again,
171
442729
2952
ta có thể làm tốt hơn cho thành phố, ta có thể chuẩn hoá mọi thứ.
07:25
we can do better than that as a city, we can normalize things.
172
445681
2969
Và chúng ta đạt được điều này, bởi đã có một trang do Socrata tạo
07:28
And we're getting there, because there's this website that Socrata makes
173
448650
3384
có tên là Cổng thông tin mở NYC.
Đây là nơi đăng tải 1100 bộ dữ liệu mà
07:32
called the Open Data Portal NYC.
174
452034
1541
07:33
This is where 1,100 data sets that don't suffer
175
453575
2257
không gặp những vấn đề tôi đã đề cập,
07:35
from the things I just told you live,
176
455832
1781
và thật đáng mừng là con số đang tăng lên.
07:37
and that number is growing, and that's great.
177
457613
2148
Bạn có thể tải về tài liệu ở bất cứ định dạng nào, CSV hay PDF hay Excel.
07:39
You can download data in any format, be it CSV or PDF or Excel document.
178
459761
3412
Bạn có thể tải bất kì tệp nào bạn muốn theo cách đó.
07:43
Whatever you want, you can download the data that way.
179
463173
2547
07:45
The problem is, once you do,
180
465720
1352
Vấn đề là, mỗi lần như thế,
07:47
you will find that each agency codes their addresses differently.
181
467072
3686
bạn sẽ thấy mỗi nguồn mã hoá những địa chỉ khác nhau.
07:50
So one is street name, intersection street,
182
470758
2141
Một địa chỉ gồm tên phố, ngã giao nhau,
07:52
street, borough, address, building, building address.
183
472899
2491
đường phố, khu phố, địa chỉ, toà nhà, địa chỉ toà nhà.
07:55
So once again, you're spending time, even when we have this portal,
184
475390
3180
Một lần nữa, bạn mất thời gian, kể cả khi đã có cổng thông tin này,
07:58
you're spending time normalizing our address fields.
185
478570
2606
để chuẩn hoá những trường địa chỉ.
08:01
And that's not the best use of our citizens' time.
186
481176
2423
Và việc này thật hao phí thời gian.
08:03
We can do better than that as a city.
187
483599
1796
Thành phố chúng ta có thể làm tốt hơn.
08:05
We can standardize our addresses,
188
485395
1645
Chúng ta có thể tiêu chuẩn hóa địa chỉ,
08:07
and if we do, we can get more maps like this.
189
487040
2185
và nếu có thể, ta sẽ có nhiều bản đồ hơn nữa.
08:09
This is a map of fire hydrants in New York City,
190
489225
2285
Đây là bản đồ vòi chữa cháy ở thành phố New York.
08:11
but not just any fire hydrants.
191
491510
1531
nhưng không chỉ có vòi chữa cháy thôi đâu.
08:13
These are the top 250 grossing fire hydrants in terms of parking tickets.
192
493041
4726
Đây là top 250 tổng số vòi chữa cháy liên quan đến vé phạt đỗ xe.
08:17
(Laughter)
193
497767
1986
(Cười)
08:19
So I learned a few things from this map, and I really like this map.
194
499753
3358
Tôi học được vài điều từ bản đồ này, tôi thực sự rất thích.
08:23
Number one, just don't park on the Upper East Side.
195
503111
2402
Thứ nhất, đừng đỗ xe ở mạn trên phía Đông.
08:25
Just don't. It doesn't matter where you park, you will get a hydrant ticket.
196
505513
3587
Tốt nhất là đừng. Dù bạn đỗ xe ở đâu thì cũng bị nhận vé phạt thôi.
08:29
Number two, I found the two highest grossing hydrants in all of New York City,
197
509100
4153
Thứ hai, tôi đã tìm ra 2 vùng có tổng vòi nước máy lớn nhất New York,
08:33
and they're on the Lower East Side,
198
513253
1886
chúng đều ở Lower East Side,
08:35
and they were bringing in over 55,000 dollars a year in parking tickets.
199
515139
5098
và 2 điểm này đã và đang mang lại hơn 55,000 đô la mỗi năm từ những vé đỗ xe.
08:40
And that seemed a little strange to me when I noticed it,
200
520237
2738
Khi biết tới điều này, tôi cảm thấy khá lạ
08:42
so I did a little digging and it turns out what you had is a hydrant
201
522975
3269
vì vậy tôi đã tìm hiểu thêm và hoá ra vấn đề ở vòi nước máy
08:46
and then something called a curb extension,
202
526244
1996
và một thứ nữa gọi là vỉa hè,
đây là một khu đi bộ khoảng 8 bước chân
08:48
which is like a seven-foot space to walk on,
203
528240
2059
và bên cạnh là chỗ để xe.
08:50
and then a parking spot.
204
530299
1156
08:51
And so these cars came along, and the hydrant --
205
531455
2254
Rồi xe đi tới, và vòi nước máy -
08:53
"It's all the way over there, I'm fine,"
206
533709
1911
"Nó ở tít đằng kia, đỗ ở đây là ổn",
và thực sự có cả vạch kẻ khéo léo để đỗ xe.
08:55
and there was actually a parking spot painted there beautifully for them.
207
535620
3474
Họ sẽ đỗ xe ở đó, và NYPD không đồng ý với lựa chọn này
08:59
They would park there, and the NYPD disagreed with this designation
208
539094
3155
và sẽ phạt họ.
09:02
and would ticket them.
209
542249
1058
Không chỉ có tôi nhận được thẻ phạt này đâu.
09:03
And it wasn't just me who found a parking ticket.
210
543307
2344
Đây là chiếc xe Google Street View
09:05
This is the Google Street View car driving by
211
545651
2146
cũng nhận một vé phạt như thế.
09:07
finding the same parking ticket.
212
547797
1617
09:09
So I wrote about this on my blog, on I Quant NY, and the DOT responded,
213
549414
4504
Tôi đã chia sẻ trên blog của mình, trang I Quant NY, và Sở Giao Thông đã hồi âm,
09:13
and they said,
214
553918
1020
họ nói rằng,
09:14
"While the DOT has not received any complaints about this location,
215
554938
3410
"Dù chúng tôi chưa nhận được bất cứ phàn nàn nào về địa điểm này,
09:18
we will review the roadway markings and make any appropriate alterations."
216
558348
4542
nhưng DOT sẽ điều chỉnh lại vạch kẻ đường, cũng như tiến hành những thay đổi hợp lí."
09:22
And I thought to myself, typical government response,
217
562890
2959
Và tôi tự ngẫm rằng, câu trả lời điển hình của chính phủ,
09:25
all right, moved on with my life.
218
565849
1881
tốt thôi, cuộc sống của tôi vẫn tiếp diễn.
09:27
But then, a few weeks later, something incredible happened.
219
567730
3970
Nhưng vài tuần sau, điều phi thường đã xảy ra.
09:31
They repainted the spot,
220
571700
2520
Họ đã sơn lại vạch đỗ xe,
09:34
and for a second I thought I saw the future of open data,
221
574220
2690
trong phút chốc, tôi nghĩ mình thấy được tương lai của thông tin mở,
09:36
because think about what happened here.
222
576910
2000
chỉ với việc nghĩ đến điều đã xảy ra ở đây.
09:38
For five years, this spot was being ticketed, and it was confusing,
223
578910
5100
Trong 5 năm, điểm này đã bị thu phí và chuyện cũng rối thêm,
09:44
and then a citizen found something, they told the city, and within a few weeks
224
584010
4306
sau đó người dân phát hiện điều gì đó, họ báo lại với thành phố, chỉ trong vài tuần
09:48
the problem was fixed.
225
588316
1294
vấn đề đã được giải quyết.
09:49
It's amazing. And a lot of people see open data as being a watchdog.
226
589610
3200
Thật ngạc nhiên. Có nhiều người canh chừng như khuyển canh nhà vậy.
09:52
It's not, it's about being a partner.
227
592810
1772
Chuyện không phải vậy. Chuyện liên quan việc trở thành một cộng sự.
09:54
We can empower our citizens to be better partners for government,
228
594582
3138
Ta có thể khiến người dân trở thành những cộng sự có ích cho chính phủ.
09:57
and it's not that hard.
229
597720
1881
chuyện đó không hề khó.
09:59
All we need are a few changes.
230
599601
1459
Tất cả những gì ta cần là một vài thay đổi.
10:01
If you're FOILing data,
231
601060
1107
Nếu bạn đang yêu cầu lưu trữ,
10:02
if you're seeing your data being FOILed over and over again,
232
602167
2867
nếu bạn thấy dữ liệu của mình được yêu cầu nhiều lần,
hãy công khai nó, đó là dấu hiệu dữ liệu cần được công khai.
10:05
let's release it to the public, that's a sign that it should be made public.
233
605034
3574
Nếu bạn làm trong cơ quan chính phủ định công khai một bản PDF,
10:08
And if you're a government agency releasing a PDF,
234
608608
2482
10:11
let's pass legislation that requires you to post it with the underlying data,
235
611090
3649
hãy thông qua đạo luật yêu cầu người đăng phải ghi rõ dữ liệu gốc,
10:14
because that data is coming from somewhere.
236
614739
2028
vì dữ liệu đó được dẫn nguồn từ đâu đó.
10:16
I don't know where, but it's coming from somewhere,
237
616767
2482
Tôi không biết từ đâu, nhưng chắc sẽ có nguồn gốc,
bạn có thể công khai nó dưới dạng PDF.
10:19
and you can release it with the PDF.
238
619249
1725
Hãy công nhận và chia sẻ tiêu chuẩn cho dữ liệu mở.
10:20
And let's adopt and share some open data standards.
239
620974
2411
Hãy bắt đầu bằng địa chỉ tại thành phố New York.
10:23
Let's start with our addresses here in New York City.
240
623385
2481
Bắt đầu bằng việc chuẩn hoá địa chỉ.
10:25
Let's just start normalizing our addresses.
241
625866
2074
Bởi New York tiên phong trong dữ liệu mở.
10:27
Because New York is a leader in open data.
242
627940
2062
Bất luận thế nào, ta là người đi đầu với thông tin mở,
10:30
Despite all this, we are absolutely a leader in open data,
243
630002
2789
nếu ta bình thường hoá mọi thứ, và đặt tiêu chuẩn dữ liệu mở,
10:32
and if we start normalizing things, and set an open data standard,
244
632791
3121
những người khác sẽ hưởng ứng theo. Bang và thậm chí chính phủ sẽ tán đồng.
10:35
others will follow. The state will follow, and maybe the federal government,
245
635912
3634
Những quốc gia khác sẽ tuân theo,
và ta không còn xa thời điểm bạn có thể viết một chương trình
10:39
Other countries could follow,
246
639546
1445
10:40
and we're not that far off from a time where you could write one program
247
640991
3411
và thông tin bản đồ của 100 quốc gia.
10:44
and map information from 100 countries.
248
644402
1890
Đây không phải khoa học viễn tưởng. Chúng ta thực sự tiến gần hơn.
10:46
It's not science fiction. We're actually quite close.
249
646292
2487
Đồng thời, ta đang trao quyền cho ai?
10:48
And by the way, who are we empowering with this?
250
648779
2240
Đó không phải là vì John Krauss hay Chris Whong.
10:51
Because it's not just John Krauss and it's not just Chris Whong.
251
651019
3005
Có hàng trăm buổi gặp mặt đang diễn ra ở thành phố New York,
10:54
There are hundreds of meetups going on in New York City right now,
252
654024
3095
những buổi meetup tích cực.
10:57
active meetups.
253
657119
1025
Hàng ngàn người đang tham dự.
10:58
There are thousands of people attending these meetups.
254
658144
2572
Họ tới dự sau khi tan làm hay vào các ngày cuối tuần,
11:00
These people are going after work and on weekends,
255
660716
2368
và họ tham gia để thấy những thông tin mở
11:03
and they're attending these meetups to look at open data
256
663084
2636
và làm cho thành phố trở nên tốt đẹp hơn.
11:05
and make our city a better place.
257
665720
1640
Những tổ chức như BetaNYC, tuần trước công khai một thứ gọi là citygram.nyc
11:07
Groups like BetaNYC, who just last week released something called citygram.nyc
258
667360
4073
11:11
that allows you to subscribe to 311 complaints
259
671433
2147
cho phép bạn góp vào 311 lời phàn nàn
11:13
around your own home, or around your office.
260
673580
2068
xuất phát từ nơi ở, nơi làm việc của bạn.
11:15
You put in your address, you get local complaints.
261
675648
2427
Bạn điền địa chỉ vào, nhận những lời phàn nàn từ địa phương.
11:18
And it's not just the tech community that are after these things.
262
678075
3374
Không phải chỉ có cộng đồng công nghệ mới dùng cách này.
Những người quy hoạch đô thị như học sinh tôi từng dạy ở Pratt cũng dùng.
11:21
It's urban planners like the students I teach at Pratt.
263
681449
2622
Đó là chủ trương chính sách, dành cho mọi người,
11:24
It's policy advocates, it's everyone,
264
684071
1919
11:25
it's citizens from a diverse set of backgrounds.
265
685990
2563
dành cho công dân có hoàn cảnh khác nhau.
11:28
And with some small, incremental changes,
266
688553
2786
Và với vài sự thay đổi nhỏ đang tăng dần,
11:31
we can unlock the passion and the ability of our citizens
267
691339
3225
ta có thể mở khoá những đam mê và năng lực của người dân
11:34
to harness open data and make our city even better,
268
694564
3156
để trang bị cho nền thông tin mở, làm thành phố tươi đẹp hơn,
11:37
whether it's one dataset, or one parking spot at a time.
269
697720
3626
cho dù đó chỉ là một tập dữ liệu, hay là một điểm đỗ xe đi chăng nữa.
11:41
Thank you.
270
701346
2322
Cảm ơn.
(Vỗ tay)
11:43
(Applause)
271
703668
3305
Về trang web này

Trang web này sẽ giới thiệu cho bạn những video YouTube hữu ích cho việc học tiếng Anh. Bạn sẽ thấy các bài học tiếng Anh được giảng dạy bởi các giáo viên hàng đầu từ khắp nơi trên thế giới. Nhấp đúp vào phụ đề tiếng Anh hiển thị trên mỗi trang video để phát video từ đó. Phụ đề cuộn đồng bộ với phát lại video. Nếu bạn có bất kỳ nhận xét hoặc yêu cầu nào, vui lòng liên hệ với chúng tôi bằng biểu mẫu liên hệ này.

https://forms.gle/WvT1wiN1qDtmnspy7