Book review: Big Data – Cuộc cách mạng sẽ thay đổi cách chúng ta sống, làm việc và tư duy

Có thể nói, Big Data là một trong những cuốn sách đầu tiên đã thành công trong việc giới thiệu được đến với số đông người đọc – dù “high tech” hay “low tech” một cách toàn diện và dễ hiểu nhất về “Big Data” – chủ đề nổi lên được bàn luận khá nhiều dạo gần đây, với tốc độ lan truyền nhanh đến chóng mặt cùng mức độ chuyên sâu đến khó có thể hiểu ngay được của chính nó.

Bằng việc đưa ra hơn 20 trường hợp thực tiễn tại Mỹ từ lĩnh vực y tế, bán lẻ, công cộng đến hình sự, nhằm hình ảnh hoá và cụ thể hoá các vấn đề cần khai thác, hai tác giả đã cô đọng hầu như toàn diện các khía cạnh về “dữ liệu lớn” qua 9 chương sách một cách tự nhiên và khéo léo, với “ngôn ngữ đơn giản hết sức có thể” để chính những người không biết quá nhiều về công nghệ vẫn có thể hình dung được dữ liệu lớn là gì, áp dụng ra sao, mang lại lợi ích gì,..

Theo tác giả, khi nói đến dữ liệu lớn tức là đề cập tới những thứ người ta có thể làm với một quy mô lớn mà không thể làm với một quy mô nhỏ hơn của dữ liệu, qua đó có thể khai thác lượng thông tin khủng đó theo những cách thức mới để rồi tạo ra những hiểu biết hữu ích và có giá trị về vấn đề hay thực trạng nào đó. “Một sự thay đổi về lượng sẽ dẫn đến một sự thay đổi về chất” – điều này có thể xem là đúng trong thế giới của dữ liệu lớn, khi mà một sự “đủ” về số lượng của dữ liệu thu thập được, chúng ta có thể dự đoán được điều gì sẽ xảy ra tiếp theo.

Big data đề cập đến việc thời đại của dữ liệu lớn sẽ thách thức cách chúng ta sống và tương tác với thế giới, nổi bật nhất là việc chúng ta tìm kiếm câu trả lời cho câu hỏi tại sao sẽ không còn nhiều ý nghĩa nữa, biết cái gì là đủ tốt rồi - bởi theo đó, thì “biết tại sao có thể là thú vị, nhưng nó không quan trọng để kích thích bán hàng. Biết cái gì mới cuốn hút những cú nhấp chuột”. Có thể máy tính và Amazon, bằng việc thu thập và khai thác dữ liệu lớn, không biết tại sao khách hàng đọc Ernest Hemingway cũng có thể muốn mua F.Scott Fitzgerald, nhưng điều đó không quan trọng, mà tiếng leng keng của máy tính tiền mới quan trọng!

"Việc chúng ta tìm kiếm câu trả lời cho câu hỏi tại sao sẽ không còn nhiều ý nghĩa nữa, biết cái gì là đủ tốt rồi - bởi theo đó, thì “biết tại sao có thể là thú vị, nhưng nó không quan trọng để kích thích bán hàng. Biết cái gì mới cuốn hút những cú nhấp chuột"

Một ví dụ được tác giả nhắc đi nhắc lại xuyên suốt cuốn sách chính là việc Google có thể dự đoán được sự lây lan của dịch cúm mùa đông trên toàn bộ nước Mỹ, ngay trước khi cả Trung tâm Phòng chống Bệnh dịch (CDC) của nước này có thể đưa ra dự đoán chính xác về địa điểm sắp lây lan tiếp theo để có kế hoạch phân bổ nguồn lực có hạn của mình đến ngăn ngừa và điều trị. Google nhận được hơn ba tỷ câu hỏi tìm kiếm mỗi ngày và lưu giữ tất cả chúng – không sót một tìm kiếm nào. Và ý tưởng ở đây là Google sẽ xác định các khu vực bị lây nhiễm vi-rút cảm thông qua những gì người ta tìm kiếm trên Internet – rằng nơi nào có mật độ người dùng tìm kiếm những cụm từ như “thuốc ho”, “triệu chứng cảm”, “điều trị sốt”,.. thì khả năng cao cúm đang lây lan đến khu vực đó. CDC có thể mất từ 1 đến 2 tuần để nhận được các báo cáo đầy đủ từ cấp tiểu bang về hồ sơ và tình trạng khu vực để dự đoán, nhưng Google thì hầu như có thể biết được điều này trong thời gian thực.

Một ví dụ điển hình nữa là Walmart – họ áp dụng Big Data vào việc sắp xếp các mặt hàng ưu tiên để giải quyết hàng tồn kho. Walmart đã thu thập và phân tích hàng tỷ các giao dịch của khách hàng trong vòng 1 năm về: khách hàng mua những mặt hàng gì, chi phí thế nào, có gì khác biệt trong giỏ hàng của họ vào những ngày khác nhau trong tuần, thậm chí cả thời tiết. Và họ đã thành công khi phát hiện rằng trước một cơn bão sắp đến, không chỉ doanh số bán hàng của đèn pin tăng, mà cả số lượng Pop-Tart (một món ăn sáng có đường của Mỹ), cũng tăng đáng kể. Vì vậy khi cơn bão sắp đến, Walmart xếp những hộp Top-Tart cùng đèn pin ở ngay phía trước cửa hàng lúc khách hàng đi vào và lấy giỏ hàng, bên cạnh những đồ tiếp tế cho bão, để tăng sự tiện lợi cho khách hàng và do đó doanh số cũng tăng.

Big data khuyên người đọc nên bắt đầu việc tìm kiếm và thử nghiệm những bước đầu tiên về “dữ liệu lớn” vào chính những công việc kinh doanh, bán hàng hay nghiên cứu hằng ngày của họ, để thấy được những cải tiến đáng kể với những bước bắt đầu tưởng như đơn giản là có ý thức về “thu thập và phân tích dữ liệu đủ lớn”, cuốn sách cũng khiến người đọc khó cưỡng lại sự hấp dẫn của việc áp dụng dữ liệu lớn khi lần lượt nêu những tên tuổi như Google, Amazon, Walmart,.. và thậm chí cả Steve Jobs đã áp dụng “dữ liệu lớn” như thế nào để kéo dài sự sống của ông khi phát hiện căn bệnh ung thư.

Sự toàn diện của “Big Data” chính là ngoài việc đề cập đến lợi ích và những khía cạnh mới mẻ của việc khai thác và áp dụng dữ liệu lớn, tác giả còn đồng thời cung cấp cho người đọc cả những “hố đen” và mặt tối đằng sau của những công việc này – khiến người đọc không khỏi đi từ hết ngạc nhiên này đến ngạc nhiên khác thông qua cách mà các cơ quan tình báo và quân sự Mỹ khai thác dữ liệu lớn vào việc phòng chống tội phạm, lên chiến lược hay giảm thiểu rủi ro thiên tai,.., cũng như là hồi chuông cảnh báo cho những ai quá xông xáo với dữ liệu lớn mà quên nhìn nhận những mặt sau của nó.

Dường như hiểu được sự phức tạp trong nội tại vấn đề, cuốn sách còn được trình bày với những mã QR Code để người đọc có thể xem lại mỗi ví dụ thông qua video trực tuyến, khiến việc đọc thú vị hơn. Bản dịch tiếng Việt do chuyên gia công nghệ thông tin Vũ Duy Mẫn hoàn thiện với ngôn từ thoát ý, linh hoạt và dễ hiểu, có thể nói Big Data là cuốn sách Khoa học Khám phá đáng đọc nhất về Dữ liệu lớn. (Đừng quên cài đặt sẵn cho smartphone ứng dụng quét Barcode khi bạn nghiền ngẫm cuốn sách này)