Nghị sĩ Mỹ vừa ra tay cấm tiệt trò 'bơm nhiễu' (noise infusion) bảo vệ riêng tư của Cục Thống kê. Cuộc chiến giữa bảo mật và tính chính xác của data lại nóng hơn bao giờ hết.

Đang yên đang lành, các bô lão nghị sĩ Mỹ vừa làm một cú "quay xe" cực gắt: Cấm tiệt Cục Thống kê (Census Bureau) sử dụng chiêu trò "bơm nhiễu" (noise infusion) để bảo mật danh tính người dân trong các báo cáo số liệu công khai.
Vụ này đang khiến giới mật mã học, các giáo chủ Differential Privacy (Bảo mật vi phân) khóc ròng vì công sức nghiên cứu coi như đổ sông đổ bể, trong khi phe thèm khát data thô thì đang gáy cực khét vì sắp có data sạch để húp.
Để anh em dễ hình dung thì Cục Thống kê Mỹ nắm trong tay toàn bộ dữ liệu nhạy cảm của hàng trăm triệu dân. Ngày xưa, nếu họ cứ thế xuất bản bảng biểu số liệu thô, các pháp sư dữ liệu chỉ cần dùng vài thuật toán cơ bản là có thể đảo ngược quy trình (reverse-engineer), dò ra chính xác nhà ông A làm nghề gì, lương bao nhiêu, có mấy vợ.
Để chống lại trò doxxing bá đạo này, Cục Thống kê đã áp dụng một chiêu thức cực ma giáo gọi là Noise Infusion (bơm thêm nhiễu ngẫu nhiên vào dữ liệu) trước khi công bố. Hiểu đơn giản là họ cố tình làm lệch số liệu đi một chút một cách có tính toán (ví dụ: thực tế có 3 người nhưng báo cáo ghi là 5). Về mặt lý thuyết bảo mật, đây là một bước đi cực kỳ xịn xò con bò để bảo vệ quyền riêng tư.
Thế nhưng đời đ*o như là mơ. Mới đây, quốc hội Mỹ đã ra sắc lệnh cấm tiệt trò bơm nhiễu này trong các sản phẩm thống kê sắp tới. Họ yêu cầu số liệu công bố phải chính xác, không được phép "bóp méo" nhân tạo nữa.
Vụ này lập tức thổi bùng lên một cuộc chiến võ mồm nảy lửa trên khắp các diễn đàn công nghệ, đặc biệt là Hacker News. Dân tình chia làm hai phe rõ rệt:
Nhìn từ vụ drama tầm cỡ quốc gia này, anh em dev chúng ta cũng rút ra được khối điều thực tế. Đây chính là bài toán kinh điển: Security vs. Usability (Bảo mật vs. Tính hữu dụng).
Nó cũng giống như việc anh em setup một hệ thống cơ sở dữ liệu trên máy chủ của mình vậy.
Làm dev thực dụng là phải biết dung hòa. Đừng cuồng công nghệ bảo mật đến mức cực đoan (như cố đấm ăn xôi bơm nhiễu làm hỏng cả giá trị cốt lõi của dữ liệu), nhưng cũng đừng vì lười mà thả trôi an toàn thông tin của người dùng.
Nguồn: Damien Desfontaines' Blog