
Lại một ngày nữa trên cõi mạng, khi các "pháp sư" chán fix bug Jira mà quay sang cào data chính phủ để hít hà drama chính trị. Lần này, một anh em dev đã vác Playwright đi scrape trang của Bộ Tư Pháp Mỹ (DOJ) để xem các đời tổng thống đã "ân xá" cho những ai.
Chuyện là một thanh niên xem video chém gió trên mạng, cay cú vì đ*o có chỗ nào verify thông tin dễ dàng. Thế là lão xắn tay áo lên build luôn con hàng Pardonned.com - một database cho phép search mọi lệnh ân xá của US.
Tech stack thì đúng chuẩn ngon-bổ-rẻ của dân indie:
Code được open-source luôn trên Github cho anh em vào săm soi. Nói thật, để bóc tách được mớ text lộn xộn từ web nhà nước thì tool phải xịn, đôi khi anh em còn cần sắm thêm con vps cắm tool cào ngày đêm mới ra ngô ra khoai được.
Data vừa lên sóng là các bô lão trên Hacker News xông vào mổ xẻ ngay tắp lự. Drama nổ ra ở mấy luồng chính:
1. Đội soi bug và đòi feature: Nhiều lão quái vào khịa ngay: "Thế ân xá vụ bạo loạn Jan 6th của Trump đâu? Án giảm nhẹ của Biden đâu?". Tác giả đành đổ mồ hôi hột giải thích là tool đang dev, từ từ rồi sẽ update. Ác cái là DOJ lưu text ngu quá, ông Trevor Milton bị phạt 500 củ đô bồi thường mà con bot cào không ra vì... text không ghi rõ theo format.
2. Bàn tròn chính trị và quyền "bá đạo": Một phe nhảy dựng lên vụ Biden ân xá phủ đầu 11 năm cho con trai Hunter Biden. Khá nhiều anh em kêu gào đây là bug của nền dân chủ. Nhưng một pháp sư ẩn danh liền vác lịch sử ra vả lại: Thời xưa Gerald Ford còn ân xá trắng án hoàn toàn cho Richard Nixon vụ Watergate cơ, án ma túy/thuế ăn thua gì.
3. Án oan và những câu chuyện chát chúa: Nhiều người bất ngờ khi thấy thời Obama ân xá nhiều vãi đạn. Nhưng bới ra mới thấy, đa phần là án ma túy phi bạo lực từ thập niên 90 - thời mà luật ngáo ngơ đến mức tống người ta vào tù 30 năm vì tàng trữ tí cỏ. Có người còn kể lại câu chuyện về một người phụ nữ bản địa Mỹ bị đi tù 10 năm chỉ vì... đ*o chịu ra tòa làm chứng chống lại chồng mình. Lúc này, quyền ân xá lại giống như một cái "hotfix" cho một hệ thống pháp luật đầy bug.
Bỏ qua chuyện chính trị nước Mỹ, bài học cho anh em mình ở đây là gì? Dữ liệu công cộng (civic data) luôn là một mỏ vàng cho các side project.
Chính phủ thì giữ data, nhưng khả năng làm UI/UX và search của họ thì đa phần là như hạch (hoặc cố tình như hạch). Chỉ cần anh em biết dùng tool đơn giản (Playwright + SQLite), giải quyết đúng chỗ ngứa của cộng đồng là auto ăn sao Github.
Tuy nhiên, trước khi định làm một trang tương tự cho data ở... khụ khụ, nước nào đó, thì anh em nhớ cân nhắc kỹ kẻo lại bị khóa mõm hoặc bế đi uống nước chè nhé!
Drama Hacker News: Dev rảnh rỗi build trang check data ân xá của Tổng thống Mỹ bằng Playwright và SQLite. Giang cư mận chia phe combat cực gắt.