Hóng hớt Job Postings API - quả API ngon bổ rẻ cung cấp 1.8 triệu việc làm từ 30+ ATS cho anh em tha hồ build tool tuyển dụng mà không sợ bị sập server.

Lại một ngày đẹp trời và tôi phát hiện ra một quả API chia sẻ hơn 1.8 triệu job active lẫn historical từ Mỹ, hoàn toàn miễn phí. Anh em nào đang nung nấu ý định build site tuyển dụng, làm tool phân tích thị trường hoặc đơn giản là muốn làm một side project "gõ code ra tiền" thì bơi hết vào đây mà hít hà.
Về cơ bản, Job Postings API là một dịch vụ cung cấp dữ liệu việc làm được tổng hợp từ hơn 30 Applicant Tracking Systems (ATS - hệ thống quản lý tuyển dụng cực phổ biến của các doanh nghiệp) với quy mô lên tới hơn 60,000 công ty tại Mỹ.
Một số điểm nhấn khiến anh em dev thèm thuồng:
Dưới phần bình luận, các đạo hữu lập trình đang chia phe bàn tán xôn xao về tính thực tế của quả API này. Dưới đây là vài luồng ý kiến nổi bật mà tôi nhặt nhạnh được:
Một ông có tên ansari_adin đặt ngay câu hỏi cực kỳ thực dụng: "Tin tuyển dụng có vòng đời rất ngắn, đăng 3 ngày trước là nay có khi đã bay màu rồi. Tần suất cập nhật thế nào để không hiển thị data cũ rích cho user?"
Tác giả đã nhảy vào giải thích ngay: Hệ thống đồng bộ dữ liệu mỗi sáng. Các job được coi là "active" nếu nó vẫn tồn tại trên hệ thống tuyển dụng vào sáng hôm đó. Ngoài ra, việc giữ lại dữ liệu lịch sử cũng giúp anh em có thể tra cứu ngược lại nếu muốn.
Một ông khác nhanh trí đề xuất: "Dùng dữ liệu lịch sử này để phân tích tần suất đăng job của một công ty. Từ đó đoán được tỷ lệ nghỉ việc (turnover rate) của họ thì đúng là hết nước chấm!" Ý tưởng này rất ma giáo, chắc chắn là dị giáo nhưng lại vô cùng thực tế cho các nhà phân tích dữ liệu.
Đồng đạo habibferdous lo ngại: "30 hệ thống ATS nghĩa là có 30 cách viết chức danh, cấp bậc (seniority) khác nhau. Gom raw data về mà không chuẩn hóa thì chỉ là chuyển đống rác từ nhà người ta sang nhà mình thôi."
Tác giả cũng thật thà thú nhận: Hiện tại hệ thống mới chỉ chuẩn hóa ở mức độ cao (high-level). Việc đồng bộ hóa sâu hơn về role hay tên công ty vẫn phải nhờ đến các mô hình AI hoặc do chính anh em dev tự xử lý khi ingest dữ liệu.
Một dev từng trải thốt lên: "Ai từng build mấy cái job board rác đều biết quả cực hình khi phải tự viết script đi cào dữ liệu từ LinkedIn hay Indeed. Cứ vài tuần tụi nó đổi cấu trúc web một lần là code lại bể, sập server liên tục. Việc dùng Proxy xịn để bypass mệt mỏi vô cùng. Có một API gom sẵn 30 ATS thế này đúng là cứu cánh!"
Tóm cái váy lại, quả API này là một món hời cho anh em nào thích mày mò làm side project để kiếm thêm thu nhập thụ động. Rate limit của free tier phải nói là cực kỳ hào phóng, đủ để chạy thử nghiệm MVP trước khi tính chuyện vắt sữa người dùng.
Tuy nhiên, đời không như là mơ. Việc dữ liệu chưa được chuẩn hóa sâu đồng nghĩa với việc anh em sẽ phải tốn kha khá tài nguyên để xử lý dữ liệu thô. Nhưng dù sao, có cơm ăn miễn phí thì đừng chê cơm nhão, cứ đăng ký lấy một cái API key để dành đi anh em, biết đâu mai mốt nó lại quay xe tính phí thì tiếc hùi hụi.
Nguồn: Product Hunt