Nghi ngờ về reCaptcha của Google? Đây là một thay thế phổ biến

hCaptcha giúp các công ty máy học có được dữ liệu của họ được dán nhãn, trả tiền cho các nhà xuất bản vì sự cố của họ và người dùng không biết sự khác biệt.
Nghi ngờ về reCaptcha của Google?  Đây là một thay thế phổ biến
[Hình ảnh: lịch sự hCaptcha ]
BỞI KATHARINE SCHWAB3 PHÚT ĐỌC
Vào mùa thu năm 2018, Google đã phát hành một phiên bản reCaptcha mới, trình phát hiện bot được sử dụng rộng rãi của công ty. reCaptcha v3, như cách gọi của nó, rất tốt trong việc phát hiện các bot nhưng nó có một mặt tối , vì các nhà nghiên cứu nghi ngờ rằng Google đang xâm phạm quyền riêng tư của người dùng để cung cấp cho hệ thống.

May mắn thay, có sự thay thế cho reCaptcha cho chủ sở hữu trang web không tin tưởng Google Google và có thể sử dụng thêm một chút tiền mặt.

Được gọi là hCaptcha , đó là một trình phát hiện bot hoạt động giống như người dùng captcha đã quen với việc họ được yêu cầu dán nhãn những gì họ nhìn thấy trong các hình ảnh khác nhau. Nhưng thay vì hiển thị hình ảnh của Google, hình ảnh của Google, công ty sử dụng để đào tạo các thuật toán học máy của mình, hCaptcha hiển thị cho người dùng hình ảnh từ bộ dữ liệu, thuộc về các công ty khác cũng cần hình ảnh được dán nhãn cho các ứng dụng học máy. Về lý thuyết, dịch vụ này giúp mọi người: bạn chứng minh bạn không phải là bot trong khi giúp các công ty trau dồi thuật toán của họ và các trang web kiếm tiền từ toàn bộ trao đổi.


[Hình ảnh: lịch sự hCaptcha ]
Bởi vì việc dán nhãn chính xác rất có giá trị đối với các công ty này, các trang web lưu trữ hCaptcha được trả tiền dựa trêncó bao nhiêu người dùng của họ nhấp qua hCaptcha và trả lời câu hỏi thành công. Tùy thuộc vào lưu lượng truy cập của họ và số lượng bot tấn công họ, các trang web có thể kiếm hàng ngàn đô la mỗi tháng. Đó là một thỏa thuận tốt cho các công ty máy học cần mọi người gắn nhãn dữ liệu của họ và cho các trang web muốn bảo mật hình ảnh xác thực và một số tiền mặt. Đối với người dùng: Trải nghiệm vẫn giống như mọi khi, mặc dù bạn có thể thấy sự khác biệt là bạn nhìn kỹ, bởi vì sẽ có logo hCaptcha thay cho biểu tượng reCaptcha mà bạn đã sử dụng. Ngày nay, 10 triệu người tương tác với hCaptcha mỗi tháng trên hàng ngàn trang web, cung cấp năng lượng cho hàng chục đến hàng trăm dự án dán nhãn máy học tại một thời điểm.
hCaptcha ( người nổi tiếng dành cho con người ) là đứa con tinh thần của Eli-Shaoul Khedouri, một doanh nhân lâu năm và chuyên gia AI, người sáng lập công ty máy học Intuition Machinesvào năm 2017. Tại Intuition Machines, Khedouri và nhóm của mình xây dựng các thuật toán học máy quy mô lớn cho các công ty Fortune 50. Trong khi Khedouri từ chối chia sẻ thông tin cụ thể vì các thỏa thuận không tiết lộ, ông nói rằng Trực giác tạo ra các thuật toán có thể làm những việc như phân tích nội dung của video. Để hoàn thành các nhiệm vụ như thế này, các mô hình của Trực giác cần hàng triệu nếu không phải hàng tỷ điểm dữ liệu, phần lớn phải được mọi người dán nhãn. Khi họ có các video hoặc hình ảnh được chú thích, nhóm của Trực giác có thể bắt đầu dạy một thuật toán cách nhận biết những gì đang diễn ra trong video. Chúng tôi thực sự đã vô tình tham gia vào công việc captcha vì chúng tôi trở thành một người tiêu dùng lớn lao động [chú thích của con người], theo ông Kh Khouri. Dịch vụ có sẵn không thực sự là những gì chúng tôi muốn.


[Hình ảnh: lịch sự hCaptcha ]
Tìm đủ người để gắn nhãn các bộ dữ liệu lớn như vậy là một thách thức nghiêm trọng. Đầu tiên, Khedouri đã cố gắng xây dựng đội ngũ của mình tại Việt Nam, người có thể chú thích các bộ dữ liệu. Nhưng một số ngày anh ấy có đủ công việc cho 12 người và những ngày khác anh ấy có đủ công việc cho 50. Vì lượng dữ liệu cần ghi nhãn thay đổi rất nhiều dựa trên bất kỳ dự án nào mà nhóm đang thực hiện, có đầy đủ nhóm thời gian không phải là cách giải quyết hiệu quả nhất về chi phí (mặc dù có lẽ tốt hơn cho người lao động).

Thay vào đó, Khedouri chuyển sang làm nông dân captcha Những người làm công việc nhấp chuột được trả một phần trăm xu để giải quyết captcha trên internet. Nhóm của ông đã xây dựng một nền tảng cho những người nông dân captcha để dán nhãn cho các bộ dữ liệu cho Máy trực giác và thiết kế các biện pháp để đánh giá mức độ chính xác của mỗi nhãn nông dân. Đó là cách hiệu quả nhất, ít tốn kém nhất để Khedouri gắn nhãn dữ liệu của mình vào thời gian thực.

hCaptcha có cùng nguồn gốc với nền tảng này mà Khedouri xây dựng chỉ để Intuition Machines sử dụng, nhưng kể từ tháng 1 năm 2019, nó đã được mở cho bất kỳ công ty nào cần bộ dữ liệu được dán nhãn. Và thay vì những người nông dân captcha đang thực hiện việc dán nhãn, đó là những người dùng internet thường xuyên như bạn và tôi. Theo trang web của hCaptcha , các công ty sẽ trả khoảng 1.11 đô la cho một triệu hình ảnh cần một nhãn.

Tất nhiên, người dùng có thể chùn bước trước khái niệm làm việc miễn phí cho các công ty, một hiện tượng phổ biến trong thế giới công nghệ . Khedouri đã thiết lập hCaptcha để tất cả các khoản thanh toán cho các trang web sẽ được xuất bản thông qua Giao thức con người, một sổ cái phi tập trung chạy trên blockchain Ethereum. Điều đó có nghĩa là ít nhất bạn có thể thấy những trang web nào đang kiếm tiền từ lao động của mình, mặc dù không phải dữ liệu bạn dán nhãn sẽ được sử dụng cho mục đích gì. (Tất cả các dự án dán nhãn dữ liệu đều theo thỏa thuận không tiết lộ vì chủ yếu dành cho các công ty lớn, Khedouri nói.)

Vì vậy, hCaptcha cung cấp một dịch vụ thay thế minh bạch hơn nếu không chính xác hoàn hảo cho một trong những dịch vụ miễn phí phổ biến nhất của Google. Khi làm như vậy, nó gia nhập hàng ngũ các dịch vụ nhỏ hơn trong trình duyệt , tìm kiếm và phân tích mà những người tập trung vào quyền riêng tư có thể hướng tới nếu họ muốn thoát khỏi phạm vi phổ biến của người khổng lồ công nghệ.

Nhận xét

Bài đăng phổ biến từ blog này

Căn hộ ấm cúng này có thể được thả xuống các tòa nhà hiện có và chỉ tốn $ 11K

Biểu đồ hấp dẫn này cho thấy cuộc sống ở Mỹ đã thay đổi như thế nào kể từ năm 2003

Pottery Barn đang phát hành một bộ sưu tập của Friends Friends (bao gồm cả bàn bào chế của Rachel)