reCAPTCHA là gì? Tìm hiểu về dịch vụ reCAPTCHA

Recaptcha là gì? Cứ mỗi khi đăng ký một tài khoản người dùng mới, viết một bình luận hay tải về một quyển ebook, phần mềm, phần lớn máy chủ web đều yêu cầu nhập mã xác thực. Ta gọi đó là Captcha.

Vậy còn reCaptcha là gì? Trong bài viết này, Thumuavitinh.com sẽ cung cấp thêm thông tin về dịch vụ reCaptcha cũng như ứng dụng nó để các bạn có thể tham khảo.

reCAPTCHA là gì? Tìm hiểu về dịch vụ reCAPTCHA

Cứ mỗi khi đăng ký một tài khoản người dùng, viết một lời luận hay tải về một quyển ebook, phần lớn máy chủ web đều yêu cầu nhập mã xác nhận để xác thực.

Thật khó chịu khi thấy một mã xác nhận tương tự như:

Recaptcha là gì
Recaptcha là gì?

Việc máy chủ yêu cầu nhập mã xác nhận là hoàn toàn chính đáng, bởi điều đó bảo vệ chính nó trước những cuộc tấn công.

Tuy vậy, mã xác nhận loại này thật là khó nhìn ra để nhập lại. Hơn thế nữa, phần lớn những trang web trên thế giới đều dùng mã xác nhận loại này. Phải chăng họ thích gây khó khăn cho người sử dụng?

Để ý một chút, ta nhận thấy dòng chữ “reCaptcha, stop spam, read book“. Chữ “stop spam” là mục đích chính của mã xác nhận này, thế còn “read book” thì có ý nghĩa gì ở đây?

CAPTCHA có nghĩa là gì?

Trước tiên, xin được nói về nghĩa của từ CAPTCHA. Từ CAPTCHA là viết tắt của cụm từ: Completely Automated Public Turing test to tell Computers and Humans Apart, tạm dịch là: Phép thử Turing công cộng hoàn toàn tự động để phân biệt máy tính với người.

Theo http://vi.wikipedia.org/wiki/CAPTCHA là một chương trình, như bạn có thể thấy, nó là một tấm ảnh số đẩy đủ màu sắc cùng với dòng văn bản méo mó.

Nó thường được gắn vào những trang web để xác nhận rằng bạn là một con người chứ không phải một cỗ máy. Nhằm ngăn chặn tình trạng lạm dụng hoặc các máy tạo thư rác tự động.

Hiện nay, vẫn chưa có một chương trình máy tính nào có thể đọc được những văn bản méo mó như con người. Nhờ vậy, các chương trình spam, tạo thư rác tự động, không thể tấn công những trang web được bảo vệ bởi CAPTCHA.

Theo thống kê của Google, có khoảng 200 triệu CAPTCHA được giải quyết bởi con người trên toàn thế giới trong mỗi ngày. Trong các trường hợp trên, bình quân mỗi người tiêu dùng 10 giây để hoàn thành 1 CAPTCHA.

Đinh nghĩa reCaptcha

Về mặt cá nhân, thì khoảng thời gian này chẳng đáng là gì. Nhưng nếu tổng hợp những trường hợp trên, sẽ tiêu thụ ít nhất 150,000 giờ làm việc mỗi ngày. Hãy tưởng tượng, nếu chúng ta có thể tận dụng tất cả những công sức đã bỏ ra này của con người? Đó cũng chính là lý do reCAPTCHA được sinh ra.

Như vậy có thể hiểu: reCAPTCHA là một dịch vụ CAPTCHA miễn phí, đồng thời giúp cho việc số hóa những tài liệu, những quyển sách và những bài báo cũ…

Để lưu trữ những kiến thức của nhân loại và làm cho nó trở nên dễ tiếp cận hơn trên thế giới. Nhiều dự án số hóa tài liệu, sách, báo tạp chí… được viết trước thời đại máy tính, đã và đang được thực hiện.

Đầu tiên, những trang sách được các nhà nhiếp ảnh chụp lại, sau đó chuyển đổi thành văn bản nhờ vào chương trình nhận dạnh ký tự ORC (Optical Character Recognition).

Việc chuyển đổi này là rất hữu ích, vì khi chụp lại một quyển sách ta sẽ được những hình ảnh. Tập tin này rất khó để lưu trữ trên những thiết bị nhỏ, do có dung lượng khá lớn, tốn nhiều thời gian để tải về và không thể tìm kiếm được.

Vấn đề lớn ở đây là ORC không thực sự hoàn hảo. Bạn có thể hình dung điều đó dựa vào ảnh sau:

Nhờ vào khả năng trời phú, bạn hoàn toàn có thể đọc được câu này là “This aged position of society were distinguished frow“, nhưng ORC thì không.

Công dụng của reCaptcha

reCAPTCHA giúp cải thiện quá trình này bằng cách gửi những từ không thể đọc được bằng máy tính đến các trang web dưới hình thức CAPTCHA để con người giải mã.

Như vậy, những mã xác nhận mà bạn nhìn thấy trên reCAPTCHA chính là những hình ảnh được quét, chụp lại trong những quyển sách cũ mà ORC không thể đọc được. Dưới đây là ảnh minh họa quá trình tạo ra một CAPTCHA:

Nhưng nếu máy tính không biết được một CAPTCHA như vậy, làm sao máy tính biết được mã xác nhận mà người dùng nhập vào là đúng hay sai?

Đây là giải pháp: Với mỗi từ mới không thể đọc được chính xác bởi ORC, nó sẽ được trao cho người dùng kết hợp với một từ khác mà câu trả lời đã được biết. Như vậy, người dùng được yêu cầu nhập cả hai từ.

Nếu họ nhập đúng từ mà máy tính đã biết đáp án thì hệ thống sẽ công nhận là họ nhập chính xác cả hai. Đồng thời ghi nhận lại đáp án của từ mới này.

Sau đó hệ thống sẽ tiếp tục gửi từ mới này cho một số người khác nữa. Theo cách làm tương tự nhằm nâng cao hơn độ chính xác cho từ mới này.

Hiện nay, reCAPTCHA đang giúp đỡ trong việc số hóa những tài liệu phiên bản cũ của tờ New York Time và những quyển sách trên Google Books.

Như vậy, cứ mỗi lần bạn nhập mã xác nhận của  reCAPTCHA là đồng thời thực hiện hai việc, xác thực và giúp đỡ số hóa tài liệu cũ.

————————————-

Cảm ơn bạn đã đọc bài viết Recaptcha là gì từ website https://thumuavitinh.com của Vi Tính Quang Chính. Nếu bạn có thông tin khác, hãy chia sẻ với mọi người trong phần bình luận bên dưới nhé!

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Bài viết liên quan

Trả lời

Email của bạn sẽ không được hiển thị công khai. Các trường bắt buộc được đánh dấu *

Gọi ngay
Chat với chúng tôi qua Zalo
Facebook Messenger