임시조치, 문의: [email protected]
CAPTCHA
최근 수정 시각: ()
캡챠에서 넘어옴
분류
1. 개요 [편집]
Completely Automated Public Turing test to tell Computers and Humans Apart.
컴퓨터와 인간을 구분하기 위한 완전 자동화된 공개 튜링 테스트
CAPTCHA(캡차)는 웹사이트에 접속하는 사용자가 실제 사람인지, 아니면 자동으로 작업을 수행하는 프로그램(봇)인지를 구별하기 위해 고안된 테스트다. 당신이 인터넷을 하면서 '나는 로봇이 아닙니다' 체크박스를 누르거나, 흐릿한 글씨를 입력하거나, 자동차·자전거·신호등이 포함된 사진을 골라본 경험이 있다면 이미 캡차를 수없이 수행한 것이다.
그 시초는 1999년으로 거슬러 올라가는데, 최고의 컴퓨터 과학 대학을 뽑는 온라인 투표에서 카네기 멜런 대학교(CMU)와 MIT 학생들이 자동으로 투표하는 봇을 만들어 경쟁적으로 투표수를 늘리는 일이 발생했다. 이 사건을 계기로 CMU 연구진들이 봇에 의한 어뷰징을 막기 위한 기술을 개발하게 된 것이 바로 캡차다.
컴퓨터와 인간을 구분하기 위한 완전 자동화된 공개 튜링 테스트
CAPTCHA(캡차)는 웹사이트에 접속하는 사용자가 실제 사람인지, 아니면 자동으로 작업을 수행하는 프로그램(봇)인지를 구별하기 위해 고안된 테스트다. 당신이 인터넷을 하면서 '나는 로봇이 아닙니다' 체크박스를 누르거나, 흐릿한 글씨를 입력하거나, 자동차·자전거·신호등이 포함된 사진을 골라본 경험이 있다면 이미 캡차를 수없이 수행한 것이다.
그 시초는 1999년으로 거슬러 올라가는데, 최고의 컴퓨터 과학 대학을 뽑는 온라인 투표에서 카네기 멜런 대학교(CMU)와 MIT 학생들이 자동으로 투표하는 봇을 만들어 경쟁적으로 투표수를 늘리는 일이 발생했다. 이 사건을 계기로 CMU 연구진들이 봇에 의한 어뷰징을 막기 위한 기술을 개발하게 된 것이 바로 캡차다.
2. 원리 [편집]
캡차의 핵심 원리는 '컴퓨터에게는 어렵지만, 인간에게는 비교적 쉬운 문제'를 제시하는 것이다.
초창기 캡차는 주로 왜곡되거나, 노이즈가 섞이거나, 여러 겹으로 겹쳐진 글자를 보여주고 그대로 입력하게 하는 방식이었다. 이런 이미지는 OCR(광학 문자 인식) 프로그램이 쉽게 읽지 못하도록 만들어졌다. 하지만 시간이 지나며 AI 기술이 발전하자, 웬만한 글자 캡차는 AI가 사람보다 더 잘 풀게 되었다.
이 때문에 현대의 캡차는 이미지 인식 기반으로 진화했다. "도로 표지판이 있는 타일을 모두 고르시오", "굴뚝 사진을 고르시오" 와 같이 특정 사물을 인식하고 선택하는 과제를 낸다. 인간은 사진 속 사물의 맥락과 형태를 쉽게 이해하지만, AI에게는 여전히 어려운 작업[1]이기 때문이다.
흥미롭게도, 우리가 캡차를 푸는 행위는 기업의 AI를 '공짜로' 훈련시키는 데이터 라벨링 작업이 되기도 한다. 예를 들어 구글 reCAPTCHA는 사용자들이 고른 '자동차'나 '표지판' 데이터를 자율주행 AI 개발에 활용했다. 말 그대로 전 세계인이 집단지성으로 AI를 가르쳐주고 있는 셈이다.
초창기 캡차는 주로 왜곡되거나, 노이즈가 섞이거나, 여러 겹으로 겹쳐진 글자를 보여주고 그대로 입력하게 하는 방식이었다. 이런 이미지는 OCR(광학 문자 인식) 프로그램이 쉽게 읽지 못하도록 만들어졌다. 하지만 시간이 지나며 AI 기술이 발전하자, 웬만한 글자 캡차는 AI가 사람보다 더 잘 풀게 되었다.
이 때문에 현대의 캡차는 이미지 인식 기반으로 진화했다. "도로 표지판이 있는 타일을 모두 고르시오", "굴뚝 사진을 고르시오" 와 같이 특정 사물을 인식하고 선택하는 과제를 낸다. 인간은 사진 속 사물의 맥락과 형태를 쉽게 이해하지만, AI에게는 여전히 어려운 작업[1]이기 때문이다.
흥미롭게도, 우리가 캡차를 푸는 행위는 기업의 AI를 '공짜로' 훈련시키는 데이터 라벨링 작업이 되기도 한다. 예를 들어 구글 reCAPTCHA는 사용자들이 고른 '자동차'나 '표지판' 데이터를 자율주행 AI 개발에 활용했다. 말 그대로 전 세계인이 집단지성으로 AI를 가르쳐주고 있는 셈이다.
3. 주요 CAPTCHA 종류 [편집]
3.1. Google reCAPTCHA [편집]
- v1: 초창기의 알아보기 힘든 텍스트를 입력하는 방식. 현재는 거의 사용되지 않는다.
- v2: "I'm not a robot" 체크박스를 누르는 방식. 체크 후 사용자의 마우스 움직임, 클릭 속도, 접속 패턴 등을 분석하여 봇으로 의심되면 이미지 퍼즐을 제시한다. 우리가 흔히 아는 '신호등 고르기'가 바로 이것이다.
- v3: 사용자가 인지하지 못하는 사이 백그라운드에서 작동하는 방식. 웹사이트에서의 활동 패턴을 점수(0.0~1.0)로 매겨 봇일 확률을 판단한다. 사용자는 캡차의 존재조차 모르는 경우가 많아 사용자 경험은 가장 좋지만, 웹사이트 방문 기록 등 광범위한 정보를 수집한다는 점에서 개인정보 침해 논란이 꾸준히 제기된다.
3.2. hCaptcha [편집]
hCaptcha
구글의 정보 독점에 대한 비판이 커지면서 대안으로 떠오른 서비스다. Cloudflare가 잠시 기본 캡차로 채택하고, 디스코드가 도입하면서 인지도가 크게 올랐다.
UI는 reCAPTCHA v2와 거의 유사하게 9개의 이미지 중 특정 사물을 고르는 방식이다. 하지만 극악의 난이도로 사용자들 사이에서 악명이 높다. 예를 들면 다음과 같다.
구글의 정보 독점에 대한 비판이 커지면서 대안으로 떠오른 서비스다. Cloudflare가 잠시 기본 캡차로 채택하고, 디스코드가 도입하면서 인지도가 크게 올랐다.
UI는 reCAPTCHA v2와 거의 유사하게 9개의 이미지 중 특정 사물을 고르는 방식이다. 하지만 극악의 난이도로 사용자들 사이에서 악명이 높다. 예를 들면 다음과 같다.
- 모호한 지시: 비행기 사진을 여러 개 보여주며 '비행기'가 아닌 '여객기'를 고르라고 하거나, AI가 생성한 듯한 기괴한 이미지를 보여주며 정체를 알 수 없는 물체를 고르라고 한다. 눈밭의 늑대 사진을 보여주며 "냉동액체"를 고르라는 지시가 커뮤니티에서 밈이 되기도 했다.
- 판정 문제: 분명히 정답을 골랐음에도 계속해서 통과시켜주지 않고 새로운 문제를 내는 경우가 많아 사용자의 분노를 유발한다.
hCaptcha는 기업에게 데이터를 판매하여 수익을 얻는 비즈니스 모델을 가지고 있으며, 사용자가 푸는 문제들은 고객사가 요청한 데이터 라벨링 작업인 경우가 많다.
3.3. Cloudflare Turnstile [편집]
Cloudflare Turnstile
Cloudflare에서 개발한 최신 캡차 솔루션으로, 사용자에게 퍼즐을 풀게 하지 않는 것을 목표로 한다.
Turnstile은 웹페이지에 보이지 않게 숨어서 사용자의 브라우저 환경, 접속 시간, 방문 기록 등 비개인적인 신호들을 분석하는 스크립트를 실행한다. 이 데이터를 통해 AI 모델이 사람인지 봇인지를 판단한다. 대부분의 경우 사용자는 아무런 과제 없이 자동으로 통과된다.
만약 시스템이 사용자를 의심스럽다고 판단하더라도, 복잡한 이미지 퍼즐 대신 간단히 체크박스 하나만 클릭하도록 요청한다. 이처럼 사용자 경험을 거의 해치지 않기 때문에 '보이지 않는 캡차'로 불리며 많은 웹사이트에서 채택하는 추세다. 2023년부터 모든 사용자에게 무료로 풀려 접근성도 좋아졌다.
떡밥위키에서도 사용한다.
Cloudflare에서 개발한 최신 캡차 솔루션으로, 사용자에게 퍼즐을 풀게 하지 않는 것을 목표로 한다.
Turnstile은 웹페이지에 보이지 않게 숨어서 사용자의 브라우저 환경, 접속 시간, 방문 기록 등 비개인적인 신호들을 분석하는 스크립트를 실행한다. 이 데이터를 통해 AI 모델이 사람인지 봇인지를 판단한다. 대부분의 경우 사용자는 아무런 과제 없이 자동으로 통과된다.
만약 시스템이 사용자를 의심스럽다고 판단하더라도, 복잡한 이미지 퍼즐 대신 간단히 체크박스 하나만 클릭하도록 요청한다. 이처럼 사용자 경험을 거의 해치지 않기 때문에 '보이지 않는 캡차'로 불리며 많은 웹사이트에서 채택하는 추세다. 2023년부터 모든 사용자에게 무료로 풀려 접근성도 좋아졌다.
떡밥위키에서도 사용한다.
3.4. 기타 [편집]
GeeTest: 글자를 순서대로 클릭하거나, 퍼즐 조각을 이동시켜 그림을 완성시키는 형태의 캡차. 중국산으로 샤오미, SF Express와 같은 중국 업체들이 주로 사용한다.
Arkose MatchKey: 그림의 방향을 회전 시키는 형태의 캡차.
Arkose MatchKey: 그림의 방향을 회전 시키는 형태의 캡차.
4. 문제점 및 한계 [편집]
- 웹 접근성 저하: 시각 장애인은 이미지 기반 캡차를 풀 수 없다는 근본적인 문제가 있다. 이를 위해 음성 캡차가 제공되지만, 배경 소음이 심하거나 발음이 불분명해 비장애인도 알아듣기 어려운 경우가 많다.
- 사용자 피로감: 정상적인 사용자임에도 불구하고 몇 번이고 캡차를 반복해서 풀어야 하는 경우가 잦다. 특히 hCaptcha처럼 난이도가 비정상적으로 높거나, 타일의 경계선에 걸친 사물을 선택해야 할지 말아야 할지 고민하게 만드는 문제는 상당한 스트레스를 유발한다.
- AI와의 영원한 전쟁: AI가 발전할수록 캡차는 뚫리고, 그러면 개발자는 더 어려운 캡차를 만든다. 결국 이 군비 경쟁의 피해는 고스란히 일반 사용자들에게 돌아간다. 이미 특정 캡차들은 AI가 인간보다 더 높은 성공률로 푼다는 연구 결과도 나왔다.
- 인력 동원: 캡차를 뚫기 위해 AI 대신 제3세계의 저임금 노동자를 고용하는, 이른바 '캡차 농장'도 성행하고 있다. 봇이 캡차에 막히면 이 화면을 원격으로 사람에게 전송하고, 사람이 문제를 대신 풀어주는 방식이다.
5. 기타 [편집]
[1] 어디까지나 '과거에는' 그랬다. 최근 이미지 생성 및 인식 AI의 발전 속도를 보면 이 전제도 곧 깨질 가능성이 높다.
Contents are available under the CC BY-NC-SA 2.0 KR; There could be exceptions if specified or metioned.
개인정보 처리방침
개인정보 처리방침