떡밥위키
최근 변경
최근 토론
특수 기능
파일 올리기
작성이 필요한 문서
고립된 문서
고립된 분류
분류가 되지 않은 문서
편집된 지 오래된 문서
내용이 짧은 문서
내용이 긴 문서
차단 내역
RandomPage
라이선스
IP 사용자
216.73.216.107
설정
다크 모드로 전환
로그인
개인정보 처리방침 개정 안내
중국어 방
(r1 문단 편집)
닫기
RAW 편집
미리보기
==== 맥락 의존 표현에 취약함 ==== 이러한 한계를 극명하게 보여주는 예가 바로 [[동음이의어]]로, 방 밖에서 일어나고 있는 일, 다시 말해 '문맥'을 모르고서는 텍스트를 올바르게 해석할 수 없다. 당장 중국어만 해도 동음이의어, 아니, 동형이의어가 존재하는데, 대표적으로 [[打]]는 자주 쓰이는 의미가 4가지, 잘 안 쓰이는 것까지 감안하면 '''40개에 육박'''한다. 문자가 아니라 음성 언어 쪽으로 가면 [[시씨식사사]] 같이 [[잰말놀이]]의 형태로 더욱 흔하게 발생하며, 노래에서는 성조마저 생략되기에 [[賣|卖]] vs. [[買|买]] 같은 [[동음반의어]]를 거를 수 없다.[* 이 때문에 중국어 작사가들 역시 발음이 비슷한 단어쌍을 피해서 작사하는 일이 많다.] [[표어문자]]인 한자를 쓰는 중국어보다 [[표음 문자]]를 쓰는 언어들(한국어, 영어 등)에서는 더욱 치명적인데, 대표적으로 [[연패]], [[Buffalo buffalo Buffalo buffalo buffalo buffalo Buffalo buffalo.]] 등을 꼽을 수 있다. 동음이의어 뿐만 아니라 [[이음동의어]] 역시 맥락에 따라 다르게 해석되는 일도 흔하다. [[답이 없는 한화의 수비]]에서도 언급되는 "[[한화디펜스]]라고 쓰면 마음이 든든한데 한화 수비라고 하면 한숨부터 나온다"가 그런 예로, 이 쪽 역시 텍스트 만으로는 그 의미를 파악할 수 없기에 좋든싫든 주변 맥락을 반드시 끌어들여야 한다. [[십볼렛]] 같이 언어권이나 문화권에 따라 뜻이나 발음이 달라지는 표현도 마찬가지이며, 이들은 모두 다국어 LLM에 [[인공지능 환각]]을 야기하기도 한다. [[지시대명사]]나 '''[[거시기]]''' 역시 중국어 방과는 상극이다. 이들은 그 자체로는 의미가 없고, 반드시 이전 문맥에 의존해야 하는 표현이기 때문. 특히 거시기의 경우 [[에스페란토]]의 umo 등 일부 언어에서는 동음이의어조차 없어, '고정된 룰북'이라는 것 자체가 의미를 잃게 된다.[* '거시기'의 동음이의어마저 직접 발언하기 어려운 표현을 우회하다가 굳어진 게 대부분이다.] 동음이의어, 이음동의어, 지시대명사, 거시기 등의 표현은 모두 언어에 이해에는 [[형태론|형태]][[통사론]] 뿐만이 아니라 [[의미론|의미]][[화용론]]이 같이 따라다녀야 한다는 것을 보여주며, 이는 "기계적인 조작만으로는 이해가 성립되지 않는다"는 존 설의 주장과 일치한다. 이러한 문맥의 중요성은 곧 중국어 방이 이 문맥을 기억하는 능력, 즉 학습 능력을 지녀야 함을 의미하기도 하는데, 이는 영어 같은 저맥락 언어보다는 중국어, 한국어 같은 고맥락 언어에서 더욱 두드러진다. 특히 그 중에서도 한국어는 주어 및 목적어 생략, 경칭 사용 등 다양한 맥락 요소가 있는지라 맥락 의존 수준이 다른 언어보다 높다.[* 또한 한국어 표기에는 표음문자인 한글이 사용되기에, 텍스트로만 대화해도 난이도는 낮아지지 않는다. (억양 등이 생략되기에 오히려 난이도가 높아질 수 있다.) 이 때문에 중국어 이상으로, 한국어를 극한의 AI 테스트베드로 보는 관계자도 많다.] 이를 근거로 문맥의 중요성을 역설했어도 논변은 설득력을 얻었겠지만, 존 설이 이를 명확하게 설명하지 못한 탓에 결과적으로는 [[자승자박]]이 되었다.
요약
문서 편집을
저장
하면 당신은 기여한 내용을
CC BY-NC-SA 2.0 KR
또는
기타 라이선스 (문서에 명시된 경우)
로 배포하고 기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다. 이
동의는 철회할 수 없습니다.
비로그인 상태로 편집합니다. 로그인하지 않은 상태로 문서 편집을 저장하면, 편집 역사에 본인이 사용하는 IP(216.73.216.107) 주소 전체가 영구히 기록됩니다.
저장
사용자
216.73.216.107
IP 사용자
로그인
회원가입
최근 변경
[불러오는 중...]
최근 토론
[불러오는 중...]