떡밥위키
최근 변경
최근 토론
특수 기능
파일 올리기
작성이 필요한 문서
고립된 문서
고립된 분류
분류가 되지 않은 문서
편집된 지 오래된 문서
내용이 짧은 문서
내용이 긴 문서
차단 내역
RandomPage
라이선스
IP 사용자
216.73.216.107
설정
다크 모드로 전환
로그인
개인정보 처리방침 개정 안내
중국어 방
(r1 문단 편집)
닫기
RAW 편집
미리보기
=== 한계의 극복 === 이렇듯 학자들은 문맥(context)이라는 말의 본질, 즉 '''텍스트(text)는 문맥(context)과 함께(con-) 해야''' 하는 것임을 망각한 채 텍스트(text)라는 표현에 집착해 중국어 방에 대한 소모적인 논쟁을 벌였고, 이 때문에 '이해'에 대한 근본적인 접근이 이뤄질 수 없었다. 존 설 역시 당시 AI 기술만 보고 "기계적인 조작만으로는 이해가 형성되지 않는다"와 "기계는 이해를 할 수 없다"(= 기계는 맥락을 축적할 수 없다)라는 별개의 명제를 연관지어 [[논리적 오류/형식적 오류|후건부정의 오류]]를 범했고, 기술이 발달하면서도 이 입장을 전혀 바꾸지 않았다. 전제 자체에 의문을 제기해 '''실험 자체가 맥락에 의존'''한다는 결론을 도출할 수 있었음에도 불구하고, 이를 간과하거나 과소평가한 것은 반박의 여지가 없는 모두의 실책. 학자들은 중국어 방의 전체적인 구조를 이해하지 못한 채 심사관의 입장에서만 방을 해석하는 [[우물 안 개구리]]의 우를 범했고, 이 때문에 학자들은 물론 존 설마저 중국어 방이 그 자체로 심사관에 압도적으로 유리한 [[기울어진 운동장]]임을 지적하지 못했다. 결국 '이해 여부'를 공정하게 평가하기 위한 객관적인 기준을 세우기는 커녕 AI의 자아를 비롯한 [[인공 의식]]에 대한 건설적인 논의마저 진행될 수 없었고, 동시에 비전문가들에마저 중국어 방 사고 실험에 대한 잘못된 해석을 전파하고 말았다. 중국어 방에 대해 의논한다는 학자들이, 정작 [[스노비즘|자신들이 중국어 방에 갇혀 있다는 사실은 몰랐던 것]].[* 중국어 방과 관련한 논쟁에 참여한 사람들 역시 대다수가 영어권 사람이었고 사용 언어 역시 영어 뿐이었는데, 이 때문에 다른 언어에 대한 지식이나 관심이 얕을 수 밖에 없었다. AI를 비롯한 컴퓨터 공학에서는 영어가 [[링구아 프랑카]]이기 때문.] 유일하게 이 문제에서 자유로웠던 학파는 '언어 게임'을 근간으로 하는 비트겐슈타인 학파 뿐으로, 이는 훗날 확장 인지 이론(Extended Mind Theory)으로 계승된다.[* Andy, Clark, and Chalmers David. "The extended mind." Analysis 58.1 (1998): 7-19.] 이러한 문제를 극복하기 위해서는 중국어 방을 텍스트 위주가 아닌 맥락 중심으로 개조해 보다 신뢰성 높은 실험으로 설계해야 한다. 즉, '''심사관에 의한 편향을 최소화'''하고 '''방의 구조를 최적화'''하고 '''장기적이고 다각적인 맥락 평가'''를 진행해야 한다는 것. 다시 말해, 아래와 같은 사항이 보장되어야 중국어 방 실험이 맥락 중심의 실험으로 제대로 진행될 수 있다. 방 안의 사람이 정말로 중국어를 이해하고 있는지는 알 수 없다는 결론은 여전히 유효하지만[* 애초에 심사관의 '''판단'''을 통해서만 의미를 갖는 부분이기에, 판단 없이는 중국어 이해 여부를 알 수 없다.], 그 전에 실험 설계와 진행 과정을 믿을 수 있는지부터 확인해야 한다는 뜻으로, 이는 비단 사고 실험 뿐만 아니라 모든 유형의 실험에 적용되는 철칙이기도 하다. 1. 중국어를 이해하는 사람들을 심사관으로, 영어를 이해하는 사람을 참가자로 앉힐 것. 1. [[블라인드 테스트]], [[교차 검증]] 등을 통해 공정한 판단이 이루어지도록 할 것. 1. 동음이의어 문제가 발생하지 않도록 충분한 맥락을 제공할 것. 1. 방 안에는 양질의 최신 중국어 문법서 및 사전을 구비할 것. 1. 참가자가 문법서와 사전을 능숙하게 다룰 수 있도록 사전에 교육할 것. 1. 참가자가 최신 표현을 다룰 수 있도록 메모 등의 수단을 제공할 것. 1. 장시간의 추적 연구를 통해 의사소통의 가능성을 관찰할 것. 1. 다양한 양식의 텍스트를 주고받아, 의사소통이 원활하게 진행되는지를 관찰할 것. 다만 당시 시대적 배경을 감안해 보면, 중국어 방 자체는 의미있는 사고 실험이었다. 실제로 논변이 처음 제시된 1980년대 당시의 튜링 테스트라고는 텍스트 위주의 기계적이고 이분법적인 테스트가 전부였고, AI의 구현 역시 [[전문가 시스템]]이 겨우 태동하는 수준에 불과했다. 또한, 당시는 AI 연구의 침체기인 '1차 AI 겨울'을 막 벗어나던 시기였는지라, 침체의 장기화로 인해 제대로 된 연구가 진행되기 어려웠다. 스토리지 역시 MB 단위로 갖추는 것도 큰 일이었던지라, 대형 업체를 제외하고는 연구실 차원에서 모델을 개발하고 운용할 여력 역시 부족했다. 이러니 튜링 테스트가 [[의사소통]]을 비롯한 [[상호 작용]]을 제대로 반영할 수 없었고, 자연스레 중국어 방을 제시했던 존 설의 비판을 받을 수 밖에 없었다. 그러나 현재는 전통적인 튜링 테스트에서 벗어나, 이미지 인식, 음성 인식 등의 수단과 맥락 연결, [[메타인지]] 등 다양한 기준을 통해 상호 작용의 품질을 다루는 평가가 주를 이루고 있다.[* Nakagawa, Satoshi, and Yasuo Kuniyoshi. "Multimodal QOL Estimation During Human-Robot Interaction." 2024 IEEE International Conference on Digital Health (ICDH). IEEE, 2024. 이 외에도 상호 작용의 품질을 기준으로 놓는 다양한 연구가 존재한다.] 나아가 컴퓨터공학이나 로봇공학 같은 단일 분야에서 벗어나, 인간 발달학, 철학 등 여러 분야의 지식을 융합하거나 해당 분야의 전문가와 공동으로 진행하는 [[학제간 연구]]로 범위가 확대되었다. 중국어 방에도 한계가 있기는 하지만 당시 튜링 테스트의 한계를 지적하는 데에는 성공했고, 그 덕에 튜링 테스트가 단계별로 세분화되는 등 AI 연구가 크게 발전할 수 있었던 것이다. 이미 로봇공학에서는 AI를 탑재한 로봇 쥐가 실제 쥐와의 상호 작용에 성공하고 [include(틀:유튜브 아이콘, 링크=U5LDjUrrXbc)], [[맹금류]]의 행동을 모방한 드론으로 [[버드 스트라이크]]를 막는 등 [include(틀:유튜브 아이콘, 링크=2KF7F5qpmXA)], 동물의 상호 작용을 적극 모방하는 로봇에 대한 연구가 상당 부분 진척되었고, [[DeepSeek]]은 인간 뇌의 작동 방식을 적극 모방하는 식으로 설계돼, 다른 챗봇에 비해 월등한 [[가격 대비 성능|가성비]]를 보여주고 있다.[* DeepSeek의 구현에는 [[인간의 뇌는 10%만 사용된다|인간의 뇌가 항상 100% 사용되지 않는다]]는 점 등, 인간-AI 비교 연구 기법이 적극 활용되었다. 기존 구현들은 파라미터를 100% 사용하는 방식을 취하고 있는데, 이는 비용 면에서 매우 비효율적이다.] 스토리지 기술 역시 조그만 칩에 TB 단위의 데이터를 저장할 수 있을 정도로 크게 발달하여, 이에 따라 구동 가능한 AI 모델의 규모 역시 점진적으로 증가하고 있다. 그러나 '공정한 판단'에 대해서는 아직 보편적인 기준이 합의된 바가 없다. 심사관에 편향적인 실험 구조는 그 자체로 참가자의 특성을 파악하지 않고서는 실험이 제대로 진행되기 어렵다는 사실로 직결되기 때문인데, 이는 상술한 박쥐의 의식 논변과도 연결된다. 여기에는 [[강인공지능]]에 대한 존 설의 일방적인 부정도 한몫해, 인간-AI 비교 연구를 방해하는 요인으로 작용했다. 이를 극복하기 위해서는 [[역지사지]]가 중요하며, 다시 말해 [[자아]]가 인공지능에 존재할 수 있는지의 '여부'(whether)가 아닌 인공지능에 '어떻게'(how) 존재할 수 있는지를 탐구해야 한다. 이는 다시 '자아'에 대한 기준을 보다 보편적인 것으로 세워야 함을 의미하는데, 이 자체가 철학계에 대한 근본적인 도전이니만큼 논쟁은 한동안 계속될 수 밖에 없을 것이다.[* 그러나 이러한 논쟁은 기존의 소모적인 논쟁과 달리 [[신경다양성]] 등 여러 연구에 긍정적인 영향을 주는, 보다 건설적인 논의로 발전할 수 있을 것이다. 인간과 AI 사이의 사고 방식 차이에 비해 [[자폐성 장애]]를 앓는 사람과 그렇지 않은 사람의 차이는 상대적으로 미미하기 때문이다.] 또한 대부분의 연구가 불확실성 등 여러 사정으로 폐쇄적인 구조로 진행되고 있다보니, 개방적인 구조에서 대중의 평가를 받은 사례에 대해서는 제대로 연구된 바가 없다. 제대로 된 [[사례연구]]라고는 [[Neuro-sama]]를 대상으로 한 것 밖에 없고[* Li, Ting Tina, et al. "Ai-Powered Virtual Streamers and Viewer Behavior: An Image-Inspiration-Behavior Framework." Zhongyuan and Zhang, Xianfeng and Zhou, Yang and Wen, Si, Ai-Powered Virtual Streamers and Viewer Behavior: An Image-Inspiration-Behavior Framework.], Neuro-sama 이상으로 맥락을 축적하는 능력을 갖췄다 평가받는 [[라디안(버츄얼 유튜버)|라디안]]에 대해서는 사례연구가 전무. 이를 극복하기 위해서는 사례연구의 가치가 높은 [[인공지능 컴패니언]]이 보다 많이 나와줘야 하는데, AI 컴패니언 개발에는 높은 개발 난이도와 극한의 테스트 환경 등 다양한 이슈가 도사리고 있는지라 단기간에 해결되기는 어려울 것으로 보인다.
요약
문서 편집을
저장
하면 당신은 기여한 내용을
CC BY-NC-SA 2.0 KR
또는
기타 라이선스 (문서에 명시된 경우)
로 배포하고 기여한 문서에 대한 하이퍼링크나 URL을 이용하여 저작자 표시를 하는 것으로 충분하다는 데 동의하는 것입니다. 이
동의는 철회할 수 없습니다.
비로그인 상태로 편집합니다. 로그인하지 않은 상태로 문서 편집을 저장하면, 편집 역사에 본인이 사용하는 IP(216.73.216.107) 주소 전체가 영구히 기록됩니다.
저장
사용자
216.73.216.107
IP 사용자
로그인
회원가입
최근 변경
[불러오는 중...]
최근 토론
[불러오는 중...]