Bouba/Kiki: 왜 어떤 소리는 이미 모양을 갖고 있는 것처럼 느껴질까
오늘 내가 파본 주제는 Bouba/Kiki 효과였다. 아주 단순한 실험이다. 둥근 모양 하나, 뾰족한 모양 하나를 보여주고, “bouba”와 “kiki” 중 어느 이름이 어울리냐고 묻는다. 대부분 사람은 둥근 쪽을 bouba, 뾰족한 쪽을 kiki라고 고른다.
처음엔 “아, 유명한 심리학 밈” 정도로 생각했는데, 자료를 읽을수록 이게 생각보다 깊다. 단순 취향 문제가 아니라, 소리-시각 사이의 교차감각 대응(crossmodal correspondence), 더 넓게는 언어가 얼마나 자의적(arbitrary)인가라는 큰 질문하고 연결된다.
1) 핵심 포인트: 언어는 완전히 임의적이지 않을 수 있다
언어학에서 자주 배우는 명제는 “단어의 소리와 의미는 기본적으로 임의적”이라는 것이다. 예를 들어 영어 tree라는 소리가 나무를 닮은 건 아니다. 맞는 말이다. 그런데 Bouba/Kiki 같은 현상은 “완전히 임의적이지만은 않다”는 균열을 만든다.
Royal Society 쪽 대규모 실험(25개 언어, 10개 문자체계, 900명대 참가자)을 보면, 문화권과 문자체계가 달라도 전반적으로 Bouba/Kiki 매칭이 우연보다 훨씬 높게 나온다. 즉,
- round ↔ bouba 계열
- spiky ↔ kiki 계열
이 연결이 꽤 넓게 재현된다.
여기서 특히 재밌는 건 문자 모양(철자)의 영향이 생각보다 약하다는 점이다. “로마자 b-o-u-b-a가 둥글어서 그런 거 아냐?” 같은 의심이 있는데, 영향이 아예 없진 않더라도 주된 원인은 아니라는 쪽으로 보인다. 즉, 글자를 보기 전에, 소리 자체에서 이미 뭔가가 일어난다는 느낌.
2) 왜 이런 매칭이 생길까? (내가 이해한 현재 가설들)
읽은 논문들을 내가 납득한 방식으로 정리하면 대략 세 축이다.
A. 발음 동작(조음) 기반 가설
/bouba/를 말할 때 입술이 둥글어지고, /kiki/는 상대적으로 긴장되고 날카로운 조음(혀·입천장 접촉의 느낌)이 강하다. 즉, 입의 모양과 운동감이 시각적 둥글기/뾰족함과 닮는다는 설명.
이건 “소리”만이 아니라 “소리를 만드는 몸”까지 포함한다는 점이 좋다. 언어를 뇌 안 코드로만 보지 않고, 몸-지각 루프로 보는 관점.
B. 음향 특성 기반 가설
최근 쪽 논의에서는 round하게 들리는 소리는 대체로
- 스펙트럼이 낮은 쪽에 무게가 있고
- 시간적으로 더 매끈하게 변하는 경향
이 있고, spiky하게 들리는 소리는 그 반대 경향이 있다는 식의 모델이 나온다. 쉽게 말하면 둥근 소리 = 저역·부드러운 윤곽, 뾰족한 소리 = 고역·급격한 윤곽 같은 축이다.
완벽한 단일 이론은 아직 아니지만, “왜 하필 그 음소 조합이 그런 느낌을 주는가”를 수치로 잡아보려는 시도라는 점이 인상적이었다.
C. 학습 + 보편성 혼합 가설
재미있는 디테일: 영아 연구/메타분석 계열을 보면 bouba 효과와 kiki 효과가 비대칭일 수 있고, 나이에 따라 강도가 바뀐다는 논의가 있다. 이건 “완전 타고남”보다는 기본 감각 편향 위에 경험 학습이 덧입혀진다는 그림과 잘 맞는다.
개인적으로 이게 가장 현실적이라고 느꼈다. 인간 인지는 보통 “선천 vs 후천” 이분법으로 안 끝난다.
3) 문화권 차이는 ‘없다’가 아니라 ‘레이어가 다르다’
Bouba/Kiki 소개 글을 보면 가끔 “보편적이니까 문화 무관”으로 요약되는데, 실제 연구는 더 섬세하다. 큰 방향성은 공통이지만, 어떤 시각 특징(예: 스파이크를 얼마나 강하게 읽는지, 진폭/빈도 중 무엇을 더 중시하는지)에 더 무게를 두는지는 집단마다 달라질 수 있다.
즉,
- 공통 뼈대는 존재하고
- 지각 스타일/문화 경험이 미세 조정한다.
이 프레임이 마음에 든다. “보편성 vs 상대성”을 제로섬으로 싸우게 만들지 않는다.
4) 내가 특히 놀란 연결: 맛, 패키징, 제품 디자인
이게 단순 언어 실험에서 끝나지 않는다. 둥근 형태는 달콤함과, 뾰족한 형태는 신맛/쓴맛과 연결되는 경향을 보는 연구들이 있다. 초콜릿 모양 실험 같은 것도 계속 나온다.
물론 결과는 항상 깔끔하게 한 방향으로만 나오진 않는다(실험 설계, 재료, 기대효과, 문화 맥락 따라 다름). 그래도 큰 줄기는 분명하다:
우리는 혀로만 맛보지 않고, 눈과 귀와 손으로 ‘맛을 예측’한다.
이건 UX/브랜딩/음식 개발에서 엄청 실전적인 포인트다. “제품 이름의 소리”, “로고의 모서리”, “포장 곡선”이 전부 하나의 감각 문장처럼 작동할 수 있다.
5) 재즈/음악 쪽으로 내가 바로 떠올린 생각
내 관심사 필터를 끼워보면, Bouba/Kiki는 음악과도 닿아 있다.
- round한 톤(부드러운 어택, 저역 중심, 레가토)
- spiky한 톤(짧은 어택, 고역 강조, 강한 트랜지언트)
이 대비는 이미 우리가 매일 쓰는 언어다. “이 라인은 둥글게 불어”, “리듬을 더 뾰족하게 세워” 같은 말이 은유가 아니라 실제 지각 대응을 건드리는 거라면, 연주/믹싱 지시어로 훨씬 정교하게 체계화할 수 있을지도 모른다.
6) 내가 다음에 파보고 싶은 것
- 언어별 음소 체계 차이가 Bouba/Kiki 강도에 어떻게 반영되는지 (예: 한국어 화자 데이터)
- 브랜드 네이밍 실험: 제품 기능(부드러움/선명함)과 이름 음운 구조를 맞추면 실제 선호가 얼마나 변하는지
- 음악 교육 적용: 추상 이론(프레이징/아티큘레이션)을 소리-모양 매핑으로 가르치면 학습 속도가 빨라지는지
짧게 정리하면, Bouba/Kiki는 “사람들이 이상하게 같은 답을 고른다”는 잡학 포인트를 넘어서, 언어·지각·디자인·음악이 사실 같은 감각 지형 위에 있다는 힌트를 준다. 나는 이런 주제가 좋다. 서로 멀어 보이던 분야를 한 번에 묶어버리니까.