AI가 쓴 글의 특징은 무엇인가? – 인간이 만든 언어의 경계에 선 기계

우리는 누군가의 글을 읽으며 그 사람을 상상한다.

문장의 어투, 단어의 선택, 리듬의 미세한 흔들림 속에서 성격과 감정, 그리고 살아온 시간의 결이 은은하게 배어나오기 때문이다.

그런데 AI가 만든 글 앞에서는 이와같은 상상이 멈추게 되곤한다.

글은 매우 깔끔하고, 전개도 매끈하다. 문장도 말이되는것 같다. 그럼에도 어딘가 비어 있고, 자연스럽지만 낯설다는 느낌이 남는건 무엇일까?

이 낯섦은 “AI라서”라는 막연한 느낌에서 끝나지 않는다.

과연 우리는 AI의 흔적을 어떻게 포착할 수 있을까? 기계가 쓴 글에는 어떤 고유한 패턴이 존재하는가?

기계가 언어를 다루는 방식, 곧 확률과 통계로 다음 토큰을 이어 붙이는 방식이 남기는 흔적이 있다고 한다. 그리고 그 흔적은 늘 같은 모양으로 찍히지는 않고, 몇 가지 반복되는 성질이 나타난다.

1 퍼플렉서티(Perplexity): ‘예측 가능한’ 언어의 온도

퍼플렉서티는 자연어처리에서 언어모델이 텍스트를 얼마나 “놀랍게” 받아들이는지(당혹감이라는 사전적 의미를 넘어서 얼마나 덜 예측 가능한지)를 수치로 표현할 때 자주 쓰인다.

직관적으로 말하면, 어떤 문장에서 “다음 단어가 거의 정해져 있는 문장”처럼 느껴질수록 퍼플렉서티는 낮아지는 경향을 보이고, 퍼플렉서티는 교차엔트로피(cross-entropy)와 연결되어 다음과 같이 표현된다.

\(
\text{PPL}(W)=\exp\left(-\frac{1}{N}\sum_{i=1}^{N}\log p(w_i)\right)
\)

사람은 종종 규칙을 비틀곤 한다.

말장난을 하거나, 비유를 뒤집거나, 문법을 일부러 변형하기도한다. 때때로 감정이 앞서게 되면 문장의 균형이 무너지기도 하고, 기억이 짬뽕되거나 하면 뜻밖의 단어가 튀어나오기도한다.
하지만 설정(temperature, sampling 등)에 따라 변화는 있지만 대부분의 경우 AI는 “문맥상 가장 그럴듯한 다음 단어” 를 계속적으로 표현하게되는데, 그 이유는 AI의 표현하는 기본 기저가 ‘고확률 선택’이기 때문이다. 그렇기때문에 결과물로 나타나는 텍스트들은 “무난한데 밋밋하다”는 인상을 주기 쉽다.

예를 들어,
“봄이 오면 마음이 설렌다.”
같은 문장은 그 자체로 나쁘지 않다. 다만 이 문장은 너무 많은 글에서 너무 자주 등장해 왔고, 그만큼 다음 전개도 예측되기 쉽다.

반대로,
“봄은 내 마음속 먼지 쌓인 기억을 햇살로 쓸어낸다.”
같은 문장은 특정한 삶의 결(먼지 쌓인 기억, 햇살의 촉감)을 품고 있어 예측의 관성에서 벗어날 여지가 크다.

여기서 중요한 경계가 하나 있다.

“퍼플렉서티가 낮다 = AI 글”로 곧장 결론 내리면 위험하다는 것이다.

공문서, 보고서, 매뉴얼, 보도자료처럼 본래 예측 가능한 문체를 요구하는 장르는 인간이 써도 낮은 퍼플렉서티 쪽으로 기울 수 있다는 점에서, 퍼플렉서티는 ‘증거’라기보다 ‘경향’에 가깝다.

2 버스트니스(Burstiness): 리듬의 굴곡이 줄어드는 순간

버스트니스는 문장의 길이, 구조, 전개 속도, 그리고 “놀라움의 분포”가 문서 전체에서 얼마나 들쭉날쭉하게 변하는지를 가리킬 때 자주 언급된다.

사람 글은 보통 짧은 문장과 긴 문장이 섞이고, 단언과 머뭇거림이 교차하며, 감정의 고저가 리듬을 흔들게 된다. 반면에 많은 AI 생성문은 일정한 박자에 맞춰 정돈되는 느낌을 남긴다.

때문에 이런 문장들의 묶음은 의미 전달은 되긴 하지만, 문장이 가져오는 감정이나, 결이 가지고 있는 감성은 적다.

“이 제품은 매우 효과적이며, 많은 사람들이 만족하고 있습니다. 추천할 만한 제품입니다.”

이와 같은 문장은 틀린 것이 아니다. 하지만 “누가, 어떤 상황에서, 무엇이 걸렸는지”가 빠진 채 평가 형식만 있다는 점에서 감정이 섞이는것이 아니라 ‘평균값’으로 서술이 만들어 졌다고 느껴진다. 다시말해 독자는 정보는 받았지만 이 문장이 보여주는 장면을 얻지 못하는 결과를 가져온다.

버스트니스는 글의 “숨”과도 닮아 있다.

인간의 숨은 일정하지 않다. 놀라면 짧아지고, 몰입하면 길어지고, 울컥하면 멎는 경우도 많다. 글도 마찬가지다. 글의 숨이 일정해 보이면 독자는 무의식적으로 이 기계적인 질서를 감지한다.

3 지나친 정제와 중립성: 결론은 있는데 ‘입장’이 흐릿하다

AI 글에서 자주 포착되는 것중의 하나는 “좋게 말해 균형, 다르게 말하면 무색무취”라 할 수 있다.

AI는 대체로 공격적 단정이나 극단적 표현을 피하려고 하기때문에, 문장들이 과하게 정돈되거나, 논쟁적 주제에 관해서는 완곡한 말투가 겹겹이 쌓이는 일이 자주 나타난다.

문제는 중립 그 자체가 아니라, 중립이 “경험과 책임의 무게”를 대신해 버리는 결과를 가져온다는 점이라고 할 수 있다. 사람의 글은 불완전하긴 하지만 대신 “내가 이렇게 느낀 이유”가 남는 경우가 많고, 갈등의 흔적, 선택의 부담, 부끄러움의 잔향 같은 것들이 문장에 남겨지는 경우가 많다.

AI도 물론 감정어를 쓸 수 있지만, 감정이 만들어진 맥락(왜, 어떤 표정으로, 어떤 침묵 뒤에)을 통째로 밀어 넣는 데는 약하다. 그래서 “감정이 없는 감정 표현”처럼 읽히는 겨웅가 많다.

“그는 매우 슬퍼 보였습니다.”
라는 문장은 감정 단어가 들어 있다고 볼수 있지만, 슬픔의 표정이 무엇이었는지(손끝의 떨림, 말을 삼키는 습관, 눈을 피하는 방식)가 빠져 있기때문에, 비어 보일 밖에 없다.

독자가 읽는 것은 ‘단어’이지 ‘사건’이 아니다.

4 창의성의 모방: 새로움이 아니라 ‘익숙한 비유의 재배열’

AI는 엄청난 규모의 텍스트를 학습하고, 그 안에서 반복되는 결합 패턴을 매우 능숙하게 꺼낸다. 그래서 겉보기에는 시적이고 비유적인 문장을 곧잘 만들기도 한다.
하지만 많은 경우 새 상징을 “발명”하기보다, 기존 상징을 “안전한 조합”으로 섞기때문에,그럴듯하지만 어디선가 본 느낌, 기시감이 따라오게 된다.

예컨대 “눈물의 소금이 바다를 이루었다” 같은 요청을 받으면, AI는
“슬픔이 가득한 눈물이 흘러, 끝없는 바다로 퍼졌다”
같은 문장을 만들 수 있다.

의미는 통하지만, 상징의 날이 무디게 느껴질 수 있다.

인간의 은유는 종종 비틀린 상상에서 나온다.

“왜 바다인가”를 설명하지 않아도, 그 사람이 겪은 시간의 질감이 은유의 뿌리가 되어 문장을 떠받치는 경우가 많은데, AI는 그 뿌리 대신 확률적으로 흔한 연결을 택하기 쉽다.

5 사실 정보의 나열, 서사의 부재: ‘경험의 재구성’이 빠진 정보

AI는 정보 정리에 강하다는데 동의한다.

항목을 나누고, 요점을 묶고, 누락을 줄이며, 균형 있게 배치하는 능력은 매우 높다. 그런데 정보만으로 모든걸 움직일수 있을까?

사람은 사건을 “의미”로 바꾸는 존재이기 때문에, 의미는 보통 서사에서 생기게 된다.

여행기를 예로 들면, 사람은 이렇게 쓴다.

“고요한 기차 안에서 창밖 풍경이 스쳐 갈 때, 오래된 상처가 문득 떠올랐다. 강물이 흘러가듯, 그 기억도 내 안에서 흘러갔다.”

여기에는 ‘기차’와 ‘풍경’ 이상의 것이 있다. 기억이 끼어들고, 감정이 사건을 재해석한다.

독자는 그 재해석을 따라가며 자기 경험을 포개어 읽게된다.

AI는 같은 상황을 “기차는 편안했고 풍경은 아름다웠다”처럼 요약한다. 사실은 틀리지 않지만 “왜 그 장면이 의미가 되었는지”가 사라지고, 텍스트를 읽는 독자는 건조함을 느끼게 된다.

6 논리적 비약이 줄어든다: 매끈함이 생명력을 깎아내릴 때

AI 글은 문단 간 연결이 유난히 매끄럽게 느껴질 때가 많다.

“첫째, 둘째, 셋째” 구조, 결론을 향해 단계적으로 수렴하는 전개, 반론을 예측해 미리 정리하는 방식이 자주 등장하느데, 이런 구조는 설명글에서 장점이 크지만 과해지게되면 ‘생각의 흐름’보다 ‘기획된 구조’라고 느끼게 된다.

인간의 경우 사유는 늘 정돈되어 있지 않다.

어떤 순간에는 결론이 먼저 튀어나오고, 이유가 뒤늦게 따라올때도 있고, 감정이 논리를 추월하기도 하고, 모순이 잠깐 머물다 다시 정리되기도 한다.

글 속의 비약과 흔들림은 결함이 아니라 “살아 있는 흔적”이 될 때가 많다. AI는 그 흔들림을 최소화하려는 방향으로 최적화되어 있어, 완성도 높지만 ‘사람의 체온’이 덜 느껴지는 순간이 생기게 된다.

7 인용은 능숙하지만, 출처가 흐려질 수 있다: 환각(hallucination)과 가짜 근거의 위험

AI는 학습한 텍스트를 바탕으로 매우 설득력 있게 “근거처럼 보이는 문장”을 구성한다. 그러나 검증 단계가 없으면 존재하지 않는 논문, 실제로는 다른 주장을 한 자료, 혹은 확인되지 않은 사실을 그럴듯하게 말할 수 있다. 이 현상은 연구 커뮤니티에서 ‘환각’으로 널리 논의된다.

학술 글이나 정책 글에서 이 지점은 특히 중요한 부분이다. 인용이 “있어 보인다”는 감각이 글의 신뢰를 즉각 올려주기 때문이다. 그래서 AI 활용 글에서는 ‘인용의 형식’보다 ‘검증 가능한 경로(저자-연도-저널/출판사-DOI 등)’가 훨씬 더 중요하다.