오늘은 구글 검색엔진이 내가 쓴 블로그 포스팅이 챗GPT 가 자동으로 대신 써준 글인지 여부를 알 수 있는가 하는 점을 살펴 봅니다.
Q. 구글은 내가 쓴 글이 인공지능 AI 가 대신 써준 글인지 아니면 내가 직접 쓴 글인지 모를까요?
아뇨, 알 수 있습니다. 구글 검색엔진은 인공지능 즉 AI가 대신 써준 글을 판별할 수 있습니다. 그렇게 말할수 있는 이유는 몇 가지가 있는데요.
첫째, 인공지능 AI 가 쓴 글은 패턴이 있다.
우선 사람이 아니기에 단정적인 화법을 안 쓰고 두루뭉실하고 그럴 듯한 단어와 문법을 사용해서 말은 그럴싸 하지만 전체적으로 문맥에 핵심이 없고, 책임지지 않으려는 회피적인 어투가 문장 여러군데서 나타납니다. 심지어 사실이 아닌 거짓 이야기를 아무렇지도 않게 지어내기도 합니다. 온라인에서 세종대왕이 맥북에어를 집어던진 사건 이야기는 유명합니다. 정황상 도저히 말이 안되는 즉 개연성이 전혀 없는 사건인데도 인공지능은 그럴듯하게 꾸며서라도 일단 문장을 만들어 줍니다.
글에서 몇가지 이런 패턴이 교차되서 나타나면 AI가 쓴 글이라고 판별할 수 있는 것이죠. 심지어 이런 패턴을 수식화해서 인공지능이 쓴 글인지 여부를 판별해내는 AI 디텍터 사이트 들도 등장하고 있는 실정입니다.
둘째, 모든 온라인 글에는 지문이 있다.
이건 구글이 아니라 우리 일반인들도 가능한 건데, 그 이유는 모든 온라인 글 즉 콘텐츠는 HTML이라고 부르는 마크업 언어(Language)를 통해 표현되기 때문입니다. 이 HTML 마크업 언어를 보려면 웹페이지 소스보기를 하시면 됩니다.
소스보기를 통해 본 온라인 글은 각종 < , >, 이런 태그들로 가득합니다. 여기서 HTML에 대한 더 자세한 내용을 알려드리긴 어렵지만, 쉽게 태그 하나만 말씀드리자면, 이건 키보드의 space키를 한번 누르는걸 의미합니다. 즉 한칸 띄어쓰기인 것이죠.
이 태그 만으로도 AI가 쓴 글을 단순히 편집기에 붙여넣기 한 것인지, 사람이 직접 한칸 한칸 키보드를 치면서 문장을 작성한건지 알 수 있습니다. 즉, HTML 소스보기를 하면, 이게 한눈에 식별 가능하다는 겁니다. 어느 문장에서 글쓴이가 고민하면서 문장을 고쳐썼는지까지 모든게 보입니다. 굳이 구글이 아니라도 말이죠. 하물며 구글은 더 고도의 알고리즘을 연구하면서 분석할테니 AI가 쓴 글인지 모를리가 없다는 게 정설입니다.
특히 이 방법은 테슬라 CEO 일론 머스크가 회사내 기밀을 유출한 내부 스파이를 식별해낸 방법으로도 유명합니다. 한때 회사내 기밀이 계속 유출되서 계약에 어려움을 겪던 머스크는 내부 임원들에게 전체 메일을 보냈는데 실은 육안으로는 똑 같은 메일, 하지만 HTML 으로 보면 조금씩 다른 메일이 전달되었습니다. 그때 핵심 원리가 space키를 누른 횟수였습니다. 결과 머스크는 회사기밀을 계속해서 유출하던 내부자를 마침내 찾아내서 해고했다고 합니다.
AI와 사람이 쓴 글을 구분하는 방법
그렇다면 이 방법으로 어떻게 AI와 사람이 쓴 글을 구분할 수 있을까요? 만약 AI가 쓴 글이라면 어딘가에서 복사 Control+C 그리고 붙여넣기 Control+V 되었을거니까 즉 스페이스 키를 누른 흔적이 거의 없겠죠? 그러나 사람이라면 분명히 문장도 고치고 썼다 지웠다를 최소 몇번이라도 할 거니까 가 여러번 중첩될 수 밖에 없을 겁니다. 이걸 이용하면 AI글과 사람 글을 구분할 수 있지 않을까요? 물론 구글이라면 그 외에도 더 여러가지 분석을 할 거겠지만요.
그래서 결론을 내보겠습니다.
요즘 유튜브.크몽 등 온라인 상에서 챗gpt를 이용한 블로그 자동 포스팅 논란이 뜨겁습니다. 기술의 발전을 이용하는 태도는 좋지만 너무 맹목적으로 추종하는 것은 별로 좋아보이지 않습니다. 어쩌면 지금 자동 포스팅 기술을 이용하여 공장에서 물건뽑듯 올려진 글들이 내 블로그를 저품질의 나락으로 안내할 수도 있으니까요.
그럼 다음 시간에는 챗gpt 인공지능 기술을 어떻게 이용하는게 좋을지 그 방법론을 살펴보도록 하겠습니다.