AI가 생성한 저품질 콘텐츠, 블로그 플랫폼 ‘미디엄’으로 대거 유입

By Kate Knibbs, WIRED US인공지능(AI)이 생성한 저품질 콘텐츠가 누리꾼이 온라인에 글을 게재하는 주요 플랫폼에도 대거 유입하는 추세이다. 블로그 플랫폼인 미디엄(Medium)도 예외는 아니다.출시 12년

www.msn.com

By Kate Knibbs, WIRED US

인공지능(AI)이 생성한 저품질 콘텐츠가 누리꾼이 온라인에 글을 게재하는 주요 플랫폼에도 대거 유입하는 추세이다. 블로그 플랫폼인 미디엄(Medium)도 예외는 아니다.

출시 12년이 된 미디엄은 지난 몇 년간 셀 수 없을 정도로 많은 전환점을 겪었다. 드디어 매출 상승을 기록하기 시작하여 2024년 8월 처음으로 월간 매출 이익을 기록했다. 미디엄 CEO 토니 스터블바인(Tony Stubblebine)을 포함한 미디엄 경영진은 미디엄을 인간의 글쓰기 활동 본거지라고 설명했다. 그러나 미디엄에도 로봇 블로거가 갈수록 증가한다는 증거가 수집됐다.

와이어드는 이미 AI 탐지 툴 스타트업 판그램 랩스(Pangram Labs)에 미디엄 게시글 분석을 문의했다. 판그램 랩스는 미디엄에 지난 6주간 게재된 최신 게시글 27만 4,466건을 표본 집단으로 선정하여 분석하고는 AI가 생성한 게시글 비율이 47% 이상이라는 집계 결과를 전했다. 판그램 랩스 CEO 맥스 스페로(Max Spero)는 “다른 인터넷 공간에서 본 AI 생성 콘텐츠 비율보다 두 배 더 높다”라고 전했다. (판그램 랩스는 2024년 여름 글로벌 뉴스 웹사이트에 하루 동안 송출된 글을 분석하고, AI 생성 콘텐츠 비율이 7%라는 분석 결과를 공개했다.)

미디엄에 게재되는 AI 저품질 콘텐츠는 독창성이 없는 따분한 글을 완성하는 경향이 있다. 특히, 페이스북에서 차단된 기존의 형태를 거부하면서 급부상한 게시글과 비교하면, AI 게시글의 지루함이 두드러진다. 인스타그램에서 초현실적인 예수의 얼굴과 새우의 몸을 합성한 AI 생성 이미지보다는 암호화폐와 관련한 의미 없는 다양한 게시글을 생성하는 경향이 더 강한 편이다. AI로 생성한 콘텐츠일 확률이 가장 높은 게시글에 주로 적용된 태그 중에는 ‘NFT’ 태그도 있었다. 지난 몇 달간 NFT 태그를 포함한 채로 게재된 게시글 5,712건 중 판그램 랩스가 AI가 생성했을 가능성이 있다고 판단한 게시글은 총 78%에 해당하는 4,492건으로 집계됐다. ‘웹 3’, ‘이더리움(Ethereum), ‘AI’, ‘애완동물’이라는 태그도 AI 생성 콘텐츠로 추정되는 글에 추가된 빈도가 높은 태그이다.

와이어드는 다른 AI 탐지 툴 스타트업인 오리지널리티 AI(Originality AI)에도 미디엄의 최신 게시글 자체 분석을 의뢰했다. 오리지널리티 AI는 2018년 게재된 게시글과 2024년 게재된 게시글의 AI 생성 콘텐츠 게재 비율을 분석했다. 2018년도 게시글 중 AI가 생성한 것으로 추정되는 게시글 비율은 3.4%였다. 오리지널리티 CEO 존 길험(Jon Gillham)은 2018년도 AI 생성 콘텐츠 비율이 거짓 양성 반응과 관련이 있다고 설명했다. 2018년에는 생성형 AI 툴 사용이 널리 확산되지 않았기 때문이다. 2024년 게재된 미디엄 게시글 473건을 분석했을 때 AI가 생성한 것으로 추정되는 콘텐츠 비율은 40%가 넘는 것으로 집계됐다. 오리지널 AI와 판그램 랩스 모두 상대 기업의 생성형 AI 콘텐츠 분석 사실을 알지 못한 채로 생성형 AI 콘텐츠 탐지 작업을 진행했으나 두 기업이 제시한 생성형 AI 콘텐츠 비율은 비슷했다.

와이어드가 AI 생성 콘텐츠 증가 추세와 관련하여 문의하면서 판그램 랩스와 오리지널리티 AI의 분석 결과를 경고하자 스터블바인은 미디엄이 AI 때문에 문제를 겪게 될 것이라는 전제를 거부했다. 스터블바인은 “AI 생성 콘텐츠 증가 추세 결과의 중요성과 AI 콘텐츠 탐지 기업이 중요한 문제를 발견했다는 견해에 동의하지 않는다”라고 말했다.

스터블바인은 미디엄 내 AI 생성 콘텐츠가 급격히 증가한 사실 자체를 부인하지는 않았다. 그는 “미디엄에 게재되는 AI 생성 콘텐츠가 올해 초보다 10배 증가할 수도 있다고 생각한다”라고 전했다. 또, AI 생성 콘텐츠가 미디엄에 등장하는 추세의 적대적 접근 방식이 일반적이라는 점도 인정하며, “미디엄은 AI 생성 콘텐츠를 강력히 반대한다”라고 말했다. 그러나 AI 탐지 툴을 사용하여 AI 생성 콘텐츠가 일으킬 문제 범위를 평가하는 것은 반대했다. 그 부분적인 이유로 AI가 100% 생성한 콘텐츠와 AI 사용 비율이 비교적 적은 콘텐츠 간의 차이점을 구분할 수 없다는 주장을 펼쳤다. (스페로는 스터블바인의 주장이 정확하지 않다고 반박하며, 판그램 랩스가 명령어 한 줄을 입력하여 챗GPT로 생성한 뒤 AI 개요에 따라 게재한 글의 차이점을 구분하여 인간이 작성한 게시글의 추가 정보를 제공할 수 있다고 말했다.)

스터블바인은 미디엄 내부에서 AI 탐지 툴 여러 개를 테스트한 뒤 AI 탐지 툴을 이용하여 AI 생성 콘텐츠 구분하려는 작업이 효과가 없었다고 전했다. (또, 판그램 랩스가 언론을 통해 자신을 이용하여 매출을 올리려 한다고 비난하기도 했다. 스페로가 와이어드의 의뢰에 따라 진행한 AI 생성 콘텐츠 분석 결과를 상세히 설명한 내용을 포함하여 미디엄에 자사 서비스를 제공하려는 메일을 보냈기 때문이다. 이에, 스페로는 “판그램 랩스가 미디엄에 도움이 될 수 있다고 생각했다”라고 말했다.)

실제로 AI 탐지 툴에는 결함이 있다. AI 생성 콘텐츠 탐지 툴은 텍스트 분석 및 예측 후 거짓 양성 혹은 거짓 음성 반응을 보인다. AI 생성 툴을 사용하여 개인의 글과 예술 작품을 분석할 때는 주의가 필요하다. 특히, 새로운 유형의 AI 생성 툴 대규모 유입 추세를 악용하여 많은 이들을 속일 수도 있기 때문이다. 그러나 AI 탐지 툴은 여전히 특정 플랫폼과 웹사이트에 존재하는 AI 생성 콘텐츠 변화를 측정하는 척도로 널리 활용된다. 또, 연구원과 언론인, 대중이 AI 생성 콘텐츠의 패턴을 파악하는 데 도움을 주기도 한다.

길험은 “AI 탐지 툴은 정확하지만, 완벽하지는 않다. 따라서 특정 콘텐츠를 AI가 생성했다고 확신할 수는 없다. 다만, AI 생성 콘텐츠가 미디엄과 같은 플랫폼을 장악하는 추세를 보는 데 매우 유용하다”라고 말했다.

[사진=Freepik]

다른 이들도 미디엄 내 AI 생성 콘텐츠 증가 추세를 탐지했다. 온라인 거짓 정보 추적 기업 뉴스가드(NewsGuard) 에디터 맥켄지 사데기(McKenzie Sadeghi)는 “새로 등장한 AI 생성 뉴스 웹사이트를 주기적으로 조사하면서 매주 미디엄에 게재되는 AI 생성 콘텐츠가 증가하는 추세를 확인했다. AI 생성 저품질 콘텐츠 상당수가 암호화폐, 마케팅, SEO와 관련이 있다는 점을 발견했다”라고 설명했다.

스터블바인은 AI 생성 콘텐츠 수치 자체가 미디엄 사용자의 다양한 콘텐츠 접근 경험을 해치지 않는다고 확신한다. 그는 “AI 생성 콘텐츠 증가 추세 자체가 문제 될 일은 없다. 미디엄에 게재되는 AI 생성 콘텐츠 접근 자체가 실제 사용자의 게시글 추천, 조회 수 증가 활동을 나타내지 않기 때문이다. AI 생성 콘텐츠가 자주 게재되는 주제의 원본 게시글 중 충분히 탐지할 수 있는 AI 생성 콘텐츠 대부분 조회 수 0건이다. 조회 수 0건은 미디엄의 AI 저품질 콘텐츠 대응 목표이자 이미 자체 시스템으로 달성한 목표이다"라고 전했다. 스터블바인은 미디엄의 AI 저품질 콘텐츠 대응 작업이 자사의 일반 목적 스팸 분류 시스템과 자체 인간의 콘텐츠 관리 시스템 결합을 효과적으로 결합한 성과라고 확신한다.

AI 생성 콘텐츠 게재 건수가 높은 계정 다수는 실제로 조회 수 기록이 매우 적거나 계정 구독자가 전혀 없는 것으로 확인됐다. 판그램 랩스가 분류한 암호화폐 관련 AI 생성 콘텐츠 게재 계정 중 하나는 하루 동안 게시글 6건을 올리고, 기존의 다른 게시글과의 관련성이 전혀 없는 것으로 나타났다. 해당 계정의 콘텐츠가 미디엄 사용 경험에 미치는 영향이 미미하다는 점을 시사한다. AI 생성 콘텐츠 분석 작업으로 분류한 또 다른 게시글은 최근 삭제된 것으로 나타났다. 일부 게시글은 계정 소유자가 자발적으로 제거했으나 반대로 미디엄이 게시글 게재 후 며칠 혹은 몇 주 뒤 삭제한 게시글도 있었다. 스터블바인은 미디엄이 시스템 조작을 시도하는 ‘스팸 링(spam ring)’을 확인할 때는 스팸 게시글 삭제를 의도적으로 미루기도 한다고 전했다.

그러나 AI 생성 콘텐츠의 게시글 모두 조회 수 0건을 기록하는 것은 아니다. 와이어드는 판그램 랩스, 오리지널리티 AI와 또 다른 AI 탐지 툴 개발사 리얼리티 디펜더(Reality Defender)가 잡아낸 AI로 생성했을 가능성이 있는 미디엄 게시글 중 다른 플랫폼의 ‘좋아요’ 반응과 같은 의미가 있는 박수 횟수 수백 건을 기록한 게시글도 여럿 존재한다는 사실을 확인했다. 적어도 조회 수 0건인 AI 저품질 콘텐츠보다는 독자가 더 많다는 사실을 시사하는 기록이다.

스터블바인은 사용자를 미디엄의 게시글 품질 관리 접근방식의 주춧돌과 같은 존재로 본다. 스터블바인은 “현재 미디엄은 기본적으로 인간의 콘텐츠 엄선 과정을 바탕으로 운영한다”라고 말했다. 이어, 미디엄에서 게시글을 송출하는 에디터 9,000명과 인간의 다양한 콘텐츠 평가로 콘텐츠 품질을 높이거나 적어도 품질이 우수한 콘텐츠를 널리 확산할 수 있다고 전했다. 또한, “더 정확하게 따지면, AI 생성 콘텐츠 자체를 제공 콘텐츠에서 제외하도록 분류한다고 생각할 수도 있다. 하지만 미디엄의 목표는 저품질 콘텐츠를 미디엄의 콘텐츠 제공 대상에서 제외하는 것이다”라고 설명했다.

미디엄은 2024년 들어 로봇 블로거의 존재를 억제하고자 다양한 대책을 시행하고, AI 정책을 개정했다. 미디엄의 태도는 링크드인, 페이스북 등 사용자에게 콘텐츠 생성 시 AI를 사용하지 않도록 유도하는 여러 플랫폼과는 현저히 대비된다. 대신, 미디엄은 AI로 생성한 콘텐츠 게재 시 ‘파트너’ 프로그램을 통한 콘텐츠 수익 창출 대상으로 인정하지 않는다. 동시에 게시글 내용과 관련된 정보 링크를 콘텐츠에 포함하도록 하는 ‘부스트(Boost)’ 프로그램으로 인간이 엄선한 콘텐츠 유포 범위를 넓히고자 한다. 미디엄은 AI 생성 콘텐츠 정의를 “콘텐츠 내용 상당수를 AI 작성 프로그램을 이용하여 생성하고는 별도의 편집, 콘텐츠 품질 개선, 사실 검증, 콘텐츠 내용 교정 과정이 극소수이거나 거의 진행하지 않고 완성한 콘텐츠”로 명시했다. 미디엄은 새로이 적용 AI 정책 시행 목적으로 활용할 AI 콘텐츠에만 적용할 특별한 집행 툴을 사용하지 않는다. 이에, 스터블바인은 “미디엄은 기존 콘텐츠 엄선 시스템이 AI 생성 콘텐츠 품질이 낮다는 이유만으로 AI 생성 콘텐츠 자체를 플랫폼에서 제공할 콘텐츠에서 제외하는 역효과를 불러올 수 있다는 점을 발견했다”라고 설명했다.

미디엄의 일부 작가와 에디터는 미디엄의 AI 콘텐츠 접근 방식을 긍정적으로 평가한다. 미디엄의 최대 규모 대중문화 콘텐츠 송출 매거진 ‘팬페어(Fanfare)’ 개설자인 에릭 피어스(Eric Pierce)는 수많은 AI 생성 콘텐츠 제출에 맞서 스스로 보호할 필요가 없다고 생각하며, 미디엄의 부스트 프로그램에 참여하는 인간 관리자의 콘텐츠 엄선 작업이 미디엄 내 인간이 작성한 최고 품질 콘텐츠를 강조하는 데 도움이 될 것으로 확신한다. 그는 “지난 몇 달간 읽은 미디엄 게시글 중 AI로 생성한 사실을 암시한 콘텐츠를 접한 적이 단 한 건도 없다. 날이 갈수록 미디엄이 AI 저품질 콘텐츠 탓에 콘텐츠 품질이 하락하는 추세에서 인간의 고품질 콘텐츠를 보호하는 성역과 같은 공간이 되고 있다고 느낀다”라고 말했다.

그러나 미디엄 작가와 에디터 중에도 미디엄에 게재된 AI 생성 콘텐츠 중 표절 콘텐츠를 발견한 이들도 적지 않다. 복수 온라인 출판 플랫폼 편집 작업을 하는 콘텐츠 마케팅 작가 마르쿠스 무식(Marcus Musick)은 AI 생성 콘텐츠로 보이는 글이 온라인에서 널리 확산된 상황을 한탄하는 글을 게재했다. (리얼리티 디펜더는 무식이 AI 생성 콘텐츠로 의심한 글을 직접 분석하고는 AI로 조작했을 확률이 99%라는 판독 결과를 전했다.) 무식이 의심한 콘텐츠의 박수는 1만 3,500건 이상으로, 독자가 많은 것으로 확인됐다.

무식은 독자의 관점에서는 물론이고, 에디터의 관점에서도 AI 콘텐츠를 자주 접하게 된다고 확신한다. 이어, 매달 기고가로 등록하고자 하는 이들 80%의 등록 요청을 거절한다고 밝혔다. AI를 이용한 것으로 의심되는 글을 제출했기 때문이다. 무식은 무용지물이라고 생각하는 AI 탐지 툴을 사용하지 않고, 직접 글을 읽고 AI 생성 콘텐츠를 판단한다.

미디엄에 AI 생성 콘텐츠 수가 눈에 띄게 증가했으나 콘텐츠 품질 유지, 저품질 콘텐츠 제거 등 미디엄이 직면하는 콘텐츠 관리 작업의 어려움은 더 넓은 웹에서 항상 접하는 난제 중 하나이다. AI 열풍으로 문제의 심각성이 더 빠른 속도로 확산되었다. 게시글 클릭을 유도할 목적으로 저품질 콘텐츠를 대거 생성하는 문제는 오래전부터 존재했으나 AI는 SEO에 집착한 기업인들이 구독자가 거의 없는 언론 기관이 AI 저품질 콘텐츠로 콘텐츠와 조회 수 부재 격차를 좁혀 부활할 방법을 즉시 제공했다. 바로 신속하게 단기간 고수익 창출이라는 품질이 낮은 튜토리얼 영상을 생성하면서 많은 이들에게 페이스북, 아마존 킨들, 미디엄 등 다양한 플랫폼에서 AI 저품질 콘텐츠를 생성하도록 유도하는 유튜브의 전체 하위 장르이다. (“AI SEO 미디엄 제국에서 한 번에 클릭 유도하기"와 같은 제목을 AI 저품질 콘텐츠 제목의 대표적인 예시로 언급할 수 있다.)

콘텐츠 표절 컨설턴트 조나단 베일리(Jonathan Bailey)는 “미디엄도 AI 생성 콘텐츠가 급격히 증가하면서 문제를 직면한 인터넷 전체와 같은 위치에 놓여있다. AI 콘텐츠는 빠른 속도로 생성할 수 있으며, 어디에나 존재하기 때문이다”라며, “스팸 필터와 인간의 콘텐츠 작업 등이 AI 저품질 콘텐츠에 대응하기 가장 좋은 수단이다”라고 분석했다.

미디엄이 고품질 콘텐츠를 추천 콘텐츠로 강조하면서 저품질 콘텐츠의 도달 범위를 제한하는 데 성공한다면, 미디엄에 저품질 콘텐츠가 대거 게재된 상황 자체가 무조건 문제가 된다고 판단하는 것이 적합하지 않다는 스터블바인의 주장은 AI 저품질 콘텐츠를 100% 제거하는 것보다 더 실질적인 대응 전략일 수도 있다. 스터블바인의 콘텐츠 관리 전략이 더 능숙한 저품질 콘텐츠 대응 접근 방식이 될 수도 있다.

AI 기술 발전과 미디어 콘텐츠 확장 추세에 따른 비관주의 관점인 ‘죽은 인터넷 이론(Dead Internet theory)’의 미래를 제시하기도 한다. 한때 극단적인 온라인 음모론의 핵심이었던 죽은 인터넷 이론은 대다수 인터넷 공간에는 실제 인간 사용자와 인간이 생성한 게시글이 전혀 없고, AI 저품질 콘텐츠와 봇이 인간을 대신한다고 주장한다. 생성형 AI 툴의 보편화에 따라 봇 제거를 포기하는 플랫폼은 AI로 도배된 플랫폼에서 인간이 직접 생성한 콘텐츠를 찾는 일이 갈수록 어려워지는 온라인 세계의 발전을 초래할 것이다.

** 위 기사는 와이어드US(WIRED.com)에 게재된 것을 와이어드코리아(WIRED.kr)가 번역한 것입니다. (번역 : 고다솔 에디터)

AI Slop Is Flooding Medium

AI가 생성한 저품질 콘텐츠, 블로그 플랫폼 ‘미디엄’으로 대거 유입

www.msn.com

저작자표시 비영리 변경금지 (새창열림)

'生活과 白書 > IT인터넷 --- 情報網' 카테고리의 다른 글

딥시크 개발 주도 '천재 소녀'… 中 2030 우상 됐다 (2)	2025.02.03
USB를 몽땅 지워 버리는 컴퓨터 바이러스 증상과 치료 (2)	2025.01.27
파워포인트 POP 글자 만들기 (0)	2025.01.19