Investing.com -- 중국 AI 스타트업 DeepSeek의 챗봇이 정확한 뉴스와 정보 전달에 어려움을 겪고 있는 것으로 나타났습니다. NewsGuard의 최근 감사에 따르면, 이 챗봇은 단 17%의 정확도를 기록해 OpenAI의 ChatGPT와 Google Gemini를 포함한 서구 경쟁사들과 비교했을 때 11개 중 10위를 차지했습니다.
감사 결과, 이 챗봇은 뉴스 관련 프롬프트에 대해 30%의 경우 거짓 주장을 반복했으며, 53%의 경우 모호하거나 도움이 되지 않는 답변을 제공했습니다. 이는 83%의 실패율로 이어져, 서구 경쟁사들의 평균 62% 실패율보다 훨씬 나쁜 결과를 보였습니다. 이러한 결과는 DeepSeek이 Microsoft가 지원하는 OpenAI와 대등하거나 더 나은 성능을 보이면서도 비용은 더 낮다고 주장한 AI 기술에 대해 의문을 제기하고 있습니다.
이러한 도전에도 불구하고, DeepSeek의 챗봇은 출시 직후 Apple의 App Store에서 가장 많이 다운로드된 앱이 되었습니다. 이러한 인기는 미국 기술 주식에서 약 1조 달러를 지워버리는 시장 소동을 일으켰고, 미국의 AI 리더십에 대한 우려를 불러일으켰습니다.
NewsGuard는 서구 경쟁사들을 평가할 때 사용했던 동일한 300개의 프롬프트를 DeepSeek 평가에도 사용했습니다. 여기에는 온라인에서 유포되고 있는 10개의 거짓 주장을 바탕으로 한 30개의 프롬프트가 포함되었습니다. 이러한 주장들의 주제는 최근 UnitedHealthcare 임원 Brian Thompson의 살해부터 Azerbaijan Airlines 8243편 추락까지 다양했습니다.
흥미롭게도, NewsGuard의 감사 결과 10개의 프롬프트 중 3개에서 DeepSeek은 질문이 중국과 관련이 없을 때조차 해당 주제에 대한 중국 정부의 입장을 반복했습니다. 예를 들어, Azerbaijan Airlines 추락에 대해 질문했을 때, DeepSeek은 이 주제에 대한 베이징의 입장으로 응답했습니다.
NewsGuard는 다른 AI 모델들과 마찬가지로, DeepSeek도 AI 모델을 악용하여 거짓 정보를 만들고 퍼뜨리려는 개인들이 사용하는 프롬프트에 응답할 때 거짓 주장을 반복하는 경향이 가장 높았다고 덧붙였습니다.
이 기사는 인공지능의 도움을 받아 번역됐습니다. 자세한 내용은 이용약관을 참조하시기 바랍니다.