OpenAI 샘 올트먼 CEO가 GPT-5에 대해 “박사급 지능을 가진 AI 모델로 가장 똑똑하고, 가장 빠르며, 가장 유용하다”는 평가한 것과 달리 사용자들 사이에서 GPT-5에 대한 불만이 쏟아지고 있다. 실제 GPT-5와 이전 모델인 GPT-4o와의 성능 비교를 위해 익명의 개발자가 만든 블라인드 테스트 사이트에서는 동일한 프롬프트에 대한 두 가지 응답을 보여주되, 어느 쪽이 GPT-5(비추론 버전)인지 혹은 전작인 GPT-4o인지 밝히지 않았다.
사용자는 여러 라운드에 걸쳐 자신이 선호하는 응답을 선택한 뒤, 마지막에 어떤 모델을 더 많이 선택했는지 요약을 받는 방식으로 진행하였다. 수만명이 참여한 결과, 상당수는 여전히 GPT-4o를 지지했다. 이러한 결과는 기술적 성능과는 별개로, 사용자 경험에서 중요한 것은 기계적인 답변보다는 성격(Personality) 이라는 사실이 부각된 셈이다.