

ThreadsAI & Toolstech-infoimage
Supermemory라는 회사가 LongMemEval이라는 벤치마크에서 98.6%를 찍었습니다. 이전 자체 기록이 85%였는데, 몇 달 만에 13포인트를 올린 겁니다.
unclejobs.ai·@unclejobs.ai·Mar 22, 2026
개요 장기 메모리 스타트업 Supermemory가 LongMemEval 벤치마크에서 98.6%라는 점수를 기록했다. 불과 몇 달 전 자체 기록이 85%였던 것에서 13포인트를 끌어올린 결과로, AI의 장기 기억 능력이 빠르게 발전하고 있음을 보여준다.
핵심 내용 LongMemEval은 AI 시스템이 장기간에 걸친 대화와 정보를 얼마나 정확하게 기억하고 검색할 수 있는지를 평가하는 벤치마크다. 기존 RAG(Retrieval-Augmented Generation) 방식은 단순 키워드 매칭이나 임베딩 유사도에 의존해 복잡한 맥락의 기억을 정확히 회수하는 데 한계가 있었다. Supermemory가 단기간에 13포인트라는 대폭적인 개선을 이룬 것은 단순한 검색 최적화를 넘어, 메모리 구조화·인덱싱·추론 기반 검색 등에서 근본적인 아키텍처 개선이 있었을 가능성을 시사한다.
기존 대비 차별점 98.6%라는 수치는 사실상 거의 완벽한 기억 회수율에 해당한다. 기존 장기 메모리 솔루션들이 70-80%대에서 정체되어 있었던 것과 비교하면 상당한 도약이다. 특히 몇 달 만에 13포인트 상승이라는 개선 속도 자체가, 이 분야의 기술 발전이 가속화되고 있음을 보여주는 신호다.
활용 가능성 개인 비서형 AI의 장기 대화 기억, 기업용 지식 관리 시스템, 고객 지원 봇의 이전 상담 맥락 유지, 의료 분야의 환자 이력 기반 상담 등에 활용 가능하다. 장기 메모리가 신뢰 가능한 수준에 도달하면, AI 에이전트의 자율성과 유용성이 한 단계 더 올라갈 것이다.
참고 자료 - 원본 게시물 ===
#supermemory#longmemeval#benchmark#rag