XAI & Toolsreference-ideavideo

i built an app to search old travel photos on my computer with natural language queries

AA·@measure_plan·Mar 17, 2026

개요 완전 로컬 AI 모델만으로 오래된 여행 사진을 자연어로 검색하는 앱을 직접 만든 사례. 무료 오픈소스 모델만 사용했다.

핵심 내용 smolVLM으로 장면과 색상을 설명하고, Roboflow RF-DETR로 객체를 감지한 뒤, ChromaDB에 메타데이터와 레이블을 저장해 시맨틱 검색을 구현했다. Python + Streamlit으로 UI를 빠르게 구성했다. 인터넷 연결 없이 완전히 로컬에서 동작한다.

왜 참고할만한가 VLM + 객체 감지 + 벡터 DB를 조합한 멀티모달 검색 파이프라인의 실용적인 구현 사례다. 각 구성 요소가 무료 로컬 모델이라는 점에서 동일한 아키텍처를 비용 없이 재현할 수 있다.

참고 자료 - 원본

#vision-language-model#object-detection#local-ai#photo-search

Related in AI & Tools