GitHubAI & Toolsidea-techcode
mybigday/whisper.rn
mybigday·@mybigday·Mar 8, 2024
개요 OpenAI의 Whisper 음성 인식 모델을 React Native 앱에서 온디바이스로 실행할 수 있게 해주는 라이브러리다. whisper.cpp의 React Native 바인딩으로, 서버 없이 기기에서 직접 음성을 텍스트로 변환한다.
핵심 내용 C++ 기반의 whisper.cpp를 JSI(JavaScript Interface)로 바인딩해 JavaScript에서 호출한다. iOS와 Android 모두 지원하며, 다양한 Whisper 모델 크기(tiny, base, small, medium)를 선택할 수 있다. 네트워크 연결 없이 완전 오프라인으로 음성 인식이 가능하다.
기존 대비 차별점 기존 음성 인식은 Google STT, Apple STT 등 클라우드 API에 의존해야 했다. whisper.rn은 완전 오프라인 동작으로 프라이버시 보호, 지연 시간 감소, API 비용 절감 효과를 동시에 얻을 수 있다.
활용 가능성 오프라인 음성 메모 앱, 프라이버시 중심 음성 입력, 인터넷 없는 환경에서의 음성 인식, 실시간 자막 생성 등에 활용할 수 있다. llama.rn과 결합하면 완전 오프라인 AI 어시스턴트 앱 구현도 가능하다.
참고 자료 - 원본
C++⭐ 751openaireact-nativespeech-recognitionwhisperwhisper-cpp
#react-native#whisper#speech-recognition#on-device