🌙오픈소스
Moonshine - 엣지 디바이스용 초경량 실시간 음성 인식 오픈소스
Whisper보다 빠르고 정확한 온디바이스 음성 인식 AI 툴킷, 26MB부터 시작하는 경량 모델로 다국어 실시간 스트리밍 지원
↗ 원본 링크#음성인식#ASR#엣지AI#실시간처리
Moonshine이란?
모든 처리를 로컬 디바이스에서 수행하는 실시간 음성 인식(ASR) 오픈소스 프레임워크입니다. 개인정보 보호와 빠른 응답 속도를 동시에 제공합니다.
주요 특징
🚀 뛰어난 성능
▸
Whisper Large v3보다 높은 정확도: WER 6.65% (Whisper는 7.44%)
▸
245M 파라미터: 로 Whisper Large(1.5B)보다 훨씬 경량화
▸실시간 스트리밍으로 말하는 중에도 텍스트 업데이트
📦 다양한 모델 크기
▸
Tiny (34M): 26MB, WER 12.00%
▸
Small (123M): WER 7.84%
▸
Medium (245M): WER 6.65%
▸한국어 Tiny 모델: WER 6.46%
🌍 폭넓은 지원
▸
플랫폼: Python, iOS, Android, macOS, Linux, Windows, Raspberry Pi
▸
언어: 영어, 한국어, 일본어, 중국어, 스페인어, 베트남어, 아랍어, 우크라이나어
Whisper 대비 개선점
✅ 30초 고정 입력 제한 제거 → 가변 길이 입력 지원
✅ 캐싱 기능 추가 → 스트리밍 지연 대폭 감소
✅ 언어별 최적화 모델 → 동일 크기 대비 높은 정확도
✅ 크로스플랫폼 C++ 코어 → 모든 환경에서 동일 API
빠른 시작
Python 설치
bash
pip install moonshine-voice기본 사용법
python
from moonshine import MicTranscriber
# 마이크 입력 자동 처리
transcriber = MicTranscriber()
@transcriber.on_line_completed
def handle_result(text):
print(f"인식 결과: {text}")
transcriber.start()핵심 기능
🎤 통합 파이프라인
하나의 라이브러리로 모든 처리 완료:
▸마이크 입력
▸음성 감지(VAD)
▸텍스트 변환
▸화자 식별
▸명령 인식
🎯 명령 인식(Intent Recognition)
자연어 기반 명령어 인식 기능 내장
활용 사례
▸📱 모바일 앱의 오프라인 음성 인터페이스
▸🏠 IoT 디바이스의 음성 제어
▸🤖 로봇의 실시간 음성 명령 처리
▸💻 라즈베리파이 기반 음성 비서
라이선스
▸영어 모델: **MIT 라이선스**
▸기타 언어 모델: **Moonshine Community License**
링크
▸GitHub: https://github.com/moonshine-ai/moonshine
▸공식 문서에서 더 많은 예제와 API 참조 가능