🌙오픈소스

Moonshine - 엣지 디바이스용 초경량 실시간 음성 인식 오픈소스

Whisper보다 빠르고 정확한 온디바이스 음성 인식 AI 툴킷, 26MB부터 시작하는 경량 모델로 다국어 실시간 스트리밍 지원

원본 링크
#음성인식#ASR#엣지AI#실시간처리

Moonshine이란?

모든 처리를 로컬 디바이스에서 수행하는 실시간 음성 인식(ASR) 오픈소스 프레임워크입니다. 개인정보 보호와 빠른 응답 속도를 동시에 제공합니다.

주요 특징

🚀 뛰어난 성능

Whisper Large v3보다 높은 정확도: WER 6.65% (Whisper는 7.44%)
245M 파라미터: 로 Whisper Large(1.5B)보다 훨씬 경량화
실시간 스트리밍으로 말하는 중에도 텍스트 업데이트

📦 다양한 모델 크기

Tiny (34M): 26MB, WER 12.00%
Small (123M): WER 7.84%
Medium (245M): WER 6.65%
한국어 Tiny 모델: WER 6.46%

🌍 폭넓은 지원

플랫폼: Python, iOS, Android, macOS, Linux, Windows, Raspberry Pi
언어: 영어, 한국어, 일본어, 중국어, 스페인어, 베트남어, 아랍어, 우크라이나어

Whisper 대비 개선점

30초 고정 입력 제한 제거 → 가변 길이 입력 지원

캐싱 기능 추가 → 스트리밍 지연 대폭 감소

언어별 최적화 모델 → 동일 크기 대비 높은 정확도

크로스플랫폼 C++ 코어 → 모든 환경에서 동일 API

빠른 시작

Python 설치

bash
pip install moonshine-voice

기본 사용법

python
from moonshine import MicTranscriber

# 마이크 입력 자동 처리
transcriber = MicTranscriber()

@transcriber.on_line_completed
def handle_result(text):
    print(f"인식 결과: {text}")

transcriber.start()

핵심 기능

🎤 통합 파이프라인

하나의 라이브러리로 모든 처리 완료:

마이크 입력
음성 감지(VAD)
텍스트 변환
화자 식별
명령 인식

🎯 명령 인식(Intent Recognition)

자연어 기반 명령어 인식 기능 내장

활용 사례

📱 모바일 앱의 오프라인 음성 인터페이스
🏠 IoT 디바이스의 음성 제어
🤖 로봇의 실시간 음성 명령 처리
💻 라즈베리파이 기반 음성 비서

라이선스

영어 모델: **MIT 라이선스**
기타 언어 모델: **Moonshine Community License**

링크

GitHub: https://github.com/moonshine-ai/moonshine
공식 문서에서 더 많은 예제와 API 참조 가능