every_holiday/VRCT

Fork 0

Files

misyaguziya d1aef28c7a Add comprehensive detailed design documents

2025-10-14 07:28:03 +09:00

6.9 KiB

Raw Blame History

model.py - VRCTコアモデルクラス

概要

VRCTアプリケーションの中核となるModelクラスを定義するモジュールです。音声認識、翻訳、VRオーバーレイ、OSC通信、WebSocketサーバーなどの主要機能を統合管理し、システム全体の動作を制御します。

主要機能

シングルトンパターン

アプリケーション全体で単一のModelインスタンスを保証
遅延初期化による軽量なインポート

音声認識機能

マイク音声のリアルタイム文字起こし
スピーカー出力の音声認識
エネルギーレベル監視
複数言語対応

翻訳機能

複数の翻訳エンジン対応（DeepL、Google、CTranslate2等）
言語自動検出
バッチ翻訳処理

VRオーバーレイ

OpenVR統合
小型・大型ログオーバーレイ
動的配置・透明度制御

OSC通信

VRChatとのOSC通信
タイピング状態の同期
ミュート状態の監視

WebSocketサーバー

外部アプリケーションとの通信
リアルタイムメッセージ配信

クラス構造

threadFnc クラス

class threadFnc(Thread):
    def __init__(self, fnc, end_fnc=None, daemon: bool = True, *args, **kwargs)

関数を繰り返し実行するスレッドラッパー
一時停止・再開機能
エラー保護機能

Model クラス

class Model:
    def __new__(cls)  # シングルトンパターン
    def init(self)    # 重い初期化処理
    def ensure_initialized(self)  # 遅延初期化

主要メソッド

初期化・管理

init() -> None

全コンポーネントの初期化
重い処理のため明示的に呼び出し

ensure_initialized() -> None

必要時の自動初期化
安全な遅延初期化

翻訳機能

getInputTranslate(message, source_language=None) -> Tuple[List[str], List[bool]]

入力メッセージの多言語翻訳
成功フラグも同時に返却

getOutputTranslate(message, source_language=None) -> Tuple[List[str], List[bool]]

出力メッセージの翻訳（逆方向）

authenticationTranslatorDeepLAuthKey(auth_key) -> bool

DeepL APIキーの認証

音声認識機能

startMicTranscript(fnc: Callable) -> None

マイク音声認識の開始
コールバック関数で結果を通知

startSpeakerTranscript(fnc: Callable) -> None

スピーカー音声認識の開始

pauseMicTranscript() -> None
resumeMicTranscript() -> None

音声認識の一時停止・再開

startCheckMicEnergy(fnc: Callable) -> None
startCheckSpeakerEnergy(fnc: Callable) -> None

音声エネルギーレベルの監視

VRオーバーレイ機能

createOverlayImageSmallLog(message, your_language, translation, target_language) -> Image

小型ログオーバーレイ画像の生成

createOverlayImageLargeLog(message_type, message, your_language, translation, target_language) -> Image

大型ログオーバーレイ画像の生成

updateOverlaySmallLogSettings() -> None
updateOverlayLargeLogSettings() -> None

オーバーレイ設定の更新

OSC通信機能

oscSendMessage(message: str) -> None

VRChatへのメッセージ送信

oscStartSendTyping() -> None
oscStopSendTyping() -> None

タイピング状態の通知

setMuteSelfStatus() -> None

VRChatミュート状態の取得

WebSocket機能

startWebSocketServer(host: str, port: int) -> None

WebSocketサーバーの起動

websocketSendMessage(message_dict: dict) -> bool

全クライアントへのメッセージ送信

checkWebSocketServerAlive() -> bool

サーバー稼働状態の確認

ファイルダウンロード機能

downloadCTranslate2ModelWeight(weight_type, callback=None, end_callback=None)

翻訳モデルのダウンロード

downloadWhisperModelWeight(weight_type, callback=None, end_callback=None)

音声認識モデルのダウンロード

ウォッチドッグ機能

startWatchdog() -> None
feedWatchdog() -> None
setWatchdogCallback(callback: Callable) -> None

システム監視とタイムアウト処理

使用方法

基本的な使い方

from model import model

# 明示的な初期化（推奨）
model.init()

# または自動初期化
model.ensure_initialized()

# 翻訳機能の使用
translations, success_flags = model.getInputTranslate("Hello World")

# 音声認識の開始
def on_transcript_result(result):
    print(f"認識結果: {result}")

model.startMicTranscript(on_transcript_result)

VRオーバーレイの使用

# オーバーレイの開始
model.startOverlay()

# 画像の作成と更新
img = model.createOverlayImageSmallLog(
    message="Hello",
    your_language="English",
    translation=["こんにちは"],
    target_language={"1": {"language": "Japanese", "enable": True}}
)
model.updateOverlaySmallLog(img)

WebSocketサーバーの使用

# サーバー起動
model.startWebSocketServer("127.0.0.1", 8765)

# メッセージ送信
message = {"type": "translation", "text": "Hello", "translation": "こんにちは"}
success = model.websocketSendMessage(message)

依存関係

必須モジュール

controller: アプリケーション制御
config: 設定管理
device_manager: デバイス管理

音声・翻訳関連

models.transcription.*: 音声認識
models.translation.*: 翻訳機能
models.transliteration.*: 音写変換

VR・通信関連

models.overlay.*: VRオーバーレイ
models.osc.*: OSC通信
models.websocket.*: WebSocket通信

ユーティリティ

models.watchdog.*: 監視機能
utils: 共通ユーティリティ
flashtext: キーワードフィルタリング

設定依存関係

多くの機能がconfigモジュールの設定に依存：

音声認識設定（しきい値、タイムアウト等）
翻訳設定（エンジン選択、言語設定等）
VR設定（オーバーレイ位置、透明度等）
OSC設定（IPアドレス、ポート等）

エラーハンドリング

初期化エラーの適切な処理
VRAM不足エラーの検出と対応
ネットワークエラーの回復機能
スレッドセーフティの保証

注意事項

重い初期化処理のため、明示的な初期化を推奨
OpenVR環境が必要（VRオーバーレイ使用時）
CUDA環境推奨（高速な音声認識・翻訳）
WebSocketサーバーは非同期で動作
音声デバイスのアクセス権限が必要

パフォーマンス考慮事項

遅延初期化によるメモリ使用量の最適化
スレッドプールによる並行処理
モデルの重複読み込み防止
キューイングによる非同期処理

6.9 KiB Raw Blame History Unescape Escape

model.py - VRCTコアモデルクラス

概要

主要機能

シングルトンパターン

音声認識機能

翻訳機能

VRオーバーレイ

OSC通信

WebSocketサーバー

クラス構造

threadFnc クラス

Model クラス

主要メソッド

初期化・管理

翻訳機能

音声認識機能

VRオーバーレイ機能

OSC通信機能

WebSocket機能

ファイルダウンロード機能

ウォッチドッグ機能

使用方法

基本的な使い方

VRオーバーレイの使用

WebSocketサーバーの使用

依存関係

必須モジュール

音声・翻訳関連

VR・通信関連

ユーティリティ

設定依存関係

エラーハンドリング

注意事項

パフォーマンス考慮事項

6.9 KiB

Raw Blame History