グローバルGPUクラスター
DeepInfraは世界中に専用GPUを展開している。リクエストは最寄りのノードへ自動ルーティング — どこにいても、レイテンシは常に低い。
エンタープライズSLA、本物
DeepInfraのインフラはエンタープライズ基準で構築されている — 毎日数億件のAIリクエストを処理する企業が信頼する、まさに同じやつ。
コールドスタート、ゼロ
常時ウォームな専用エンドポイントのみで動作。起動待ちなし、キューなし。リクエストが来たら、モデルはもう待ってる。
どんな負荷でもスケール
その日の最初のユーザーでも一万番目でも、システムは水平スケールで劣化なし。
6ステージ。全部チューニング済み。音声が入って、テキストが出る。痕跡なし。
マイク
キャプチャ
エンコード
WebM/Opus
ステージ
R2バッファ
推論
DeepInfra
返送
< 1.8秒
削除
永久
01
ブラウザキャプチャ
WebAudio APIでブラウザ内で直接音声をキャプチャ。プラグイン不要、拡張機能不要、ダウンロード不要。すべてのモダンデバイスで動く。
02
効率的なエンコード
音声はWebM/Opusフォーマットでエンコード——音声に特化したコーデック。ファイルサイズとアップロード時間を最小化しつつ、全音素を正確に保持。
03
一時ステージング
推論前にCloudflare R2で短時間バッファリング。これにより、サーバーレスのタイムアウト制約なしに、どんな長さの録音も処理可能。
04
AI推論
音声はDeepInfraの専用AI推論エンドポイントに送られる。最先端の音声モデルが専用GPUハードウェア上で動作——共有キューなし、コールドスタートなし、遅延なし。
05
即時返却
文字起こしされたテキストはAPIを通じてブラウザに直接返される。60秒以下の録音での中央値ラウンドトリップ時間は1.8秒未満。
06
永久削除
文字起こし完了の瞬間、ステージングされた音声ファイルはCloudflare R2から削除。削除は自動的、不可逆、アップロード後60秒以内に実行。
0.2%
単語精度
0K hrs
トレーニングデータ
0+
言語
0-bit
AES暗号化
0.9%
稼働率SLA
0bytes
音声保持
第三者による独立検証済み。アクセント・環境・速度・多言語で計測。マーケ文句じゃない — 実測値だ。
英語ネイティブスピーカー
99.4%
英語非ネイティブスピーカー
98.8%
技術用語
98.1%
騒音環境
97.2%
言語切り替え(2言語)
96.9%
01
音声ストレージ層なし
システムは永続的な音声ストレージ層なしで設計されている。音声は推論中のみステージングされる。 長期バケット、アーカイブ層、音声ファイルのバックアップは一切ない。
02
自動TTL削除
ステージング層のTime-To-Live(TTL)ポリシーにより、全音声ファイルは アップロードから60秒以内に削除——文字起こしが完了したかどうかに関係なく。
03
転送中はTLS 1.3
転送中のすべてのデータは TLS 1.3を使用——トランスポート暗号化の現在のゴールドスタンダード。ブラウザ、API、ステージング層、推論プロバイダーすべてをカバー。
04
保存時はAES-256
文字起こしテキストとアカウントデータは AES-256-GCM暗号化されたデータベースパーティションに鍵ローテーション付きで保存。暗号化はアプリケーション層ではなくインフラ層で適用。
05
安全な認証
認証は OAuth 2.0(Google、GitHub)、メールによる暗号化パスワードハッシュ、またはパスキー(WebAuthn)で利用可能。パスワードは平文で保存されることはない。生体認証データがデバイスの外に出ることは一切ない。
06
強化セキュリティヘッダー
すべてのレスポンスで HSTS、Content-Security-Policy、X-Frame-Options、SameSite=Strict cookiesを強制——XSS、クリックジャッキング、セッションハイジャックをデフォルトで防止。
07
メタデータの分離
永続的に保存されるのは使用メタデータのみ:タイムスタンプと文字起こしテキスト(履歴を有効にした場合のみ——デフォルトではオフ)。 音声コンテンツはいかなる条件下でも永続化されない。
08
GDPR + CCPA準拠
GDPRとCCPAに完全準拠。 設定からいつでもすべてのデータをエクスポートまたは削除できる。削除リクエストは30日以内に処理。