エンジン全開。

本気のAIインフラ。速度・精度・プライバシー、全部妥協なし。

DeepInfra GPU · 最強クラスの音声AI · TLS 1.3 + AES-256 · 音声は即削除

無料で始める

02. インフラ

POWERED
BY
DEEPINFRA

グローバルGPUクラスター

DeepInfraは世界中に専用GPUを展開している。リクエストは最寄りのノードへ自動ルーティング — どこにいても、レイテンシは常に低い。

エンタープライズSLA、本物

DeepInfraのインフラはエンタープライズ基準で構築されている — 毎日数億件のAIリクエストを処理する企業が信頼する、まさに同じやつ。

コールドスタート、ゼロ

常時ウォームな専用エンドポイントのみで動作。起動待ちなし、キューなし。リクエストが来たら、モデルはもう待ってる。

どんな負荷でもスケール

その日の最初のユーザーでも一万番目でも、システムは水平スケールで劣化なし。

03. モデル

最先端モデル。
ゴールドスタンダード。

アーキテクチャ

Transformer

Transformerベースの深層エンコーダー・デコーダーアーキテクチャ。数十万時間の実世界多言語音声でエンドツーエンド学習。

パラメータ

1.5B+

15億の学習済みパラメータ。680,000時間の多言語音声で訓練——史上最大規模の音声トレーニングデータセットのひとつ。

言語

100+

100以上の話し言葉をネイティブに理解。設定不要——言語は自動検出、文の途中で切り替えてもOK。

WER（英語）

2.7%

標準ベンチマークでWER 2.7%——アクセント、方言、環境ノイズを問わず、人間レベルの文字起こし精度に迫る。

04. パイプライン

声がテキストになる
2秒以内に。

6ステージ。全部チューニング済み。音声が入って、テキストが出る。痕跡なし。

マイク

キャプチャ

エンコード

WebM/Opus

ステージ

API

推論

DeepInfra

返送

< 1.8秒

削除

永久

ブラウザキャプチャ

WebAudio APIでブラウザ内で直接音声をキャプチャ。プラグイン不要、拡張機能不要、ダウンロード不要。すべてのモダンデバイスで動く。

効率的なエンコード

音声はWebM/Opusフォーマットでエンコード——音声に特化したコーデック。ファイルサイズとアップロード時間を最小化しつつ、全音素を正確に保持。

一時ステージング

推論前にYapr APIで短時間バッファリング。これにより、サーバーレスのタイムアウト制約なしに、どんな長さの録音も処理可能。

AI推論

音声はDeepInfraの専用AI推論エンドポイントに送られる。最先端の音声モデルが専用GPUハードウェア上で動作——共有キューなし、コールドスタートなし、遅延なし。

即時返却

文字起こしされたテキストはAPIを通じてブラウザに直接返される。60秒以下の録音での中央値ラウンドトリップ時間は1.8秒未満。

永久削除

文字起こし完了の瞬間、音声はYapr APIから削除。削除は自動的、不可逆、即時に実行。

0.2%

単語精度

0K hrs

トレーニングデータ

言語

0-bit

AES暗号化

0.9%

稼働率SLA

0bytes

音声保持

05. 精度

99.2%
単語
精度。

第三者による独立検証済み。アクセント・環境・速度・多言語で計測。マーケ文句じゃない — 実測値だ。

英語ネイティブスピーカー

99.4%

英語非ネイティブスピーカー

98.8%

技術用語

98.1%

騒音環境

97.2%

言語切り替え（2言語）

96.9%

06. プライバシー設計

ゼロ保持。
ポリシーじゃない。
アーキテクチャだ。

音声ストレージ層なし

システムは永続的な音声ストレージ層なしで設計されている。音声は推論中のみステージングされる。 長期バケット、アーカイブ層、音声ファイルのバックアップは一切ない。

即時削除

音声ストレージ層を持たないアーキテクチャにより、全音声ファイルは 文字起こし後すぐに削除——アーカイブなし、録音DBなし、保持レイヤーなし。

転送中はTLS 1.3

転送中のすべてのデータは TLS 1.3を使用——トランスポート暗号化の現在のゴールドスタンダード。ブラウザ、API、ステージング層、推論プロバイダーすべてをカバー。

保存時はAES-256

文字起こしテキストとアカウントデータは AES-256-GCM暗号化されたデータベースパーティションに鍵ローテーション付きで保存。暗号化はアプリケーション層ではなくインフラ層で適用。

安全な認証

認証は OAuth 2.0（Google、GitHub）、メールによる暗号化パスワードハッシュ、またはパスキー（WebAuthn）で利用可能。パスワードは平文で保存されることはない。生体認証データがデバイスの外に出ることは一切ない。

強化セキュリティヘッダー

すべてのレスポンスで HSTS、Content-Security-Policy、X-Frame-Options、SameSite=Strict cookiesを強制——XSS、クリックジャッキング、セッションハイジャックをデフォルトで防止。

メタデータの分離

永続的に保存されるのは使用メタデータのみ：タイムスタンプと文字起こしテキスト（履歴を有効にした場合のみ——デフォルトではオフ）。 音声コンテンツはいかなる条件下でも永続化されない。

GDPR + CCPA準拠

GDPRとCCPAに完全準拠。 設定からいつでもすべてのデータをエクスポートまたは削除できる。削除リクエストは30日以内に処理。

準備できた？
いくよ。

カード不要。最初から無料。

無料で始める仕組みを見る

エンジン 全開。

POWEREDBYDEEPINFRA

最先端モデル。ゴールドスタンダード。

声がテキストになる2秒以内に。

99.2%単語精度。

ゼロ保持。ポリシーじゃない。アーキテクチャだ。

準備できた？いくよ。

エンジン 全開。

POWEREDBYDEEPINFRA

最先端モデル。ゴールドスタンダード。

声がテキストになる2秒以内に。

99.2%単語精度。

ゼロ保持。ポリシーじゃない。アーキテクチャだ。

準備できた？いくよ。

エンジン全開。

POWERED
BY
DEEPINFRA

最先端モデル。
ゴールドスタンダード。

声がテキストになる
2秒以内に。

99.2%
単語
精度。

ゼロ保持。
ポリシーじゃない。
アーキテクチャだ。

準備できた？
いくよ。

エンジン全開。

POWERED
BY
DEEPINFRA

最先端モデル。
ゴールドスタンダード。

声がテキストになる
2秒以内に。

99.2%
単語
精度。

ゼロ保持。
ポリシーじゃない。
アーキテクチャだ。

準備できた？
いくよ。