Clusters GPU mondiaux
DeepInfra déploie une flotte de GPUs dédiés à l'échelle mondiale. Chaque requête est routée vers le nœud le plus proche — latence au plancher, peu importe où tu es.
SLA enterprise, sans blabla
L'infra DeepInfra est construite selon les standards enterprise — la même que celle utilisée par des boîtes qui traitent des centaines de millions de requêtes IA par jour.
Fini les cold starts
On tourne exclusivement sur des endpoints dédiés toujours chauds. Zéro délai de démarrage, zéro file d'attente. Ta requête arrive, le modèle est déjà là.
Scale sans broncher
Que tu sois le premier ou le dix millième utilisateur de la journée, le système scale horizontalement sans dégradation.
Six étapes. Toutes optimisées à fond. L'audio entre, le texte sort, rien ne reste.
MIC
Capturé
ENCODE
WebM/Opus
BUFFER
R2 Buffer
ANALYSE
DeepInfra
RETOUR
< 1,8s
SUPPR.
Définitif
01
Capture navigateur
L'audio est capté nativement dans ton navigateur via la WebAudio API. Aucun plugin, aucune extension, rien à télécharger. Fonctionne sur tous les appareils modernes.
02
Encodage efficace
L'audio est encodé en WebM/Opus — un codec conçu pour la voix. Taille de fichier et temps d'upload minimisés, chaque phonème préservé.
03
Staging temporaire
Les fichiers transitent brièvement par Cloudflare R2 avant l'inférence. Ça nous permet de traiter des enregistrements de n'importe quelle durée sans contrainte de timeout serverless.
04
Inférence IA
Ton audio est envoyé à l'endpoint d'inférence dédié de DeepInfra. Des modèles vocaux de pointe tournent sur du hardware GPU dédié — pas de file d'attente partagée, pas de cold start, pas de délai.
05
Retour instantané
Le texte transcrit revient directement dans ton navigateur via notre API. Le temps aller-retour médian est sous 1,8 seconde pour les enregistrements de moins de 60 secondes.
06
Suppression définitive
Dès que la transcription se termine, le fichier audio est supprimé de Cloudflare R2. La suppression est automatique, irrévocable, et se fait dans les 60 secondes suivant l'upload.
0.2%
précision des mots
0K hrs
données d'entraînement
0+
langues
0-bit
chiffrement AES
0.9%
SLA de disponibilité
0bytes
audio conservé
Évalué indépendamment. Testé sur des accents, environnements, débits et langues variés. Pas du marketing — une mesure vérifiée.
Locuteurs natifs anglais
99.4%
Locuteurs non natifs anglais
98.8%
Vocabulaire technique
98.1%
Environnements bruyants
97.2%
Alternance de langues (2 langues)
96.9%
01
Aucune couche de stockage audio
Le système est conçu sans couche de stockage audio permanent. L'audio est mis en staging uniquement le temps de l'inférence. Pas de bucket long terme, pas de tier d'archive, pas de backup des fichiers audio.
02
Suppression automatique par TTL
Une politique Time-To-Live (TTL) sur la couche de staging garantit que tous les fichiers audio sont supprimés dans les 60 secondes suivant l'upload — que la transcription aboutisse ou échoue.
03
TLS 1.3 en transit
Toutes les données en transit utilisent TLS 1.3 — le standard de référence actuel en chiffrement de transport. Ça couvre ton navigateur, notre API, notre couche de staging et notre fournisseur d'inférence.
04
AES-256 au repos
Le texte des transcriptions et les données de compte sont stockés dans des partitions de base de données chiffrées en AES-256-GCM avec rotation des clés. Le chiffrement est imposé au niveau infrastructure, pas applicatif.
05
Authentification sécurisée
L'authentification est disponible via OAuth 2.0 (Google, GitHub), email avec hachage de mot de passe chiffré, ou passkeys (WebAuthn). Les mots de passe ne sont jamais stockés en clair. Tes données biométriques ne quittent jamais ton appareil.
06
En-têtes de sécurité renforcés
Chaque réponse applique HSTS, Content-Security-Policy, X-Frame-Options et SameSite=Strict cookies — protection contre XSS, clickjacking et détournement de session par défaut.
07
Séparation des métadonnées
Les seules données stockées de façon permanente sont les métadonnées d'utilisation : horodatages et texte de transcription (uniquement si tu actives l'historique — désactivé par défaut). Le contenu audio n'est jamais persisté, quelle que soit la situation.
08
Conformité RGPD + CCPA
Conformité réglementaire totale avec le RGPD et le CCPA. Tu peux exporter ou supprimer toutes tes données à tout moment via les Réglages. Les demandes de suppression sont traitées sous 30 jours.