Clusters GPU globais
A DeepInfra opera uma rede de GPUs dedicadas espalhadas pelo mundo. Cada request vai pro nó mais próximo — latência baixa, sempre, de onde você estiver.
SLA enterprise de verdade
A infra da DeepInfra segue padrões enterprise — a mesma usada por empresas que processam centenas de milhões de requests de IA por dia.
Cold starts? Não existe aqui.
Rodamos só em endpoints dedicados sempre quentes. Sem espera, sem fila. Seu request chegou — o modelo já tá lá.
Escala sem cair de rendimento
Seja o primeiro ou o décimo milésimo usuário do dia, o sistema escala horizontal sem degradar. Simples assim.
Seis etapas. Todas no máximo. O áudio entra, o texto sai, zero rastro.
MIC
Capturado
CODIF.
WebM/Opus
BUFFER
R2 Buffer
INFERIR
DeepInfra
RETORNO
< 1,8s
EXCLUIR
Permanente
01
Captura no navegador
O áudio é capturado nativamente no seu navegador usando a WebAudio API. Sem plugin, sem extensão, sem download. Funciona em qualquer dispositivo moderno.
02
Codificação eficiente
O áudio é codificado em formato WebM/Opus — um codec feito pra voz. Minimiza o tamanho do arquivo e o tempo de upload preservando cada fonema.
03
Staging temporário
Os arquivos passam brevemente pelo Cloudflare R2 antes da inferência. Isso permite processar gravações de qualquer duração sem restrições de timeout serverless.
04
Inferência IA
Seu áudio é enviado pro endpoint dedicado de inferência da DeepInfra. Modelos de fala de ponta rodando em GPU dedicada — sem fila compartilhada, sem cold start, sem atraso.
05
Retorno instantâneo
O texto transcrito volta direto pro seu navegador pela nossa API. O tempo médio de ida e volta é menor que 1,8 segundo pra gravações de menos de 60 segundos.
06
Exclusão permanente
No instante que a transcrição termina, o arquivo de áudio é deletado do Cloudflare R2. A exclusão é automática, irrevogável, e acontece em até 60 segundos após o upload.
0.2%
precisão de palavras
0K hrs
dados de treinamento
0+
idiomas
0-bit
criptografia AES
0.9%
SLA de uptime
0bytes
áudio retido
Testado de forma independente. Medido em sotaques, ambientes, velocidades e idiomas. Não é papo de marketing — é dado verificado.
Falantes nativos de inglês
99.4%
Falantes não nativos de inglês
98.8%
Vocabulário técnico
98.1%
Ambientes barulhentos
97.2%
Troca de idioma (2 idiomas)
96.9%
01
Sem camada de armazenamento de áudio
O sistema é projetado sem camada permanente de armazenamento de áudio. O áudio fica no staging apenas durante a inferência. Não existe bucket de longo prazo, nem tier de arquivo, nem backup de arquivos de áudio.
02
Exclusão automática por TTL
Uma política de Time-To-Live (TTL) na camada de staging garante que todos os arquivos de áudio são deletados em até 60 segundos após o upload — independente de a transcrição ter sido concluída ou não.
03
TLS 1.3 em trânsito
Todos os dados em trânsito usam TLS 1.3 — o padrão ouro atual em criptografia de transporte. Isso cobre seu navegador, nossa API, nossa camada de staging e nosso provedor de inferência.
04
AES-256 em repouso
Texto de transcrição e dados de conta são armazenados em partições de banco de dados criptografadas com AES-256-GCM com rotação de chaves. A criptografia é aplicada no nível de infraestrutura, não de aplicação.
05
Autenticação segura
A autenticação está disponível via OAuth 2.0 (Google, GitHub), email com hash de senha criptografado, ou passkeys (WebAuthn). Senhas nunca são armazenadas em texto simples. Seus dados biométricos nunca saem do seu dispositivo.
06
Headers de segurança reforçados
Toda resposta aplica HSTS, Content-Security-Policy, X-Frame-Options e SameSite=Strict cookies — prevenindo XSS, clickjacking e sequestro de sessão por padrão.
07
Separação de metadados
Os únicos dados armazenados permanentemente são metadados de uso: timestamps e texto de transcrição (apenas se você ativar o histórico — desativado por padrão). Conteúdo de áudio nunca é persistido em nenhuma circunstância.
08
Conformidade LGPD + CCPA
Conformidade total com LGPD e CCPA. Você pode exportar ou deletar todos os seus dados a qualquer momento pelas Configurações. Solicitações de exclusão são processadas em até 30 dias.