OpenSearch, SageMaker, JumpStart, Canvas, Studio, Stable Diffusion, CFG, RAG, Chunking, Bedrock Knowledge Bases. Tudo isso parece muita coisa? É porque é. Vamos abrir uma ferramenta de cada vez, ver pra que serve, e quando puxar do balaio.
Abrir a caixa 🛠️Pensa naquela busca rápida de email, busca de produto na Amazon, busca de logs da aplicação... Tudo isso precisa de um motor de busca de verdade. OpenSearch é o serviço gerenciado da AWS que entrega isso: ele indexa documentos, vetores e logs, e devolve resultado relevante em milissegundos.
Digita uma palavra-chave (ex.: "gato", "nuvem", "ml") e veja como o OpenSearch retorna resultados com um score de relevância.
Serviço gerenciado da AWS pra busca, análise e visualização de dados. É o sucessor do Elasticsearch na AWS.
Em IA, é muito usado como banco de vetores (vector database) pra guardar embeddings em pipelines de RAG. Você joga representações numéricas dos seus documentos lá e, na hora da busca, ele acha os documentos semanticamente parecidos com a pergunta do usuário.
Capacidades-chave: busca por texto completo, busca vetorial (k-NN), agregações, análise de logs em tempo real, dashboards.
Aqui mora a confusão. SageMaker não é UM serviço, é uma família inteira. Cada filho dela serve pra um tipo de pessoa e de problema. Vê a árvore genealógica:
A plataforma da AWS pra construir, treinar e fazer deploy de modelos de ML. Pensa nela como o "Photoshop do ML": tem ferramenta pra todo perfil de usuário.
Um catálogo de modelos prontos (foundation models e modelos clássicos). Imagina uma App Store, mas pra modelos de ML.
Você navega, escolhe um, e o JumpStart faz o deploy pra você em um endpoint. Pode usar como tá, ou fazer fine-tuning com seus próprios dados.
Inclui: Llama, Mistral, Stable Diffusion, BERT, modelos da Hugging Face, e dezenas mais.
| cliente | idade | comprou? |
|---|---|---|
| Ana | 28 | SIM |
| Bruno | 45 | NÃO |
| Carla | 32 | SIM |
| Diego | 38 | ❓ |
ML sem código. Pensado pra analistas de negócio que entendem do dado mas não programam.
Você faz upload do CSV, escolhe a coluna que quer prever, e o Canvas treina vários modelos automaticamente. No final, mostra qual deu o melhor resultado e quais variáveis mais influenciam.
Também integra com foundation models (GenAI) pra tarefas de texto, sem programar.
A IDE web completa da AWS pra ML. É o ambiente unificado onde cientista de dados faz tudo: notebook, debug, treino, deploy, monitoramento.
Pensa no VSCode, mas:
1) roda no navegador
2) tem GPU sob demanda
3) integra com S3, Athena, Redshift
4) tem experimentos, pipelines e MLOps embutidos
É onde acontece o trabalho "sério" de ML.
Stable Diffusion é um modelo de geração de imagens a partir de texto. A mágica dele: ele aprendeu a transformar TV antiga com chuvisco (ruído aleatório) em uma imagem coerente, passo a passo. Igual escultor revelando estátua no mármore.
Modelo de difusão latente que cria imagens a partir de uma descrição textual (prompt).
Como funciona, simplificado:
1️⃣ Começa com uma imagem 100% ruído (chuvisco)
2️⃣ A cada passo, ele remove um pouco de ruído, guiado pelo prompt
3️⃣ Depois de N passos (tipicamente 20-50), uma imagem coerente surge
O treino dele foi feito ao contrário: pegou imagens reais e foi adicionando ruído aos poucos. O modelo aprendeu o caminho de volta.
Quando Stable Diffusion gera uma imagem, ele precisa decidir: seguir o prompt à risca (literal, conservador) ou improvisar e ser criativo? O CFG Scale é o botão que controla isso.
Parâmetro que controla o quanto o modelo "ouve" o prompt ao gerar a imagem.
CFG baixo (1-5): modelo improvisa muito, pode gerar coisas inesperadas. Imagens mais "artísticas" mas podem ignorar o prompt.
CFG médio (6-12): equilíbrio entre criatividade e fidelidade. 7-8 é o padrão.
CFG alto (13-20): modelo obedece o prompt literalmente. Pode gerar imagens "duras", saturadas, com artefatos. Em casos extremos, fica forçado.
Um LLM tipo Claude ou Llama é poderoso, mas não conhece os documentos da sua empresa. E retreinar custa caro. RAG resolve isso: antes de responder, o sistema busca os documentos relevantes e aumenta a pergunta com esse contexto. O modelo então gera a resposta usando esse material.
Clica em cada etapa pra entender o que acontece ali.
O RAG é a técnica mais comum hoje pra dar conhecimento específico (de empresa, de domínio, atualizado) pra um LLM, sem precisar retreinar.
LLMs têm uma janela de contexto limitada (mesmo as grandes têm limite). E quando você busca documentos similares, faz mais sentido achar o parágrafo certo do que o livro inteiro. Por isso, antes de jogar tudo no banco vetorial, a gente quebra em pedaços -chunks.
Montar RAG do zero dá trabalho: precisa de banco vetorial, código de ingestão, embeddings, integração com LLM... Bedrock Knowledge Bases faz tudo isso pra você. É RAG-as-a-Service da AWS.
Serviço totalmente gerenciado da AWS pra montar pipelines de RAG sem escrever código de orquestração.
O que ele entrega:
📂 Conexão direta com S3 (e outras fontes): aponta a pasta com seus PDFs, e ele cuida do resto.
✂️ Chunking gerenciado (estratégias: fixed, hierarchical, semantic)
🔢 Embeddings automáticos via modelos do Bedrock (ex.: Titan, Cohere)
💾 Banco vetorial gerenciado (usa OpenSearch Serverless por padrão, ou Pinecone/Redis)
📎 Citações automáticas: a resposta vem com a fonte do documento
Cada serviço/conceito numa frase só. Salva, imprime, tira print. Ideal pra revisar antes da prova.