Caixa de Ferramentas: IA Practitioner pra Escola da Nuvem

01 · OpenSearch Service

O Ctrl+F dos seus dados.

Pensa naquela busca rápida de email, busca de produto na Amazon, busca de logs da aplicação... Tudo isso precisa de um motor de busca de verdade. OpenSearch é o serviço gerenciado da AWS que entrega isso: ele indexa documentos, vetores e logs, e devolve resultado relevante em milissegundos.

🔍 Tenta buscar algo

Digita uma palavra-chave (ex.: "gato", "nuvem", "ml") e veja como o OpenSearch retorna resultados com um score de relevância.

👆 Digita aí em cima pra ver a busca acontecer

amazon-opensearch-service

OpenSearch Service

Serviço gerenciado da AWS pra busca, análise e visualização de dados. É o sucessor do Elasticsearch na AWS.

Em IA, é muito usado como banco de vetores (vector database) pra guardar embeddings em pipelines de RAG. Você joga representações numéricas dos seus documentos lá e, na hora da busca, ele acha os documentos semanticamente parecidos com a pergunta do usuário.

Capacidades-chave: busca por texto completo, busca vetorial (k-NN), agregações, análise de logs em tempo real, dashboards.

App de e-commerce com busca inteligente, chatbot com RAG, análise de logs de aplicação, busca em base de documentos da empresa.

02 · A família SageMaker

O canivete suíço de ML da AWS.

Aqui mora a confusão. SageMaker não é UM serviço, é uma família inteira. Cada filho dela serve pra um tipo de pessoa e de problema. Vê a árvore genealógica:

🧪 Amazon SageMaker

A plataforma da AWS pra construir, treinar e fazer deploy de modelos de ML. Pensa nela como o "Photoshop do ML": tem ferramenta pra todo perfil de usuário.

Amazon SageMaker

🚀 JumpStart

Pra quem quer começar AGORA

Catálogo de modelos pré-treinados prontos pra deploy em 1 clique. Llama, Stable Diffusion, BERT, etc. Você pega, faz fine-tuning (opcional) e usa.

🎨 Canvas

Pra analista de negócio (no-code)

Interface sem código. Você joga um CSV, escolhe a coluna que quer prever, e o Canvas treina o modelo sozinho. ML pra quem não programa.

💻 Studio

Pra cientista de dados (pro)

IDE web completa pra ML. Notebooks Jupyter, debug, experimentos, pipelines, deploy. É o "VSCode do ML" na AWS.

🚀

🦙

Llama
Text gen

🎨

Stable Diffusion
Image gen

🧠

BERT
NLP

👁️

YOLO
Object detection

            👉 1 clique pra deploy
          

sagemaker-jumpstart

SageMaker JumpStart

Um catálogo de modelos prontos (foundation models e modelos clássicos). Imagina uma App Store, mas pra modelos de ML.

Você navega, escolhe um, e o JumpStart faz o deploy pra você em um endpoint. Pode usar como tá, ou fazer fine-tuning com seus próprios dados.

Inclui: Llama, Mistral, Stable Diffusion, BERT, modelos da Hugging Face, e dezenas mais.

Você quer testar um LLM rapidamente sem treinar do zero, ou prototipar uma POC. JumpStart entrega o modelo em minutos.

📊 Vendas.csv

cliente	idade	comprou?
Ana	28	SIM
Bruno	45	NÃO
Carla	32	SIM
Diego	38	❓

⬇️

🎨 Canvas treina sozinho

Sem código. Sem notebook. Sem terror.

sagemaker-canvas

SageMaker Canvas

ML sem código. Pensado pra analistas de negócio que entendem do dado mas não programam.

Você faz upload do CSV, escolhe a coluna que quer prever, e o Canvas treina vários modelos automaticamente. No final, mostra qual deu o melhor resultado e quais variáveis mais influenciam.

Também integra com foundation models (GenAI) pra tarefas de texto, sem programar.

Equipe de marketing quer prever churn, mas não tem cientista de dados. Canvas resolve. Ou: analista financeiro quer prever vendas do próximo mês.

            
            
            
            studio.ipynb
          
import sagemaker
from sklearn.ensemble import RandomForestClassifier
# Train model
model = RandomForestClassifier()
model.fit(X_train, y_train)
# Deploy to endpoint
predictor = model.deploy(
  instance_type="ml.m5.large"
)

              ✓ Endpoint deployed: model-prod-001
            

sagemaker-studio

SageMaker Studio

A IDE web completa da AWS pra ML. É o ambiente unificado onde cientista de dados faz tudo: notebook, debug, treino, deploy, monitoramento.

Pensa no VSCode, mas:
1) roda no navegador
2) tem GPU sob demanda
3) integra com S3, Athena, Redshift
4) tem experimentos, pipelines e MLOps embutidos

É onde acontece o trabalho "sério" de ML.

Time de ciência de dados precisa de um ambiente colaborativo, com acesso a GPU, versionamento de experimentos e pipelines de produção.

03 · Stable Diffusion

Como uma imagem nasce de ruído puro.

Stable Diffusion é um modelo de geração de imagens a partir de texto. A mágica dele: ele aprendeu a transformar TV antiga com chuvisco (ruído aleatório) em uma imagem coerente, passo a passo. Igual escultor revelando estátua no mármore.

🎬 O processo, passo a passo

Arrasta o slider e vê o ruído virar imagem.

"um gato astronauta no Rio de Janeiro"

🎚️ Passo de denoising 5/5

stable-diffusion

Stable Diffusion

Modelo de difusão latente que cria imagens a partir de uma descrição textual (prompt).

Como funciona, simplificado:

1️⃣ Começa com uma imagem 100% ruído (chuvisco)
2️⃣ A cada passo, ele remove um pouco de ruído, guiado pelo prompt
3️⃣ Depois de N passos (tipicamente 20-50), uma imagem coerente surge

O treino dele foi feito ao contrário: pegou imagens reais e foi adicionando ruído aos poucos. O modelo aprendeu o caminho de volta.

Geração de arte, design, mockups, avatares, fotos de produto, ilustrações de marketing. Disponível no Bedrock e via JumpStart.

04 · CFG · Classifier-Free Guidance

O "obedecer ou ousar" do modelo.

Quando Stable Diffusion gera uma imagem, ele precisa decidir: seguir o prompt à risca (literal, conservador) ou improvisar e ser criativo? O CFG Scale é o botão que controla isso.

🎚️ Mexe no controle e vê o modelo mudar de personalidade

Prompt: "um gato vestido de chef"

Equilibrado

Bom mix entre criatividade e seguir o prompt. Sweet spot pra maioria dos casos.

CFG Scale 7,5

1-5: criativo

6-12: equilibrado

13-20: literal

classifier-free-guidance

CFG Scale

Parâmetro que controla o quanto o modelo "ouve" o prompt ao gerar a imagem.

CFG baixo (1-5): modelo improvisa muito, pode gerar coisas inesperadas. Imagens mais "artísticas" mas podem ignorar o prompt.

CFG médio (6-12): equilíbrio entre criatividade e fidelidade. 7-8 é o padrão.

CFG alto (13-20): modelo obedece o prompt literalmente. Pode gerar imagens "duras", saturadas, com artefatos. Em casos extremos, fica forçado.

Você quer testar variações de uma ideia? CFG baixo. Você precisa de algo bem específico do prompt? CFG alto. Não sabe? Deixa em 7,5 e vai.

05 · RAG · Retrieval-Augmented Generation

Como dar ao LLM conhecimento que ele não tem.

Um LLM tipo Claude ou Llama é poderoso, mas não conhece os documentos da sua empresa. E retreinar custa caro. RAG resolve isso: antes de responder, o sistema busca os documentos relevantes e aumenta a pergunta com esse contexto. O modelo então gera a resposta usando esse material.

📚 O pipeline RAG, etapa por etapa

Clica em cada etapa pra entender o que acontece ali.

📄

Ingestão

Documentos da empresa

→

✂️

Chunking

Quebrar em pedaços

→

🔢

Embedding

Virar vetor

→

🔍

Retrieval

Buscar similares

→

🤖

Geração

LLM responde

👆 Clica em uma etapa pra ver o detalhe

O RAG é a técnica mais comum hoje pra dar conhecimento específico (de empresa, de domínio, atualizado) pra um LLM, sem precisar retreinar.

06 · RAG · Chunking

Por que quebrar o documento em pedaços?

LLMs têm uma janela de contexto limitada (mesmo as grandes têm limite). E quando você busca documentos similares, faz mais sentido achar o parágrafo certo do que o livro inteiro. Por isso, antes de jogar tudo no banco vetorial, a gente quebra em pedaços -chunks.

✂️ Mexe nos parâmetros e vê como o texto é dividido

📏 Tamanho do chunk (caracteres) 120

🔁 Overlap (sobreposição) 20

Chunks gerados

120

Tamanho médio

580

Caracteres totais

🎯 A regra geral: chunk pequeno = busca mais precisa, mas perde contexto. Chunk grande = mais contexto, mas busca menos precisa. O overlap serve pra não perder informação que cai entre dois chunks (tipo uma frase importante que ficou cortada no meio). Tipicamente uns 10-20% do tamanho do chunk.

07 · Bedrock Knowledge Bases

RAG sem você ter que montar tudo.

Montar RAG do zero dá trabalho: precisa de banco vetorial, código de ingestão, embeddings, integração com LLM... Bedrock Knowledge Bases faz tudo isso pra você. É RAG-as-a-Service da AWS.

📦 Você só faz isso:

1️⃣ Aponta pro S3

2️⃣ Escolhe o LLM

3️⃣ Pronto

⬇️

🤖 Bedrock faz por baixo dos panos:

✂️ Chunking automático

🔢 Gera embeddings

💾 Guarda em OpenSearch / Pinecone

🔄 Sincronização automática

🔍 Retrieval

💬 Resposta com citação

bedrock-knowledge-bases

Bedrock Knowledge Bases

Serviço totalmente gerenciado da AWS pra montar pipelines de RAG sem escrever código de orquestração.

O que ele entrega:

📂 Conexão direta com S3 (e outras fontes): aponta a pasta com seus PDFs, e ele cuida do resto.
✂️ Chunking gerenciado (estratégias: fixed, hierarchical, semantic)
🔢 Embeddings automáticos via modelos do Bedrock (ex.: Titan, Cohere)
💾 Banco vetorial gerenciado (usa OpenSearch Serverless por padrão, ou Pinecone/Redis)
📎 Citações automáticas: a resposta vem com a fonte do documento

Você quer um chatbot que responda sobre os manuais da empresa, ou um assistente que consulta documentos jurídicos. Bedrock KB monta isso em horas, sem você programar pipeline.

🔄 RAG manual vs Bedrock KB

🛠️ RAG manual (você monta)

Escreve código de ingestão
Escolhe e configura banco vetorial (OpenSearch, Pinecone)
Implementa estratégia de chunking
Gerencia sincronização
Mais flexível, mais trabalhoso

⚡ Bedrock KB (AWS faz)

Aponta pro S3 e tá pronto
Banco vetorial gerenciado
Chunking automático configurável
Sync automático
Menos flexível, muito mais rápido de subir

TL;DR · Cola final

A cola visual.

Cada serviço/conceito numa frase só. Salva, imprime, tira print. Ideal pra revisar antes da prova.

🔍 OpenSearch

amazon-opensearch-service

"Onde guardar e buscar dados/vetores?"

Motor de busca gerenciado. Usado como vector DB em RAG. Sucessor do Elasticsearch.

🧪 SageMaker

amazon-sagemaker

"Plataforma completa de ML"

A "mãe" de tudo. Treino, deploy, monitoramento. Família com JumpStart, Canvas e Studio.

🚀 JumpStart

sagemaker-jumpstart

"Modelo pronto, em 1 clique"

Catálogo de modelos pré-treinados (Llama, SD, BERT). Deploy rápido + fine-tuning opcional.

🎨 Canvas

sagemaker-canvas

"ML pra quem não programa"

Interface no-code. Sobe CSV, escolhe a coluna, ele treina sozinho. Pra analista de negócio.

💻 Studio

sagemaker-studio

"IDE completa de ML"

Notebook + GPU + deploy + experimentos. O "VSCode do ML" da AWS. Pra cientista de dados.

🖼️ Stable Diffusion

stable-diffusion

"Como gera imagem de texto?"

Modelo de difusão. Começa do ruído puro e vai limpando passo a passo guiado pelo prompt.

🎚️ CFG

classifier-free-guidance

"Obedecer ou ousar?"

Quanto o modelo segue o prompt. Baixo = criativo. Alto = literal. Padrão ~7-8.

📚 RAG

retrieval-augmented-generation

"LLM com conhecimento meu"

Busca documentos relevantes ANTES de gerar resposta. Sem precisar retreinar o modelo.

✂️ Chunking

document-chunking

"Como quebrar os docs?"

Dividir docs em pedaços pra caber no contexto. Use overlap pra não perder info nas bordas.

🤖 Bedrock KB

bedrock-knowledge-bases

"RAG sem montar nada"

RAG totalmente gerenciado. Aponta pro S3, escolhe LLM, pronto. Chunking + embeddings + retrieval automáticos.

🧰 Resumo do resumo

"Que ferramenta eu uso?"

Cada uma resolve uma dor diferente. Comece pela pergunta: tenho dado? quero modelo pronto? sei programar? Daí escolhe.