DataLoader com pin_memory e num_workers

16 de dezembro de 2024

DataLoader + pin_memory

Aviso: Este post foi traduzido para o português usando um modelo de tradução automática. Por favor, me avise se encontrar algum erro.

Em PyTorch, quando se treinam redes neurais, especialmente em grandes conjuntos de dados, aproveitar o DataLoader com pin_memory=True e definir num_workers em um número positivo aumenta significativamente o desempenho.

pin_memory=True permite uma transferência mais rápida dos dados para a GPU mantendo-os na memória pinned (bloqueada por página).

Ao mesmo tempo, num_workers determina o número de subprocessos utilizados para a carga de dados, o que permite a obtenção assíncrona de dados sem bloquear o cálculo da GPU

Essa combinação minimiza o tempo de inatividade da GPU, garantindo um uso mais eficiente dos recursos de hardware e tempos de treinamento do modelo mais rápidos.

data_loader = DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4, pin_memory=True)

Perguntas frequentes

O que exatamente pin_memory=True faz no DataLoader do PyTorch e por que isso acelera a transferência para a GPU?

`pin_memory=True` faz o `DataLoader` alocar os tensores de cada batch em memória "pinned" (bloqueada por página) do host, em vez de memória paginável comum. Isso permite que a cópia host→GPU aconteça de forma assíncrona e mais rápida, pois o driver CUDA consegue usar DMA diretamente nessa região sem precisar de uma cópia intermediária para um buffer temporário.

Para que serve num_workers em DataLoader(dataset, batch_size=32, shuffle=True, num_workers=4, pin_memory=True) e como isso evita que a GPU fique ociosa?

`num_workers=4` diz ao `DataLoader` para usar 4 subprocessos que carregam e preparam os batches em paralelo, em vez de fazer isso de forma síncrona no processo principal. Assim, enquanto a GPU está processando o batch atual, esses workers já estão preparando o próximo de forma assíncrona, o que, combinado com `pin_memory=True`, minimiza o tempo ocioso da GPU e acelera o treinamento.

Continuar lendo

Tutorial CSS: Flexbox, Grid e Design Web

Guia completo de CSS: aprenda seletores, propriedades, modelo de caixa e layout. Exemplos práticos para iniciar ou aprimorar seu web design.

Deep Research com LangGraph (3/3): agente Writer e relatório final

Terceira e última parte da série Deep Research com LangGraph. Implemente o agente Writer que redige o relatório final a ...

Deep Research com LangGraph (2/3): Research Supervisor multiagente

Segunda parte da série Deep Research com LangGraph. Construa o Research Supervisor que coordena vários agentes Researche...

Últimos posts -->

Você viu esses projetos?

Tutor educacional multiagente

Gymnasia

Horeca chatbot

Ver todos os projetos -->

>_ Disponível para projetos

Tem um projeto com IA?

Vamos conversar.

maximofn@gmail.com

Especialista em Machine Learning e Inteligência Artificial. Desenvolvo soluções com IA generativa, agentes inteligentes e modelos personalizados.

Escreva-me LinkedIn

Quer assistir alguma palestra?

Agentes do Amanhã: Descifrando os Mistérios da Planificação, UX e Memória

Agentes de IA, impulsionados por LLMs, prometem transformar aplicações. Mas eles são meros executores hoje ou futuros colaboradores inteligentes? Para...

Crie sua própria inteligência Apple

Aprenda a criar um sistema de IA para executar eficientemente em um dispositivo

Últimas palestras -->

Quer melhorar com essas dicas?

Boas práticas criando agentes com Claude Code

Palestra técnica: skills, subagentes, slash commands e MCPs no Claude Code

o1 prompt engineering

Criar prompts melhores para o1 seguindo um exemplo

Memory profiler

Ver o uso de memória de um script

Últimos tips -->

Use isso localmente

Os espaços do Hugging Face nos permitem executar modelos com demos muito simples, mas e se a demo quebrar? Ou se o usuário a deletar? Por isso, criei contêineres docker com alguns espaços interessantes, para poder usá-los localmente, aconteça o que acontecer. Na verdade, se você clicar em qualquer botão de visualização de projeto, ele pode levá-lo a um espaço que não funciona.