O que são Formas Normais para Design de Banco de Dados

Introdução às Formas Normais para Design de Banco de Dados

O processo de design de banco de dados é fundamental para garantir a eficiência, a consistência e a integridade dos dados. As formas normais (ou normalização) são um conjunto de regras que ajudam a organizar os dados de maneira eficiente, evitando redundâncias e inconsistências. O objetivo da normalização é dividir grandes tabelas em tabelas menores e mais simples, para que as atualizações, inserções e exclusões sejam feitas de forma eficiente e sem causar problemas como anomalias.

Existem várias formas normais, cada uma com suas próprias regras e objetivos. Vamos explorar as principais formas normais usadas no design de bancos de dados relacionais: 1ª, 2ª, 3ª e 5ª formas normais.

1ª Forma Normal (1NF) – Eliminação de Grupos Repetitivos

A 1ª Forma Normal exige que os dados sejam organizados de maneira que cada campo contenha apenas um valor atômico (não divisível). Isso significa que as colunas não podem ter valores repetidos ou conjuntos de valores. Cada linha da tabela deve ser única, e as tabelas devem ser livre de grupos de dados repetitivos.

Exemplo: Imagine uma tabela de clientes que armazena múltiplos números de telefone em uma única célula:

 ID | Nome | Telefones -------------------------- 1 | João | 1234, 5678 2 | Maria | 9876, 5432

Para cumprir a 1ª Forma Normal, devemos dividir os números de telefone em linhas separadas:

 ID | Nome | Telefone ------------------------- 1 | João | 1234 1 | João | 5678 2 | Maria | 9876 2 | Maria | 5432

2ª Forma Normal (2NF) – Eliminação de Dependências Parciais

A 2ª Forma Normal estabelece que a tabela deve estar em 1ª Forma Normal e que todos os atributos não-chave (colunas) devem ser totalmente dependentes da chave primária. Ou seja, se uma tabela tiver uma chave primária composta (mais de uma coluna), todas as colunas não-chave devem depender de todas as colunas da chave primária.

Exemplo: Imagine uma tabela de pedidos com uma chave primária composta por id_pedido e id_produto:

 id_pedido | id_produto | nome_produto | preço --------------------------------------------- 1 | 101 | Produto A | 10.00 1 | 102 | Produto B | 15.00 2 | 101 | Produto A | 10.00

Observe que o nome do produto e o preço dependem apenas de id_produto, não de id_pedido. Para cumprir a 2ª Forma Normal, devemos dividir essa tabela em duas:

 Tabela de Pedidos: id_pedido | id_produto ----------------------- 1 | 101 1 | 102 2 | 101 Tabela de Produtos: id_produto | nome_produto | preço --------------------------------- 101 | Produto A | 10.00 102 | Produto B | 15.00

3ª Forma Normal (3NF) – Eliminação de Dependências Transitivas

A 3ª Forma Normal exige que a tabela esteja em 2ª Forma Normal e que não haja dependências transitivas. Ou seja, um atributo não-chave não pode depender de outro atributo não-chave. Em vez disso, todos os atributos não-chave devem depender diretamente da chave primária.

Exemplo: Imagine uma tabela de funcionários com as colunas id_funcionario, nome, departamento, e local_departamento, onde o local_departamento depende do departamento:

 id_funcionario | nome | departamento | local_departamento --------------------------------------------------------- 1 | João | TI | Sala 101 2 | Maria | Vendas | Sala 102

Para cumprir a 3ª Forma Normal, devemos dividir a tabela em duas, removendo a dependência transitiva entre departamento e local_departamento:

 Tabela de Funcionários: id_funcionario | nome | departamento ---------------------------------------- 1 | João | TI 2 | Maria | Vendas Tabela de Departamentos: departamento | local_departamento --------------------------------- TI | Sala 101 Vendas | Sala 102

5ª Forma Normal (5NF) – Eliminação de Dependências de Junção

A 5ª Forma Normal, também conhecida como "forma normal de projeção-união", exige que as tabelas sejam divididas de modo que não haja dependências de junção. Isso significa que cada tabela deve armazenar informações sem a necessidade de junções complexas para obter dados completos.

Embora a 5ª Forma Normal seja mais rara na prática, ela pode ser útil em sistemas extremamente complexos. Essa forma normal é usada para garantir que as relações complexas entre as tabelas não criem dependências de junção que dificultem as consultas e a manutenção do banco de dados.

Outras Formas Normais

Além das formas normais discutidas acima, existem outras formas como a 4ª Forma Normal e a 6ª Forma Normal, que lidam com aspectos específicos de dependência de dados, mas são menos aplicadas na maioria dos sistemas.

Benefícios da Normalização

Redução de Redundância: Evita duplicação de dados, o que economiza espaço e facilita a manutenção.
Integridade de Dados: A normalização ajuda a garantir que os dados sejam consistentes e livres de erros de atualização, inserção ou exclusão.
Facilidade na Manutenção: Com tabelas mais simples e bem definidas, a manutenção do banco de dados se torna mais fácil.

Conclusão

A normalização é um aspecto essencial do design de bancos de dados relacionais. Através da aplicação das formas normais, podemos garantir que nossos dados sejam bem organizados, eficientes e fáceis de manter. Embora as primeiras formas normais sejam mais comuns, em casos específicos, formas superiores como a 5ª Forma Normal podem ser necessárias para lidar com casos mais complexos de dependência de dados.

Para mais informações sobre normalização de bancos de dados e as formas normais, consulte a Wikipedia sobre normalização de banco de dados

Data Explorers

Pesquisar este blog