Guia de boas práticas para particionar tabelas no Data Lake, incluindo recomendações de quando e como particionar para otimizar performance e custos.
<dimensão>_data_particao
com formatos ‘YYYY-MM-DD’.
Particione pela coluna mais frequentemente utilizada nas cláusulas WHERE das consultas SQL.Isso maximiza os benefícios do particionamento, pois permite que o mecanismo de consulta descarte rapidamente partições irrelevantes que precisam ser escaneados Por exemplo, se a maioria das consultas filtra por data de criação, particione por esse campo.
DATE
, TIMESTAMP
ou DATETIME
(não pode ser campo repetido ou aninhado/STRUCT).INTEGER
(também não pode ser campo repetido ou aninhado/STRUCT).