Um data lake é uma solução centralizada que permite o armazenamento, processamento e proteção de grandes quantidades de dados
A tradução literal do conceito é bastante sugestiva: lago de dados. A imagem remete a um volume imenso de informação bruta armazenada em algum lugar
Os data lakes armazenam conjuntos grandes de massas de dados, que podem incluir uma combinação de dados estruturados, não estruturados e semiestruturados
Um data lake precisa ser organizado, para não se tornar um depósito confuso de informações, onde os usuários podem não encontrar o que precisam
Hoje, a maior parte dos data lakes integra as arquiteturas de dados em nuvem de muitas organizações