Pojem „big data“ označuje velké objemy dat, které jsou tak rozsáhlé, že tradiční nástroje a techniky pro zpracování dat nejsou schopny je efektivně zpracovat a analyzovat. Charakterizují je tři hlavní vlastnosti známé jako 3V (Volume, Velocity, Variety), v češtině 3R:
- Rozsah: Množství dat je enormní a neustále roste. Může se jednat o data neznámé velikosti, v některých organizacích to mohou být terabajty, petabajty nebo dokonce exabajty dat.
- Rychlost: Data jsou generována a přicházejí rychle, často v reálném čase. To vyžaduje schopnost rychle je zpracovávat a analyzovat.
- Různorodost: Data pocházejí z různých zdrojů a mají různé formáty, jako je text, obrázek, video a další.