Шта је складиштење података?
Складиштење података је електронско складиштење велике количине информација од стране компаније или организације. Складиштење података је витална компонента пословне интелигенције која користи аналитичке технике пословних података.
Концепт складиштења података увели су 1988. ИБМ истраживачи Барри Девлин и Паул Мурпхи. Потреба за складиштењем података еволуирала је како су рачунарски системи постали сложенији и рјешавали све веће количине података. Кључна књига о складиштењу података је ВХ Инмонова књига „Изградња складишта података“ која је први пут објављена 1990. године и од тада је више пута тискана.
Како функционише складиштење података
Складиштење података користи се за пружање бољег увида у перформансе компаније упоређивањем података обједињених из вишеструких хетерогених извора. Складиште података је дизајнирано за покретање упита и анализа историјских података изведених из трансакцијских извора.
Једном када се подаци уграде у складиште, они се не мењају и не могу се мењати, јер складиште података анализира догађаје који су се већ догодили фокусирајући се на промене података током времена. Подаци који се складиште морају бити ускладиштени на сигуран начин, поуздано, лако проналажење и лако управљање.
Постоје одређени кораци који се подузимају за стварање складишта података. Први корак је вађење података, који укључује прикупљање велике количине података из више изворних тачака. Након састављања података он пролази кроз чишћење података, процес чешљања података за грешке и исправљања или искључења евентуалних пронађених грешака.
Очишћени подаци се тада претварају из формата базе података у формат складишта. Након што се чувају у складишту, подаци пролазе кроз сортирање, консолидацију, резимирање, итд. Тако да су координиранији и лакши за употребу. Временом се у складиште додаје више података како се вишеструки извори података ажурирају.
Кључне Такеаваис
- Складиштење података је електронско складиштење велике количине информација од стране компаније или организације. Складиште података је дизајнирано за покретање упита и анализа историјских података изведених из трансакцијских извора за потребе пословне интелигенције и рударства података. Складиштење података користи се за веће увид у рад компаније упоређивањем података обједињених из вишеструких хетерогених извора.
Посебна разматрања: Мининг података
Предузећа могу да складиште податке за коришћење у истраживању и вађењу података, тражећи обрасце информација који ће им помоћи да побољшају своје пословне процесе. Добар систем складиштења података такође може олакшати разним одељењима компаније да приступе подацима других.
На пример, складиште података може омогућити компанији да лако процени податке продајног тима и помогне му у доношењу одлука о томе како побољшати продају или поједноставити одељење. Предузеће би се могло одлучити да се фокусира на навике потрошње својих купаца како би боље позиционирало своје производе и повећало продају.
Помоћу складиштења података, компанија може да прикупи историјске податке о потрошњи својих клијената током протеклих, рецимо, 20 година, и да изврши аналитику ових података. Добијене информације могу пружити увид у склоности својих потрошача; доба дана, месеца или године са већом продајом; или највећи потрошач у години.
Ефективно складиштење и управљање подацима су такође оно што омогућава процесе, као што су покретање резервација путовања и коришћење аутоматизованих машина за обраду података.
Процес рударјења података рашчлањује се на пет корака:
- Организације прикупљају податке и убацују их у своја складишта података. Затим их складиште и управљају, било на интерним серверима или у облаку. Пословни аналитичари, менаџерски тимови и стручњаци за информациону технологију приступају подацима и одређују како их желе организовати. Апликацијски софтвер затим сортира податке на основу резултата корисника. Крајњи корисник коначно представља податке у формату за лако дељење, као што је граф или табела.
Складиштење података у односу на базе података
Складиште података није нужно исти концепт као стандардна база података. База података је трансакциони систем који је постављен за надгледање и ажурирање података у реалном времену како би били доступни само најновији подаци. Складиште података је програмирано тако да агрегира структуриране податке током одређеног временског периода. На пример, база података може имати само најновију адресу купца, док складиште података може имати све адресе у којима је купац живео последњих 10 година.
