빅데이터분석기사(필기) 1과목 정리
빅데이터 개념 데이터 : 객관적 사실, 가공하기 전 정보 : 가공, 처리하여 의미가 도출된 요소 지식 : 유의미한 정보로 분류하고 일반화 지혜 : 맥락에 의해 도출되는 창의적 아이디어 데이터 양을 측정하는 단위의 크기 KB < MB < GB < TB < PB < EB < ZB < YB ( 10^3, 2^10 부터 시작) 빅데이터 특성 규모, 다양성, 속도, 가치, 신뢰성, 정확성, 휘발성 데이터 거버넌스 개념 : 기업에서 사용하는 데이터의 가용성, 유용성, 통합성, 보안성을 관리하기 위한 정책과 프로세스를 다루며, 프라이버시, 보안성, 데이터 품질, 관리 규정 준수를 강조하는 모델 구성요소 : 원칙, 조직, 프로세스 조직평가를 위한 성숙도 단계 도입 단계 : 분석을 시작해 환경과 시스템을 구축하는 단계 ..
2024. 4. 6.
Apriori 연관 규칙 알고리즘 - 개념, 전처리 방법, 모델 적용
연관규칙 알고리즘의 이해 Apriori 알고리즘은 연관 규칙 학습 알고리즘 중 하나로, 데이터셋에서 특정 항목들 간의 연관성을 찾아내는 데 사용된다예를 들어, 고객의 구매 기록을 분석하여 '우유를 산 고객들은 계란도 산다' 등과 같은 연관성을 찾아낼 수 있다. "Apriori 원칙" "특정 항목 집합이 자주 발생한다면, 그 항목들의 부분 집합들도 자주 발생한다" 는 것을 기반으로 한다,즉, 자주 발생하는 항목 집합의 하위 집합들은 더 자주 발생할 가능성이 높다는 것을 의미한다. 더 쉽게 설명하면, 다음과 같은 상황이 발생했다고 가정해보자. A 고객은 마트에서 '파, 양파, 두부' 를 한번에 구매했다. B 고객은 마트에서 '양파, 두부'를 한번에 구매했다.C 고객은 마트에서 '두부, 파'를 한번에 구..
2024. 3. 24.