본문 바로가기

분류 전체보기113

Linear Algebra for AI_1 Introductory Linear Algebra for AIAI에서 선형대수는 핵심적인 역할을 한다. 벡터와 행렬을 다룰 수 있어야 머신러닝과 딥러닝의 수학적 원리를 이해할 수 있다.이 포스팅에서는 선형대수의 기본 개념부터 AI에서 어떻게 활용되는지까지 개괄적으로 정리한다.1. Fundamental Concepts of Linear Algebra선형대수에서 중요한 개념(연산)크게 Addition 과 Scaler Multiplication(Scailing) 이 있다.Addition (벡터/행렬의 덧셈과 뺄셈) : 벡터나 행렬의 요소별로 더하고 빼는 연산Scalar Multiplication (스칼라 곱셈) : 하나의 숫자(스칼라)를 벡터 또는 행렬에 곱해서 크기를 조정Linear Combination (.. 2025. 2. 23.
DataBase_Relational Data Model 1. Relational Database 개요Relational Database(관계형 데이터베이스)는 여러 개의 Relation(테이블)로 구성되며, 데이터를 구조화된 형태로 저장하고 관리하는 데이터 모델이다. 여기서, set(집합)의 개념은 관계형 데이터베이스를 이해하기 위해 꼭 알아야 하는 개념이다. 2.1 Set (집합)의 특징서로 다른 요소(Elements)를 가지는 Collection순서는 중요하지 않다2.2 Relation의 개념Set of Tuples (튜플들의 집합)데이터베이스에서 테이블(Table)로 표현된다2.3 Cartesian Product (직교곱) 개념집합 A와 B가 있을 때, Cartesian Product는 두 집합의 모든 가능한 조합을 의미한다.Set A = {학생1, 학.. 2025. 2. 20.
폐쇄망에서 파이썬 패키지 설치하기 인터넷 환경에서 사용하던 가상 환경 하나를 폐쇄망에서 설치하고 싶은 경우 PC 환경- 인터넷 가능 PC1,-  폐쇄망(DB) PC2 요약- PC1 : 패키지, 파이썬 버전 다운로드 파일로 저장- PC2 : 설치 1. PC1 ( 인터넷 o)패키지 다운로드(1) 가상환경 접속 후 , 설치된 패키지 목록을 requirements.txt 로 저장pip freeze > requirements.txt (2) requirements.txt 확인 및 정리requirements.txt 파일을 열어보면 //file , @ 등을 제거한다. (3) 패키지 다운로드패키지 폴더를 생성한 후, requirements.txt 에 있는 패키지를 whl/tar.gz 형태로 저장한다(install(x), download(x))pip do.. 2025. 1. 15.
Regression 손실 함수와 최적화 Supervised Learning (지도 학습)| Supervised Learning -> Input(x) 와 대응되는 target(y) 가 있는 경우데이터셋을 통해 새로운 입력(x) 가 주어졌을 때 y 를 출력하는 모델을 학습시킴모델의 출력값 y 를 prediction , 정답 y를 Label 이라고 함Y의 형태에 따라 Regression(회귀) - 실수형, Classification(분류)로 나뉨Conditional Probability Model(조건부 확률 모델)| True Distribution: 데이터는 실제 분포 P(X,Y)에서 Random sampling 된다고 가정 >  i.i.d (independent and identically distributed) 가정  :  샘플들이 서로 독립.. 2024. 12. 8.
A/B test , Uplift Modeling_1 A/B test 개요A/B test에 관한 것, 가설설정에 필요한 세부 요소, 데이터 분석가의 역할을 중심으로 설명할 것이다.1 ) A/B Test?| 대조군(A) 과 실험군(B)을 비교해 더 나은 성과를 나타내는 방법이 무엇인지 측정하는 실험 Audience(테스트 대상)대조군(Control) : 어떤 '처치'도 하지 않은 그룹실험군(Vaiation) : '처치'를 한 그룹 여기서, '처치' 란 콘텐츠, UX/UI , 프로모션 등을 적용한 것을 의미한다.대조군 대비 실험군이 어떤 성과를 보이느냐, 해당 성과가 더 나은 것인지 판단하는 목적으로 시행한다. 측정 : '전환' 즉, 의도한 액션을 취했는지를 비교데이터 분석가의 역할 : 대조군과 실험군의 차이가 통계적으로도 유의한 지 판단 "A/B test 는.. 2024. 12. 1.
항등 함수와 소프트맥스 함수 기계학습 문제는 크게 회귀와 분류로 나눈다.회귀에서는 출력층의 활성화 함수로, 항등 함수를분류에서는 출력층의 활성화 함수로, 소프트맥스 함수를 이용한다.1. 항등함수 identity function항등함수는 입력을 그대로 출력하는 함수이다.입력과 출력이 항상 같다는 뜻의 항등이다. 따라서 신경망에서 항등함수를 사용하게 되면, 입력 신호와 출력신호가 같다.  2. 소프트맥스 함수 softmax function$ y_{k} = exp(a_{k}) / \sum_{i = 1}^{n}exp(a_{i}) $ n : 출력층의 뉴런 수k : k번째 출력 소프트맥스 함수의 분자는 입력신호의 지수함수, 분모는 모든 입력 신호의 지수함수의 합이다.이를 그림으로 나타내면 다음과 같다.  즉, 츨력층의 각 뉴런이 모든 입력신호.. 2024. 9. 23.
신경망과 활성화함수 단층 퍼셉트론으로 AND, OR 게이트를 표현할 수 있고, 다층 퍼셉트론을 통해 XOR게이트를 표현할 수 있다는 것을 알았다.이번에는 신경망과 퍼셉트론의 차이점인 활성화 함수에 대해서 다뤄본다. 1. 신경망과 퍼셉트론신경망은 입력층(0층) > 은닉층 > 출력층으로 나눌 수 있다.신경망과 퍼셉트론의 차이점을 이해하기 위해, 퍼셉트론을 다시 생각해본다. $ y = \begin{Bmatrix}0  (b + w_{1}x_{1}+ w_{2}x_2 \leq \theta ) \\1  (b + w_{1}x_{1}+ w_{2}x_2 > \theta  \end{Bmatrix} $ 이 식을 조금 다른 형태로 작성해본다면, $ y = h(b + w_{1}x_{1}+ w_{2}x_2) $$ h(x) = \begin{Bmatri.. 2024. 9. 21.
퍼셉트론과 논리회로 1 퍼셉트론을 이해하기 위해, 논리회로를 직접 구현하면서 기초부터 정리했다.퍼셉트론과 신경망에 앞서, 함수를 구현하기 위해 가장 기본적인 Numpy 라이브러리의 브로드캐스트 기능을 먼저 알아야 한다.1. Numpy 브로드 캐스트넘파이 배열(np.array)은 N차원 배열을 작성할 수 있다.1차원 배열 : 벡터(Vector)2차원 배열 : 행렬(Matrix)3차원 배열 : 텐서(Tensor) 넘파이에서는 서로 다른 배열끼리도 계산할 수 있는 브로드캐스팅 기능이 있다.a = np.array([[3,4],[5,6]])b = np.array([10,20]) # [10,20],[10,20]의 계산과 동일하게 적용됨print(a*b)[[ 30 80] [ 50 120]] 이 기능을 사용해서 다차원 배열을 가지고 있는 .. 2024. 9. 18.
가중치 규제 - Ridge,Lasso,Elastic Net 0.  과적합(Overfitting) 과 일반화 성능회귀분석의 성능을 평가할 때 대부분 실제값 - 예측값의 차이를 가지고 평가한다.실제값 - 예측값의 관계만 살펴보게 되면 회귀계수에 대해서 과적합이 되는 경우가 발생할 수 있다.이렇게 되면, 당연히 train 데이터 성능보다,  test 데이터에서는 성능이 잘 안 나올 수 있고, 실시간 배치 데이터를 받았을 때 성능이 나빠질 수 있다. 과적합을 방지하여 일반화 성능을 높이는 방법은 다음과 같다. 1. 학습 데이터 늘리기2. 모델의 복잡도 줄이기3. 가중치 규제(Regularization) 적용4. 드롭아웃 모델은 기본적으로 손실함수(Cost Function)을 최소화하는 방법으로 작동한다.이때, 학습데이터에 존재하는 노이즈가 과하게 모델에 반영되어, 손실.. 2024. 7. 28.
ANOVA(Analysis of Variance , 분산 분석) ANOVA(Analysis of Variance , 분산 분석)이란?집단 간의 차이를 비교하기 위한 분석이다.두 집단까지는 평균 차이(T-Test)를 이용하여 검정하였지만, 세 집단부터는 분산(F-통계량)을 이용해서 통계적 유의성을 검정한다. 🔎 왜 세 집단 이상부터는 평균(Average)이 아니라, 분산(Variance) 을 이용해서 검정할까?T검정을 독립적으로 연속해서 수행할 경우, 유의 수준(significance level)이 왜곡된다.예를 들어 A,B,C 세 집단이 있다. 이들의 평균을 비교하고, 해당 표본 집단의 평균이 모집단에서도 유의한지 검정해보려면 두 집단씩 T- Test 를 하게 된다.(A와 B 비교, A와 C 비교, B와 C 비교)유의 수준을 5%(두 집단 간 평균 차이가 우연히 발.. 2024. 6. 1.