분류 전체보기 54

[분류] 1. 로지스틱 회귀분석

1️⃣ 로지스틱 회귀분석 1. 로지스틱 회귀분석(Logistic Regression) 지도학습, 선형 회귀모델 기반의 이진/다중 분류모형 독립변수는 연속형 자료 , 종속변수는 범주형 자료 이진분류 : 유방암 예측(Wisconsin breast cancer data) 다중분류 : 스팸 메일 분류, handwritten digits data 2. 특징 클래스 소속 확률(odds)을 이용하여 분류 활성함수 : Sigmoid 함수 이용 2️⃣ scikit-learn 실습 1. 패키지 불러오기 from sklearn.linear_model import LogisticRegreesion 2. 하이퍼파라미터 logreg = LogisticRegression(C = 1e5, solver = 'lbfgs', multi_..

ML | DL 2022.08.10

3. 시계열 분석의 확률과정 및 정상성

1️⃣ 시계열 자료와 확률과정 1. 확률과정(Stochastic process) ① 시계열 자료 시간을 통해서 순차적으로 발생한 실측값 ② 확률과정 시점 t에 대응되는 확률변수들의 집합 2. 정상성 ① 정의 및 특징 정의 : 시계열의 확률적인 성질들이 시간의 흐름에 따라 불변 특징 뚜렷한 추세가 없음. 즉, 시계열의 평균이 시간 축에 평행 시계열의 진폭(변동)이 시간의 흐름에 따라 일정 시계열 자료의 과거와 미래의 상관관계가 시간의 흐름에 따라 일정 ② 평균, 분산, 자기공분산 정상성은 평균, 분산, 자기공분산이 시점 t에 관계없이 일정 평균 μ 는 모든 시점에서 일정 분산 σ^2 는 모든 시점에서 일정 자기공분산이 시차(time lag, k = t - s)에만 의존 ③ 정상성을 갖는 시계열 자료 그림 ..

2. 전통적 방법 : 시계열 데이터 구성요소(추세, 순환, 계절, 우연변동)

*유튜브 김성범[소장 / 인공지능공학연구소] 강의를 바탕으로 정리한 내용입니다. 1 시계열 데이터 구성요소 1. 추세변동(Trends) 시간이 경과함에 따라 관측값이 지속적으로 증가하거나 감소하는 추세를 갖는 경우의 변동 10년 이상 동일방향으로 상승 또는 하강 경향을 나타내는 요인 주로 경제 데이터에서 발생 2. 순환, 주기변동(Cycle) 주기적인 변화를 가지나 계절에 의한 것이 아니고 주기가 긴 경우의 변동 확장과 수축 과정을 반복하는 주기적인 변동요인 주기나 폭이 애매하지만 cycle이 있음 3. 계절변동(Season) 주별, 월별, 계절별과 같이 주기적인 요인에 의한 변동 4. 우연변동, 불규칙변동 시간에 따른 규칙적인 움직임과는 무관하게 랜덤한 원인에 의해 나타나는 변동 천재지변, 정책 변화 ..

2-1. 조건부 확률과 베이즈정리

1 조건부 확률 1. 조건부 확률(Uniform Distribution) A 사건이 이루어진 이후에 B 사건이 발생할 확률 Association Rule, 정확도, 추천시스템에 활용 컴퓨터를 산 사람에게 마우스를 사라고 추천한다면? → B|A 2 베이즈 정리 1. 베이즈 정리(Bayes' Rule) 사전(prior) 확률과 사후(posterior) 확률 사이의 관계를 조건부 확률을 이용해 계산하는 확률 실제생활에서는 사후 확률만 알고 있는 경우가 많음. 2. 사전 설계 코호트(Cohort) 연구, 전향적 연구 P(B|A) : 원인(A)가 발생한 후 결과(B)가 나타날 확률 A(원인) → B(결과) 3. 사후 설계 사례 - 대조연구, 후향적 연구 P(A|B) : 결과(B)가 나온 이후에 원인(A)일 확률 ..

1-3. 포아송분포와 지수분포

1 포아송분포 1. 포아송분포(Poisson distribution) 랜덤하게 선택한 일정한 단위 시간이나 공간 내에 발생하는 사건의 개수를 설명 지수분포 와 역의 관계 경영학에서는 대기시간 모형 에서 많이 사용 K 서비스 센터는 5분에 평균 1.5회의 전화가 온다. 5분 동안에 2회의 전화를 받을 확률은? 2 지수분포 1. 지수분포(Exponential distribution) 연속확률분포 두 사건 사이의 시간에 대한 확률 K 서비스 센터는 5분에 평균 1.5회의 전화가 온다. 대기시간이 1분이내일 확률은?

1. 시계열 분석 개요 및 데이터 다루기

시계열 분석(Time series analysis) 1 시계열 분석 1. 시계열 분석 의미 : 시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계 정보를 추출하기 위한 노력 과거 행동을 진단할 뿐만 아니라 미래 행동을 예측하기 위해 시계열 분석을 수행 2 시계열자료의 특징 시간의 영향을 받음 예) 일별주가, 일별 강우량, 월별 실업률, 월별 판매량 등 시계열 자료는 서로 독립이 아니므로 새로운 분석법이 필요 횡단면자료(cross-sectional data)와 종단면자료(longitudinal data) 구분 횡단면 자료 종단면 자료 정의 고정된 시간에 측정된 자료 단위시간에 따라 측정된 자료 특징 관측값들간 독립 관측값들 사이에 연관성 존재 예 2010년 100개 기업의 고용자 수 1970년 ~ 20..

1. 미분(differentiation)과 경사하강법(gradient descent)

1️⃣ 미분(differentiation) 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구 편미분(partialdifferentiation) 벡터가 입력인 다변수 함수의 경우 사용 2️⃣ 경사하강법(gradient descent) 1) 경사하강법 함수의 극소값의 위치를 구할 때 사용 목적함수를 최소화할 때 사용 이론적으로 미분가능하고 볼록(convex)한 함수에 대해선 적절한 학습률과 학습횟수를 선택했을 때 수렴 보장 한 번 업데이트할 때마다 전체 데이터를 미분해야 함 ↔ 경사상승법(gradient ascent) : 목적함수를 최대화할 때 사용 2) 파라미터 ① 학습률 : 어느 만큼 이동시킬지 정해주는 것 미분을 통해 업데이트하는 속도 조절. 조심해서 다뤄야 함. 3) 알고리즘 var = ini..

ML | DL 2022.07.14

[IT신문스크랩] 카카오브레인, 한국어 초거대 AI 모델 개발 성과... ‘구글 클라우드 고객 어워즈’ 수상

본문 내용 http://www.aitimes.kr/news/articleView.html?idxno=25482 더보기 구글 클라우드는 카카오브레인이 구글의 AI 추론처리 텐서 프로세싱 유닛(Tensor Processing Units. 이하, TPU)를 활용한 한국어 초거대 AI 모델 개발 성과로 ‘구글 클라우드 고객 어워즈(Google Cloud Customer Awards)’에서 다양성·공평성·포용성, 소셜 임팩트, 미디어 및 엔터테인먼트 등 총 3개 부문을 수상했다. 올해로 2회를 맞이한 구글 클라우드 고객 어워즈는 전 세계 다양한 산업 분야에서 혁신적인 사고를 발휘하고 구글 클라우드의 제품과 솔루션을 활용해 성공적으로 비즈니스를 변화시킨 기업에 수여된다. 카카오브레인은 한국어에 특화된 초거대 AI ..

IT신문스크랩 2022.07.11

[IT신문스크랩] 메쉬코리아, 부릉 AI추천 배차의 '사회적 효과' 연구결과 발표

본문 내용 메쉬코리아, 부릉 AI추천 배차의 '사회적 효과' 연구결과 발표 (news1.kr) 더보기 유통물류 브랜드 부릉(VROONG)을 운영중인 메쉬코리아(의장 유정범)는 자체 기술로 개발해 운영 중인 AI(인공지능) 추천 배차 시스템이 배송기사의 생산성과 수익을 높인다는 연구결과가 경영정보분야 세계 최대 학술대회인 ICIS(International Conference on Information Systems)에서 발표됐다고 21일 밝혔다. 메쉬코리아와 한국과학기술원(KAIST) 연구진(엄지용 교수, 김연서 박사과정)이 공동으로 진행한 이번 연구는 음식 배송기사들이 AI 배차 시스템으로부터 현재 위치와 주문 수행 상황, 예상되는 배송 품질 등이 고려된 적합도 높은 배차를 받음으로써 노동 생산성과 수익..

IT신문스크랩 2022.07.08

[CS] 파일시스템과 터미널 환경

1️⃣ 파일 시스템(File system) 1. 의미 OS에서 파일을 저장하는 트리구조 저장 체계 File from wiki : 컴퓨터 등의 기기에서 의미 있는 정보를 담는 논리적인 단위. 모든 프로그램은 파일로 구성되어 있고, 파일을 사용 2. 파일의 기본 체계 1) 디렉토리(Directory) 폴더 또는 디렉토리로 불림 파일과 다른 디렉토리를 포함할 수 있음 2) 파일(File) 컴퓨터에서 정보를 저장하는 논리적인 단위 파일은 파일명과 확장자로 식별됨(예: hello.py) 실행,쓰기,읽기 등을 할 수 있음 3. 절대 경로와 상대 경로 *경로 : 컴퓨터 파일의 고유한 위치, 트리구조상 노드의 연결 1) 절대 경로 : 루트 디렉토리부터 파일위치까지의 경로 2) 상대 경로 : 현재 있는 디렉토리부터 타깃..

CS 2022.07.07
728x90