분류 전체보기 69

1. 시계열 분석 개요 및 데이터 다루기

시계열 분석(Time series analysis) 1 시계열 분석 1. 시계열 분석 의미 : 시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계 정보를 추출하기 위한 노력 과거 행동을 진단할 뿐만 아니라 미래 행동을 예측하기 위해 시계열 분석을 수행 2 시계열자료의 특징 시간의 영향을 받음 예) 일별주가, 일별 강우량, 월별 실업률, 월별 판매량 등 시계열 자료는 서로 독립이 아니므로 새로운 분석법이 필요 횡단면자료(cross-sectional data)와 종단면자료(longitudinal data) 구분 횡단면 자료 종단면 자료 정의 고정된 시간에 측정된 자료 단위시간에 따라 측정된 자료 특징 관측값들간 독립 관측값들 사이에 연관성 존재 예 2010년 100개 기업의 고용자 수 1970년 ~ 20..

1. 미분(differentiation)과 경사하강법(gradient descent)

1️⃣ 미분(differentiation) 변수의 움직임에 따른 함수값의 변화를 측정하기 위한 도구 편미분(partialdifferentiation) 벡터가 입력인 다변수 함수의 경우 사용 2️⃣ 경사하강법(gradient descent) 1) 경사하강법 함수의 극소값의 위치를 구할 때 사용 목적함수를 최소화할 때 사용 이론적으로 미분가능하고 볼록(convex)한 함수에 대해선 적절한 학습률과 학습횟수를 선택했을 때 수렴 보장 한 번 업데이트할 때마다 전체 데이터를 미분해야 함 ↔ 경사상승법(gradient ascent) : 목적함수를 최대화할 때 사용 2) 파라미터 ① 학습률 : 어느 만큼 이동시킬지 정해주는 것 미분을 통해 업데이트하는 속도 조절. 조심해서 다뤄야 함. 3) 알고리즘 var = ini..

ML | DL 2022.07.14

[IT신문스크랩] 카카오브레인, 한국어 초거대 AI 모델 개발 성과... ‘구글 클라우드 고객 어워즈’ 수상

본문 내용 http://www.aitimes.kr/news/articleView.html?idxno=25482 더보기 구글 클라우드는 카카오브레인이 구글의 AI 추론처리 텐서 프로세싱 유닛(Tensor Processing Units. 이하, TPU)를 활용한 한국어 초거대 AI 모델 개발 성과로 ‘구글 클라우드 고객 어워즈(Google Cloud Customer Awards)’에서 다양성·공평성·포용성, 소셜 임팩트, 미디어 및 엔터테인먼트 등 총 3개 부문을 수상했다. 올해로 2회를 맞이한 구글 클라우드 고객 어워즈는 전 세계 다양한 산업 분야에서 혁신적인 사고를 발휘하고 구글 클라우드의 제품과 솔루션을 활용해 성공적으로 비즈니스를 변화시킨 기업에 수여된다. 카카오브레인은 한국어에 특화된 초거대 AI ..

IT신문스크랩 2022.07.11

[IT신문스크랩] 메쉬코리아, 부릉 AI추천 배차의 '사회적 효과' 연구결과 발표

본문 내용 메쉬코리아, 부릉 AI추천 배차의 '사회적 효과' 연구결과 발표 (news1.kr) 더보기 유통물류 브랜드 부릉(VROONG)을 운영중인 메쉬코리아(의장 유정범)는 자체 기술로 개발해 운영 중인 AI(인공지능) 추천 배차 시스템이 배송기사의 생산성과 수익을 높인다는 연구결과가 경영정보분야 세계 최대 학술대회인 ICIS(International Conference on Information Systems)에서 발표됐다고 21일 밝혔다. 메쉬코리아와 한국과학기술원(KAIST) 연구진(엄지용 교수, 김연서 박사과정)이 공동으로 진행한 이번 연구는 음식 배송기사들이 AI 배차 시스템으로부터 현재 위치와 주문 수행 상황, 예상되는 배송 품질 등이 고려된 적합도 높은 배차를 받음으로써 노동 생산성과 수익..

IT신문스크랩 2022.07.08

[CS] 파일시스템과 터미널 환경

1️⃣ 파일 시스템(File system) 1. 의미 OS에서 파일을 저장하는 트리구조 저장 체계 File from wiki : 컴퓨터 등의 기기에서 의미 있는 정보를 담는 논리적인 단위. 모든 프로그램은 파일로 구성되어 있고, 파일을 사용 2. 파일의 기본 체계 1) 디렉토리(Directory) 폴더 또는 디렉토리로 불림 파일과 다른 디렉토리를 포함할 수 있음 2) 파일(File) 컴퓨터에서 정보를 저장하는 논리적인 단위 파일은 파일명과 확장자로 식별됨(예: hello.py) 실행,쓰기,읽기 등을 할 수 있음 3. 절대 경로와 상대 경로 *경로 : 컴퓨터 파일의 고유한 위치, 트리구조상 노드의 연결 1) 절대 경로 : 루트 디렉토리부터 파일위치까지의 경로 2) 상대 경로 : 현재 있는 디렉토리부터 타깃..

CS 2022.07.07

[IT신문스크랩] 흔들리는 넷플릭스…토종 OTT ‘콘텐트 투자 올인’ 대신 '전략적 협업'[토종 OTT 생존전략①]

본문 내용 https://economist.co.kr/2022/07/06/it/general/20220706091021016.html 더보기 국내 OTT 시장에서 기업들의 경영 전략 변화가 감지되고 있다. 경쟁 관계에 놓여있던 이들이 공동전선을 구축하는가 하면 콘텐트 포트폴리오를 확대하거나, 아예 틈새시장을 노리는 기업도 있다. 올해 초까지만 하더라도 너나 할 것 없이 콘텐트 투자에 뭉칫돈을 쏟아붓겠다고 공언했던 것과 상반된 행보다. “2025년까지 1조원 투자 목표(콘텐츠웨이브)”, “향후 5년간 5조원 투입(CJ ENM)”, “3년간 5000억원 이상 투자(스튜디오지니)” 등이 대표적이다. 이들은 자사 플랫폼에서만 볼 수 있는 독점 콘텐트를 내세워 소비자를 매료할 생각이었다. 대규모 지출이 불가피하지..

IT신문스크랩 2022.07.07

[IT신문스크랩] #1. 구글에 검색광고시장 뺏기는 ‘네카오’

본문 내용 https://www.mk.co.kr/news/it/view/2022/07/586008/ 더보기 구글의 국내 검색광고시장 점유율이 4년여 만에 2배 가까이 성장하면서 30%에 육박했다. 1위 사업자 네이버는 지난 연말 처음으로 시장점유율 70% 달성에 실패하더니 최근에는 65% 선도 불안하다. 카카오는 수년간 10%의 벽을 넘지 못하고 되레 반토막이 났다. 4일 데이터 기술전문기업인 NHN데이터에 따르면 지난달 구글애즈(Ads)의 국내 검색광고 상품별 평균유입률이 28.6%에 이르면서 역대 최대치를 기록했다. 유입률은 광고를 통해 관련 홈페이지나 상품에 접속한 고객 수를 뜻한다. 구글애즈는 2018년 말 15.6%에서 꾸준히 상승해 2020년 말 20%를 돌파한 데 이어, 지난 연말에는 25...

IT신문스크랩 2022.07.06

1-2. 이산 균일분포와 이항분포

1 이산 균일분포 1. 이산 균일분포(Uniform Distribution) 표본공간 내의 모든 사건의 발생 가능성이 동일한 확률분포 이산 균등분포라고도 함. 주머니 속에 1부터 10까지 적힌 공이 들어 있고, 하나를 뽑을 때 나오는 눈이 관측될 확률 2 이항분포 1. 베르누이 시행(Bernoulli trial) 결과는 두 가지(성공, 실패)이고, 각각의 결과가 서로 독립적인 시행 각 시행에서 '성공'의 확률 p는 변하지 않음. 모든 시행들은 서로 독립 2. 이항분포(Binomial Distribution) 성공률 p인 베르누이 시행을 독립적으로 n번 반복 시행할 때, 성공의 횟수를 X. X는 이항분포를 따름 - 100개의 제품을 불량품과 양호품으로 구분하는 경우 - 1,000명의 유권자에게 정부정책에 ..

1-1. 확률

1 확률변수와 확률분포 * 확률(Probability) : 어떤 현상이 일어날 가능성에 대한 믿음의 정도 어떤 실험에서 특정한 사건의 발생 비율에 해당되는 개념(0~1) 확률 = 가능성 = % 1. 확률변수(random variable) 표본공간 내의 각 사건들에 실수값을 대응시키는 함수 2. 확률분포(Probability Distributions) 확률변수 X의 각 값(x)에 대응하는 확률(0~1)을 표시 1) 이산확률분포(Discrete Probability Distributions) 일양분포, 이항분포, 포아송분포, 초기하분포, 기하분포 2) 연속확률분포(Continuous Probability Distributions) 정규분포, t-분포, 카이제곱분포, f분포 2 확률 특성 1. 2. 순열과 조..

728x90