분류 전체보기 76

고도화된 RAG: 단순히 검색만으로는 한계가 있다 (Self-RAG, GraphRAG)

전통적인 RAG 기술 👀chunking, query 변형, 검색 알고리즘, re-rank, ... 1️⃣ Self-RAG💫 Self-Reflection (자체 반영)검색된 문서와 생성된 응답 모두에 대해 점검하고 검증하는 추가 단계를 포함 → 자체 평가LLM이 기존 RAG의 각 단계에 직접 개입하여 보다 정교한 제어를 수행하는 방식1) 작동방식검색: 사용자의 질문을 분석하여 외부 데이터 검색이 필요한지 결정(Retrieve=yes 토큰 출력)생성: 검색된 정보가 있으면, 이를 바탕으로 답변관련성 평가: 검색된 문서의 관련성 평가답변 생성: 관련 정보가 있는 문서가 존재할 경우 → 자신의 기존 지식 + 검색 정보 결합한 포괄적인 답변 관련 정보가 있는 문서가 없다면 →..

NLP | LLM 2025.06.20

RAG & Agent 시스템 성능 검증은 어떻게 할까?

1. RAG 시스템 성능 검증1.1 컴포넌트별 평가 (Component-wise Evaluation)1.1.1 Retrieval 성능 평가지표공식설명측정 방법Precision@KP@K = (관련 문서 수 in top-K) / K상위 K개 중 관련 문서 비율수동 라벨링 또는 자동 판정Recall@KR@K = (검색된 관련 문서 수) / (전체 관련 문서 수)전체 관련 문서 중 검색된 비율완전한 관련성 데이터셋 필요Mean Reciprocal Rank (MRR)MRR = (1/|Q|) Σ (1/rank_i)첫 번째 관련 문서의 평균 역순위여러 쿼리에 대한 평균Normalized DCG (NDCG)NDCG = DCG / IDCG순위를 고려한 누적 이득관련성 점수 기반 (0-3점 등)Hit RateHR@K = ..

NLP | LLM 2025.06.19

[카카오 코테 2018 | python] 비밀지도

문제 링크 : https://school.programmers.co.kr/learn/courses/30/lessons/17681level1프로그래머스Q1) 문제를 어떻게 이해했나요?A1) 주어진 두 지도를 각각 이진수 형태로 변환하고, 각 위치에서 둘 중 하나라도 벽(1)이면 전체 지도에서 벽으로 표시해야합니다.Q2) 어떤 방식으로 풀건가요?A2) OR 연산을 수행하여 둘 중 하나라도 1이면 1이 되도록 처리를 합니다. 그리고, 그 결과를 n자리의 2진수로 변환합니다.2진수 문자열에서 '1' 은 '#'으로 '0'은 ' '으로 치환하여 리스트로 반환합니다. 🔥 내 코드: 2진수를 직접 구하는 함수를 만들었음def num_to_2(n, num): result = "" while num > 0: ..

Algorithm 2025.06.19

[카카오 코테 2018 | python] [1차] 다트 게임

문제 링크: https://school.programmers.co.kr/learn/courses/30/lessons/17682level1Q1) 이 문제 어떻게 이해하셨나요?A1) 이 문제는 다트 점수를 규칙에 따라 계산한 다음 총합을 구하는 문제라고 이해했습니다. 다트는 총 3세트로 구성이 되어있고, 각 세트는 점수, 보너스, 옵션으로 구성되어있습니다.Q2) 어떻게 풀 계획인가요?A2) 우선 입력값의 문자열을 순서대로 탐색하면서 점수, 보너스, 옵션을 파싱합니다.점수를 계산한 후, 옵션에 따라 현재 점수와 이전 점수를 처리하고 마지막에 점수 리스트의 합을 반환합니다.*풀이 과정1. 먼저 문자열을 탐색하면서 점수를 뽑는데, 10은 두자리 숫자라서 예외처리를 해줘야합니다.2. 점수를 뽑았으면 그 다음 문자는..

Algorithm 2025.06.19

데이식스 3번째 팬미팅 🍀I Need My Day🍀 후기

2024년 6월 23일 여름냄새 가득한 날잠실실내체육관에서 팬미팅이 열렸다. 컨셉은 직장인...🫠왜 하필 직장이야...!!!아무리 데이식스라도 팬미팅에서까지 회사를 떠올리게 만드는 건 싫어!!!라는 약간의 아쉬움과 함께 팬미팅장소로 도착했다. 자리는 2층 나름 가운데였고, 또 나름 앞이었다.시야 나쁘지 않았음! 본격적인 팬미팅시작!!직장인 컨셉이 무색하게 아주 많이 "CUTE" 했다 😊🦊 🐻 🐶 🐰 🍀 분명 "승진 게임"을 하고 있는데 귀여워...팀장, 부장, 사원 이런 단어들이 막 나오는데다행히 PTSD 안왔음ㅎㅏ하하(안웃겨) 귀엽다 🍀🍀🍀 이날 팬미팅 끝나고 도운의 "문득" 만 주구장창 들으면서 집에 간 것 같다. 기념사진까지 귀여움 팬미팅은 처음이었는데 다른 매력이 있다. 진짜 회..

Better Life 2025.06.18

[통계] 교차분석(Cross Tabulation Analysis)

1. 교차분석 의미- 독립변인과 종속변인이 모두 명목척도 혹은 서열척도로 측정한 불연속 변인일 때 적용하는 통계방법 교차분석은 2개 또는 그 이상의 범주 변인들에 근거한 케이스들의 중복된 빈도 분포를 생산하는 과정에서 적용되는 통계 기법이다. 이때 생산한 빈도 분포표를 교차표(cross tabulation table) 또는 분할표(contingency table)라고 하며, 1904년 칼 피어슨(Karl Pearson)이 처음으로 사용했다. 교차분석은 두 범주 변인 간 관계가 상호 독립 관계인지 아니면 상호 연관성을 맺고 있는지를 검증하는 방법이다. 이 중 카이제곱 교차분석은 실제로 나온 관찰빈도(observed frequency)와 각 셀에서 통계적으로 기대할 수 있는 빈도, 즉 기대빈도(expecte..

[인공지능 기초수학] #3. 벡터 with 인공지능, 파이썬

1. 의미- 크기(magnitude)와 방향(direction)을 가진 물리량, 차원의 공간에 존재- (대수적 정의) 수 또는 함수의 나열- 보통 데이터의 묶음(tuple), 열과 행 존재- 데이터 레코드 하나를 단독으로 벡터로 나타낼 때는 열 하나로 표시 2. 단위 벡터 - 같은 벡터라도 좌표가 다를 수 있다.- 길이가 1인 벡터, 방향o, 크기 영향x- 정규화(normalizing) : 벡터를 단위 형태로 변환하는 것 3. 벡터의 크기 = 길이 = normfrom scipy import linalglinalg.norm(a) # norm - L1 : 컴퓨터 비전에서 주로 씀 |x| = a+b+c- L2 : K-평균 클러스터링과 K-최근접 |x| = sqrt(a+b+c)linalg.norm(a, ord ..

ML | DL 2025.06.18

[인공지능 기초수학] #2. 스칼라, 벡터, 행렬, 텐서

1. 선형대수- 데이터 분석에 필요한 각종 계산을 돕는 학문- 대량의 데이터를 포함하는 복잡한 계산 과정을 간단한 수식으로 서술 할 수 있다. ① 스칼라- 실수(real number)인 숫자 중 하나 ② 벡터- 크기(magnitude)와 방향(direction)을 가진 물리량, 차원의 공간에 존재- (대수적 정의) 수 또는 함수의 나열- 보통 데이터의 묶음(tuple), 열과 행 존재- 데이터 레코드 하나를 단독으로 벡터로 나타낼 때는 열 하나로 표시 [인공지능 기초수학] #3. 벡터 with 인공지능, 파이썬[참고도서] : 모든 이미지의 저작권은 해당 링크에 있습니다. https://thebook.io/080246/part03/ch10/unit...blog.naver.com ③ 행렬- 2차원 배열- ..

ML | DL 2025.06.18

[인공지능 기초수학] #1 미분법 - 오차역전파

1. 오차역전파란?역전파는 계산 결과와 정답의 오차를 구해서 이 오차에 관여하는 노드 값들의 가중치와 편향을 수정하는데, 이때 오차역전파(backpropagation)는 오차가 작아지는 방향으로 반복해서 수정합니다. 이 횟수가 커지면 그만큼 정확성은 높아지지만 시간이 오래 걸리는 단점이 있고, 횟수가 작아지면 정확성은 떨어지지만 시간이 단축되는 장점이 있습니다. 이 횟수의 주기를 1 에포크(epoch)라고 하며, 에포크를 늘리면서 가중치와 편향을 업데이트(학습)하여 점점 오차를 줄여 나갑니다. 2. 계산방식(1) 입력 값에 가중치를 곱한 값과 편향을 합하여 그 값이 임계치인 0을 넘으면 1을 출력하고, 그렇지 않으면 0을 출력하는 순전파 과정을 거친다.(2) 출력 값과 정답의 차이인 오차를 구한다. 역방..

ML | DL 2025.06.18

로컬 환경에서 필수인 Ollama에 대해 알아보기

Ollama란?사용자가 로컬에서 LLM을 직접 실행할 수 있도록 도와주는 오픈소스 플랫폼다양한 오픈 소스 LLM 모델의 설치, 실행, 커스터마이즈 기능까지 간편하게 제공하기 때문에 오픈 소스 AI 기술을 활용하고자 하는 사용자들에게 최적의 솔루션을 제공합니다. 🔥 로컬 LLM 실행에 Ollama를 선택해야 하는 이유로컬 LLM 실행은 개인정보 보호, 비용 효율성, 오프라인 사용, 그리고 완전한 제어권이 중요한 프로젝트에 특히 적합한 선택입니다.클라우드 기반 AI 서비스가 널리 사용되고 있지만, 로컬에서 LLM을 실행할 수 있는 Ollama를 선택하는 것에는 여러 중요한 장점이 있습니다.1) 완벽한 개인정보 보호 및 보안모든 데이터(프롬프트, 문서, 생성된 텍스트)가 로컬 시스템에서만 처리외부로 데이터가..

NLP | LLM 2025.06.18
728x90