
1️⃣ 평가용 데이터셋 구축하기테스트 데이터셋을 생성하는 방법은 RAGAS에서 생성하거나, 직접 입력해서 추가할 수 있습니다.과정question-retrieval 평가: 검색한 결과(retrieval)과 질문(question)과 관련성이 있는지 평가question-answer 평가: LLM이 생성한 답변(answer)이 질문과 얼마나 관련성이 있는지 평가retrieval-answer 평가: LLM이 생성한 답변이 검색된 결과 안에서 답변하였는지 평가. 특히, 할루시네이션 확인에 필요ground truth: 평가나 학습을 위해 사람이 정해 놓은 기준 정답. 이를 기준으로 검색이나 응답 결과의 정확도를 판단할 수 있습니다. 2️⃣ LLM-as-a-judge로 평가하기LLM을 평가자로 활용하는 방식입니다.qu..