반응형
Vector DB란 무엇인가?
CS 지식/AI 관련2024. 12. 26. 22:30Vector DB란 무엇인가?

Vector DB란?핵심 요소는 3가지입니다.1. Vector2. Dimensionality3. Similarity Search Vector란?수학적으로 방향 (direction)과 크기 (magnitude)가 존재하는 값입니다. 왜 Vector DB를 써야 하는가?80%의 데이터는 unstructured data입니다.예를 들면 사진, 음악, PDF, 영상 등이 있죠.그래서 기존의 Relational DB에 위와 같은 데이터들을 저장하기 위해서는 별도의 메타데이터를 추가하는 등의 작업이 필요합니다.잘 어울리지는 않는 use case에 가깝죠. 반면 vector DB는 이러한 unstructured data의 저장에 특화되어 있습니다.왜일까요?1. 비정형 데이터를 의미 벡터로 변환해 저장임베딩 : 비정형..

Vector DB : 전통적인 DB와 비교한 Vector DB의 특징들
CS 지식/AI 관련2024. 12. 25. 11:19Vector DB : 전통적인 DB와 비교한 Vector DB의 특징들

Vector DB에 대해서 정리 하면서 궁금한점을 중간 중간에 추가해 두었고 그에 대한 답도 추가해 두었습니다.전통 DB의 특징RDBMS 기반입니다.Structured data 입니다 - predefined column과 row가 있습니다.Schema-based - database structure는 사용전에 미리 정의되어야 합니다.Data manipulation and querying - SQL로 데이터를 조작해야함.ACID Compliant - Atomicity, Consistency, Isolation, Durability를 보장해야함.Indexing - 데이터 검색 및 가져오기를 빠르게 하기 위함. 전통 DB의 한계Scalability - 큰 테이블에 대해서 복잡한 쿼리를 처리하는데 어렵다.Fle..

Vector DB - Vector Similarity 측정 방법 3가지
CS 지식/AI 관련2024. 12. 22. 21:52Vector DB - Vector Similarity 측정 방법 3가지

Vector Similarity 측정 방법vector similarity는 기본적으로 vector의 방향, 크기, 그리고 상대적인 위치에 영향을 많이 받습니다.이를 고려해서 vector similarity를 측정할 수 있는 3가지 정도의 방법이 있는데 아래와 같습니다. 1. Cosine Similarity위의 예제를 Cosine Similarity를 통해서 계산하면 아래와 같은 결과가 나옵니다. 2. Euclidean Distance1. vector의 크기가 고려 되어야할때2. clustering 할때 가장 이상적임과 같은 두가지 특징을 가지고 있습니다. 3. Dot Product1. Image 검색과 도출2. 음악 추천등에 도움이 되는 계산 방식이라고 합니다.

반응형
image