MPP 구조
빠른 쿼리 수행을 위한
병렬 프로세싱 수행
모든 노드가 동등 역할을
수행하여 확장성 보장
혁신과 도전을 통한 목표 성취로 고객만족을 최우선으로 생각하는 기업
Vertica Analytics Platform
SQL 데이터베이스
뛰어난 성능을 보유한 SQL 기반 데이터베이스MPP 프로세싱을 보유한 Columnar 엔진
Software-only 제품으로, Cloud / On-premise 어떤 환경에서도 구성 지원
기존 데이터 웨어하우스 대비 10-50배의 성능 보유
고급 분석과 머신 러닝
새로운 업무 활용을 위한 고급 분석 기능 제공대용량에 대한 End-to-End 머신러닝 제공
병렬 프로세싱으로 수행되는 시계열, 회귀분석, 지리 분석, 클러스터링 등 제공 SQL 기반으로 활용 가능
R, Python, Java, C++ 코드를 데이터베이스 내에 활용가능
버티카 쿼리 엔진
모든 데이터를 꼭 데이터베이스에 적재하지 않아도 수행 가능한 쿼리 엔진쿼리 엔진을 하둡과 연계하여 데이터 레이크의 분석 플랫폼으로 활용
HDFS나 S3에 존재하는 Parquet 또는 ORC 를 External Table로 선언 가능
DW와 Data Lake 간 JOIN 구문을 이용한 연계 분석 수행 제공
버티카 아키텍처의 근간 구조
데이터가 지속적으로 증가하는 데에 효과적으로 대응빠른 쿼리 수행을 위한
병렬 프로세싱 수행
모든 노드가 동등 역할을
수행하여 확장성 보장
컬럼 기반 구조의 저장으로
연산 수행을 효과적으로 수행
약 10개의 압축 및 인코딩 기능으로
디스크 사용률 및 I/O 양 감소
고급 분석을 수행하기에 최적화 된
구조로 물리 데이터 저장
분석 중심의 업무 설계를 위한 아키텍처
데이터 위치가 분석 업무를 수행하는 병목이 되지 않는 플랫폼 아키텍처버티카 아키텍처의 근간 구조
데이터가 지속적으로 증가하는 데에 효과적으로 대응Vertica Portfolio
컬럼 처리 및 선진 압축 기법
최대 성능 및 확장성
다양한 선진 기법 제공
(Machine Learning, Pattern matching, Flex Tables 등)
클라우드 플랫폼으로의 빠른 전개
AWS, Azure, Google, Vmware 지원
유연한 클라우드 기반 옵션 제공
Computing Node 와 Storage 분리
Object Storage 기반의 무한한 확장성
Workload에 따른 유연한 증설 및 Multi-Cluster 구성 지원
Vertica 5대 기술 요소
필요한 컬럼만을 조회하여
빠른 쿼리 성능 보장
I/O 비용을 최소화하는
동시에 성능을 가속화
Name node와 같은 single
point of failure를 제거한
순수 MPP 아키텍처
Exabyte 수준의 확장성 제공
특정 노드에 대한 종속성이 없는
분산 쿼리 수행
노드 장애 대처와 쿼리 성능을
담보하기 위한 최적화 방안 제공
Advanced Analytics and Machine Learning
버티카 고급 분석 기능 목록
Aggregate
Analytical
Window functions
Date/Time functions
String functions
Mathematical functions
Standard functionality that
performs at scale
Pattern matching
Event series joins
Time series
Event-based windows
Sessionization
Conversion analysis
Fraud detection
Fast Aggregates (LAP)
C++
Java
R
Python
ODBC/JDBC
HIVE
Hadoop
Flex zone
Specialized parsers
Custom data mining
Semi-structured data processing
Linear Regression
Logistic Regression
K-means
Naïve Bayes
Support Vector Machines
Random Forest
Statistical modeling
Cluster analysis
Predictive analytics
Geospatial analysis
Turing Award 수상자인 Michael Stonebraker 박사의 C-Store 프로젝트의 결과로 2006년 시장에 출시되었습니다
Michael Stonebraker 박사는 Greenplum, Netezza등의 기초인 Postgres DB를 개발한 세계적인 석학입니다.