Databricks
Why Databricks?
데이터엔지니어, 데이터과학자, 비즈니스분석가 모두에게 최고의 데이터플랫폼 제공
비용 절감 & 운영 최적화
기업의 데이터 운영비용을 절감하는
스마트 클라우드 활용
스마트 클라우드 활용
- 스팟 인스턴스 활용으로 불필요한 비용 절감
- 데이터 중복제거 및 스토리지 최적화 기능 제공
- 사용량 기반과금 -> 필요한 만큼만 사용하여 비용 효율적
강력한 보안 & 데이터 거버넌스
기업데이터를 안전하게 보호하는
최고 수준의 보안 환경
최고 수준의 보안 환경
- Unity Catalog 기반 권한 관리
- IP 보호 및 개인정보 준수 강화
단일 플랫폼에서 데이터 & Al 통합
데이터엔지니어링, 데이터분석,
머신러닝까지 한곳에서!
머신러닝까지 한곳에서!
- 데이터저장, 처리, 분석, AI 모델 개발까지
하나의 플랫폼에서 - SQL,Python,R.Scala 등 다양한 언어 지원
- 실시간 및 배치 데이터 처리 가능
초고속 데이터 처리성능
대용량 데이터를 신속하게 처리하는
Apache Spark기반 엔진
Apache Spark기반 엔진
- 기존 Hadoop 대비 최대100배 빠른 속도
- 수십억개의 데이터도 빠르고 안정적으로 분석 가능
- 클라우드 네이티브 환경으로 자동 확장 지원
강력한 머신러닝 & AI 지원
데이터과학자를 위한
AI 최적화 환경
AI 최적화 환경
- AutoML 기능 제공 -> 모델 학습을 자동화
- MLfIow 기반 MLOps + 모델실험 및 배포 간편
- 데이터 준비부터 모델 배포까지 엔드투엔드 AI 워크플로우 제공
호환 불가한 데이터에 대한 연계 플랫폼의 필요성
데이터브릭스는 불완전한 Use Case지원, 분리 및 중복, 호환되지 않는 문제등을 해결 할 수 있습니다.

Databricks의 활용 범위
End to End를 Databricks Lakehouse가 지원

최신 Data + AI 가속화 기능

Databricks SQL
SQL검색 및 대시보드 이용을 간단히

Databricks Notebook & AutoML
SQL/Python 베이스 코딩부터 AutoML까지

Databricks Delta Live Table
데이터 파이프라인 및 품질 관리

Databricks Unity Catalog
데이터 사전, 데이터 리니지