Dataiku
SOLUTIONS
Dataiku
The End-to-End Platform for Everyday AI

Dataiku + Solomontech
솔로몬텍은 Dataiku의 공식 파트너사로서, 고객사가 Dataiku 솔루션을 효과적으로
도입하고 활용할 수 있도록 종합적인 서비스를 제공합니다. Dataiku 구축 뿐만
아니라 데이터 분석 및 데이터 사이언스 프로젝트를 위한 전문 지식과 데이터
엔지니어링 서비스를 제공합니다.

Everyday AI를 위한 선도 플랫폼
Dataiku는 데이터 준비, 탐색, 분석 및 머신 러닝 모델을 구축, 검증, 테스트, 배포,
관리하는 올인원 (all-in-one) 플랫폼입니다. 하나의 플랫폼 위에서 비즈니스와
관련된 다양한 부서 사람들이 AI를 위한 혁신을 주도할 수 있습니다.
Dataiku
Unite Business & Tech in One End-to-End Platform


Data Preparation
• 내장된 다양한 기능을 통하여 데이터에 액세스할 수 있습니다.
• 시각적인 대화형 환경에서 데이터 정리 및 변환
(no code, full code 등)을 수행합니다.
• 시계열, 지리 공간, 이미지, 텍스트 데이터를 포함한 간단한
데이터 준비부터 고급 데이터 준비까지 100여개 이상의 내장
프로세서로 구성된 풍부한 라이브러리를 활용합니다.

Visualization
• 기본으로 제공하는 차트 및 대시보드 기능을 통해 즉각적인
시각적 통찰력을 얻을 수 있습니다.
• Python, R 및 SQL 등을 함께 활용할 수 있습니다.
• 수치 분포, 이상치 자동탐지, 결측치, 전체 통계 요약 등을
빠른 시각적 분석을 통해 데이터를 탐색합니다.

Machine Learning
• 최신 머신러닝 라이브러리
(scikit-learn, MLlib, XGBoost, TensorFlow, Keras 등)를
기반으로 구성 가능한 AutoML을 활용합니다.
• Python 및 R등을 이용하여 모델을 직접 customizing
할 수 있습니다.
• JupyterLab, Rstudio, VSCode 등 선호하는 노트북 및
IDE를 사용하여 모델을 구축할 수 있습니다.

DataOps
• Dataiku visual flow 와 recipe를 사용하여 aggregation,
join 및 기타 변환을 포함하여 코더와 비코더 모두를 위한
데이터 파이프라인을 쉽게 구축합니다.
• 내장된 스케줄러를 사용하여 대시보드와 파이프라인을
자동으로 업데이트 할 수 있습니다.
• 대시보드, 경고 및 프로젝트 요약을 통해 전체 비즈니스
이해관계자들에게 프로젝트 활동 등의 상태를 지속적으로
알려줍니다.

Governance & MLOps
• 프로젝트 번들을 사용하여 프로덕션 팀이 프로젝트를 이해하고,
테스트하고, 실행하는 데 필요한 모든 것을 쉽게 배포할 수
있습니다.
• 내장된 데이터 드리프트 모니터링 및 경고를 통해 모델 성능에
영향을 미치기 전에 미리 문제를 감지합니다.
• 내장된 거버넌스 계획을 통해 설계 단계 전반과 생산 전에
적절한 검토 및 승인을 보장합니다.

Applications
• Dataiku에서 직접 노코드 대화형 웹 애플리케이션을 만들거나
Dash Plotly, R Shiny, Bokeh 및 Streamlit을 포함한 주요
애플리케이션 프레임워크를 활용합니다.
• 내장된 대시보드를 사용하여 프로젝트 관계자와 정보를
공유하거나 통합 커넥터를 통해 Power-BI, Qlik 및 Tableau와
같은 BI 플랫폼에 결과를 푸시합니다.

Generative AI
• 엔터프라이즈 규모의 실제적이고 안전한 Generative AI
애플리케이션을 구축할 수 있습니다.
• LLM Mesh를 통해 유선형 개발 도구, 사전 구축된 사용 사례
및 AI 기반 비서를 제공하여 모든 사람이 Generative AI로
더 많은 일을 할 수 있도록 돕습니다.
Dataiku
데이터이쿠의 주요 기능
생성형 AI
데이터이쿠를 사용하여 안전한
생성형 AI 애플리케이션을 구축
할 수 있습니다. 간소화된 개발
도구, 구축된 사용 사례, AI
어시스턴트를 통해 모든 사람이
생성 AI를 활용할 수 있도록
도와줍니다.
데이터 준비
데이터이쿠에서는 프로젝트
데이터에 접근하여 탐색하고
준비할 수 있으며, 시각적 레시피,
코딩 인터페이스, 생성형 AI를
사용하여 모든 유형의 데이터셋을
정리, 결합, 변환할 수 있습니다.
시각화
데이터이쿠의 내장된 데이터
프로파일링, 통계 분석, 차트 작성
기능을 활용하여 데이터 분석 및
보고에 드는 시간을 절약하세요.
막대 차트, 선 차트, 원형 차트,
박스 플롯, 2D 분포, 히트맵,
테이블, 산점도, 지도, 맞춤형
웹 앱 을 활용하여 데이터를
시각화하세요.
AI & ML
Dataiku AutoML은 프롬프트
엔지니어링, 예측, 클러스터링,
시계열 예측, 컴퓨터 비전 작업,
인과 ML 등을 포함한 AI 및 기계
학습을 위한 안내 프레임워크를
통해 모델 개발을 효율적으로
할 수 있습니다.
DataOps
데이터이쿠의 프로젝트는
데이터 변환 및 이동의 흐름을
나타내는 시각적인 파이프라인이 있습니다. 이 데이터 파이프라인
을 자동화, 모니터링을 하고 알림을 설정함으로써 팀에게 적합한 데이터를 제공합니다.
MLOps
단일 플랫폼에서 기계 학습 모델
을 개발, 배포, 모니터링 및 유지
관리하세요. Deployer는 운영자
가 개발, 테스트, 생산 환경에서 dataiku 프로젝트 버전과 API
배포를 관리할 수 있는 최적의
공간입니다.
협업
Dataiku의 Flow는 공유
공간에서 프로젝트를 진행할 수
있는 협업 환경을 제공합니다.
팀은 기존 데이터 프로덕트를
쉽게 재사용함으로써 매번
처음부터 반복하는 것을 피할 수
있습니다.
거버넌스
데이터 이니셔티브의 상태와
진행 상황을 추적하고 워크플로우와 거버넌스 프로세스가 올바르게 되어있는지 확인합니다. 이는
회사가 생성AI 프로젝트를
확장하고 모델의 우선순위를
결정하는데 도움을 줍니다.
보안
강력한 보안을 통해 SSO 및
LDAP을 사용하는 인증 위험을
관리하세요. 역할 기반 접근 제어,
감사 추적, 사용자, 연결,
프로젝트, 컴퓨트 및 전체
수준에서 작동할 수 있는
세분화된 권한 기능이
포함되어 있습니다.
Dataiku
플랫폼 주요 기능

생성형 AI를 현실로
데이터이쿠를 사용하여 실험실을 넘어 실제 업무에 적용 가능하고
안전한 생성형 AI 애플리케이션을 구축할 수 있습니다. 데이터이쿠는
간소화된 개발 도구, 사전 구축된 사용 사례, AI가 적용된 어시스턴트
기능을 제공하여 모든 사람이 생성형 AI로 더 많은 일을 할 수 있도록
돕습니다.
데이터 준비 시간을 줄이고
비즈니스 인사이트에 집중하세요
현업 및 데이터 분석 팀이 대규모로 데이터를 연결, 정제, 준비하여
데이터 분석 프로젝트를 수행할 수 있도록 지원합니다. 사전 구축된
맞춤형 비주얼 및 코드 레시피를 통해 데이터 준비에 소요되는 시간을
줄입니다. 생성형 AI가 지원하는 데이터 준비 기능을 활용하여 데이터
정제에 드는 시간을 획기적으로 줄일 수 있습니다.


AutoML을 활용하여 프로젝트를 수행하세요
AutoML과 최신 AI 기술을 사용하여 고급 머신러닝 모델을
구축하고평가하세요. 사용하기 쉬운 시각적 ML 프레임워크에서
피처 엔지니어링을 가속화하고 모델 실험을 추적하세요. 머신러닝
프로젝트 전체를 쉽게 재사용하고 복제할 수 있습니다.
AI 프로젝트 생애주기 관리
데이터 과학자, 머신러닝 엔지니어, 운영자가 상용 환경에서 머신러닝
모델과 AI 프로젝트를 배포, 모니터링 및 관리할 수 있도록 하세요.
드리프트 모니터링을 자동화하고, 모델 성능을 쉽게 비교하며,
비즈니스 애플리케이션을 위한 고품질의 결과물을 지속적으로
제공할 수 있습니다.

Dataiku
산업별 솔루션






은행
• 고객 관리: 세그멘테이션,
리뷰 분석, Next best offer 등
• 리스트 관리: 신용 리스크
스트레스 테스트, AML,
신용카드 사기, 신용 scoring 등
• 운영 효율화: 프로세스 마이닝,
재무 예측
리테일, 소비재
• 고객 인사이트: RFM 고객
세그멘테이션, 고객 만족도 분석
• 예측: 고객 Lifetime Value
예측, 수요 예측, 재무 예측
• 개인화 추천: 시장 기반 분석,
제품 추천
제조
• Industry 4.0: CO2 배출,
전력소모량 예측, 예지보전
(Predictive Maintenance),
Batch Performance 최적화,
품질관리, 파라미터 분석기 등
• 운영 효율화: 프로세스 마이닝
• 효율화: 재고 및 물류 최적화,
할인 최적화 등



제약
• 프로세스 개선: Drug
Repurposing Knowledge
Graph (DRKG), 임상 사이트
인텔리전스, 옴니채널 마케팅
최적화, 약물유전체학
공공
• 국방, 교통 계획 및 관리,
스마트 시티 등
통신
• 세일즈, 마케팅, 서비스 중단
예측, 예지보전, 프로세스
마이닝 등
• 제조/공급체인: 예지보전,
배치 퍼포먼스 최적화



에너지
• CO2 배출, 전력소모량 예측,
예지보전 (Predictive
Maintenance), Batch
Performance 최적화,
품질관리, 파라미터 분석기 등
보험
• 보험 청구 모델링
• 운영 효율화: 재무 예측,
프로세스 마이닝 등
헬스케어
• 건강의 사회적 결정 요인
(SDOH) 분석, 약물유전체학,
프로세스 마이닝, 보험 클레임
모델링, 임상 사이트 인텔리전스
• 운영 효율화: 프로세스 마이닝
출처: dataiku.com

Dataiku
Dataiku 관련 유용한 링크
[토크아이티] LG화학이 얘기하는 AI 전사 도입 적용 사례 feat. 데이터이쿠 CDS플랫폼


[토크아이티] AI 플랫폼이 필요한 이유 feat. 데이터이쿠
[토크아이티] 전사적 생성형 AI 적용 및 LMM활용 이슈와 극복 방안,
실제 Use case 소개 feat.데이터이쿠

