데이터사이언티스트는데이터사이언스워크플로에서생산성을저해하는여러가지문제에부딪힙니다。조직에서데이터중심으로바뀔수록,간편한데이터액세스와가시성을강조한협업환경,데이터로훈련한모델,재현성,데이터에서발견한인사이트가중요합니다。
이전
이후
데이터준비에서탐색적분석,예측분석에이르기까지모든분석워크플로유형을
협업방식으로실행하는개방형통합플랫폼입니다。
Python, R, Scala, SQL로협업방식을통해코드를쓰고,대화형시각화를활용해데이터를탐색하며砖노트북으로새로운인사이트를발견해보세요。
공동작성,메모작성,자동버전관리,Git통합과역할기반액세스관리등이제공되므로신뢰를기반으로안전하게코드를공유할수있습니다。
모든실험과모델을하나의장소에서추적하고,지식을캡쳐하고,대시보드를게시할수있으며,원시데이터에서인사이트까지모든워크플로에걸쳐동료및이해관계자에게손쉽게핸드오프할수있습니다。
이제는노트북컴퓨터의데이터용량에제한을받거나,이용할수있는컴퓨팅파워로행동범위를한정짓지않아도됩니다。
Conda지원으로로컬환경을클라우드로빠르게마이그레이션하고,
노트북을자동관리형클러스터로연결하여필에따라분석워크로드를확장합니다。
많이바쁘시죠…아마노트북에수백개의프로젝트가저장되어있고특정한도구세트에익숙해져있을것입니다。
즐겨사용하는IDE를砖에연결하여무한한데이터스토리지와컴퓨팅이제공하는이점을그대로누리세요。아니면砖내에서RStudio나JupyterLab을직접이용해도원활한환경을보장받을수있습니다。
내장된인터랙티브시각화나같은다른지원되는라이브러리(예:matplotlib ggplot)로모든작업을끝내고새인사이트를찾아냈습니다。
분석을동적대시보드로간단하게바꾸어결과를간편하게공유하고내보낼수있습니다。대시보드는항상최신상태로유지되고터랙티브쿼리도실행할수있습니다。
역할기반액세스관리를통해셀,시각화나노트북을공유할수도있고와HTML IPython笔记本을비롯한여러가지형식으로내보낼수도있습니다。
scikit-learn、XGBoost TensorFlow, Keras등,가장일반적으로사용하는프레임워크를포함하여바로사용할수있고최적화된머신러닝환경에클릭한번으로액세스하고시간을단축할수있습니다。또는,Conda를사용하여毫升환경으로편안하게마이그레이션하고맞춤설정이가능합니다。砖의단순화된확장으로소규모데이터에서대규모데이터를손쉽게확장할수있기때문에더이상노트북에저장되는데이터용량이적어서걱정할필요가없습니다。
ML运行时은하이퍼매개변수튜닝,모델검색등기본AutoML기능을제공하여데이터사이언스워크플로를가속화하도록지원합니다。예를들어逻辑回归,基于树模型,GraphFrames와같이가장일반적으로사용하는알고리즘과프레임워크에서기본으로제공하는최적화를사용하여훈련시간을단축합니다。
모든프레임워크,로그매개변수,결과,관리형MLflow를사용한각각의실행에대한코드버전에서실험을자동추적합니다。
수천개의실행과여러기여자사이에서모든워크스페이스나프로젝트,각노트북에서모든실험을안전하게공유,발견하고시각화합니다。
검색,분류,필터링,고급시각화로결과를비교하여모델의최적버전을찾고,해당실행에대응하는적절한코드버전으로빠르게돌아갑니다。
시작할준비가되셨나?