고객 사례

음성,데이터및ai로홈엔터테먼트혁신

10배

전체적데이터처리컴퓨팅비용절감

90%

프라관리에필한DevOps리소스감소

업종:미디어및엔터테먼트

솔루션:고객세분화

플랫폼사용사례:三角洲湖데이터사이언스머신 러닝ETL

클라우드:AWS

“康卡斯特에서는砖의도움을받아확장을마치고매일같이수십억건에달하는트랜잭션과테라바이트급데이터를처리하고있습니다。”

——康卡斯特的Jan Neumann,머신러닝부사장

배경이미지

수백만의고객을개인화된경험에연결해주는글로벌기술미디어기업인Comcast는방대한데이터,취약한데이터파이프라인,데이터사이언스협업부족으로인해어려움을겪었습니다。三角洲湖및MLflow를활용하는砖를사용한덕분에페타바이트규모데이터를처리하는성능을갖춘데이터파이프라인을구축하고수백개모델의수명주기를관리하여,음성인식과머신러닝을적용한매우혁신적이고독창적이면서도수상경력에빛나는시청환경을구현할수있었습니다。

데이터및ml구사항에못미치는프라

특정프로그램에서고객의음성요청에즉시답하면서도수십억개의개별상호작용을실천가능한인사이트로바꾸는작업은Comcast它인프라와데이터분석,데이터사이언스팀에부담을주었습니다。설상가상으로클라우드,온프레미스등에흩어진서로다른범위의환경에,또경우에따라서는기기에직접모델을배포해야했습니다。

  • 방대한데이터:엔터테인먼트시스템에서생성되는수십억건의이벤트와2000만건이상의음성명령이쌓임에따라세션화해서분석해야할데이터가페타바이트규모를넘어섰습니다。
  • 취약한파이프라인:복잡한데이터파이프라인은수시로장애가일어났고복구가어려웠습니다。작은파일들을관리하기어려워다운스트림머신러닝에데이터를입력하는속도가느려졌습니다。
  • 협업부족:서로다른지역에서서로다른스크립팅언어로작업하는데이터사이언티스트들은코드를공유하고재사용하기가어려웠습니다。
  • 毫升모델관리:수백개의모델을개발,훈련및배포하는작업은대체로수동으로이루어져서느린데다복제가힘들어확장이어려웠습니다。
  • 개발과배포간의마찰:개발팀에서는최신도구와모델을사용하고싶어하지만,운영팀에서는검증된인프라에배포하고싶어했습니다。

三角洲湖를사용한프라자동화,데이터파이프라가속화

康卡斯特는데이터수집에서머신러닝모델배포에이르기까지모든분석방식을현대화하여고객이만족할만한새로운기능을제공해야할필요성을느꼈습니다。지금은砖레이크하우스플랫폼을사용하여풍부한데이터세트를구축하고대규모로머신러닝을최적화하고있으며,팀간워크플로간소화,협업강화,인프라복잡성완화,우수한고객환경지원이가능해졌습니다。

  • 간소화된인프라관리:자동클러스터관리및비용관리기능(예:자동확장,스팟인스턴스)으로운영비용을절감했습니다。
  • 三角洲湖를사용한적절한성능의데이터파이프라인:三角洲湖는영상및음성애플리케이션과기기에서수집한원본원격측정정보를수집,보강하여최초처리하는데사용합니다。
  • 작은파일들을신속히관리:三角洲湖는대규모로빠르고안정적으로데이터를입력할수있도록파일을최적화합니다。
  • 협업워크스페이스:康卡斯特는인터랙티브노트북으로팀간협업과데이터사이언스창의성발휘환경을개선하고,모델프로토타이핑속도를크게단축해이터레이션을가속화합니다。
  • 수단순화된毫升명주기:관리형MLflow의Kubeflow환경을통해머신러닝수명주기와모델제공을단순화하여수백개의모델을간편하게추,적관리합니다。
  • 안정적인대규모ETL:三角洲湖는대규모로효율적인분석파이프라인에서과거데이터와스트리밍데이터를안정적으로결합하여더욱풍부한인사이트를제공합니다。
  • 또한Comcast는画面를사용하여애널리스트에게데이터를제공함으로써고객분석용데이터세트를빠른속도로더폭넓게지원합니다。
Comcast동상썸네일

숨은스토리:데이터팀효과

康卡斯特를든든히뒷받침하는우수한데이터팀소개

지금보기→

Ml을사용한개marketing맞춤형환경제공

경쟁이치열한엔터테먼트산업에서는일시정지버튼을누를틈이없습니다。康卡斯特는통합분석전략으로무장한덕분기에人工智能반엔터테인먼트의미래로빠르게나아가며,경쟁사보다우월한고객경험을제공하여시청자만족도와참여를높이고있습니다。

  • 에미상을수상한시청자환경:砖는참여를유도하는지능적인음성명령기능으로에미상을받은매우혁신적인시청자환경을구현하도록Comcast를지원합니다。
  • 컴퓨팅비용10배감소:康卡斯特는三角洲湖를사용하여데이터수집을최적화함으로써성능을개선하는동시에640대의컴퓨터64개를로줄일수있었습니다。팀은이제프라관리보다는분석에더많은시간을할애할수있게되었습니다。
  • DevOps력축소:200年명의사용자를온보딩하는데필요한DevOps풀타임직원수가5명에서명0.5으로줄었습니다。
  • 데이터사이언스생산성향상:단일인터랙티브워크스페이스를통해다양한프로그래밍언어를지원하여글로벌데이터사이언티스트들간더욱원활한협업을끌어냅니다。또한三角洲湖는데이터팀이데이터파이프라인에서언제든데이터를활용하여새로운모델구축및훈련에더욱빠르게대응할수있도록지원합니다。
  • 모델배포기간단축:운팀에서각플랫폼에모델을배포하는시간이몇주에서몇분으로단축되었습니다。