머신러닝라이브러리(MLlib)

回到术语表

Apache火花의머신러닝라이브러리(机器学习库,MLlib)는단순성,확장성,다른툴과의통합을염두에두고고안하였습니다。데이터사이언티스트는火花의확장성,언어호환성과속도를활용하여데이터문제점과모델에만집중할수있습니다。즉분산형데이터를둘러싼복잡한문제(인프라,구성등)를해결하는데시간을뺏기지않아도됩니다。MLlib은기火花반으로구축된확장할수있는머신러닝라이브러리로보편적인학습알고리즘과유틸리티로구성되어있습니다。예를들어분류,회귀,클러스터링,공동작업필터링,차원감소와기본최적화기본형식(原始)등이대표적입니다。Spark MLLib은Spark SQL, Spark Streaming및DataFrame과같은다른Spark구성소와원활하게통합되며Databricks Runtime으로설치됩니다。이라이브러리는火花애플리케이션의일부분으로Java、Python Scala및에서사용할수있으므로완료된워크플로내에포함할수있습니다。MLlib을사용하면모델전처리,먼징(绿豆)교육이나데이터에관한대규모예측등의작업을할수있습니다。심지어MLlib에서교육한모델을사용하여结构化流에서예측을할수도있습니다。火花는정교한머신러닝API를제공하여다양한머신러닝작업을수행하는데쓸수있습니다。 분류부터 회귀, 클러스터링부터 딥러닝까지 많은 것이 가능합니다.

额外的资源

回到术语表