熊猫로고

데이터사이언스분야에서熊猫DataFrame으로데이터사이언스의모든잠재력을이끌어낸다면기업의업무방식을혁신할수있다는말은과장이아닙니다。이를위해서는적합한데이터구조가필요하며적합한데이터구조를사용하면데이터를조작하고분석하면서효율성을극대화할수있습니다。

이러한목적을위해사용가능한가장유용한데이터구조중하나가熊猫DataFrame입니다。

熊猫는Python프로그래밍언어로작성된오픈소스라이브러리로,빠르고조정가능한데이터구조와데이터분석툴을제공합니다。원래韦斯·麦金尼가개발한이데이터조작툴은NumPy패키지기반으로구축되었으며주요데이터구조를DataFrame이라고부릅니다。

잠깐만。천천히진행하세。pandas DataFrame이뭔가特赦?라고질문하고싶으시다면걱정마세。잠시후자세히설명해드리겠습니다。지금은熊猫DataFrame이데이터에크게의존하는분야에서사용하기적합한사용자친화적툴이라고만이해하시면됩니다。이러한분야의예로는사이언티픽컴퓨팅,머신러닝,그리고앞서언급한데이터사이언스가있습니다。

熊猫의구체적구조는바로아래에나와있습니다。여기서다룰주제에는熊猫DataFrame을만드는방법,熊猫DataFrame으로작업을시작하는방법,그리고熊猫DataFrame을사용하여얻을수있는이점이포함되어있습니다。

熊猫는다음과같이두가지유형의데이터구조를제공합니다。

  • 熊猫数据框架(2차원)
  • 熊猫系列(1차원)

熊猫의데이터구조유형

熊猫는CSV또는TSV파일과같은데이터또는SQL(结构化查询Lnaguage)데이터베이스를행과열이있는Python개체로바꿉니다。이러한개체를数据帧이라고합니다。이러한개체는통계소프트웨어(예:Excel또는SPSS)에서이용할수있는테이블과무척비슷합니다。Excel과유사하게,大熊猫DataFrame을사용하면테이블형식의데이터를여러행의관측과여러열의변수로저장및조작하고,주어진데이터세트에서유용한정보를추출할수있습니다。

Apache Spark 3.2기반pandas API를실행할수있습니다。그러면熊猫워크로드를고르게배포하여모두올바르게수행되도록할수있습니다。

지금까지熊猫가제공하는두가지유형의데이터구조를살펴봤습니다。그럼이제잠시추고pandas DataFrame이무엇지살펴보도록하죠。먼저간단히정의를설명한다음DataFrame이받아들일수있는입력유형이포함된유용한목록을알려드리겠습니다。

熊猫数据框架이란무엇입니까?

pandas DataFrame은테이블형식의데이터를현하고다루는한방식입니다。이것은데이터를여러행과열로구성하여2차원데이터구조로만드는테이블로보일수있습니다。DataFrame은처음부터새로만들어도되고,NumPy배열과같은다른데이터구조를사용해도됩니다。

熊猫DataFrame을사용하면다양한형식으로다양한소스에서데이터를가져올수있습니다。예를들면,熊猫콘텐츠를가져오면서NumPy배열도가져올수있습니다。

DataFrame이수용하는주입력유형은다음과같습니다。

  • 사전(Dict),목록,사전또는계열(系列)의1D ndarray
  • 二维numpy.ndarray
  • 구조적또는레코드ndarray
  • 계열(系列)
  • 또다른数据帧

pandas DataFrame으로작업하는방법에대한일반적tmp질문

熊猫熊猫가제공하는구조와DataFrame의뜻을안다고해서熊猫DataFrame에대한모든것을안다고할수는없습니다。그래서이섹션에서는熊猫DataFrame으로작업하는방법과관련하여가장흔한질문몇가지에답해보려고합니다。

아래6개의질문과답변중에여러분이궁금한사항이없다면계속이글을읽어보시기바랍니다。이글을끝마치기전에여러가지다른주제를다루고추가적인핵심질문몇가지에대해답변을드릴것입니다。

1.pandas DataFrame에서rm덱스,행또는열을삭제하는방법

모든DataFrame열(또는행또는덱스)이항상똑같이필하지는않습니다。경우에따라数据帧개체를삭제해야할수있습니다。그래서삭제하는방법을보여드리려고합니다。

덱스부터시작하여차례로한가지씩삭제하는방법을설명하겠습니다。아래의예,그리고이글에서이후에사용되는모든예의코드에서일반적인사용법처럼“DataFrame”을“df”로축약하겠습니다。

DataFrame에는항상일종의인덱스가있어서인덱스를완전히삭제하는것이어렵지만,인덱스라벨을수정하거나이름을모두삭제하는것이가능합니다。删除df.index.name명령을실행하면이름을삭제할수있습니다。

또한DataFrame表덱스를초기화할수도있습니다。이기능은중복된덱스값이있는경우유용합니다。인덱스를초기화하고중복된인덱스를드롭한다음중복없는새로운열의인덱스를복원하기만하면됩니다。

열을삭제하는일은약간더쉽습니다。Drop()방법을사용하여열을제거할수있습니다。이를위해서는제거하려는열의라벨을입력한다음올바른열의이름인지확인한후下降()명령을실행해야합니다。또한原地로를如此설정하면DataFrame을재할당하지않고도열을제거할수있습니다。

마지막으로,DataFrame행을삭제하는방법을보여드리겠습니다。

df。drop_duplicates()를실행하면행라벨에제공한기준에따라중복된행을제거할수있습니다。또한열에도사용할수있는.drop()방법을선택할수도있습니다。그러나행의덱스를대신드롭하려는경우는예외입니다。이작업을수행한후덱스를반드시초기화하십시오。

누락된값이있는특정행을제거하려면,DataFrame。dropna(axis=0, how='any', thresh=None,子集=None, inplace=False)를사용할수있습니다。그러면널(空)값이있는모든행이자동으로제거됩니다。또한선택된특정데이터에서누락된값을제거할지여부를결정하기위해함수의매개변수를조정할수도있습니다。

널(null)값을특정값으로바꾸려고하는경우에는.dropna()로삭제하는대신.fillna()명령을사용할수있습니다。

2.pandas DataFrame의tmp덱스또는열의이름을재지정하는방법

덱스및열의이름을재지정하는것은삭제하는것보다훨씬더쉽고간단합니다。개체이름의재지정은.rename()방법을사용하고새값을줄인덱스(또는열)를채우기만하면됩니다。

이름재지정작업에서原地인수를假로변경하면열의이름을바꿀때DataFrame이재할당되지않습니다。

3.pandas DataFrame에서데이터형식을지정하는방법

대부분DataFrame사용자는DataFrame에서값을편집및변경하고형식을지정해야합니다。이작업을진행할경우알아야할가장중한전략몇가지를살펴보겠습니다。

문자열의모든인스턴스를교체하려는경우,.replace()명령을사용하고(변경전값,변경후값)의형식으로작업을완료할수있습니다。

그러면프로그램이자동으로변경하려는문자열또는값의모든인스턴스를변경후문자열또는값으로대체합니다。

사용자에게필요할수있는또다른유형의형식지정방법은문자열에서필요하지않은부분을제거하는것입니다。Map()명령을"결과(result)"열에사용할경우선택된lambda함수를해당열의각소에적용합니다。

또한열의텍스트를여러행으로나눌수도있습니다。하지만이작업은조금더복잡합니다。그래서간단한튜토리얼을진행하려고하니조금만기다려주세。

첫째,행의길이가너무길어서나누고자하는행을결정해야합니다。나눌행을찾은후에는행이들어있는열과공간의문자열을찾아야합니다。다음단계는여러행으로나눌값들을찾아서이값들을계열(系列)개체에넣는것입니다。

계열(系列)에NaN값이있다면걱정마세。올바른방향으로가고있는것입니다。계열(系列)을스태킹하기만하면계열(系列)의최종카피에불필요한南값이없도록할수있습니다。

스태킹된계열(系列)을원하는형식으로바꾸려면DataFrame과정렬되도록레벨을드롭해야합니다。그런다음,계열(系列)을DataFrame으로변환하기만하면됩니다。즉,계열을원본계열이속해있던DataFrame으로다시넣은다음원본DataFrame에서결함이있는열을삭제합니다。이마지막단계(열삭제)를통해중복된행이생성되지않도록할수있습니다。

DataFrame의데이터에적용할수있는마지막종류의형식지정은DataFrame의행또는열에함수를적용하는것입니다。

먼저.loc[]또는.iloc[]를사용하여작업하려는행을선택합니다。하지만현재数据帧을사용중이므로더구체적으로df。Loc및df。Iloc를사용해야합니다。그다음,적합한행을선택했다면행또는열에倍压器와같은기능을적용하기위해应用()를사용할수있습니다。

4.빈数据帧을만드는방법

빈DataFrame을만들려면熊猫DataFrame()함수를사용해야합니다。

DataFrame을NaN로초기화하려면단순히numpy。Nan을사용할수있습니다。numpy。南에는类型浮动이있고이는새DataFrame의데이터값도기본적으로类型浮动이라는뚯입니다。dtype속성을입력한다음찾고있는유형(类型)을입력하여이기본설정을피할수있습니다。

DataFrame()함수를사용하려면사용자가DataFrame에넣으려고하는인덱스나열과같은데이터를전달해야합니다。이데이터는다양한유형을가질수있습니다。또한,설정한대로,항상dtype속성을사용하여데이터유형을자유롭게지정할수있습니다。

사용자는빈DataFrame이사용할축라벨또는덱스를지정할수있습니다。이를지정하지않으면,熊猫DataFrame은일반규칙에따라자동으로구성합니다。

5.熊猫는데이터를가져올때날짜를iphoneiphone식하나iphoneiphoneiphone?

이론적으로는그렇지만실제로는약간더복잡합니다。

熊猫는날짜가입력되고있다는사실을인식하지만,사용자의가이드가있을때가장잘인식합니다。구체적으로말하자면,CSV파일이나이와유사한파일에서데이터를가져올때마다parse_dates인수를추가해야합니다。CSV파일의경우다음과같이보일것입니다。

pd。read_csv (yourFile, parse_dates = True)

이방법은숫자형식의날짜에가장효과적입니다。그러나날짜가모두이러한형식으로되어있지는않습니다。

일반적이지않은날짜형식이나DataFrame이인식하기어려운날짜형식의경우에는자체파서(解析器)를만들어야합니다。이를위해입력된날짜와시간을인식하는방식을제어하기위한형식문자열을사용하는λ함수를사용할수있습니다。

熊猫에게어떤방식으로가이드를제공하든작업을완료하면熊猫는날짜와시간을인식할것입니다。즉,사용자측에서최소한의입력으로도DataFrame에게사용자가공급한날짜기반정보를모두인식하도록지시할수있습니다。

6.언제,왜,그리고어떻게熊猫数据帧을재구성해야합니까?

데이터분석은熊猫DataFrame의가장중요한용도중하나이기때문에DataFrame을구성하고재구성할줄아는것이매우중요합니다。그래야DataFrame의구조를데이터분석요구사항에가장적합하도록구성할수있습니다。

“언제数据帧을재구성해야합니까?”라는질문에대한답은이렇습니다。현재형식이사용자가구축하려는데이터분석에유용하지않은경우,그리고이목적을위해새열또는행을만들생각이없는경우DataFrame을재구성해야합니다。DataFrame을재구성해야하는이유는데이터분석에가장적합한형태(形状)를찾아야하기때문입니다。

그러면질문하나만남습니다。“어떻게재구성해야할까?”

피봇하거나스태킹중에서선택할수있고”언스태킹및멜팅(unstacking和融化)”방법을사용할수도있습니다。이세가지방법이각각어떻게작동하는지자세히살펴보고DataFrame재구성에이들을어떻게사용할수있는지알아보겠습니다。

피봇방법으로数据帧재구성

먼저피봇옵션부터살펴보겠습니다。이방법을사용하면원본테이블에서새테이블을만듭니다。따라서사용자는원하는모습의새카피를구성할수있습니다。이함수를사용하려면세개의수를전달해야합니다。

첫째,값이있습니다。이인수는새DataFrame으로통합될예정인원본DataFrame의값을선택하는지점이며포함할것과제외할것을선택할수있습니다。

그다음,열을전달합니다。무엇을전달하든이것이최종테이블의열이됩니다。

마지막으로,새테이블에사용할marketing덱스를선택해야합니다。

결과적으로생기는테이블에어떤데이터를통합할지를구체적으로생각하는것이중요합니다。예를들면,지정된열에중복된값을포함하는행을포함하면오류메시지가@시됩니다。또다른예는최종테이블에포함할값을정확히선택하지않을경우여러열로피봇하는것입니다。

그다음스태킹에대해고려해보겠습니다。

스태킹(堆叠)방법으로DataFrame을재구성

DataFrame을스태킹하면DataFrame이높아지는것을식할수도있습니다。DataFrame의데이터형식을지정하는방법을설명하면서세번째질문에서스태킹에대해다뤘습니다。

기술적으로설명하자,면가장안쪽에있는열인덱스를이동하여가장안쪽에있는행인덱스로바꾸는것입니다。이렇게하면가장안쪽의레벨에위치한새레벨의행라벨이있는새인덱스를가진DataFrame을얻게됩니다。

이제언스택킹하는방법을고려해야합니다。상상할수있듯이,언스태킹은스태킹과반대되는프로세스입니다。스태킹은가장안쪽의열인덱스를이동하는반면,언스태킹은가장안쪽의행인덱스를이동합니다。따라서언스태킹을할때는가장안쪽의행인덱스를이동하여이것이가장안쪽의열인덱스로대신사용될수있도록합니다。언스태킹은멜팅과함께사용됩니다。그래서이다음으로멜팅을살펴보겠습니다。

멜팅(融化)방법으로DataFrame재구성

멜팅은DataFrame이하나이상의열을식별자변수로사용하고,나머지열은측정변수인경우에이상적입니다。이러한경우에멜팅으로tmp해DataFrame은기본적으로더넓어지지않고길어집니다。

멜트로(融化)측정변수가DataFrame의너비가아니라높이에배치되도록측정변수를행축에언피봇(un-pivot)합니다。최종산물에는두개의열이포함되며둘중하나는변수를위한것이고나머지하나는값을위한것입니다。

pandas DataFrame사용법

DataFrame은Excel스프레드시트와거의비슷한방식으로사용할수있으며,熊猫DataFrame도마찬가지입니다。

기본적으로,pandas DataFrame을데이터구조로사용할수있습니다。熊猫DataFrame은스프레드시트처럼데이터를처리하고데이터를분석하는데도사용할수있습니다。

熊猫는데이터를읽거나조작해야하는경우에가장유용한툴입니다。pandas DataFrame에데이터를입력하는방법은이미설명했습니다。熊猫는다양한유형의데이터와호환되므로다양한유형의데이터를熊猫에가져올수있습니다。이덕분에사용자의정보가어떤형식이든작업을수행할수있습니다。

그리고위에서설명한형식지정프로세스에따라데이터를필요한형식으로변환할수있습니다。이미확보한데이터를필에따라더적합하고더유용한형식으로구성할수도있습니다。

熊猫는특히Python과함께사용하도록설계되었으므로熊猫와Python을대부분함께사용할수있습니다。따라서PySpark및pandas로SHAP계산스케일링과같은작업을쉽게수행할수있습니다。

熊猫DataFrame안에서특정작업과함수를어떻게실행하는지더구체적으로살펴보겠습니다。熊猫DataFrame만들기,인덱싱및반복과같은작업에대해살펴본후처음부터熊猫를사용하면얻을수있는이점을자세히살펴보겠습니다。

pandas DataFrame을만드는방법

熊猫DataFrame은다양한방법으로사용할수있는다목적툴이기때문에몇가지다른전략에따라만들수있습니다。

4번질문에답하면서빈熊猫DataFrame을설정하는방법을이미살펴보았습니다。이방법은새熊猫DataFrame을만들때사용할수있는방법중하나입니다。이방법은熊猫로”이전”할수있는다른데이터구조가없는경우에가장적합합니다。다시말해,완전히백지에서부터시작하려고사는경우에가장적합합니다。

이제NumPy ndarray에서熊猫DataFrame을만드는방법을살펴보겠습니다。

视频目录컨대,NumPy배열로상당히쉽게DataFrame을만들수있습니다。선택한배열을熊猫데이터인수의DataFrame()함수로전달하기만하면이인수는NumPy데이터를사용하여새DataFrame을구성할것입니다。이수는다음은형태입니다。

打印(pd。Dataframe [])

입력하려는데이터는꺾쇠괄호에들어갑니다。

熊猫가구체적인정보를사용하여사용자에게적합한DataFrame을만들수있도록값,인덱스,열이름은NumPy배열에이미포함되어있어야합니다。

熊猫DataFrame을사용할경우얻을수있는장점중하나는DataFrame()함수에다양한구조를입력할수있다는것입니다。비NumPy구조를사용하여구조를만들경우,이프로세스는거의동일한방식으로작동합니다。다시말해,사용자는DataFrame()함수에배열을전달한다음熊猫에게이정보로새DataFrame을만들도록지시합니다。

뿐만아니라DataFrame을입력정보로사용하여새DataFrame을만들수도있는데my_df = pd。数据帧()을사용하고입력데이터를공식에삽입하면됩니다。

원본사전의키는계열(系列)의인덱스안에포함되고DataFrame도동일합니다。가져오기가완료되면키는자동으로정렬됩니다。

.index특성과함께形状특성을사용하여새로만든DataFrame의차원을알아볼수있습니다。이특성을사용하면너비와높이가표시되는데높이만알고자하는경우,LEN()함수(다시말하지만.index특성과함께)를사용하면DataFrame의높이가표시됩니다。

이두방법모두모든NaN값이포함된DataFrame의규격을보여줍니다。반면,df[0]。count()를사용하면南값이포함되지않은DataFrame의높이가표시됩니다。

pandas DataFrame에서의tmp덱싱

데이터덱싱은물리적항목들을덱싱하는것과같다고생각하면됩니다。다시말해,大熊猫에서인덱싱하는경우,작업하려는특정값,행열,을선택하여데이터를분류하고정리하게됩니다。

熊猫DataFrame에서인덱싱을통해수행할수있는작업은Excel에서수행가능한작업과비슷합니다。가장큰차이점은熊猫에서는더자세하게다양한목적을위해인덱싱할수있다는것입니다。따라서원하는대로데이터를처리하기위해다양한옵션을이용할수있습니다。

熊猫에서인덱싱을시작하려면먼저DataFrame에서작업하려는데이터의특정행및/또는열을선택해야합니다。예를들면,행은몇개만사용하되열은모두사용할수도있고,반대로열은몇개만사용하되행을모두사용할수도있습니다。소수의특정행과열이필한경우도있을수있습니다。

데이터의특정하위그룹을선택하므로덱싱은때때로하위그룹선택이라고도불립니다。

pandas DataFrame에서tmp덱싱이어떻게이루어지는지설명해보겠습니다。

熊猫에서덱싱을수행하는방법은네가지입니다。첫째,bmp덱싱연산자함수bmp df[]가있습니다。라벨을다루는경우df。Loc[]를사용할수도있습니다。df。Iloc[]는위치및/또는정수기반데이터에주로사용됩니다。마지막으로,라벨및정수기반데이터모두를위한함수ddf。Ix[]가있습니다。

방금설명한이네가지인덱싱스타일을인덱서라고부르며,이들은가장흔히사용되는데이터인덱싱방법에속합니다。

pandas DataFrame을통한반복

熊猫DataFrame에서동일한그룹의명령문(声明)을반복해서실행해야할경우를대비해두는것이좋습니다。

이것역시熊猫에서상당히쉽게실행할수있는함수입니다。반복을설정하려면for循环와iterrows()명령을둘다사용해야합니다。그러면(眼镜框덱스,계열(系列))쌍의형식으로DataFrame행을반복하고

결과값에(rm덱스,행)튜플(元组)을얻을수있습니다。

熊猫에서반복을수행하면DataFrame에게사전과같이반복하라고지시하는것으로개체의키에대해반복이수행되어행과열의항목이차례로처리됩니다。

pandas数据帧을이용하면얻을수있는점

  • 다양한데이터베이스및데이터형식의데이터를손쉽게로드
    • 다양한데이터유형과함께사용할수있음
  • 공용키를사용하는데이터세트를직관적으로병합,조marketing하여완전한데이터보기가능
  • 데이터프레임하나에세그먼트레코드여러개
  • 스마트한라벨기반슬라이싱,창의적인덱싱및대규모데이터세트의하위집합설정지원
  • 熊猫DataFrame내기본내장기능에액세스하여얻은데이터에서설득력있는통계를얻기위해신속한집계및요약수행
  • 특정연산작업을포함한나만의Python함수를정의하여DataFrame레코드에적용
  • 더적은쓰기작업으로도더많은작업을수행하도록돕는구문보유
    • c++또는Java에서최대15줄을사용해야하는작업을두줄이하로수행할수있음
    • 워크플로를효율화하고,매일의작업량을늘리고,처리및분석할수있는데이터의양을증가시킴
  • Python과함께사용하도록설계된熊猫는다양한기능을모두Python과완전히호환하여사용가능
    • Python에능숙한많은산업의전문가들이Python-pandas조합을이용할경우접근성이향상됨
  • 제공되는구문을활용하여대량의데이터를간편하고효율적이며빠르게처리할수있음
  • 유연한데이터처리방식덕분에데이터를쉽게편집하고필요한모든함수를적용할수있어데이터접근법을맞춤화할수있음
  • 오픈소스기반으로뛰어난접근성으로누구나熊猫를사용할수있음
  • 설계단계에서고려한프로그램밍언어가아니더라도다양한유형의프로그래밍언어와호환됨(예,Java및HTML과호환)
  • _json과같은다른형식으로쉽게변환가능

5가지주pandas DataFrame시각화툴

熊猫DataFrame은다양한기능과함수를사용하고熊猫라이브러리에입력되는모든데이터를유연하게조작할수있는기회를제공하지만,매우시각적인툴은아닙니다。이툴은기본적으로무대뒤의모습과같다고생각할수있습니다。

여러가지이유로이는매우유용합니다。예를들면,입력한데이터를시각적으로@현해야하는경우가그렇습니다。

Excel과같은툴을熊猫와비교해서살펴보면Excel에서는버튼몇개를누르면자동으로순전히숫자로만된데이터가시각적인그래프,차트등으로바뀝니다。熊猫에는이러한기능이없습니다。

그래서데이터시각화툴을원하면熊猫DataFrame이아닌다른툴을고려해야합니다。

5가지주DataFrame시각화툴을아래에모아두었습니다。상위두개의툴은JavaScript툴이고나머지세개의툴은Java와관련이없는데이터분석애플리케이션입니다。각툴을자세히분석하여해당툴이유용한이유와툴의순위가어떻게매겨졌는지보여드리겠습니다。

그러면,상위두개의툴을먼저살펴보겠습니다。그리고왜JavaScript툴이1,2위를차지했는지도알려드리겠습니다。

JavaScript툴

원래LiveScript라고불렸던JavaScript는유연하고동적인특성덕분에현재가장인기있는프로그래밍언어중하나가되었습니다。JavaScript가사용하는구문은프로그래밍언어cmc언어의구문과비슷합니다。

JavaScript를사용하면대화식웹페이지를만들거나기존웹페이지를조정할수있습니다。熊猫DataFrame처럼JavaScript는데이터를조작할수있기때문에JavaScript를사용하여계산을수행하고데이터기반결론을검증할수있습니다。CSS또한JavaScript는HTML또는문서에동적텍스트를삽입하려는경우유용합니다。

여기서는熊猫DataFrame시각화에사용할수있는JavaScript툴을살펴보고있습니다。

砖가뽑은최고의시각화툴목록에서1、2위자리를JavaScript툴이차지한이유가는JavaScript언어로서항상진화하고있기때문입니다。JavaScript는광범위하게유용하기때문에널리사용될뿐만아니라,끊임없이확장되고발전되고있기때문에더많은사람들이사용하고있습니다。JavaScript따라서로만들어진툴은더유연할수있으며,사용자의최신요구사항을잘반영할수있습니다。

이제熊猫DataFrame시각화를위한최고의JavaScript툴인Qgrid를살펴본후,이목적을위한두번째로선정한PivotTable.js를살펴보겠습니다。

1.Qgrid

Quantopian이개발한Qgrid는SlickGrid구성요소를사용하여DataFrame의상호작용가능성을강화하므로표시된버전으로熊猫DataFrame에서데이터를분류하고필터링할수있습니다。Qgrid는Jupyter노트북위젯입니다。

Qgrid를사용하면데이터를유형별로필터링하게됩니다。이는Qgrid로사용이간편한필터링시스템을이용할수있음을의미합니다。

데이터시각화와관련하여특히유용한Qgrid의기능은렌더링기능을구성하는것입니다。구성을완료한후에사용자는DataFrame에서선택한데이터를읽을수있기때문에Qgrid는데이터를조작하거나면밀히검사해야하는사용자에게특히더적합합니다。

Qgrid의작동원리를간략히살펴보겠습니다。

Qgrid를사용하려면특정공간을상위레이아웃을사용하거나parentWidget()과함께사용하여QGridLayout에할당해야합니다。그러면이툴은공간을행과열로나누어할당된각위젯을적합한셀에배치합니다。

2.PivotTable.js

熊猫와사용하면좋은툴목록에서2위를차지한PivotTable.js는피봇테이블라이브러리를사용하는JavaScript모듈입니다。이툴을사용하면데이터를요약하고피봇하여데이터와더쉽게상호작용하고접근성을향상할수있습니다。

PivotTable.js의주된장점은사용이매우간편하다는것이며클릭과드래그만으로기능을모두사용할수있습니다。

이툴의기능에는熊猫DataFrame의데이터에대한통계적분석과더불어단순시각화가포함됩니다。이툴은篇DataFrame의데이터를간략하게제공하여한눈에더쉽게이해할수있도록데이터를피봇하고요약할수있는훌륭한툴입니다。또한테,이블을구축한후에는테이블안에포함된데이터를필터링할수있어동일한위젯으로추가적인기능을제공합니다。

PivotTable.js는熊猫DataFrame에피봇차트와테이블을드래그하여드롭하는데도유용합니다。이방법을사용하여Jupyter및IPython笔记本의테이블을이동할수있어熊猫라이브러리에입력하는데이터의유연성이향상됩니다。

데이터분석애플리케이션

우리가확인한대로熊猫DataFrame은데이터를분석하려는사용자에게매우유용합니다。

데이터로작업하는일은복잡할수있습니다。데이터가생성되어도데이터를적합한툴에입력하거나올바른공식을적용하지않으면데이터가자동으로정리되지는않습니다。이때문에데이터분석애플리케이션이매우유용합니다。잘정리된데이터로데이터를분석하는함수를프로그래밍할수있다면이작업을훨씬더빨리수행할수있습니다。

이섹션에서는熊猫DataFrame에저장된정보의시각화를지원하는가장적합한세가지데이터분석애플리케이션에대해알아보겠습니다。

3.pandasGUI

pandasGUI Python기는반라이브러리로,데이터조작및요약통계를지원하도록개발되었습니다。pandasGUI는GUI(图形用户界面)를사용하여DataFrame라이브러리에적용되며인터페이스를통해작업원하는을수행합니다。pandasGUI는UI(用户界面)에서명령을입력하도록설계되었으며,프로그램은熊猫에서명령을실행합니다。

참고로pandasGUI를설치할때는별도의새로운가상환경을설정하는것이가장좋습니다。그다음,이환경에서pandasGUI라이브러리를설치하면더깨끗하게설치할수있고이툴을더간편하게사용할수있습니다。

설치와설정이완료되면즉시작업을시작할수있습니다。DataFrame을함수에전달하면pandasGUI가자동으로데이터세트에서가져온행과열로채워집니다。이러한방식으로한번에두개이상의데이터세트를로드할수도있어더욱빠르게많은정보를쉽게확인할수있습니다。

데이터가함수로성공적으로전달되면gui를통해데이터에액세스할수있습니다。여기서부터다양한방식으로데이터와상호작용하고편집,분석,조작할수있습니다。이툴은제공되는함수와레이아웃면에서Excel스프레이드시트와비슷한방식으로사용할수있습니다。

GUI형식의데이터는다른형식으로복사하거나붙여넣기할수있기때문에사용자는차트나그래프와같은시각화유형으로데이터를매우쉽게이동할수있습니다。

기본적으로,pandasGUI는매우사용이간편합니다。또한,경험이적은코더에게도매우사용자친화적입니다。그래서이툴이熊猫DataFrame에유용한데이터시각화툴중에서3위를차지했습니다。

4.Tabloo

Tabloo는“테이블형식데이터시각화를위한미니멀대시보드앱”이라고설명할수있습니다。Tabloo는Python에서실행할수있으므로熊猫와도완전히호환됩니다。

이데이터시각화툴은다른유형의백엔드언어들과도호환되지만瓶백엔드를사용합니다。이백엔드는사용자가에熊猫数据库입력하는데이터를시각적으로이해할수있도록지원하는단순한인터페이스를제공하는데사용됩니다。

또한,Tabloo를사용하면데이터의플롯을그릴수있습니다。이는필요한그래프와차트를보기위해외부소프트웨어에의존하지않아도된다는의미이며다른툴을사용하지않고도신속한시각화를수행하고싶은경우편리합니다。

사용방식면에서Tabloo는熊猫gui와공통점이많습니다。Tabloo도데이터를셀로정리하여pandasGUI에서실행할수있는동일한기능대부분을사용하여데이터를조작할수있습니다。그러나Tabloo에서는한번에두개이상의필터를적용하기가조금더어려운반면pandasGUI는한번에두개이상의필터를적용할수있습니다。

Tabloo작동의기반이되는구문은熊猫gui와마찬가지로쿼리구문입니다。

pandasGUI와Tabloo의중요한차이점한가지는pandasGUI의기능이더풍부하다는점입니다。Tabloo도사용자에게유용한기능을제공하지만pandasGUI를사용하면데이터취급시더많은옵션을이용할수있습니다。이러한이유로이툴은목록에서더낮은순위를차지하게되었습니다。

5.维加拉

Tabloo에상응하는아키텍처를사용하는维은이목록의마지막순위를차지합니다。维은反应프런트엔드와함께Tabloo와매우유사한瓶백엔드를사용합니다。React프런트엔드는D-Table의광범위한옵션들을최대한활용하도록지원합니다。

维의사용자인터페이스는이애플리케이션의이름에서알수있듯이매우상세합니다。熊猫데이터를D-Table로가져와서액세스할수있습니다。그러면데이터가자동으로행과열로정리하여사용자가원하는방식대로데이터세트를정렬하는다양한정렬기능을제공합니다。예를들면,선택된행또는열에锁(잠금),隐藏(숨기기)、删除(삭제)및重命名(이름재지정)과같은기능을사용할수있습니다。

또한维을사용하면차트부터히스토그램그리고그외의형태로데이터를시각화할수있습니다。

维의유용한기능중한가지는언제든지애플리케이션에서코드를내보낼수있다는것입니다。그러면이코드를다른애플리케이션에붙여넣어코드의유효성을확인하거나다른방식으로데이터를처리할수있습니다。

D-Table을통해데이터형식지정을수행할수도있습니다。예를들어,데이터세트에날짜가포함되어있다고가정해보겠습니다。날짜의월과일을마침표가아니라백슬래시로구분하고싶다면维에서조정할수있습니다。

pandas DataFrame特赦약

pandas DataFrame으로데이터를쉽고빠르게처리,조작,분석하세。

熊猫DataFrame은Python과함께사용하도록설계된라이브러리로,Python에익숙하지않은사용자도사용할수있습니다。또한이,라이브러리는다양한형식의데이터를처리할수있으므로어떤형식의데이터라도쉽게입력할수있습니다。

지금까지熊猫를사용할경우얻을수있는가장큰장점들에대해이미설명했지만다시한번간단히요약해서말씀드리겠습니다。熊猫DataFrame을사용하면데이터를신속하고간편하게집계할수있습니다。pandas DataFrame은다양한시각화툴과호환되어유연성을극대화합니다。다른스크립팅언어와다르게,熊猫帧은단몇줄의코드명령으로도많은작업을수행할수있어더욱간편하게일상적으로사용할수있습니다。

한마디로표현하자면熊猫DataFrame의유용성으로데이터를처리하고자하는누구나쉽게활용할수있습니다。

额外的资源

回到术语表